人工智能是2023年消费电子展的热门趋势,但这并不是因为新的人工智能模型或研究突破。消费电子亚博技术支持专业彩票平台展的焦点是消费者。展会上最吸引人的人工智能演示针对的是一种特定用途。然而,这并不是对人工智能潜力的损害:相反,我认为这正是今年人工智能如此吸引人的原因。这个领域已经足够成熟,可以超越演示,为无数消费设备、应用程序和服务提供切实的改进。以下是一些突出的例子:

人工智能硬件将出现在价格实惠的Windows笔记本电脑上

AMD在2023年消费电子展上展示了一系列移动处理器。这包括Ryzen 7040系列x86处理器中的第一个专用AI处理器:Ryzen AI.它最终提供了一种Windows替代苹果硅芯片的人工智能硬件。AMD声称,Ryzen AI处理器比苹果M2芯片上的AI硬件速度快20%,效率高50%。

这张幻灯片详细介绍了AMD Ryzen AI处理器的规格Ryzen AI是AMD Ryzen 7040移动处理器的专用引擎。AMD

Ryzen AI处理器不会打败大型gpuNvidia的RTXAMD Radeon,或英特尔的Xe.然而,即使是最不强大的gpu在全速时也需要50 - 75瓦,而顶级显卡可以超过400瓦。包括Ryzen AI在内的Ryzen 7040处理器的总热设计功率为35至45瓦,而AI处理器只占其中的一小部分。

AMD表示,他们致力于将Ryzen AI保留在未来产品的路线图上。这意味着像AMD的Ryzen cpu和Radeon gpu这样持续的改进和创新。Ryzen AI还处于早期阶段,但这是朝着正确方向迈出的一大步。

人工智能驱动的语音可以发出自己的声音

语音变形和翻译通常不会演示(除非你是谷歌),但两家人工智能语音初创公司在CES上表现强劲。

一款用于实时翻译语音的智能手机应用程序。Verbum是一款由人工智能驱动的文本和语音翻译应用程序。

OneMeta AI带来了Verbum这是一款实时语音翻译web应用程序,目前已上市。首席执行官Saúl Leal让我坐下来与该公司的产品主管Dayanna Rojas进行视频聊天,她从智利打来电话。她说西班牙语,而我说英语,由Verbum翻译:首先是通过文本,然后是人工智能生成的语音。这是一个令人信服的演示,更令人印象深刻的展厅忙乱的音频环境。Leal说,这项服务也可以通过电话进行,即使没有互联网连接。

我还和销售副总裁马丁·阿勒斯谈过Speechmorphing.除了翻译,语音变形还可以调整一个人的声音,使其听起来像另一个人的声音,或者根据文本输入创建语音。该服务可以使用现有的语音录音进行训练,重现任何有足够数据的声音。是的,这意味着你可以像摩根·弗里曼一样说话。但该应用程序还可以让部分或全部丧失说话能力的人恢复语音。

Nvidia Canvas获得360度升级

NVIDIA Canvas更新:为您的3D场景提供360度环境地图英伟达

我第一次尝试英伟达帆布,只需几笔就能生成令人印象深刻的2D景观。即使在当时,它也令人印象深刻,为不喜欢艺术的人(比如我自己)提供了一个创造迷人风景的机会。在2023年的CES上,英伟达推出了Canvas 360,它增加了对创建360度全景图像的支持。

这可能看起来像是一个噱头:毕竟,360度相机并没有流行起来。但Canvas 360的目的远不止全景照片。它的真正价值将被3D艺术家挖掘出来,他们希望快速为3D场景创建合适的背景。建筑师可以使用它去创造与客户想要创造的环境相似的场景,而游戏设计师则可以快速迭代背景场景去改变关卡的氛围。

3D扫描被削弱

泡桐树引擎这是一款安卓、iOS和网页应用,可供创作者使用摄影测量用于3D物体的专业级扫描,即将获得升级:支持神经辐射场,更广为人知的是nerf。

KIRI引擎将使用nerf从照片和视频中创建3D场景。youtu.be

这项技术可以根据照片或视频创建3D对象和场景。不同于摄影测量,需要从不同角度拍摄多张照片,nerf使用人工智能来估计物体的隐藏部分。生成的3D模型可以移动、调整大小、旋转,并从任何角度观看。

nerf已经在2022年掀起了波澜,但KIRI引擎将把它们带到Android和iPhone设备上。KIRI的代表告诉我,该功能将在2023年的头几个月推出。

视频通话中很难有眼神交流,为什么不假装一下呢?

在与NVIDIA Maxine的视频会议中保持眼神交流英伟达

2013年,微软研究院(Microsoft Research)向我展示了一个秘密演示,演示了它试图建造一个隐藏在LCD屏幕后面的网络摄像头。我们的目标吗?在虚拟网络会议上让直接的眼神交流成为可能。大多数情况下,这一策略奏效了,一些智能手机制造商也尝试了类似的策略,但事实证明,很难很好地执行。

英伟达(Nvidia)有另一个解决方案:用人工智能来伪装。这项被称为眼睛矫正的功能将成为英伟达广播的一部分,这是该公司为视频和直播创作者设计的软件实用程序套件。它会自动伪造你眼睛的位置,让你看起来像是在看相机。

搭载锐龙AI处理器的AMD笔记本电脑也将具备类似功能。微软于2022年在部分Windows设备上推出的Studio特效(包括眼部矫正)与Ryzen AI兼容。

对话(0)

深度学习可以把音乐会体验带回家

一个世纪以来对真正逼真的声音制作的追求终于得到了回报

12分钟读取
垂直
图像包含仪器、左右张开的双手等多个方面。
斯图亚特·布拉德福德
蓝色的

现在记录下来了声音已经无处不在,我们几乎不去想它。从我们的智能手机、智能音箱、电视、收音机、光盘播放器和汽车音响系统,它是我们生活中持久而令人愉快的存在。2017年,民意调查公司的一项调查尼尔森大约90%的美国人经常听音乐,平均每周听32小时。

在这种自由流动的快乐背后,是巨大的产业,它们将技术应用于以最大可能的真实感再现声音的长期目标。从19世纪80年代爱迪生的留声机和喇叭扬声器开始,一代又一代追求这一理想的工程师发明和开发了无数的技术:三极管真空管、动态扬声器、磁性留声机卡带、几十种不同拓扑结构的固态放大电路、静电扬声器、光盘、立体声和环绕声。在过去的五十年里,数字技术,就像音频压缩而且流媒体,已经改变了音乐产业。

继续阅读↓ 显示更少
{“imageShortcodeIds”:[]}
Baidu