亚博真人yabo.at
          
          对于技术内部人士
主题
         航空航天
         2020年亚博论坛

         2020年亚博收网行动

         2021亚博最新

         2021欧洲杯亚博

         能源
         2020欧洲杯亚博

         188亚博

         半导体
         亚博排列五投注网站
         电信
         运输
        
部分
          特性
          新闻
          的意见
          职业生涯
          DIY
          大局
          工程资源
         
更多的
          专题报告
          集合
          讲解员
          播客
          视频
          时事通讯
          顶级编程语言
          机器人导
         
IEEE会员
          最新一期
          杂志存档
          该研究所
          TI存档
         
IEEE会员
          最新一期
          杂志存档
          该研究所
          TI存档
         
亚博真人yabo.at
          关于我们
          联系我们
          转载及权限
          广告
         
遵循IEEE频亚博真人yabo.at谱
           
支持IEEE频谱亚博真人yabo.at
          亚博真人yabo.at是IEEE的旗舰出版物，IEEE是世界上最大的致力于工程和应用科学的专业组织。我们的文章、播客和信息图表向读者介绍技术、工程和科学的发展。

          加入IEEE
         
          订阅
         
               对IEEE
               联系与支持
               可访问性
               不歧视政策
               条款
               IEEE隐私政策
              
              ©版权所有IEEE 2023作为一个非盈利组织，IEEE是世界上最大的技术专业组织，致力于推动技术造福人类。

人工智能耳机解决嘈杂的变焦通话

人工智能、网络技巧和定制硬件的巧妙结合消除了背景噪音

4分钟读取

一幅两只手的画。其中一人手持Clearbuds耳塞，这是首批可在智能手机上实时运行的机器学习系统之一。另一只手拿着显示ClearBuds应用程序的智能手机。

华盛顿大学的研究人员发明了一种名为ClearBuds的耳塞，可以提高说话者的声音，减少背景噪音。ClearBuds应用程序和耳塞使用了一种新颖的麦克风系统，构成了首批在智能手机上实时运行的机器学习系统之一。

Raymond Smith/华盛顿大学

没有什么比一个团队成员坚持在嘈杂的咖啡馆里拨号更能破坏Zoom会议的气氛了。一款名为ClearBuds的新型人工智能无线耳机有望解决这一问题，它能屏蔽背景噪音，并确保麦克风只接收呼叫者的声音。

语音增强技术已经应用于各种产品，包括助听器、Zoom和谷歌Meet等远程会议服务，以及苹果AirPods Pro等无线耳机。其目标是去除传入音频中不必要的噪音或失真，提高说话者声音的清晰度信号处理算法或更新机器学习方法。

它们通过利用空间线索来帮助区分音源或声学信息，从而区分不同种类的噪音，如讲话或交通声音。但是同时做到这两点，并且计算预算小到足以在消费级设备上运行，这是一个重大的挑战，大多数现实世界的系统仍然有很多需要改进的地方。

华盛顿大学的一个团队巧妙地结合了定制的入耳式无线耳机、定制的蓝牙协议和可以在智能手机上运行的轻量级深度学习模型，构建了一个名为“智能手机”的系统ClearBuds这几乎完全消除了背景噪音。

“对我们来说，ClearBuds的诞生是出于需要，”他说伊珊Chatterjee他是一名博士生，也是《一篇论文在ACM移动系统、应用和服务国际会议上介绍了这项技术。他不仅是我的同班同学，还是我另外两位作家、博士生的室友Maruchi金而且Vivek Jayaram．

查特吉说:“当大流行封锁开始时，和其他许多人一样，我们发现自己在这样近距离的房间里接了很多电话，房子周围有很多噪音，厨房的噪音、建筑噪音、谈话声。”所以他们决定集中他们在硬件、网络和机器学习方面的经验来解决这个问题。

Jayaram说，语音增强的最大挑战之一是分离出多种声音。虽然最近的机器学习方法已经很擅长区分不同种类的声音，并利用它来屏蔽背景噪音，但当两个人同时说话时，它们仍然很困难。

解决这个问题的最好方法是使用多个相距稍远的麦克风，这样你就可以三角定位不同噪音的来源。这使得根据两个说话者的位置而不是他们的声音来区分他们成为可能。但要使其有效，麦克风需要在一个合理的距离。

大多数商业产品在每个耳塞中都有麦克风，它们之间的距离应该足够远，以便进行像样的三角测量。但是，流媒体和同步音频都超出了今天的蓝牙标准，Kim说。这就是为什么苹果的AirPods和高端助听器在每个耳塞里都有多个麦克风，允许它们在从单个耳塞传输到连接的智能手机之前进行一些有限的三角测量。

为了解决这个问题，研究人员设计了一个定制的无线协议，让其中一个耳塞传输一个时间同步信标。第二个耳塞利用这个信号将自己的内部时钟与另一个耳塞的内部时钟进行匹配，确保两个音频流保持同步。该团队在由商品电子元件制成的定制耳塞上实现了这一协议，并将外壳3d打印出来，但同步每个耳塞的流只解决了部分问题。

研究人员希望利用最新的深度学习技术来处理音频，但他们还需要在智能手机上运行语音增强软件。这些模型都有大量的计算预算，大多数使用人工智能进行语音增强的商业产品都依赖于将音频传输到强大的云服务器。贾亚拉姆说:“一部手机，即使是较新的手机，其计算能力也只是GPU卡的一小部分，GPU卡通常用于运行深度学习。”

他们的解决方案是采用一个预先存在的神经网络，该网络可以学习检测两个传入信号的时间差，因此可以对源进行三角测量。然后，他们通过减少参数和层数，将其精简到最基本的部分，直到它可以在智能手机上运行。像这样剥离网络导致音频质量明显下降，引入了噼啪声、静态和砰砰声，因此研究人员将输出输入另一个网络，该网络学会过滤掉这些扭曲。

贾亚拉姆说:“这种创新是将两种不同类型的神经网络结合在一起，每一种都可以非常轻量级，结合在一起，它们可以接近这些无法在iPhone上运行的真正大型神经网络的性能。”

在与苹果AirPods Pro进行测试时，ClearBuds在所有测试中都实现了更高的信号失真比。该团队还让37名志愿者对来自嘈杂现实环境的音频剪辑进行评分，比如嘈杂的餐馆或繁忙的交通十字路口。通过ClearBuds的神经网络处理的那些被发现有最好的噪音抑制和整体的听力体验。在实际测试中，8名志愿者明显更喜欢ClearBuds，而不是他们通常用来打电话的音频设备。

他说，输出结果确实存在一些失真Tillman Weyde但它们并不是特别具有侵入性，总体而言，该系统在去除背景噪音和声音方面非常有效。他补充说:“这是一个学生和学术团队的伟大成果，他们显然在这个项目上投入了大量的工作，以便在影响数亿使用无线耳机的人的问题上取得有效进展。”

亚历山大Defossez脸书巴黎人工智能研究中心的研究科学家说，这项工作非常令人印象深刻，但他指出一个局限性是，将音频传输到智能手机并进行处理的总时间为109毫秒。他说:“我们总是从网络得到50到100毫秒的延迟。”“额外增加100毫秒是一个巨大的代价，随着通信堆栈变得越来越‘智能’，我们最终将在所有通信中遇到相当明显而恼人的延迟。”

信号处理机器学习无线通信蓝牙耳塞

对话(0)

主题

部分

更多的

IEEE会员

IEEE会员

亚博真人yabo.at

遵循IEEE频亚博真人yabo.at谱

支持IEEE频谱亚博真人yabo.at

人工智能耳机解决嘈杂的变焦通话

人工智能、网络技巧和定制硬件的巧妙结合消除了背景噪音

研究6G电信对社会的影响

从地面监测太空天气

2023年消费电子展最佳科技

有关的故事

忆阻器以1/800的功率运行AI任务

新的人工智能将计算机图形速度提高了5倍

警察如何利用国会暴乱的数字记录

法医技术很强大，但它值得以隐私为代价吗?

社交媒体为数字取证提供了线索

数字数据如何让我们更容易地将这些点连接起来

地理围栏的目标是地点，而不是人——这是一个问题

用数字技术发出一声尖叫

主题

部分

更多的

IEEE会员

IEEE会员

亚博真人yabo.at

遵循IEEE频亚博真人yabo.at谱

支持IEEE频谱亚博真人yabo.at

通过创建账户享受更多免费内容和福利

保存文章以供以后阅读需要一个IEEE Spectrum帐户亚博真人yabo.at

研究所的内容仅供会员使用

下载完整的PDF刊物是IEEE会员的独家权利

访问光谱的数字版本是IEEE会员的独家

以下主题是IEEE成员的独家特性

在文章中添加回复需要IEEE Spectrum帐户亚博真人yabo.at

创建一个帐户以访问更多内容和功能亚博真人yabo.at包括保存文章以供以后阅读，下载Spectrum Collections，以及参与与读者和编辑的对话。有关更多独家内容和功能，请考虑加入IEEE．

加入世界上最大的致力于工程和应用科学的专业组织，并获得Spectrum的所有文章、档案、PDF下载和其他福利。了解更多→

访问成千上万的文章-完全免费

创建一个帐户，并获得独家内容和功能:保存文章，下载收藏，而且与科技业内人士交谈——全部免费!为了获得充分的使用权和福利，加入IEEE作为付费会员。

人工智能耳机解决嘈杂的变焦通话

人工智能、网络技巧和定制硬件的巧妙结合消除了背景噪音

研究6G电信对社会的影响

从地面监测太空天气

2023年消费电子展最佳科技

有关的故事

忆阻器以1/800的功率运行AI任务

新的人工智能将计算机图形速度提高了5倍

最大和最小的人工智能计算机的新记录

警察如何利用国会暴乱的数字记录

法医技术很强大，但它值得以隐私为代价吗?

社交媒体为数字取证提供了线索

数字数据如何让我们更容易地将这些点连接起来

地理围栏的目标是地点，而不是人——这是一个问题

用数字技术发出一声尖叫