热资讯！钉钉会议两篇论文入选国际语音顶会INTERSPEECH 2022-- 迪族网

热资讯！钉钉会议两篇论文入选国际语音顶会INTERSPEECH 2022

来源：量子位　2022-09-06 19:35:49

【资料图】

利用深度学习来提升语音增强效果和鲁棒性，已成为实时音视频通信领域研究的热点之一。钉钉蜂鸣鸟音频实验室提出了一种新的窄带滤波网络架构，可大幅提升去噪和去混响联合语音增强效果，提升音频质量，相关论文已被语音领域顶会INTERSPEECH 2022收录。

INTERSPEECH是由国际语音通讯协会（ISCA）创办的顶级学术会议，也是全球最大的综合性语音领域的科技盛会，在国际上享有极高盛誉并具有广泛的学术影响力，历届INTERSPEECH会议都倍受全球各地语音研究领域人士的关注。

不同于目前普遍以全频带语音信息作为输入的实现方式，钉钉蜂鸣鸟音频实验室提出的窄带滤波网络架构，是以每个频带信息作为输入，让每个频带共享网络参数，并引入听觉研究领域的频-时调制谱感受区（spectro-temporal receptive fields，STRFs）。

窄带滤波网络架构的目的，是从本质上提高输入的频带信息对语音和非语音的鉴别力，从而大幅提升窄带滤波网络消除噪音和混响的算法效能。

测试证明，相比带宽滤波网络，这种轻量的模型能得到更好的实时单通道语音增强效果，可提升20%的语音质量，并减少约70%的网络模型大小，大幅降低推理的复杂度，可应用于在噪杂的办公室、大会议室等复杂场景中提升语音质量。

值得一提的是，该研究也验证了仅用一个神经网络模型进行多项语音增强任务的可行性。过去，在音频链路中部署过多不同神经网络模型，会导致消耗过多的运算资源，而采用一个模型，将有效缓解神经网络在落地过程中遇到的难点。

据介绍，钉钉蜂鸣鸟音频实验室提出的关于「兼容指向型麦克风的波达方向与距离的联合估计框架」的论文一并入选INTERSPEECH，该框架是用于提升声源定位的精度和效果。

实验室研究人员表示：“波达方向与距离估计对于声源定位技术是相当关键的信息。我们提出的算法首先对声音信号传播进行建模，融合不同传感器/麦克风类型（全向和指向型），再利用稀疏贝叶斯学习框架准确地联合判断出波达方向与距离信息，可应用于多声源定位。”

实验证明，在双声源场景下，当信噪比(signal-to-noise ratio SNR）达到8dB，波达方向估计误差即能控制在1度以内，距离估计误差能控制在0.1米之内。

钉钉蜂鸣鸟音频实验室旨在用传统信号处理结合深度学习算法，来解决实时语音通信碰到的复杂问题，提升钉钉会议、直播以及合作会议硬件的产品体验，并探索下一代音视频形态。其重点研究方向包括音频3A算法、单通道/多通道语音增强、声源定位等。

关键词：神经网络模型语音质量研究领域

推荐DIY文章

主机存在磨损或划痕风险 PICO4便携包宣布召回

穿越湖海！特斯拉Cybertruck电动皮卡可以当“船”用

vivoXFold+折叠旗舰开售配备蔡司全焦段旗舰四摄

飞凡R7正式上市全系标配换电架构

中兴Axon30S开售拥有黑色蓝色两款配色

荣耀MagicBookV14 2022正式开售搭载TOF传感器

华硕无双上新新增指纹识别模块和键盘背光

曝爱彼迎联合创始人加入特斯拉董事会自愿放弃现金薪酬

联想YOGAPro14si9版将开启预售搭载i9-12900H处理器

RTX4090发布：性能提升高达2倍功耗保持450W

一加NordWatch智能手表官宣采用矩形表盘

小米米家智能枕开启众筹内置智能压电传感器可捕捉心跳

出轨成性，死拖张嘉倪，换着法子骂网友，买2023-05-25
今日快看!西藏日喀则：金融活水“贷”动文2023-05-25
雪居之地哪些首领具有扫射和狂热的资质2023-05-25
塞尔达传说王国之泪为海布拉带来和平挑战视2023-05-25
塞尔达传说王国之泪科尔天的下落挑战视频攻2023-05-25
塞尔达传说王国之泪白鸟所指引的洞窟任务在2023-05-25
天天快资讯丨垃圾分类达人评选，诉求降65%2023-05-25
新疆：棉企调降基差汽运出库未降温2023-05-25
「雷鸟Air Plus+雷鸟魔盒」评测：1+1能否2023-05-25
实测！AI诈骗生成露脸说话视频仅需数十元 2023-05-25
外媒：禁售美光就是中国开始反击的信号2023-05-25
玩转光追1080P：iGame GeForce RTX 40602023-05-25
李佳琦联合近千家品牌启动618 三大直播间2023-05-25
小米什么都想要：手机虽然大缩水，但还有汽2023-05-25
关注：戴森发布全新360 Vis Nav吸尘机器2023-05-25
教育部部署各地深入开展“2023高考护航行动2023-05-25
HugNLP框架：一键刷榜，全面统一NLP训练_世2023-05-25
民乐：力促商务经济高质量发展_动态2023-05-25
光天化日有人持刀劫持女子，有人一锹拍在持2023-05-25
布朗炮轰塔图姆：不知道他为什么总是排挤我2023-05-25
塞尔达传说王国之泪为阿卡莱带来和平挑战视2023-05-25
雪居之地裸地精输出怎么样|全球快看点2023-05-25
塞尔达传说王国之泪骸骨马任务在哪里做2023-05-25
世界今日报丨雪居之地裸地精抓位怎么样2023-05-25
沪指跌0.23％，深成指跌0.05％，创业板平开。2023-05-25
微信红包不收多久退回？微信红包发错了怎么2023-05-25
电池正极是凸出来还是凹进去？电池正极是什2023-05-25
手机信号不好怎么能增强信号？手机无网络信2023-05-25
直动式减压阀是常开还是常闭？直动式减压阀2023-05-25
环球关注：一季度价格战拖累毛利！小鹏汽车2023-05-25

热资讯！钉钉会议两篇论文入选国际语音顶会INTERSPEECH 2022

新闻排行

精彩推荐

综合信息