icassp 2021,icassp 2021 rebuttal

近日,由快手音视频市场部协同意大利罗马第一高校(Sapienza University of Rome, Italy),在国际性音频顶尖大会 ICASSP 2022 上进行的深层 3D 音频信号分析挑战赛(L3DAS22:Machine Learning for 3D Audio Signal Processing)考试成绩宣布公布。本次比赛一共有来源于全世界近 50 支学界和工业领域精英团队报考,比赛成效将在2021年 5 月 ICASSP 2022 交流会的 Special Session 上开展共享。

做为第一届 L3DAS21 比赛的总冠军,快手音视频市场部音频优化算法精英团队在深度神经网络的音频信号分析方位上不断探寻。本次精英团队协同意大利罗马第一高校进行挑战赛,致力于给予一个常用的数据和公平公正的测试平台,推动真正情景下 3D 深层音频信号分析关键技术的科学研究。根据深度神经网络的 3D 音频信号分析技术性造成学界和学术界普遍关心,在虚似和真正大会、游戏软件开发、音乐编辑,无人驾驶及监管等行业深层次运用。相比于单路音频,3D 音频带上的增加量三维声源处方向信息内容,有利于提高视频语音和感情鉴别、声源处分离出来、语音增强和去噪,及其声学材料消噪优化算法的实际效果。

此次挑战赛共设定了2个每日任务:

任务一:多路 3D 语音增强每日任务,致力于办公场景下的即时语音增强要求。

每日任务二:真正情景下特殊声源处检验和精准定位每日任务,致力于无人驾驶、监管等应用领域。

通过近三个月的猛烈争夺,挑战赛結果宣布出炉。每日任务一中,卡耐基梅隆高校、百度搜索和腾讯官方排序前三名;中科院声学所、重庆邮电大学和马来西亚 ForteMedia 排序每日任务二的前三名。与此同时,快手将为每一个每日任务的前两位精英团队给予丰富奖励金。本次挑战赛数据仿真模拟了 40,000 多个 3D 自然环境,给予了 2 组 Ambisonics 文件格式的 3D 音频。比赛精英团队的考试成绩根据视频语音可懂度指标值 (Short-Time Objective Intelligibility, STOI) 和英语单词准确率 (Word Error Rate, WER) 2个指标值开展综合性鉴定。

图 1:每日任务一: 语音增强比赛考试成绩

图 2:每日任务二:声源处检验及精准定位比赛考试成绩

快手音视频市场部聚集了音频行业顶级优秀人才,融合快手业务流程推动了前端优化算法的运用和落地式,深层次即时视频语音通讯、音频声效及后处理工艺、音频內容了解、音频编解码、音频硬件配置等众多行业。精英团队人员在 IEEE ICASSP、Interspeech、ACM/IEEE TALSP 等顶尖学术会和刊物上,均有发布系列产品期刊论文,并多次夺得音频挑战赛总冠军。

快手界定的「音视频」不限于界面感观,更注重「视」「听」统一的完美感受。在不一样情景中,快手音视频市场部根据将丰富多彩的音频解决工作能力与视频编辑工作能力紧密结合,全自动产生优化算法管理决策,为消费者展现真实的视听盛宴。针对前沿科技,精英团队将不断资金投入产品研发与探寻,维持领跑,以解决更加丰富多彩多元化的应用领域。

比赛官方网站:https://www.l3das.com/icassp2022/results.html

发表评论:

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。

Powered By Z-BlogPHP 1.7.3

 Theme By 优美尚品

每日搜寻全球各个角落的热点新闻,锁定小童说事网,多一点惊喜与感动!