微软模拟飞行2020,微软687亿美元收购动视暴雪

IT之家 1 月 27 日信息,怎么让 AI 语音合理效仿人们会话的丰富多彩动态性与感情,已成為全世界学者的一同考验。据微软官方信息,就在前不久,微软公司 Azure Neural TTS(神经元网络文字转语音)发布的新一代模型“Uni-TTS v4”在这里一行业获得了划时代的重大进展。在“2021 国际性语音生成比赛(Blizzard Challenge 2021)”的测验中,Uni-TTS v4 的语音主要表现与通用性数据上的当然语音对比几乎沒有显著区别,展示出足够“叫嚣”真人版会话的整体实力。

“耳听”为实,微软官方还发布了几个 TTS 和真实会话的比照,一起来体会下新模型产生的真实语音主要表现。

英文:The visualizations of the vocal quality continue in a quartet and octet.

真人录音:

Uni-TTS v4:

英语:Like other visitors, he is a believer.

真人录音:

Uni-TTS v4:

汉语:此外,也需要避开当今的地域形势风险性,等候适合的机会干预。

真人录音:

Uni-TTS v4:

客户可以在 Azure TTS 在线客服中应用自编文原本建立新的 demo。现阶段 Uni-TTS v4 可适用 TTS 语言表达库文件 7 个语系的 8 个语音,研发部门还将不断应用全新模型提升 Neural TTS 已适用的其他语言表达及其自定神经系统语音,便于能让客户根据 Azure TTS API、 Microsoft Office 和 Edge browser 立即得到更出众的新一代 TTS 语音。

官方网详细介绍,为了更好地让 TTS 在以上两层面得到提高,Uni-TTS v4 在声学材料建模中导入了二项关键升级,科学研究精英团队最先选用了一个含有 transformer 和卷积神经网络块的新构架,以能够更好地仿真模拟声学材料模型中的部分和全局性相互依赖;次之,从显性基因视角(真实身份 ID、语系 ID、声调、说话速度)和潜在性视角(语句级和语素级韵律)系统化对自变量信息内容开展建模。这种视角各自应用监督学习和无监督学习,保证端到端的声频具备充足当然的感染力。

IT之家掌握到,做为微软公司 Azure 认知能力服务项目中的强劲语音生成作用,Neural TTS 可用以协助开发人员将文字变换为真人版一般的真实当然语音,常被用以语音小助手情景、文字朗读作用,及做为辅助专用工具这些,与此同时也被融合到微软公司的 Edge Read Aloud、Immersive Reader 和 Word Read Aloud 等旗舰级设备中,还被 AT&T、Duolingo、Progressive 等诸多顾客选用。Neural TTS 已有着 330 好几个音质,适用来源于不一样国家和地区的近 130 种语言表达或家乡话。客户和公司可以利用检索“Azure TTS”进到产品网站,检测感受 Neural TTS 的丰富多彩预置语音,亦或视频录制并提交自身的样版,来建立特有的自定语音。

发表评论:

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。

Powered By Z-BlogPHP 1.7.3

 Theme By 优美尚品

每日搜寻全球各个角落的热点新闻,锁定小童说事网,多一点惊喜与感动!