9月20日-23日,2022全球制造业大会在昆明进行,交流会由工信部、国家科技部、国家商务部、国务院国资委、安徽市人民政府等共同主办。科大讯飞AI研究所执行院长、音频及语言表达信息资源管理我国工程研究中心副主任刘聪受邀参加交流会,参与“对焦元宇宙·一起向未来”为主题人工智能创新社区论坛,该论谈由安徽科学合理技术厅举办,安徽人工智能技术研究会、中国机械科技发展战略安徽省研究所筹办。
主题报告阶段,刘聪发布《用人工智能核心技术助推元宇宙持续发展》的主旨演讲,和中国科学院院士、浙大工程项目与计算机图形学研究院院长谭建荣,想到集团副总裁、上海市科学研究院毛振宇,京东副总裁、京东商城探寻科学研究院陶大程,美的数字科技(上海市)有限责任公司研发基地经理谈晟,中华医学技术高校地球上和空间教授冷伟,广州视源电子器件科技发展有限公司顶尖战略资源官、领导班子段宇,北京市的卢深视科技公司CEO户磊,三七互娱网络技术集团股份有限公司高级副总裁朱怀敏等业内医学专家、专家学者齐聚一堂,紧紧围绕元宇宙领域内的技术推动、政府决策、人才规划、产业发展规划等热门话题“伦剑”。
人工智能技术助推
元宇宙发展趋势的三大核心技术
1992年,勾勒虚拟现实技术、互联网人格特质等“未来的世界”的奇幻小说《雪崩》面世,让“元宇宙”这个概念初次闪过于大家视线。30年过去,“元宇宙”时期如期而至。
“从目前来讲,‘元宇宙’并不是单独的技术、并不是单独的产业链,更重要的是一个技术性架构”,刘聪觉得,以智能人机交互为代表人工智能技术技术,是“元宇宙”持续发展的基础支撑,人工智能三大核心技术已经助推元宇宙发展趋势:第一,根据多传感器的多模光纤感知力,第二,融合各种数据与专业知识深度逻辑思维能力,第三,跨终端页面呈现出来的多维度语言表达能力。
作为我国人工智能领域的头部企业,科大讯飞在“智能人机交互”领域内的技术提升和创新,持续开拓创新。
在认知技术层面,科大讯飞在语言等场景中的单多形式优化算法做到国际性领先地位,繁杂场景语音识别技术在全球多路语音分离和鉴别比赛CHiME中夺得三连冠,多种语言语音识别技术在NIST组织多种语言鉴别比赛时全部15个语言22项赛事所有第一。如今,科大讯飞正引领着感知智能技术领域内的科学研究场景持续进到“深水区”,图文识别、无人驾驶等技术屡次更新世界记录。
于此基础上,科大讯飞积极推动从“单多形式认知”到“多模态认知”的系统创新,在繁杂场景的认知、繁杂数据的了解等多个方面都获得了重大进展。根据多模态语音识别技术、视野检查等多模态结合技术,科大讯飞上线了“多模态免唤起交互系统”,互动回应通过率超93%之上、误叫醒率0.01%,现阶段已经在车载式场景完成定点生产。除此之外,即时图像识别技术完成了“腾空笔写”,科大讯飞视野跟踪技术完成了“目光电脑打字”,多模光纤感知算法为顾客增添了更多元、更直观、更沉浸于的交互方式。
在认识了解技术层面,科大讯飞的机器阅读理解水平持续演变,能做到先读题后解题。在2019年全世界机器阅读理解顶尖水平考试SQuAD 2.0中,科大讯飞系统软件实际效果初次超出人们平均;2017年,科大讯飞智医助理初次通过国家医师考试临床医学综合性笔试题目,并且以456分的成绩超过96.3%人类学生,让设备初次具备出任全科医师能力。
科大讯飞还“开启”了设备逻辑推理的众多新成就:2022年的CommonsenseQA 2.0常识推理争霸赛中,科大讯飞以76.06%的名次得到第一;应对特殊领域内的知识推理,科大讯飞在OpenBookQA科学合理知识推理争霸赛中更新最好成绩,变成了全球第一个超越人类平均(91.7%)的单实体模型。将人们基本常识和场景化专业知识等信息整合成“处事图普”,打造出积极交互系统,那样当面对小孩子乱扔小玩具时,AI就可坦然讲出“来收拾一下小玩具”,更具有亲切感。
在多维度表述技术层面,科大讯飞融合音质量化分析编号的视频语音特性耦合,让语音识别具有调整情绪能力。与此同时,科大讯飞还完成了语音识别的一大提升——判别分析练习,其实就是一句话人性化语音识别。在拍摄个性化的导航语音包、为虚拟人物“还原”自己的声音等行业,此项技术都大有作为、来日可期。
从2D虚拟人物到3D虚拟形象,借助本身最新自定品牌形象形成、多模态词义认知、根据词义的回应对话生成、多维度表述等技术,科大讯飞上线了根据词义围绕的多模态虚拟人物互动技术,不但可以完成虚拟人物迅速构架,还可以给予AI推动、API连接、多场景解决方法等,给予“一站式”的虚拟人物打造出服务项目。
“以虚助实”元宇宙持续发展
“以虚拟人物为依托的新一代人机交互技术,是‘元宇宙’的关键所在要求”,刘聪觉得,元宇宙不该沦落资本奴仆,要向着身心健康方向发展,理应有明确使用价值落地式规范,如根据具有真正可见的应用案例、可以产业化推广运用商品、可以用数据统计的证明应用成效三大标准来给予考量。
“面向未来的‘元宇宙’,大家要打造视觉触等多路感知融合高的沉浸于人机交互技术。”刘聪说,人工智能技术技术的不断发展,会不断提升将来“元宇宙”的感受,产生更沉浸式体验的情感体验、更多种多样的信息、更精准高效的信息获取渠道。“虚拟人物产业是‘元宇宙’落地式先峰,应当通过‘技术 服务平台’创变各种运用,为行业降低成本。”
依据Gartner技术成熟情况曲线图,10年以内,将有一大批新技术进到成熟期,成本费大幅度下降将加快元宇宙产品类别的商业化的。虚实融合是元宇宙的终极形态,刘聪觉得,元宇宙要健康发展趋势,理应坚持以关心真实世界为初衷,以虚助实,用元宇宙来服务于民生和产业发展规划。
元宇宙如何健康发展趋势?刘聪分享三点思索:
第一, 人们不可仅仅是元宇宙的参观者,更应该是实施者和设计师。
第二, 元宇宙室内空间做为技术和信息核心区,应更多的去做真实世界“需有所而不可为”的事,例如对家庭等场景的服务机器人,无法在实际场景中搭建之而面临的各种各样繁杂场景并制定对应计划方案,但是能够在虚幻世界中以模拟仿真等形式提高场景普及率,进而将网络世界中搭建的相匹配优化算法融合机器人本体构造用于真实的世界。
第三, 坚持不懈促进数字经济的创变中国实体经济,以虚助实,发展趋势元宇宙就是为了用技术去建设一个越来越美好的真实世界。
刘聪详细介绍,科大讯飞大力支持省领导干部对元宇宙行业发展趋势“积极相拥、提前谋划”的重要讲话,今后将不断探寻在适宜的场景和连接点中去拥抱元宇宙所带来的产业链机遇,用优秀技术更强创变元宇宙产业发展。
如今在具体的运用场景中,科大讯飞的虚拟人物技术赢得了愈来愈广泛应用。
例如,科大讯飞虚拟人物技术已用以线下推广资询正确引导及业务查询等工作,在全国各地四百多家网络媒体及企业机构中应用;2022北京冬奥期内,科大讯飞选用新型多种语言、多模态虚拟人物做为“智能大屏”的关键,为比赛量身定制了多种语言虚似冬奥志愿者,适用英中俄日法西6个语系的比赛、赛程安排、交通出行、文化艺术、旅游等冬奥知识互动问答和记录查询。
在2021年第五届全世界1024开发者节上,科大讯飞初次发布虚拟人物交互平台1.0,具备“多模光纤认知、感情围绕、多维度表述、独立订制”特性,面对媒体新闻、企业形象宣传、小视频生产制造、文旅产业宣传策划等场景大批量化短视频内容制造的要求,可以实现虚拟人物的视频语音、嘴唇、神情、姿势等操纵,也支持30多语种及家乡话的内容创作,针对不同形状不一样语言的虚拟人物内容创作要求。
刘聪详细介绍,科大讯飞公布运行“超脑2030方案”,让人工智能技术懂专业知识、善学习、能演变,让AI智能机器人走进千家万户。这个计划将继续打造出数字经济的中的AI虚拟人物大家族,为数字经济的、虚幻世界和“元宇宙”给予可进一步协助人们,并具有专业技能支持定制、可持续进化、有温度的等特性专业的智能机器人。
“元宇宙在教学、诊疗、工业生产等行业都是有辽阔的应用空间,但发展历程路漫漫兮,必须各方面的技术点、全产业链通力合作,非常期待与各界人士携手并肩,共同推动‘元宇宙’持续发展。”刘聪表明。