关注乐鱼智能掌握最新行业动态与资讯
当前位置:首页 >  新闻中心 >  公司新闻

乐鱼首个支持30种方言混说语音大模型发布—新闻—科学网

发布日期:2024-08-21 11:55:29 访问量:53 来源:乐鱼智能

“唔该查吓德律风费吖”“侬帮阿拉查下话费好伐?”中国电信万号智能客服天天接到几百万通德律风,此中很多是用方言拨打,尤为是一些白叟习气说方言、只会说方言,智能客服及人工客服都难以理解,沟通效率年夜打扣头。

近日,中国电信人工智能研究院(TeleAI)发布业内首个撑持30种方言自由混说的语音辨认年夜模子——星斗超多方语言音辨认年夜模子,攻破单一模子只能辨认特订单一方言的困境,可同时辨认理解粤语、上海话、湖南话、温州话等30多种方言,是海内撑持至多方言的语音辨认年夜模子。

据统计,天下仍有约20%人口未普及平凡话,他们经常被阻遏于智能信息办事以外,难以享遭到AI时代的便当。构建高品质方言数据库,是方言掩护以及研究的根蒂根基。当前,中国电信人工智能研究院已经构建超30种、超30万小时的高品质方言数据库,方言数据库于富厚性以及高品质等层面均居在业内前列。

中国电信人工智能研究院(TeleAI)对峙自立研发立异,推出了星斗语音年夜模子,经由过程超年夜范围语音预练习以及多方言结合建模,率先实现单一模子撑持30种方言自由混说语音辨认,是海内撑持至多方言、笼罩人口至多的语音年夜模子。

据中国电信首席技能官、人工智能研究院院长李学龙先容,研发团队创始“蒸馏+膨胀”结合练习算法,解决了超年夜范围多场景数据集以及年夜范围参数前提下预练习坍缩的问题,并实现1B参数80层模子不变练习。同时,星斗语音年夜模子也是业内首个开源的基在离散语音表征的语音辨认年夜模子,其经由过程“从语音到token再到文本”的建模新范式,将推理时语音传输比特率降低数十倍。

AI正于为传承言语文化注入全新生命力。方语言料收罗、记载以及归纳后,需包管能被后人准���确理解。中国幅员广宽,“百里差别俗,十里差别音”各类方语言法语音特性各不不异,传统的方言研究依靠在查询拜访者客观感知标注,人力项目量伟大且难以体系标注。而AI可以或许更高效、体系地对于方言举行收拾整顿归纳,对于方言掩护以及传承意思庞大。

星斗语音年夜模子已经广泛运用落地。据先容,星斗语音年夜模子已经于福建、江西、广西、北京、内蒙等地的中国电信万号智能客服试点运用,接入星斗年夜模子之后,万号智能客服秒懂30种方言,实现日均处置惩罚约200万通德律风;智能客服翼声平台接入星斗年夜模子的语音理解以及阐发威力,实现31省全笼罩,天天处置惩罚125万通客服德律风。此外,星斗语音年夜模子还落地多地市的12345平台。

版权声明:凡本网注明“来历:中国科学报、科学网、科学新闻杂志”的所有作品,消息网转载,请于正文上方注明来历以及作者,且不患上对于内容作本色性改动;微信公家号、头条号等新媒体平台,转载请接洽授权。邮箱:shouquan@stimes.cn。/乐鱼

Copyright © 2019 乐鱼智能技术股份有限公司.粤ICP备16017609号

粤公网安备44030402003674号