97豆奶视频国产-а的天堂网最新版在线-成人理论片-国产免费午夜福利片在线-中国主播福利在线观看

97豆奶视频国产-а的天堂网最新版在线-成人理论片-国产免费午夜福利片在线-中国主播福利在线观看

語(yu)種
中文簡體 中(zhong)文(wen)繁體(ti) English
營業廳
網上營業廳 掌上(shang)營業(ye)廳
返(fan)回頂部
首個支持30種方言混說語音大模型發布!中國電信人工智能研究院用AI守護方言
2024-05-25 中國電信
分享:
   

“唔(wu)該查(cha)嚇電話(hua)費吖”“儂幫(bang)阿拉查(cha)下(xia)話(hua)費好伐?”粵語、上海話(hua)、四川話(hua)······中(zhong)國(guo)電信萬(wan)號(hao)智(zhi)能(neng)客(ke)服(fu)每天接(jie)到幾(ji)百萬(wan)通(tong)電話(hua),其中(zhong)很大比例用方言(yan)撥打(da),尤其是(shi)“老(lao)少邊(bian)窮”地區,一些老(lao)人習慣(guan)說方言(yan),甚至只會說方言(yan),智(zhi)能(neng)客(ke)服(fu)及人工客(ke)服(fu)都難(nan)以理解,溝通(tong)效率(lv)難(nan)免(mian)大打(da)折扣。據統計,全(quan)國(guo)仍(reng)有約20%人口未普(pu)及普(pu)通(tong)話(hua),他們(men)常常被隔絕在智(zhi)能(neng)信息服(fu)務之外,難(nan)以享受到AI時代的便利。

近日(ri),中國電信(xin)人(ren)工(gong)智(zhi)(zhi)能(neng)研究院(TeleAI)發布業內(nei)首個(ge)支持30種方言自(zi)由混說的(de)(de)(de)(de)語(yu)音識(shi)(shi)(shi)別大(da)模型(xing)(xing)——星(xing)辰超多(duo)方言語(yu)音識(shi)(shi)(shi)別大(da)模型(xing)(xing),打破單一模型(xing)(xing)只能(neng)識(shi)(shi)(shi)別特定(ding)單一方言的(de)(de)(de)(de)困(kun)境,可同時識(shi)(shi)(shi)別理解粵(yue)語(yu)、上海(hai)話、四(si)川話、溫州(zhou)話等30多(duo)種方言,是國內(nei)支持最(zui)多(duo)方言的(de)(de)(de)(de)語(yu)音識(shi)(shi)(shi)別大(da)模型(xing)(xing)。中國電信(xin)人(ren)工(gong)智(zhi)(zhi)能(neng)研究院用最(zui)前(qian)沿的(de)(de)(de)(de)語(yu)音識(shi)(shi)(shi)別技術(shu),讓(rang)溝通(tong)更加自(zi)然流(liu)暢(chang),極大(da)解決老年人(ren)及“老少邊窮”地(di)區人(ren)們的(de)(de)(de)(de)信(xin)息(xi)服(fu)務無法(fa)觸達的(de)(de)(de)(de)問題,為人(ren)們搭建一條(tiao)通(tong)往AI時代的(de)(de)(de)(de)溝通(tong)橋梁。

用AI守護方言,讓語言文化煥發生命力

方言(yan)是中(zhong)(zhong)國(guo)文化(hua)多(duo)樣性(xing)的(de)瑰寶,傳承(cheng)豐富(fu)的(de)歷(li)史文化(hua)內涵;方言(yan)也是不同(tong)區(qu)域(yu)文化(hua)的(de)靈魂,凝聚人(ren)們鄉(xiang)情的(de)根源,具有豐富(fu)的(de)人(ren)文價值。然而,很多(duo)方言(yan)卻在社會經濟快速發(fa)展中(zhong)(zhong)不斷消亡,保護方言(yan)傳承(cheng)語言(yan)文化(hua)已迫在眉睫。

AI正在為傳承語(yu)言(yan)(yan)文化注(zhu)入全新生命力(li)。方(fang)言(yan)(yan)語(yu)料采集、記(ji)錄和歸納后,需保(bao)證能被后人正確理解。中國幅(fu)員遼闊(kuo),“百里(li)不(bu)同(tong)俗,十里(li)不(bu)同(tong)音”各(ge)(ge)種方(fang)言(yan)(yan)語(yu)法(fa)語(yu)音特征各(ge)(ge)不(bu)相同(tong),傳統(tong)的方(fang)言(yan)(yan)研究依賴于調查者主觀(guan)感知標(biao)注(zhu),人力(li)工程量巨大(da)且難以系統(tong)標(biao)注(zhu)。而(er)AI能夠更高(gao)效、系統(tong)地對(dui)方(fang)言(yan)(yan)進(jin)行整理歸納,對(dui)方(fang)言(yan)(yan)保(bao)護和傳承意義重大(da)。

構建高(gao)(gao)質(zhi)量方言(yan)數(shu)(shu)據(ju)庫,是(shi)方言(yan)保護(hu)和(he)(he)研究的基礎。當前(qian)(qian),中(zhong)國(guo)電(dian)信人(ren)工智能研究院已構建超30種,超30萬小時的高(gao)(gao)質(zhi)量方言(yan)數(shu)(shu)據(ju)庫,方言(yan)數(shu)(shu)據(ju)庫在(zai)豐富性和(he)(he)高(gao)(gao)質(zhi)量等(deng)層面(mian)均居于(yu)業內(nei)前(qian)(qian)列。

中國電信人(ren)工(gong)智能研(yan)(yan)(yan)究院(TeleAI)堅持自主研(yan)(yan)(yan)發(fa)創新,在(zai)中國電信CTO、人(ren)工(gong)智能研(yan)(yan)(yan)究院院長李(li)學龍帶領(ling)下,推出了星辰(chen)語(yu)音(yin)(yin)大(da)(da)模(mo)(mo)(mo)型(xing)(xing),通過超大(da)(da)規(gui)模(mo)(mo)(mo)語(yu)音(yin)(yin)預訓練和多(duo)方(fang)言聯合(he)建模(mo)(mo)(mo),率先(xian)實現單一(yi)模(mo)(mo)(mo)型(xing)(xing)支持30種方(fang)言自由混說語(yu)音(yin)(yin)識別,是國內支持最(zui)(zui)多(duo)方(fang)言、覆蓋人(ren)口最(zui)(zui)多(duo)的(de)(de)語(yu)音(yin)(yin)大(da)(da)模(mo)(mo)(mo)型(xing)(xing);研(yan)(yan)(yan)發(fa)團隊首(shou)創“蒸餾+膨脹(zhang)”聯合(he)訓練算法,解決超大(da)(da)規(gui)模(mo)(mo)(mo)多(duo)場景(jing)數據集和大(da)(da)規(gui)模(mo)(mo)(mo)參數條件下,預訓練坍縮的(de)(de)問(wen)題,實現1B參數80層模(mo)(mo)(mo)型(xing)(xing)穩定訓練;星辰(chen)語(yu)音(yin)(yin)大(da)(da)模(mo)(mo)(mo)型(xing)(xing)也是業內首(shou)個開源的(de)(de)基于離散語(yu)音(yin)(yin)表征(zheng)的(de)(de)語(yu)音(yin)(yin)識別大(da)(da)模(mo)(mo)(mo)型(xing)(xing),通過“從語(yu)音(yin)(yin)到(dao)token再到(dao)文本”的(de)(de)建模(mo)(mo)(mo)新范式,將推理(li)時語(yu)音(yin)(yin)傳輸比特率降(jiang)低數十倍。

星辰(chen)語音(yin)(yin)(yin)大(da)模(mo)(mo)型(xing)以絕對(dui)領先的性能(neng),斬(zhan)獲多(duo)(duo)個(ge)國(guo)(guo)(guo)(guo)際權威賽(sai)事冠軍。在(zai)權威國(guo)(guo)(guo)(guo)際語音(yin)(yin)(yin)頂會INTERSPEECH2024離散語音(yin)(yin)(yin)單元建模(mo)(mo)挑(tiao)戰賽(sai)上(shang),憑借星辰(chen)語音(yin)(yin)(yin)識別大(da)模(mo)(mo)型(xing)的領先技術,中國(guo)(guo)(guo)(guo)電信人工智能(neng)研究院(yuan)語音(yin)(yin)(yin)團隊斬(zhan)獲語音(yin)(yin)(yin)識別賽(sai)道(dao)(dao)冠軍。在(zai)業(ye)內(nei)知(zhi)名的多(duo)(duo)方言語音(yin)(yin)(yin)識別數(shu)據集KeSpeech任務上(shang),星辰(chen)語音(yin)(yin)(yin)大(da)模(mo)(mo)型(xing)打破紀(ji)(ji)錄(lu),領先之(zhi)前最優結(jie)果(guo)20%,以高(gao)達92.97%的準確(que)率刷(shua)新最優結(jie)果(guo)。同(tong)時在(zai)NIST(美國(guo)(guo)(guo)(guo)國(guo)(guo)(guo)(guo)家(jia)標準與技術研究院(yuan))組(zu)織的Babel低資(zi)源語音(yin)(yin)(yin)識別項目(mu)電話粵(yue)語賽(sai)道(dao)(dao)上(shang),刷(shua)新紀(ji)(ji)錄(lu)取得目(mu)前業(ye)內(nei)最好成績。極佳的性能(neng)保(bao)證用戶與星辰(chen)語音(yin)(yin)(yin)大(da)模(mo)(mo)型(xing)對(dui)話,無需刻意切換(huan)普通話,也(ye)無需提高(gao)音(yin)(yin)(yin)量放慢語速,可以像和家(jia)人講(jiang)話一樣自然(ran)地(di)暢所欲(yu)言。

勇擔央企使命,中國電信搭建AI時代溝通橋梁

隨著AI技(ji)(ji)術(shu)高速(su)發展,人(ren)(ren)(ren)們享(xiang)受著智能(neng)化(hua)、無(wu)人(ren)(ren)(ren)化(hua)服務(wu)的便利。然(ran)而,“老少邊窮(qiong)”地(di)(di)區及很多老人(ren)(ren)(ren),由于方言限制,正逐漸被AI時代(dai)拋棄。中國電信(xin)(xin)堅(jian)定地(di)(di)承擔央企責任(ren),用AI搭建溝通的橋梁,讓每一個(ge)人(ren)(ren)(ren)都能(neng)享(xiang)受AI時代(dai)便利。同時,中國電信(xin)(xin)有幾億(yi)用戶和豐富應用場(chang)景,天然(ran)具(ju)備數(shu)據飛輪飛速(su)轉動的優(you)勢,無(wu)疑(yi)將促進(jin)技(ji)(ji)術(shu)更(geng)快進(jin)步,更(geng)好地(di)(di)服務(wu)每一個(ge)人(ren)(ren)(ren)。

據悉,星(xing)辰(chen)語(yu)音大(da)模(mo)(mo)型已(yi)廣(guang)泛應用落地(di)(di)。星(xing)辰(chen)語(yu)音大(da)模(mo)(mo)型已(yi)在福建、江西、廣(guang)西、北京、內蒙(meng)古(gu)等(deng)地(di)(di)的中國電(dian)(dian)信萬(wan)號智能(neng)客(ke)服(fu)試點應用,接入星(xing)辰(chen)大(da)模(mo)(mo)型以后,萬(wan)號智能(neng)客(ke)服(fu)秒(miao)懂30種方言(yan),自(zi)(zi)然流暢地(di)(di)服(fu)務用戶,實現(xian)日(ri)均處(chu)理(li)約200萬(wan)通(tong)(tong)電(dian)(dian)話;智能(neng)客(ke)服(fu)翼聲平(ping)臺接入星(xing)辰(chen)大(da)模(mo)(mo)型的語(yu)音理(li)解和分析能(neng)力,實現(xian)31省份全覆(fu)蓋,每天處(chu)理(li)125萬(wan)通(tong)(tong)客(ke)服(fu)電(dian)(dian)話。此外,星(xing)辰(chen)語(yu)音大(da)模(mo)(mo)型還落地(di)(di)多(duo)地(di)(di)市(shi)的12345平(ping)臺,賦能(neng)客(ke)服(fu)人員秒(miao)懂30種方言(yan),更(geng)自(zi)(zi)然流暢理(li)解更(geng)多(duo)市(shi)民(min)需求,提(ti)升(sheng)溝通(tong)(tong)效(xiao)率(lv),助力政務工作智能(neng)化升(sheng)級,更(geng)高效(xiao)、便捷地(di)(di)為每一位市(shi)民(min)提(ti)供服(fu)務。

在(zai)中國(guo)國(guo)際大數(shu)(shu)據產業博覽(lan)會上,星(xing)辰語音(yin)大模型讓數(shu)(shu)字人“能聽(ting)會說”,數(shu)(shu)字人“數(shu)(shu)數(shu)(shu)”,聲音(yin)甜美生動,與康輝(hui)同臺主持(chi),中英(ying)文隨意切換,交流(liu)對話自然流(liu)暢(chang),廣(guang)受(shou)好評(ping)。

星辰語(yu)(yu)(yu)音大模(mo)型(xing)現已對外開(kai)源,攜手(shou)合作伙伴及個(ge)人開(kai)發者(zhe),開(kai)發面向更多(duo)場(chang)景的(de)應用,共同守護方(fang)言(yan)、傳承語(yu)(yu)(yu)言(yan)文化,助力AI普惠(hui)。未來,中國電信(xin)人工智能(neng)研究院將持續(xu)深(shen)耕研發創新,不(bu)斷提高支持方(fang)言(yan)的(de)數量和準確度,計劃建成首個(ge)覆蓋(gai)全國333個(ge)地市(shi)方(fang)言(yan)和主要(yao)少數民族語(yu)(yu)(yu)言(yan)的(de)語(yu)(yu)(yu)音識別大模(mo)型(xing),切實讓“老少邊窮”、老年人等群體都能(neng)享受到AI時代的(de)便(bian)利(li)。

掃一掃在手機打開當前頁