支持1100種語言文本、語音互轉(zhuǎn),Meta推出開源AI項目MMS

來源:IT之家
作者:故淵
時間:2023-05-23
1566
Meta公司推出了Massively Multilingual Speech(MMS)項目,為1100多種語言提供了先進(jìn)的語言轉(zhuǎn)文本、文本轉(zhuǎn)語音服務(wù),且支持將近4000多種未標(biāo)記的口語。

IT之家 5月23日消息,Meta公司推出了Massively Multilingual Speech(MMS)項目,為1100多種語言提供了先進(jìn)的語言轉(zhuǎn)文本、文本轉(zhuǎn)語音服務(wù),且支持將近4000多種未標(biāo)記的口語。

d66c8fe0-d7e6-4231-843e-7a16d70d335e.webp.jpgf76b8448-de46-47a8-b131-63c8ae8e9bb6.webp.jpg7aa64b5e-bbc7-423e-a17f-f1f15caf44a7.webp.jpg2ca22cc2-8cf6-4c62-a879-9e4c8ff0eb0d.webp.jpg

Meta為MMS項目整合了自我監(jiān)督學(xué)習(xí)工作wav2vec 2.0和一個新的數(shù)據(jù)集,通過實測發(fā)現(xiàn)MMS優(yōu)于現(xiàn)有模型,且支持的語言數(shù)量是其10倍。

Meta創(chuàng)造這項成就的關(guān)鍵在于引入了龐大的音頻數(shù)據(jù)集,其中包含1100多種新約圣經(jīng)(New Testament)的朗讀內(nèi)容。Meta表示整合該音頻數(shù)據(jù)集之后所產(chǎn)生的語音模型在男性和女性聲音中表現(xiàn)同樣出色。

立即登錄,閱讀全文
原文鏈接:點擊前往 >
版權(quán)說明:本文內(nèi)容來自于IT之家,本站不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。文章內(nèi)容系作者個人觀點,不代表快出海對觀點贊同或支持。如有侵權(quán),請聯(lián)系管理員(zzx@kchuhai.com)刪除!
優(yōu)質(zhì)服務(wù)商推薦
更多
個人VIP