IT之家 5月23日消息,Meta公司推出了Massively Multilingual Speech(MMS)項目,為1100多種語言提供了先進的語言轉文本、文本轉語音服務,且支持將近4000多種未標記的口語。
Meta為MMS項目整合了自我監(jiān)督學習工作wav2vec 2.0和一個新的數(shù)據(jù)集,通過實測發(fā)現(xiàn)MMS優(yōu)于現(xiàn)有模型,且支持的語言數(shù)量是其10倍。
Meta創(chuàng)造這項成就的關鍵在于引入了龐大的音頻數(shù)據(jù)集,其中包含1100多種新約圣經(jīng)(New Testament)的朗讀內容。Meta表示整合該音頻數(shù)據(jù)集之后所產(chǎn)生的語音模型在男性和女性聲音中表現(xiàn)同樣出色。