IT之家 5月23日消息,Meta公司推出了Massively Multilingual Speech(MMS)項目,為1100多種語言提供了先進(jìn)的語言轉(zhuǎn)文本、文本轉(zhuǎn)語音服務(wù),且支持將近4000多種未標(biāo)記的口語。
Meta為MMS項目整合了自我監(jiān)督學(xué)習(xí)工作wav2vec 2.0和一個新的數(shù)據(jù)集,通過實測發(fā)現(xiàn)MMS優(yōu)于現(xiàn)有模型,且支持的語言數(shù)量是其10倍。
Meta創(chuàng)造這項成就的關(guān)鍵在于引入了龐大的音頻數(shù)據(jù)集,其中包含1100多種新約圣經(jīng)(New Testament)的朗讀內(nèi)容。Meta表示整合該音頻數(shù)據(jù)集之后所產(chǎn)生的語音模型在男性和女性聲音中表現(xiàn)同樣出色。