人工智能自動翻譯系統(tǒng)發(fā)展都是,效果已經(jīng)越來越好,不過目前的技術(shù)仍然是基于文本來進(jìn)行翻譯,并非直接通過語音進(jìn)行。最近Meta就開發(fā)出無文本翻譯系統(tǒng),就算沒有標(biāo)準(zhǔn)的文本書寫系統(tǒng),也仍然可以訓(xùn)練AI模型。
Meta表示,新推出的“通用語言翻譯工具”(Universal Speech Translator,UST)是全世界首個(gè)人工智能“口語對口語”翻譯系統(tǒng),可以對應(yīng)沒有標(biāo)準(zhǔn)書寫系統(tǒng)以及缺乏專業(yè)翻譯人員的語言,直接進(jìn)行翻譯。
(1/3)Until now,AI translation has focused mainly on written languages.Universal Speech Translator(UST)is the 1st AI-powered speech-to-speech translation system for a primarily oral language,translating Hokkien,one of many primarily spoken languages.https://t.co/onYKQ8uoKNpic.twitter.com/Iy8MRMOypQ
—Meta AI(@MetaAI)October 19,2022
他們首個(gè)應(yīng)用這個(gè)技術(shù)的語言,就選擇了臺語(閩南語)和英語的組合,系統(tǒng)已經(jīng)可以對于兩個(gè)語言之間的對話進(jìn)行自動翻譯和發(fā)音,Mark Zuckerberg更親自示范這個(gè)技術(shù)。Meta表示,對于這種口耳相傳的語言,在收集資料、設(shè)計(jì)模型和評估準(zhǔn)確度的時(shí)候相當(dāng)困難,需要首先利用“語音探勘”技術(shù)分析語音,然后配對閩南語和中文,再翻譯到英文增加到訓(xùn)練數(shù)據(jù)庫,中間也加入自己的拼音系統(tǒng)來評估準(zhǔn)確度。Meta表示未來這個(gè)技術(shù)可以擴(kuò)展到其他語言,也將會公開“大型語音翻譯語料庫”(LASER)讓其他研究人員使用。