在Meta公司CEO馬克?扎克伯格口中“全世界最快的超級計算機之一”的支持下,該公司的最新人工智能模型如今能夠翻譯200種不同的語言,包括許多缺少資源、不受目前翻譯系統(tǒng)支持的語種。
該公司將此次項目命名為“不落下一門語言”(No Language Left Behind),力爭每天能在Meta公司的App之間實現(xiàn)至少250億次翻譯。
雖然如今全球已有超過7100種已知語言,但其中許多都缺少足夠的數(shù)據(jù)集,無法對人工智能開展訓(xùn)練。這些所謂的低資源語言包括埃及阿拉伯語、巴厘語、撒丁語、尼日利亞富拉語、班詩蘭語、姆班杜語等等。這些語言的使用者不少,但在互聯(lián)網(wǎng)上為數(shù)不多。
“我們所用的人工智能模型技術(shù)正在幫助這些由全球數(shù)十億人使用的語言實現(xiàn)高質(zhì)量翻譯?!盡eta公司CEO馬克?扎克伯格在Facebook上發(fā)表的一則聲明中表示。
該公司稱,該模型可以“高質(zhì)量地”翻譯55種非洲語言。
“要想感受這一項目的規(guī)模有多大,這套包含200種語言的模型有超過5000萬個參數(shù),我們用全世界最快的超級計算機之一——Research SuperCluster(RSC)對其展開了訓(xùn)練?!?/p>
“這些進展讓我們的App每天可以進行超過250億次翻譯?!?/p>
“跨語言交流正是AI的超能力之一,但隨著我們在AI方面不斷推進,我們所做的各項工作都在隨之進步,比如在Facebook和Instagram上推送最有趣的內(nèi)容、推薦相關(guān)度最高的廣告、以及確保所有用戶的服務(wù)安全性等等?!?/p>
“這意味著,這項技術(shù)的影響將遍及全球數(shù)十億人,讓他們能夠用自己的語言進行交流?!盡eta AI研究科學(xué)家瑪塔?R?科斯塔尤薩在該項目宣傳視頻中指出。
Meta AI用戶研究員艾爾?揚布拉德也表示:“這將會改變?nèi)藗兩畹姆绞健⒆錾獾姆绞?、以及受教育的方式?!宦湎乱婚T語言’項目的一切工作都以這項任務(wù)為核心,真正做到以人為本?!?/p>
為開展這一項目,這家科技巨頭首先需要對以低資源語言為母語的人士開展探索性訪談,了解他們的翻譯需求。接著研發(fā)出一套計算機模型,并利用針對低資源語言定制的數(shù)據(jù)挖掘技術(shù)收集的數(shù)據(jù)對模型開展了訓(xùn)練。
“最關(guān)鍵的是,我們用人工翻譯的基準數(shù)據(jù)集Flores-200對4萬多個翻譯方向的翻譯表現(xiàn)進行了評估。”研究團隊在解釋這套AI模型的論文摘要中指出。
研究人員還指出,該項目將涵蓋更多低資源語言,從而減少數(shù)字不平等現(xiàn)象。
“由于‘不落下一門語言’項目以減少全球數(shù)字鴻溝為宗旨,未來將有越來越多的低資源語言被納入項目范圍中。”