Meta發(fā)布新AI模型可在數(shù)十種語言間進行語音翻譯

來源：新浪科技

作者：新浪科技

時間：2023-08-24

Meta發(fā)布了一個AI模型，能夠翻譯和轉(zhuǎn)錄數(shù)十種語言的語音，為實現(xiàn)跨語言實時交流奠定了潛在基礎(chǔ)。

新浪科技訊北京時間8月23日早間消息，Meta發(fā)布了一個AI模型，能夠翻譯和轉(zhuǎn)錄數(shù)十種語言的語音，為實現(xiàn)跨語言實時交流奠定了潛在基礎(chǔ)。

該公司在一篇博文中宣稱，其SeamlessM4T模型可支持近100種語言的文本和語音翻譯，以及35種語言的語音翻譯，將以前只能在單獨的模型中提供的技術(shù)結(jié)合在一起。

Meta首席執(zhí)行官馬克·扎克伯格表示，在他的設(shè)想中，這些工具將幫助全球用戶在元宇宙實現(xiàn)實時的無障礙互動。

Meta表示將向公眾提供該模型，供非商業(yè)使用。

作為全球最大的社交媒體公司，Meta在今年發(fā)布了大量免費的基本AI模型，包括一個名為Llama的大型語言模型，該模型對OpenAI和谷歌（133.21,3.52,2.71%）銷售的專利模型構(gòu)成了嚴峻挑戰(zhàn)。

扎克伯格表示，開放的人工智能生態(tài)系統(tǒng)對Meta來說是有利的，因為相比提供收費AI模型，該公司可以通過有效的眾包方式為其社交平臺創(chuàng)建面向用戶的工具。

盡管如此，Meta也面臨著與業(yè)界其他企業(yè)類似的法律問題，這些問題都與創(chuàng)建模型時所攝取的訓(xùn)練數(shù)據(jù)有關(guān)。

今年7月，喜劇演員莎拉·西爾弗曼（Sarah Silverman）等創(chuàng)作者對Meta和OpenAI提起了版權(quán)侵權(quán)訴訟，指控這兩家公司未經(jīng)許可將他們的書籍用作訓(xùn)練數(shù)據(jù)。

對于SeamlessM4T模型，Meta公司的研究人員在一份研究論文中表示，他們從400萬小時的“原始音頻中”收集了音頻訓(xùn)練數(shù)據(jù)，原始音頻來自一個公開的網(wǎng)絡(luò)數(shù)據(jù)抓取庫，但該公司沒有具體說明是哪個庫。

Meta公司發(fā)言人也沒有回答有關(guān)音頻數(shù)據(jù)來源的問題。

研究論文稱，文本數(shù)據(jù)來自去年創(chuàng)建的數(shù)據(jù)集，這些數(shù)據(jù)集是從維基百科和相關(guān)網(wǎng)站中提取的內(nèi)容。

AI Meta

原文鏈接：點擊前往 >

版權(quán)說明：本文內(nèi)容來自于新浪科技，本站不擁有所有權(quán)，不承擔(dān)相關(guān)法律責(zé)任。文章內(nèi)容系作者個人觀點，不代表快出海對觀點贊同或支持。如有侵權(quán)，請聯(lián)系管理員（zzx@kchuhai.com）刪除！

相關(guān)文章

Facebook廣告投放轉(zhuǎn)化率低到底該怎么辦？

Meta發(fā)布新AI模型 可在數(shù)十種語言間進行語音翻譯