人工翻譯跟不上“洋粉絲”追國(guó)內(nèi)網(wǎng)絡(luò)小說(shuō)的速度,「推文科技」就用AI翻譯給他們看

作者:王藝瑾
時(shí)間:2018-12-07
14258
中國(guó)傳統(tǒng)文化出海這件事,念叨了很多年,但一直收效不大。反而是中國(guó)的網(wǎng)絡(luò)小說(shuō),在過(guò)去十年里,似乎不費(fèi)吹灰之力就贏得了大批海外讀者的追捧。

中國(guó)傳統(tǒng)文化出海這件事,念叨了很多年,但一直收效不大。反而是中國(guó)的網(wǎng)絡(luò)小說(shuō),在過(guò)去十年里,似乎不費(fèi)吹灰之力就贏得了大批海外讀者的追捧?!豆泶禑簟?、《誅仙》、《錦衣夜行》和《將夜》在東南亞收攬了一大波忠實(shí)讀者,《盜墓筆記》和《全職高手》也在歐美市場(chǎng)收獲了良好口碑。

根據(jù)艾瑞咨詢的《2017年中國(guó)網(wǎng)絡(luò)文學(xué)出海白皮書(shū)》,目前海外英文網(wǎng)文用戶約有700多萬(wàn),但未來(lái),東南亞、歐洲和美洲的英文網(wǎng)文的用戶規(guī)模將增加至6億左右。這無(wú)疑是一個(gè)極具潛力的市場(chǎng)。

但目前中國(guó)網(wǎng)絡(luò)文學(xué)的翻譯速度和質(zhì)量還遠(yuǎn)不能滿足這么多讀者的需求,其主要原因在于網(wǎng)絡(luò)文學(xué)版權(quán)界限模糊、翻譯人員缺失、翻譯效率低下和資金實(shí)力薄弱。為了解決翻譯人員缺乏和效率低下的痛點(diǎn),一些公司打算用人工智能做網(wǎng)文翻譯。

36氪近日接觸到的「推文科技」就是一個(gè)基于AI翻譯的海外小說(shuō)社區(qū)。該公司成立于2017年11月,今年7月研發(fā)了網(wǎng)絡(luò)文學(xué)AI翻譯系統(tǒng),根據(jù)BLEU算法的評(píng)測(cè)對(duì)比,其文學(xué)翻譯質(zhì)量超過(guò)谷歌。AI機(jī)器翻譯研發(fā)商「Atman」是推文科技的戰(zhàn)略發(fā)起股東之一,為后者提供獨(dú)家算法支持。

推文科技的CEO童铘說(shuō),中國(guó)的網(wǎng)絡(luò)小說(shuō)作家有800萬(wàn),網(wǎng)絡(luò)小說(shuō)庫(kù)存將近2000萬(wàn)部,但能出海的只有200到300部,剩下的都卡在“翻譯”這個(gè)問(wèn)題上。

雖然用AI翻譯網(wǎng)文是一件新鮮事兒,但在網(wǎng)文的人工翻譯領(lǐng)域,已經(jīng)有不少玩家。擁有大量版權(quán)庫(kù)的閱文集團(tuán)在2017年5月上線了“起點(diǎn)國(guó)際”,Wuxiaworld(武俠世界)和Gravity Tales兩家頭部的海外中國(guó)網(wǎng)文翻譯網(wǎng)站也早在2014年就已經(jīng)成立。

談及競(jìng)爭(zhēng)優(yōu)勢(shì),童铘告訴36氪,雖然這些網(wǎng)站具有先發(fā)優(yōu)勢(shì),但他們都依靠人工翻譯,而現(xiàn)在比較穩(wěn)定的人工翻譯只有近百人。與之相比,推文科技目前的AI機(jī)器能夠全自動(dòng)從全網(wǎng)監(jiān)測(cè)、抓取、翻譯和發(fā)布中文小說(shuō),無(wú)需經(jīng)過(guò)人工審校流程,使行業(yè)效率提高3600倍(翻譯1000字,人工需要1小時(shí),AI需要1秒),成本降低到原來(lái)的1/100(翻譯100萬(wàn)字,人工需要10萬(wàn)元,AI需要1000元)。

該公司稱,其網(wǎng)文平臺(tái)Babelchain在9月上線后,日均更新小說(shuō)數(shù)量位居國(guó)內(nèi)第二(僅次于起點(diǎn)國(guó)際),月活用戶5萬(wàn),連續(xù)兩個(gè)月用戶量實(shí)現(xiàn)100%增長(zhǎng)率。

2.png

Babelchain網(wǎng)頁(yè)

推文科技的COO趙嘉敏說(shuō):“人工譯者一天翻譯3000字到5000字就到頭了,但把文章丟給機(jī)器,秒出?!壁w嘉敏是譯言網(wǎng)的聯(lián)合創(chuàng)始人,也是凱文·凱利在中國(guó)的唯一出版人。他相信,未來(lái)必然是大規(guī)模的人機(jī)協(xié)同。

當(dāng)然,即使AI技術(shù)確實(shí)能提高翻譯速度和作品數(shù)量,但機(jī)器真的能保證小說(shuō)翻譯的文學(xué)性和藝術(shù)性嗎?

針對(duì)這個(gè)問(wèn)題,趙嘉敏說(shuō):“我做翻譯做了這么多年,我很清楚人工智能今天到了一個(gè)什么樣的水準(zhǔn)。打個(gè)比方說(shuō),人類譯者平均分是70分的話,今天人工智能的分?jǐn)?shù)絕對(duì)不低于70分?!?/p>

目前,推文科技要求機(jī)器翻譯做到流暢和準(zhǔn)確,但下一步是解決古詩(shī)詞翻譯“信達(dá)雅”的問(wèn)題,這需要聘請(qǐng)翻譯專家來(lái)幫助訓(xùn)練機(jī)器。近日,該公司與西湖大學(xué)前沿技術(shù)研究所張?jiān)澜淌趫F(tuán)隊(duì)簽署了獨(dú)家合作協(xié)議,在機(jī)器學(xué)習(xí)算法和自然語(yǔ)言識(shí)別領(lǐng)域開(kāi)展聯(lián)合研究。

談及網(wǎng)文需求量大的原因,童铘表示,網(wǎng)絡(luò)小說(shuō)的成癮性要比傳統(tǒng)文學(xué)強(qiáng)很多,因?yàn)槊恳徊烤W(wǎng)文通常都是200萬(wàn)字以上,娛樂(lè)性強(qiáng),而且是一個(gè)長(zhǎng)期更新連載的過(guò)程,在這個(gè)追更過(guò)程中,讀者會(huì)自動(dòng)形成社區(qū)貼吧進(jìn)行討論。

這種高粘度的閱讀習(xí)慣,也使得付費(fèi)閱讀成為平臺(tái)盈利的一種可能。目前,海外網(wǎng)文平臺(tái)大多依靠廣告、打賞和眾籌作為主要收入來(lái)源,但Babelchain還處于積累用戶的階段,全網(wǎng)免費(fèi)閱讀。

推文科技目前最大的成本在于研發(fā)。他們目前的版權(quán)合作方是免費(fèi)為其提供中文內(nèi)容,后期二者會(huì)采取版權(quán)分成形式。

談及此次創(chuàng)業(yè)是否在單純追逐人工智能的風(fēng)口,童铘說(shuō),與其說(shuō)是追逐AI,不如說(shuō)是一直等待AI技術(shù)成熟。此前,他在新華社《參考消息》擔(dān)任新媒體中心主任時(shí)就發(fā)現(xiàn),即使翻譯團(tuán)隊(duì)里有100多個(gè)極其資深的翻譯專家,也只能支撐報(bào)紙出版的需求,難以應(yīng)對(duì)新媒體轉(zhuǎn)型時(shí)對(duì)翻譯作品數(shù)量的要求。直到2016年谷歌提出神經(jīng)網(wǎng)絡(luò)算法,機(jī)器翻譯質(zhì)量大幅提升,他才找到提高翻譯效率的辦法。

推文科技曾于今年8月獲得數(shù)百萬(wàn)元人民幣的天使輪融資,目前已開(kāi)放Pre-A輪融資窗口,計(jì)劃募集150萬(wàn)-200萬(wàn)美元,用于AI機(jī)器翻譯發(fā)布網(wǎng)絡(luò)升級(jí)、出海版權(quán)庫(kù)建設(shè)、C端產(chǎn)品研發(fā)和優(yōu)化、以及海外用戶社區(qū)運(yùn)營(yíng)。該公司的最終目標(biāo),不只是讓中國(guó)的網(wǎng)絡(luò)小說(shuō)出海,而是利用AI讓好故事在全球跨語(yǔ)言傳播。


版權(quán)說(shuō)明:本文內(nèi)容來(lái)自于36氪,本站不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。文章內(nèi)容系作者個(gè)人觀點(diǎn),不代表快出海對(duì)觀點(diǎn)贊同或支持。如有侵權(quán),請(qǐng)聯(lián)系管理員(zzx@kchuhai.com)刪除!
掃碼關(guān)注
獲取更多出海資訊的相關(guān)信息
個(gè)人VIP
小程序
快出海小程序
公眾號(hào)
快出海公眾號(hào)
商務(wù)合作
商務(wù)合作
投稿采訪
投稿采訪
出海管家
出海管家