由于技術(shù)發(fā)展迅速,幾乎任何內(nèi)容都可以用機(jī)器翻譯(Machine Translation,MT)。即使現(xiàn)在還不能,也很快就會(huì)成為可能。
然而,大多數(shù)情況下這還不夠。讓我們看看Alconost的機(jī)器翻譯后編輯(MTPE)服務(wù)團(tuán)隊(duì)如何處理機(jī)器翻譯MT部分的。
1.首先,我們深入了解客戶項(xiàng)目的情況背景。
我們盡可能多地從客戶提供的信息中獲取信息并受益:簡介、詞匯表、術(shù)語。所有這些都有助于我們更好地了解如何為客戶提供最具成本效益的報(bào)價(jià)。
2.下一階段是對(duì)MT引擎的評(píng)估。
在此階段,我們會(huì)考慮所有可能的方法來獲得最佳的翻譯輸出。例如,引擎訓(xùn)練、神經(jīng)機(jī)器翻譯(NMT)的自適應(yīng)翻譯,以及大型語言模型(LLM)的Prompt工程。讓我們深入探討我們?cè)趯?shí)踐中使用的兩種最流行的方法。
2.1自適應(yīng)翻譯
假設(shè)客戶有一個(gè)基本的翻譯工具(或神經(jīng)機(jī)器翻譯(NMT)),可以很好地處理一般文本。但客戶希望他們的內(nèi)容符合特定標(biāo)準(zhǔn)和特定風(fēng)格。這就是我們提供的自適應(yīng)機(jī)器翻譯的情況—它會(huì)動(dòng)態(tài)調(diào)整方法。
如果客戶有任何以前的翻譯,我們將借助翻譯記憶庫為它們做好最佳利用的準(zhǔn)備。
自適應(yīng)機(jī)器翻譯能夠滿足客戶的獨(dú)特需求,學(xué)習(xí)客戶的特定術(shù)語和風(fēng)格,使翻譯更加準(zhǔn)確和一致。
2.2 Prompt工程
作為一支精通技術(shù)且了解趨勢的團(tuán)隊(duì),Alconost知道,要從LLM那里獲得高質(zhì)量的內(nèi)容,需要遵守他們的規(guī)則并提供指導(dǎo)。這需要付出努力、時(shí)間和采取多樣化的方法。LLM只喜歡并響應(yīng)被告知盡可能詳細(xì)的內(nèi)容。我們會(huì)適當(dāng)關(guān)注具體項(xiàng)目的背景,并向他們提供詳細(xì)的說明。
你可能會(huì)問,為什么不直接使用專門的AI工具或ChatGPT來實(shí)現(xiàn)這一點(diǎn)呢?
當(dāng)然可以,但很可能無法判斷質(zhì)量是否足夠好。我們將提供只有通過人力和語言專業(yè)知識(shí)才能實(shí)現(xiàn)的服務(wù)和質(zhì)量。
那么,NMT和LLM有什么不同呢?
3.與客戶就即將進(jìn)行的評(píng)估進(jìn)行的溝通可以分為三種類型
3.1默認(rèn)程序——快速評(píng)估
這是使用各種機(jī)器翻譯引擎對(duì)內(nèi)容進(jìn)行小樣本(約2000個(gè)字符)的翻譯。此外,專業(yè)翻譯人員會(huì)根據(jù)質(zhì)量和一致性對(duì)每個(gè)機(jī)器翻譯版本進(jìn)行評(píng)估。得分最高的機(jī)器翻譯引擎將被選入該項(xiàng)目。
3.2全面評(píng)估——適合尋求更深入的翻譯質(zhì)量研究的客戶
這是什么意思?根據(jù)譯員評(píng)分得出的機(jī)器翻譯的最佳結(jié)果將由專業(yè)語言學(xué)家進(jìn)行后期編輯,以創(chuàng)建最終結(jié)果(參考翻譯)。接下來,我們將其與機(jī)器翻譯進(jìn)行比較,并將數(shù)字匯總到表格中。計(jì)算指標(biāo)以選擇針對(duì)特定類型內(nèi)容和目標(biāo)語言的最佳引擎。列表包括但不限于以下指標(biāo):
TER—翻譯編輯率是一項(xiàng)基于編輯距離的自動(dòng)指標(biāo)。它衡量將機(jī)器翻譯輸出轉(zhuǎn)換為參考所需的編輯次數(shù)(插入、刪除、移位和替換)。它顯示了人類需要對(duì)機(jī)器翻譯輸出進(jìn)行多少編輯才能使其與給定的參考翻譯完全相同。
hLEPOR—是一種基于n-gram的自動(dòng)度量。它考慮了增強(qiáng)的長度懲罰、n-gram位置差異懲罰和召回率。hLEPOR是LEPOR度量的增強(qiáng)版本?;旧希琱LEPOR計(jì)算機(jī)器翻譯和文本段的參考翻譯中n-gram的相似性。
COMET—是一種用于訓(xùn)練多語言機(jī)器翻譯評(píng)估模型的神經(jīng)框架,它與人類判斷的相關(guān)性達(dá)到了新的最高水平。COMET使用來自源輸入和參考翻譯的信息來預(yù)測機(jī)器翻譯質(zhì)量。
3.3針對(duì)客戶的具體方法
我們珍惜客戶的時(shí)間。只需告訴我們對(duì)結(jié)果的偏好,我們就會(huì)接手并準(zhǔn)確交付。
總結(jié)評(píng)估過程:為您的項(xiàng)目選擇最佳的MT引擎或翻譯方法簡單且合乎邏輯:
首先,我們會(huì)對(duì)您的項(xiàng)目文本進(jìn)行抽樣,并根據(jù)您的具體情況和需求,采用不同的方法進(jìn)行翻譯。
然后,我們將翻譯結(jié)果提交給我們的翻譯人員進(jìn)行徹底的審查。
如果您同意,我們將進(jìn)行測試后編輯。我們將比較指標(biāo)和譯員的評(píng)分(如果有歧義,會(huì)與譯員溝通并澄清)——以確保我們選擇了正確的翻譯引擎。
4.翻譯過程本身
我們以評(píng)估結(jié)果為指導(dǎo)來提供翻譯,以確保提供一致、有節(jié)制、經(jīng)濟(jì)高效且高質(zhì)量的MTPE服務(wù)。
機(jī)器翻譯能否提供高質(zhì)量的內(nèi)容?
是的,但是,要實(shí)現(xiàn)這一目標(biāo),仍然需要指導(dǎo)和人類專業(yè)知識(shí)。
首先,Alconost MTPE服務(wù)的每個(gè)階段都需要人工參與。其次,這不是自動(dòng)化,而是優(yōu)化和提高專業(yè)語言學(xué)家的工作效率。第三,人類在決定翻譯質(zhì)量以及為其添加人性化和專業(yè)知識(shí)方面擁有最終決定權(quán)。
我們的機(jī)器翻譯后編輯(MTPE)服務(wù)分為不同套餐:
-原始MT
-輕度譯后編輯
-全面譯后編輯
-定制場景