從商業(yè)問(wèn)題到落地應(yīng)用，Line靠六階段方法論打造ML應(yīng)用

來(lái)源：十輪網(wǎng)

作者：十輪網(wǎng)

時(shí)間：2024-11-03

每一項(xiàng)ML系統(tǒng)，都是因一個(gè)商業(yè)問(wèn)題而存在，這正是Line購(gòu)物大力擁抱AI的目標(biāo)，他們最關(guān)鍵的商業(yè)問(wèn)題是提升銷售額，而機(jī)器學(xué)習(xí)團(tuán)隊(duì)的任務(wù)，就是想辦法用ML來(lái)提高銷售額。

不過(guò)，從商業(yè)問(wèn)題出發(fā)，到落地成為一支AI應(yīng)用，Line開(kāi)發(fā)團(tuán)隊(duì)有一套自己的方法論，這是一套涵蓋了整個(gè)機(jī)器學(xué)習(xí)（ML）生命周期的開(kāi)發(fā)流程，從定義問(wèn)題、將問(wèn)題轉(zhuǎn)為ML問(wèn)題、建模、執(zhí)行AB測(cè)試、評(píng)估和決策等環(huán)節(jié)。

用ML方法解決商業(yè)問(wèn)題

Line機(jī)器學(xué)習(xí)工程師黃昱睿指出，團(tuán)隊(duì)接到商業(yè)需求時(shí)，先從定義問(wèn)題開(kāi)始，以提升銷售額的需求為例，考量了設(shè)計(jì)新產(chǎn)品、推行折價(jià)券和提高用戶體驗(yàn)等3種實(shí)現(xiàn)策略，最終選擇ML可行性最高的第三種。

那么，如何利用ML方法，來(lái)兼顧獲利（即訂單成交量）與用戶體驗(yàn)，開(kāi)發(fā)團(tuán)隊(duì)從Line購(gòu)物用戶旅程找切入點(diǎn)。由于Line購(gòu)物屬于導(dǎo)購(gòu)平臺(tái)，專門(mén)提供商品、文章等頁(yè)面，來(lái)引導(dǎo)顧客到商品店家平臺(tái)，同時(shí)在過(guò)程中提供點(diǎn)數(shù)優(yōu)惠或反饋，因此用戶購(gòu)物旅程會(huì)經(jīng)歷：頁(yè)面瀏覽、點(diǎn)擊有興趣的商品／商店／文章、頁(yè)面跳轉(zhuǎn)至商家商品、最終下單。

在這段旅程中，Line鎖定下單前的“點(diǎn)擊有興趣商品”，作為ML問(wèn)題切入點(diǎn)。也就是說(shuō)，Line要預(yù)測(cè)用戶有興趣的商品，并在對(duì)的時(shí)間推薦給他們，來(lái)提高點(diǎn)擊率。

為進(jìn)一步將這個(gè)概念轉(zhuǎn)換為可行的ML方法，Line團(tuán)隊(duì)先進(jìn)行2個(gè)數(shù)據(jù)面分析。首先是推薦時(shí)間點(diǎn)，若鎖定用戶操作“當(dāng)下”想購(gòu)買的商品，就得依據(jù)用戶過(guò)去購(gòu)買的數(shù)據(jù)來(lái)訓(xùn)練模型，好讓模型預(yù)測(cè)有興趣的商品。但這類數(shù)據(jù)量少，會(huì)造成模型過(guò)度學(xué)習(xí)，進(jìn)而影響推薦效果和用戶體驗(yàn)。

另一個(gè)考量是，模型要根據(jù)點(diǎn)擊次數(shù)來(lái)推薦商品，還是用戶“會(huì)點(diǎn)擊”的商品來(lái)推薦？也就是說(shuō)，這個(gè)推薦模型該采用回歸模型，還是分類模型。

“我們最后選擇分類模型，”黃昱睿解釋，電商場(chǎng)景中，通常有群重度用戶，他們的熱門(mén)商品點(diǎn)擊率和消費(fèi)額遠(yuǎn)大于一般用戶，因此以點(diǎn)擊次數(shù)來(lái)推薦商品，就會(huì)過(guò)于偏頗。

于是，團(tuán)隊(duì)將ML問(wèn)題調(diào)整為“用戶未來(lái)幾天會(huì)點(diǎn)擊的商品”，不僅能解決因數(shù)據(jù)稀疏、模型過(guò)度學(xué)習(xí)的問(wèn)題，還能提前秀出用戶想要的商品，優(yōu)化用戶體驗(yàn)。

這就是Line團(tuán)隊(duì)將商業(yè)問(wèn)題，轉(zhuǎn)換為ML問(wèn)題的過(guò)程。

建模靠5步驟，完成還得不斷迭代

有了ML問(wèn)題，接下來(lái)就是建模。建模一般有5個(gè)步驟，包括特征工程、集成模型數(shù)據(jù)、模型訓(xùn)練、模型推論，以及脫機(jī)評(píng)估。

在特征工程階段，Line認(rèn)為，頁(yè)面瀏覽、點(diǎn)擊和下單這類用戶行為，是決定點(diǎn)擊購(gòu)買商品的關(guān)鍵。但光有這些特征還不夠，還得與其他特征做交叉群組計(jì)算，比如，年齡30歲至40歲點(diǎn)擊網(wǎng)站的次數(shù)，交叉比對(duì)年齡30歲至40歲且是男性、點(diǎn)擊該網(wǎng)站的次數(shù)，又或是再交叉比對(duì)其他屬性。

多了這些資訊，就能協(xié)助團(tuán)隊(duì)更準(zhǔn)確觀察，用戶在特定時(shí)間是否會(huì)點(diǎn)擊該商品。尤其，黃昱睿點(diǎn)出，這種交叉計(jì)算資訊，可以補(bǔ)足同一個(gè)特征未必持續(xù)有效的缺陷。完成特征工程后，就可以進(jìn)行模型數(shù)據(jù)的集成，準(zhǔn)備進(jìn)入訓(xùn)練模型的階段。

不同模型的訓(xùn)練方式各有不同，但黃昱睿點(diǎn)出，模型訓(xùn)練有2個(gè)常見(jiàn)要點(diǎn)，包括各項(xiàng)指標(biāo)需與基準(zhǔn)相比，以及比較多組模型成效。其中，這個(gè)基準(zhǔn)可以是人工方法，也可以是傳統(tǒng)統(tǒng)計(jì)方法，ML工程師得觀察采用模型后，指標(biāo)表現(xiàn)是否逐步提升。

在推論部分，因Line購(gòu)物推薦模型，主要比對(duì)用戶嵌入矢量和商品嵌入矢量的相關(guān)性來(lái)推薦，進(jìn)行推論時(shí)得同時(shí)考慮矢量大小和推論時(shí)間。

“矢量小、維度低，數(shù)據(jù)量少，推論速度快，”黃昱睿解釋，矢量大則相反，因此如何拿捏矢量大小與推論時(shí)間，得看應(yīng)用場(chǎng)景和準(zhǔn)確度等其他數(shù)據(jù)來(lái)決定。

最后則是脫機(jī)評(píng)估，就像是模型的“模擬考”，來(lái)確認(rèn)模型學(xué)習(xí)成效，以及是否太貼近訓(xùn)練數(shù)據(jù)、難以應(yīng)對(duì)新資訊等問(wèn)題。

這就是Line購(gòu)物推薦模型的建模5步驟。不過(guò)，一套模型得要多次執(zhí)行這些步驟、不斷迭代，才能達(dá)到真正可用程度。因此黃昱睿表示，善用YAML配置文件輔助，可加速這個(gè)過(guò)程，節(jié)省工程師手動(dòng)設(shè)置時(shí)間。

AB測(cè)試有4要點(diǎn)

接下來(lái)就是AB測(cè)試環(huán)節(jié)。在這個(gè)階段，Line團(tuán)隊(duì)會(huì)將模型新做法和舊做法分為實(shí)驗(yàn)組和對(duì)照組，來(lái)處理用戶或?yàn)g覽記錄資訊，比較兩種做法的推薦成效。

黃昱睿提醒有4個(gè)AB測(cè)試的基本概念，包括用戶要均勻分布，如隨機(jī)分組就是一種方法。再來(lái)，在同個(gè)實(shí)驗(yàn)中，用戶組別要固定，比如在一段時(shí)間內(nèi)，登錄網(wǎng)站的同一位用戶，都要固定在A組。

第三，若同個(gè)實(shí)驗(yàn)中，實(shí)驗(yàn)比率增加，如實(shí)驗(yàn)范圍從10%擴(kuò)大至20%時(shí)，實(shí)驗(yàn)組的成員不變，即不能重新分組。最后，由于推薦系統(tǒng)屬于線上應(yīng)用場(chǎng)景，因此測(cè)試時(shí)，要確保API也能高效率執(zhí)行。

每次AB測(cè)試時(shí)，Line還會(huì)為每次輸入的瀏覽記錄，粘貼一個(gè)標(biāo)簽（Tag），存儲(chǔ)至數(shù)據(jù)庫(kù)后，可進(jìn)行后續(xù)分析。同理，他們也會(huì)在每次的瀏覽記錄中，加入一些資訊，比如這次實(shí)驗(yàn)的唯一代碼，方便后續(xù)做不同實(shí)驗(yàn)的比較。

評(píng)估帶來(lái)的ML反思

有了實(shí)驗(yàn)組和對(duì)照組后，就進(jìn)入黃昱睿認(rèn)為ML生命周期中“最重要的”階段：評(píng)估。在這個(gè)階段，Line關(guān)注的評(píng)估指標(biāo)有ML指標(biāo)和商業(yè)指標(biāo)，如ML的精確度、平均排名倒數(shù)，或是商業(yè)的點(diǎn)擊率、轉(zhuǎn)化率、交易轉(zhuǎn)量等，不僅能讓非技術(shù)的高層主管理解ML效益，也能衡量ML是否解決了商業(yè)問(wèn)題。

黃昱睿接著說(shuō)明，要是評(píng)估發(fā)現(xiàn)ML指標(biāo)表現(xiàn)亮眼，但商業(yè)指標(biāo)沒(méi)有起色，這可能意味著，“原本定義的ML問(wèn)題，沒(méi)有打中要害?！?/p>

他以自己多年前的一項(xiàng)Email營(yíng)銷項(xiàng)目為例，他與團(tuán)隊(duì)打造一套ML模型，來(lái)預(yù)測(cè)用戶是否點(diǎn)擊Email內(nèi)容。

當(dāng)時(shí)評(píng)估發(fā)現(xiàn)，模型預(yù)測(cè)精確度很高，但購(gòu)買率還是很低。這是因?yàn)?，?dāng)初團(tuán)隊(duì)開(kāi)發(fā)模型，只考量用戶是否點(diǎn)擊，并未納入后續(xù)的購(gòu)買、成交等消費(fèi)行為，這時(shí)就得回過(guò)頭去定義問(wèn)題。

不只如此，黃昱睿在后來(lái)一次次的評(píng)估中，觀察到推薦模型的特征相關(guān)性，與原本想象的特征，有很大的不同。

Line購(gòu)物推薦模型是用來(lái)預(yù)測(cè)用戶會(huì)點(diǎn)擊的商品，照常理來(lái)說(shuō)，點(diǎn)擊行為應(yīng)該是推薦成功與否，最相關(guān)的特征。但他后來(lái)發(fā)現(xiàn)，并非如此，因?yàn)辄c(diǎn)擊并不是用戶完全主動(dòng)的行為，而是網(wǎng)站先呈現(xiàn)內(nèi)容，用戶才能點(diǎn)擊?！爸鲃?dòng)搜索，才是相關(guān)性最高的特征?！彼寡?。也因此，Line后來(lái)強(qiáng)化購(gòu)物推薦模型時(shí)，打算納入更多與搜索相關(guān)的特征。

黃昱睿建議，開(kāi)發(fā)者在構(gòu)建推薦模型前，可先分析主動(dòng)事件和被動(dòng)事件，再找尋相關(guān)特征，如此打造的推薦模型，效果會(huì)更好。

上線后需監(jiān)控ML性能與商業(yè)指標(biāo)

推薦模型經(jīng)評(píng)估可行、正式部署上線后，Line團(tuán)隊(duì)還有套監(jiān)控機(jī)制，時(shí)時(shí)把關(guān)模型性能。

監(jiān)控指標(biāo)不只有特征、ML性能指標(biāo)，還要有商業(yè)指標(biāo)，比如訂單量、點(diǎn)擊率，才能找出問(wèn)題和改進(jìn)方法。比如，用戶每天的商品點(diǎn)擊率遞減，團(tuán)隊(duì)可從該商業(yè)指標(biāo)發(fā)現(xiàn)問(wèn)題，順藤摸瓜找出推薦模型性能逐退下降原因，介入調(diào)整。

黃昱睿點(diǎn)出，理想的推薦系統(tǒng)生命周期，應(yīng)該由ML工程師和產(chǎn)品負(fù)責(zé)人一起合作維護(hù)。“有時(shí)候推薦效果不好，不只是推薦的原因，”他舉例，曾經(jīng)做過(guò)流失分析，就算對(duì)流失用戶發(fā)送優(yōu)惠券，用戶仍不買單。這時(shí)，就需要ML工程師與產(chǎn)品負(fù)責(zé)人共同討論，比如重新設(shè)計(jì)或重新建模，來(lái)提高推薦成功率。

“最理想的狀況是，工程師、產(chǎn)品負(fù)責(zé)人，甚至是企業(yè)中更多組織加入這整個(gè)ML生命周期，就能做出更完整的產(chǎn)品或服務(wù)，”他總結(jié)。

Line

上一篇：從MLOps到LLMOps，Line臺(tái)灣提示工程管理有一套

原文鏈接：點(diǎn)擊前往 >

版權(quán)說(shuō)明：本文內(nèi)容來(lái)自于十輪網(wǎng)，本站不擁有所有權(quán)，不承擔(dān)相關(guān)法律責(zé)任。文章內(nèi)容系作者個(gè)人觀點(diǎn)，不代表快出海對(duì)觀點(diǎn)贊同或支持。如有侵權(quán)，請(qǐng)聯(lián)系管理員（zzx@kchuhai.com）刪除！

相關(guān)文章