微軟、亞馬遜、臉書(shū)如何靠AB測(cè)試創(chuàng)收上億美金?

來(lái)源:全球贏
作者:MarTechApe
時(shí)間:2020-08-11
3312
時(shí)至今日,Microsoft,Amazon,Booking.com,F(xiàn)acebook,和Google,這樣的大體量互聯(lián)網(wǎng)公司每年進(jìn)行的實(shí)驗(yàn)高達(dá)上萬(wàn)個(gè),測(cè)試幾百萬(wàn)用戶的行為。

2012年,微軟的一位Bing的工程師想改變廣告標(biāo)題在Bing的搜索結(jié)果中的展現(xiàn)方式。實(shí)現(xiàn)這個(gè)想法只需要幾行代碼,但是它被淹沒(méi)在成百上千的新提議中,沒(méi)有受到重視。直到6個(gè)月后,一名工程師重拾了這個(gè)“遺珠”,在Bing上測(cè)試了一個(gè)實(shí)驗(yàn)——A/B Test。通過(guò)A/B Test,一部分的用戶可以看到改變后的廣告展示方式,而另一部分用戶看到的界面保持原樣不變,以此測(cè)試效果。驚人的是,幾小時(shí)內(nèi)新的廣告展示方式就產(chǎn)生了極高的廣告收入,高到監(jiān)測(cè)系統(tǒng)誤認(rèn)為這是一個(gè)程序內(nèi)的bug。這個(gè)小小的改變,成功將Bing的收益提高了12%,即每年1億美金??芍^是Bing史上最厲害的賺錢點(diǎn)子了。

Bing的這個(gè)例子告訴我們,一一測(cè)試所有的新點(diǎn)子,絕對(duì)是一件大工程。但是人們也開(kāi)始意識(shí)到,如果同時(shí)進(jìn)行多個(gè)版本簡(jiǎn)單的測(cè)試,性價(jià)比極高。

ia_800000003.jpg

時(shí)至今日,Microsoft,Amazon,Booking.com,F(xiàn)acebook,和Google,這樣的大體量互聯(lián)網(wǎng)公司每年進(jìn)行的實(shí)驗(yàn)高達(dá)上萬(wàn)個(gè),測(cè)試幾百萬(wàn)用戶的行為。而初創(chuàng)公司,和對(duì)互聯(lián)網(wǎng)依賴程度較低的公司,像Walmart,租車公司,航空公司,也會(huì)定期進(jìn)行小規(guī)模測(cè)試。因?yàn)闆Q策者們普遍發(fā)現(xiàn),“測(cè)試一切”的方法能為公司帶來(lái)極大回報(bào)。對(duì)Bing來(lái)說(shuō),A/B測(cè)試每月成功地幫助公司敲定了和數(shù)十個(gè)收益相關(guān)的改動(dòng),這些改動(dòng)每年將Bing每次搜索的收益增加了10%-25%。

除此以外,A/B測(cè)試也對(duì)提升用戶滿意度做出了巨大貢獻(xiàn)。每月數(shù)以百計(jì)的改動(dòng),不僅提高了Bing的獲利能力,還將Bing在美國(guó)搜索引擎的市場(chǎng)占有率,從初創(chuàng)時(shí)的8%提高至23%。

在這個(gè)網(wǎng)絡(luò)對(duì)所有行業(yè)都至關(guān)重要的時(shí)代,嚴(yán)格的在線測(cè)試應(yīng)該成為企業(yè)標(biāo)準(zhǔn)操作程序中的一環(huán)。除了網(wǎng)站,A/B測(cè)試還能方便快捷地評(píng)估商業(yè)模型,企業(yè)決策,產(chǎn)品,服務(wù),營(yíng)銷活動(dòng)等不同方面。有了A/B測(cè)試,企業(yè)決策的過(guò)程變得更科學(xué),告別了依賴直覺(jué),拍腦袋做決定的時(shí)代。但是遺憾的是,很多企業(yè)并不知道如何科學(xué)合理地進(jìn)行測(cè)試,或者測(cè)試的次數(shù)遠(yuǎn)遠(yuǎn)不夠。

今天我們來(lái)看看,如何合理地設(shè)計(jì)、執(zhí)行測(cè)試,解讀測(cè)試結(jié)果,解決可能的問(wèn)題。利用文中的例子,舉一反三,你就可以從容應(yīng)對(duì)更復(fù)雜的A/B測(cè)試。

ia_800000004.png

A/B測(cè)試的價(jià)值

A/B測(cè)試中,實(shí)驗(yàn)設(shè)計(jì)人員會(huì)設(shè)計(jì)兩個(gè)版本的實(shí)驗(yàn)。

A:控制版,通常是已有系統(tǒng),假設(shè)為成功版。

B:實(shí)驗(yàn)版,經(jīng)過(guò)改動(dòng)的版本,借以挑戰(zhàn)現(xiàn)存的成功版。

隨機(jī)分配不同版本給用戶體驗(yàn),并比較兩個(gè)版本的關(guān)鍵性指標(biāo)(單變量測(cè)試:比較A/B/C,和A/B/C/D版本。多變量測(cè)試:同時(shí)評(píng)估多個(gè)變量的不同版本)。不同版本的變量,可以是新功能的增加,用戶界面的更改(例如新的排版),后端的改動(dòng)(例如改進(jìn)亞馬遜書(shū)籍推薦的算法)或不同商業(yè)模型的測(cè)試(例如提供免費(fèi)送貨)。對(duì)于決策者關(guān)心的,企業(yè)運(yùn)營(yíng)中的各個(gè)環(huán)節(jié)(比如:銷售量,重復(fù)使用率,點(diǎn)擊率或用戶在頁(yè)面停留的時(shí)間),都可以通過(guò)線上A/B測(cè)試來(lái)對(duì)其進(jìn)行優(yōu)化。

ia_800000005.png

任何擁有上千日活(Daily Active User)的公司都能實(shí)行A/B測(cè)試。通過(guò)A/B測(cè)試,公司能獲取大量用戶樣本、自動(dòng)收集網(wǎng)站和APP上大量用戶交互數(shù)據(jù)、以及同時(shí)運(yùn)行多個(gè)版本測(cè)試,從而快速精準(zhǔn),低成本地評(píng)估許多實(shí)驗(yàn),達(dá)到系統(tǒng)的快速迭代,企業(yè)發(fā)展的迅速轉(zhuǎn)向。在今天,許多科技公司意識(shí)到了A/B測(cè)試的優(yōu)點(diǎn),這些公司有一個(gè)單獨(dú)的團(tuán)隊(duì)負(fù)責(zé)構(gòu)建、管理和改進(jìn)測(cè)試架構(gòu)的工作,為產(chǎn)品組提供服務(wù)。合理利用A/B測(cè)試,會(huì)為公司提供極大的競(jìng)爭(zhēng)優(yōu)勢(shì)。

1.小改變可能有大影響

一個(gè)常見(jiàn)的商業(yè)誤區(qū)是:只有大投入才會(huì)產(chǎn)生大影響。但在互聯(lián)網(wǎng)世界并非如此,成功更多源于很多正確的小改變。雖然商業(yè)世界更推崇大的、顛覆性的想法,實(shí)際上,大多數(shù)成功都是通過(guò)累積成百上千的小改進(jìn)來(lái)實(shí)現(xiàn)的。

再來(lái)看一個(gè)Microsoft微軟的例子,2008年,一名英國(guó)的微軟員工提出了一個(gè)看似很小的建議:當(dāng)用戶點(diǎn)擊MSN主頁(yè)上的Hotmail鏈接時(shí),自動(dòng)為Hotmail打開(kāi)一個(gè)新窗口,而不是在同一個(gè)頁(yè)面上跳轉(zhuǎn)至Hotmail。通過(guò)在90萬(wàn)英國(guó)用戶中進(jìn)行了測(cè)試,微軟發(fā)現(xiàn)了一個(gè)激動(dòng)人心的結(jié)果:通過(guò)MSN主頁(yè)打開(kāi)Hotmail的用戶量增加了8.9%。然而,大家對(duì)這個(gè)改變眾說(shuō)紛紜,因?yàn)楫?dāng)時(shí)幾乎不會(huì)有網(wǎng)站會(huì)在新的標(biāo)簽頁(yè)上打開(kāi)鏈接,所以微軟只在英國(guó)采取了這個(gè)小小的改變。

2010年6月,Microsoft微軟對(duì)270萬(wàn)美國(guó)用戶進(jìn)行了同樣的實(shí)驗(yàn),獲得了類似的結(jié)果,因此微軟開(kāi)始在全球推行這項(xiàng)改變。除此以外,微軟還探尋了此項(xiàng)改變是否能同樣作用于其他功能上。在一項(xiàng)針對(duì)美國(guó)1200萬(wàn)用戶的測(cè)試中,微軟發(fā)現(xiàn),通過(guò)在新的標(biāo)簽頁(yè)上展現(xiàn)用戶在MSN的搜索結(jié)果,用戶點(diǎn)擊量增加了5%。新標(biāo)簽中打開(kāi)鏈接是一個(gè)極易實(shí)現(xiàn)的改變,只需幾行代碼,使這成為了微軟提高用戶參與度的最佳方法之一。除了Microsoft微軟,F(xiàn)acebook臉書(shū)、Twitter推特等在內(nèi)的許多網(wǎng)站至今都在使用這項(xiàng)技術(shù)。

微軟的例子并非獨(dú)一無(wú)二。亞馬遜在測(cè)試中發(fā)現(xiàn),將信用卡優(yōu)惠活動(dòng)從網(wǎng)站主頁(yè)移到購(gòu)物車頁(yè)面,每年可增加數(shù)千萬(wàn)美元的利潤(rùn)。

這些公司的經(jīng)驗(yàn)說(shuō)明,小投資可以產(chǎn)生大回報(bào)。然而,大投資可能只很產(chǎn)生很少,甚至0回報(bào)。比如微軟曾花費(fèi)超過(guò)2500萬(wàn)美元,將Bing必應(yīng)與社交媒體一體化——在搜索結(jié)果頁(yè)面的第三窗格內(nèi)展示Facebook和Twitter的相關(guān)內(nèi)容,但此舉在用戶參與度和收入方面產(chǎn)生的影響微乎其微。

ia_800000006.jpg

2.實(shí)驗(yàn)可以引導(dǎo)投資決策

線上測(cè)試可以幫助決策者了解對(duì)于潛在改進(jìn)的理想投資數(shù)額。舉個(gè)例子,微軟曾面臨一個(gè)問(wèn)題:如何縮短Bing顯示搜索結(jié)果所需時(shí)間。當(dāng)然,結(jié)果顯示肯定是越快越好。但是公司該如何量化提高搜索速度所帶來(lái)的價(jià)值呢?團(tuán)隊(duì)?wèi)?yīng)該用3個(gè)人、10個(gè)人還是50個(gè)人來(lái)提升性能呢?為了解決這些問(wèn)題,微軟進(jìn)行了一系列的A/B測(cè)試:通過(guò)為搜索速度添加人為延遲,研究了加載速度的細(xì)微差異所產(chǎn)生的影響。數(shù)據(jù)表明,每100毫秒加載速度差異對(duì)公司收益的影響為0.6%。與此同時(shí),Bing必應(yīng)的年收益已經(jīng)超過(guò)30億美元,那么每100毫秒的提速就能增加1800萬(wàn)美元的年收入——足以維持一個(gè)規(guī)??捎^的團(tuán)隊(duì)運(yùn)作。

A/B測(cè)試結(jié)果也幫助了必應(yīng)Bing權(quán)衡重要商業(yè)決策,尤其是那些可能提高搜索結(jié)果相關(guān)性,但會(huì)減慢軟件響應(yīng)速度的功能。為了避免多個(gè)小改動(dòng)累積導(dǎo)致的顯著性能下降,Bing會(huì)在團(tuán)隊(duì)改良搜索引擎和其他組件性能后,再上線會(huì)降低響應(yīng)速度毫秒或以上的新功能。

大浪淘沙始見(jiàn)金

早在100年以前,百貨公司老板John Wanamaker就有一句營(yíng)銷名言:“我在廣告上的投入有一半都是浪費(fèi),但我不知道是哪一半。”這句話同樣適用于A/B測(cè)試,因?yàn)榻^大部分試圖超越已有版本的新實(shí)驗(yàn)都會(huì)以失敗告終,即使是專家也經(jīng)常錯(cuò)誤地估計(jì)實(shí)驗(yàn)結(jié)果。在Google和Bing,只有10%~20%的測(cè)試會(huì)有積極成果。在Microsoft,1/3的測(cè)試有積極影響,1/3的有負(fù)面影響,還有1/3沒(méi)有產(chǎn)生影響。這就像青蛙王子的故事,想要發(fā)現(xiàn)好點(diǎn)子,公司需要親吻很多青蛙(進(jìn)行大量的實(shí)驗(yàn))才能找到王子。

A/B測(cè)試極易被錯(cuò)誤使用

正式進(jìn)行A/B測(cè)試之前,團(tuán)隊(duì)?wèi)?yīng)該確保測(cè)試版本既不會(huì)降低性能,也不會(huì)產(chǎn)生意料之外的結(jié)果。在必應(yīng)Bing,除了一些低風(fēng)險(xiǎn)的bug修復(fù)和硬件類操作系統(tǒng)升級(jí),其余80%的改動(dòng)會(huì)首先以控制變量的實(shí)驗(yàn)方式進(jìn)行。

大部分的科學(xué)測(cè)試的基礎(chǔ)框架都需要以下幾項(xiàng):記錄工具(記錄例如用戶點(diǎn)擊、鼠標(biāo)懸停和事件時(shí)間等數(shù)據(jù))、數(shù)據(jù)流和專業(yè)的數(shù)據(jù)科學(xué)家。隨著A/B測(cè)試的發(fā)展和普及,網(wǎng)絡(luò)上出現(xiàn)了一些針對(duì)A/B測(cè)試的第三方工具和服務(wù)。但如果企業(yè)有大規(guī)模測(cè)試的需求,第三方工具和服務(wù)很難勝任。穩(wěn)定的基礎(chǔ)框架能降低每次的實(shí)驗(yàn)成本,并提高實(shí)驗(yàn)結(jié)果可靠性。相反,如果基礎(chǔ)框架缺失,企業(yè)測(cè)試的成本會(huì)居高不下,從而導(dǎo)致決策者不愿進(jìn)一步投入,或進(jìn)行更多試驗(yàn)。

ia_800000007.png

微軟的A/B測(cè)試基礎(chǔ)架構(gòu)就是一個(gè)優(yōu)秀范例:Microsoft的分析實(shí)驗(yàn)團(tuán)隊(duì)有80多人,每天可以實(shí)行數(shù)以百計(jì)的產(chǎn)品在線對(duì)照試驗(yàn)(包括Bing,Cortana,Exchange,MSN,Office,Skype,Windows和Xbox等各種產(chǎn)品)。每次測(cè)試會(huì)有數(shù)十萬(wàn)至千萬(wàn)用戶參與試用新改動(dòng),團(tuán)隊(duì)對(duì)測(cè)試結(jié)果進(jìn)行嚴(yán)密的統(tǒng)計(jì)分析,并自動(dòng)生成記分板,一一檢查幾百到上千個(gè)指標(biāo)后,標(biāo)記那些成效顯著的改動(dòng)。(當(dāng)然如果你的企業(yè)規(guī)模較小,或?qū)?shí)驗(yàn)依賴度較低,實(shí)驗(yàn)團(tuán)隊(duì)投入可以降低)

3.三種企業(yè)常見(jiàn)的實(shí)驗(yàn)團(tuán)隊(duì)人員結(jié)構(gòu):

1.集中型(Centralized model)

集中型結(jié)構(gòu)意味著會(huì)有一組數(shù)據(jù)科學(xué)家為整個(gè)公司服務(wù)。這種結(jié)構(gòu)的優(yōu)點(diǎn)是,實(shí)驗(yàn)組人員可以持續(xù)關(guān)注長(zhǎng)期項(xiàng)目,比如設(shè)計(jì)更好的實(shí)驗(yàn)工具和開(kāi)發(fā)更先進(jìn)的統(tǒng)計(jì)算法。但一大缺點(diǎn)是,一個(gè)實(shí)驗(yàn)組在服務(wù)所有產(chǎn)品組時(shí),會(huì)對(duì)實(shí)驗(yàn)任務(wù)有不同的優(yōu)先級(jí),這可能導(dǎo)致各組之間資源和成本分配的沖突。另一個(gè)問(wèn)題是,當(dāng)數(shù)據(jù)科學(xué)家著手商業(yè)項(xiàng)目時(shí),可能會(huì)因?yàn)槿狈I(yè)知識(shí)和商業(yè)經(jīng)驗(yàn)而難以將實(shí)驗(yàn)結(jié)果關(guān)聯(lián)起來(lái),更難看到結(jié)果背后的關(guān)鍵點(diǎn)。除此以外,數(shù)據(jù)科學(xué)家的身份可能缺乏影響力,無(wú)法說(shuō)服決策層相信實(shí)驗(yàn)結(jié)果或者為技術(shù)投資。

2.分離型(Decentralized model)

分離型結(jié)構(gòu)是企業(yè)為不同的業(yè)務(wù)部門配置數(shù)據(jù)科學(xué)家。這種的優(yōu)點(diǎn)是,數(shù)據(jù)科學(xué)家可以成為其負(fù)責(zé)業(yè)務(wù)領(lǐng)域的專家。但缺點(diǎn)也很明顯:對(duì)于員工而言,只為一個(gè)業(yè)務(wù)部門工作,數(shù)據(jù)科學(xué)家未來(lái)的職業(yè)道路并不明朗,同時(shí)也會(huì)缺乏同事的反饋和指導(dǎo)。而對(duì)于實(shí)驗(yàn)而言,只針對(duì)單個(gè)部門的實(shí)驗(yàn)可能不足以證明改動(dòng)提案的合理性。

3.衛(wèi)星型(Center-of-excellence model)

衛(wèi)星型是讓一些數(shù)據(jù)科學(xué)家成為團(tuán)隊(duì),集中工作,剩余的數(shù)據(jù)科學(xué)家分散在不同的業(yè)務(wù)部門(微軟采用的結(jié)構(gòu))。團(tuán)隊(duì)中心主要負(fù)責(zé)對(duì)照實(shí)驗(yàn)的設(shè)計(jì)、執(zhí)行和結(jié)果分析。有了團(tuán)隊(duì)統(tǒng)一為公司構(gòu)建的實(shí)驗(yàn)平臺(tái)和實(shí)驗(yàn)工具,企業(yè)可以顯著降低A/B測(cè)試所需的時(shí)間和資源。除此以外,團(tuán)隊(duì)還能基于優(yōu)秀實(shí)驗(yàn)開(kāi)設(shè)課程,舉辦Lab和會(huì)議,在全公司范圍推廣。衛(wèi)星型結(jié)構(gòu)的主要的缺點(diǎn)是,中心團(tuán)隊(duì)和產(chǎn)品團(tuán)隊(duì)的責(zé)任劃分可能并不明晰,比如當(dāng)需要增加測(cè)試數(shù)量時(shí),哪個(gè)團(tuán)隊(duì)?wèi)?yīng)為招聘更多的數(shù)據(jù)科學(xué)家來(lái)買單呢?

實(shí)驗(yàn)團(tuán)隊(duì)結(jié)構(gòu)的好壞不是絕對(duì)的非黑即白。小公司一般會(huì)使用第三方服務(wù),或者從集中型結(jié)構(gòu)起步。待公司發(fā)展壯大后,轉(zhuǎn)向其他結(jié)構(gòu)。對(duì)于擁有多個(gè)業(yè)務(wù)組的大公司,那些高度依賴測(cè)試的業(yè)務(wù)組管理層,會(huì)在企業(yè)統(tǒng)一規(guī)劃前實(shí)行測(cè)試,那么分離型結(jié)構(gòu)就較為適用這種情況。如果在線實(shí)驗(yàn)是公司決策環(huán)節(jié)中的不可或缺的一環(huán),可以通過(guò)衛(wèi)星型結(jié)構(gòu)的中心團(tuán)隊(duì)先構(gòu)建實(shí)驗(yàn)范例,制定實(shí)驗(yàn)標(biāo)準(zhǔn),然后再將其推行至各個(gè)業(yè)務(wù)部門。

立即登錄,閱讀全文
原文鏈接:點(diǎn)擊前往 >
文章來(lái)源:全球贏
版權(quán)說(shuō)明:本文內(nèi)容來(lái)自于全球贏,本站不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。文章內(nèi)容系作者個(gè)人觀點(diǎn),不代表快出海對(duì)觀點(diǎn)贊同或支持。如有侵權(quán),請(qǐng)聯(lián)系管理員(zzx@kchuhai.com)刪除!
掃碼關(guān)注
獲取更多出海資訊的相關(guān)信息
優(yōu)質(zhì)服務(wù)商推薦
更多
掃碼登錄
打開(kāi)掃一掃, 關(guān)注公眾號(hào)后即可登錄/注冊(cè)
加載中
二維碼已失效 請(qǐng)重試
刷新
賬號(hào)登錄/注冊(cè)
小程序
快出海小程序
公眾號(hào)
快出海公眾號(hào)
商務(wù)合作
商務(wù)合作
投稿采訪
投稿采訪
出海管家
出海管家