阿里云飛天大數(shù)據(jù)產(chǎn)品價(jià)值解讀

來源:云棲號(hào)
作者:吳世龍
時(shí)間:2020-08-26
2854
本次分享主要圍繞以下三個(gè)方面:一、如何評(píng)估搜索質(zhì)量、體驗(yàn)與業(yè)務(wù)。價(jià)值二、OpenSearch背景與核心能力介紹。三、典型案例。

演講嘉賓簡(jiǎn)介:阿里云智能高級(jí)產(chǎn)品專家——吳世龍(染天)

以下內(nèi)容根據(jù)演講視頻以及PPT整理而成。

觀看回放:https://yq.aliyun.com/live/43343

本次分享主要圍繞以下三個(gè)方面:

一、如何評(píng)估搜索質(zhì)量、體驗(yàn)與業(yè)務(wù)價(jià)值

二、OpenSearch背景與核心能力介紹

三、典型案例

一、如何評(píng)估搜索質(zhì)量、體驗(yàn)與業(yè)務(wù)價(jià)值

1.搜索-無處不在

生活中多種不同場(chǎng)景需要進(jìn)行搜索,在企業(yè)內(nèi)部產(chǎn)品中也需要使用多種搜索功能,方便用戶快捷地獲取企業(yè)相關(guān)商品、服務(wù)、內(nèi)容等信息。搜索在不同的企業(yè)業(yè)務(wù)中的角色可能有所不同。如下圖所示,搜索在電商行業(yè)是十分重要的業(yè)務(wù)流量轉(zhuǎn)化入口,在其他領(lǐng)域也必不可少。

搜索是用戶獲取信息的基礎(chǔ)手段與能力,如果搜索不好用,用戶信任度必會(huì)降低。如果搜索在某業(yè)務(wù)場(chǎng)景中使用不多,建議衡量業(yè)務(wù)的全站流量結(jié)構(gòu)。

ia_6300000005.png

2.評(píng)估搜索質(zhì)量、體驗(yàn)與業(yè)務(wù)價(jià)值

六成左右客戶不清楚如何評(píng)估搜索質(zhì)量、體驗(yàn)與業(yè)務(wù)價(jià)值,那么引出以下問題。

搜索的業(yè)務(wù)價(jià)值驅(qū)動(dòng)力是什么?搜索在企業(yè)內(nèi)部的業(yè)務(wù)價(jià)值驅(qū)動(dòng)一般依靠被動(dòng)的Bad case、KPI或業(yè)務(wù)需求。依靠Bad case驅(qū)動(dòng),搜索結(jié)果具有隨機(jī)性,不固定時(shí)間地點(diǎn)場(chǎng)合,搜索體驗(yàn)差。KPI指標(biāo)判斷,容易片面和不知所以然。依靠業(yè)務(wù)需求指業(yè)務(wù)方或運(yùn)營指明將某些搜索結(jié)果置于前排,意味著結(jié)果排序相關(guān)性勢(shì)必會(huì)完全依賴于業(yè)務(wù)方經(jīng)驗(yàn)而無法客觀的保障用戶的體驗(yàn)與業(yè)務(wù)轉(zhuǎn)化,不具備可控性。以上三種業(yè)務(wù)價(jià)值驅(qū)動(dòng)方式都存在較大問題。

目前許多企業(yè)的做法是根據(jù)上述所謂的內(nèi)部搜索業(yè)務(wù)價(jià)值驅(qū)動(dòng)力,做召回、排序、業(yè)務(wù)需求以及擴(kuò)展搜索歷史等功能。

如何衡量?主觀?客觀?如果明確了搜索的業(yè)務(wù)價(jià)值驅(qū)動(dòng)力,如何衡量驅(qū)動(dòng)效果,即業(yè)務(wù)價(jià)值?具有客觀的體系化衡量手段才有可能實(shí)現(xiàn)客觀的判斷。

下圖所列舉為一套以淘寶內(nèi)部為典型的搜索上線流程。首先需要有監(jiān)控/評(píng)估搜索用戶體驗(yàn)的方法,周期性評(píng)測(cè)用戶體驗(yàn)。通過監(jiān)控/評(píng)估明確迭代/專項(xiàng)。在上線前做一些A/B Test或灰度測(cè)試,如果沒有問題可全量上線,并監(jiān)控線上效果。例如翻頁率下降,說明用戶以往搜索10頁才能找到的內(nèi)容現(xiàn)在1、2頁就可以找到,搜索體驗(yàn)提升。

該鏈路是主動(dòng)監(jiān)控、評(píng)估搜索業(yè)務(wù)價(jià)值的,好的驅(qū)動(dòng)力應(yīng)該是高效的體系化的持續(xù)化的實(shí)現(xiàn)交付價(jià)值。

那么如何衡量搜索業(yè)務(wù)價(jià)值?該鏈路源頭是監(jiān)控/評(píng)估能力,需要有體系化、專業(yè)的報(bào)表與評(píng)估服務(wù)。報(bào)表是客觀性數(shù)據(jù),只能反映果而不能體現(xiàn)因,評(píng)估服務(wù)是人工主觀評(píng)估服務(wù)。監(jiān)控/評(píng)估取代了所謂Bad case、KPI、業(yè)務(wù)需求,更加體系化地衡量搜索體驗(yàn)。

ia_6300000006.png

如下圖所示,OpenSearch報(bào)表評(píng)估提供5大維度的30+指標(biāo)。報(bào)表只能體現(xiàn)整體結(jié)果,而局部效果的評(píng)估可以根據(jù)大量指標(biāo)從不同視角得出不同結(jié)論。五大維度分為流量指標(biāo)、點(diǎn)擊類指標(biāo)、用戶分析類指標(biāo)、Query分析類指標(biāo)、成交指標(biāo),核心指標(biāo)由其提煉而來。

以往每天上班第一件事是查看關(guān)鍵指標(biāo),如發(fā)現(xiàn)可能存在問題,需要檢查連帶影響,確保報(bào)表各項(xiàng)核心指標(biāo)正常后才會(huì)展開其他工作。因此該體系化、專業(yè)的報(bào)表與評(píng)估服務(wù)不僅帶給客戶一種技術(shù)能力,更使客戶能夠在平臺(tái)上完整落地、驅(qū)動(dòng)搜索業(yè)務(wù)。

ia_6300000007.png

如何高效、可持續(xù)、體系化地交付搜索價(jià)值?搜索的相關(guān)市場(chǎng)、場(chǎng)景、用戶、文化一直處于變化中,明確搜索業(yè)務(wù)價(jià)值驅(qū)動(dòng)力、衡量方式后,如何高效、可持續(xù)、體系化地交付搜索價(jià)值?

與一般開源不同,OpenSearch提供的不是需要客戶自行拼搭開發(fā)的零散工具,而是一套完整服務(wù),一切皆為提升業(yè)務(wù)價(jià)值、體現(xiàn)大家的專業(yè)能力。OpenSearch服務(wù)主要有以下四個(gè)特點(diǎn)。第一,免運(yùn)維,客戶只需要提供數(shù)據(jù)并配置滿足自身業(yè)務(wù)訴求的策略。第二,開箱即用,只需提供數(shù)據(jù)與配置策略,操作便捷。第三,一站式,提供搜索核心功能、擴(kuò)展功能。第四,高搜索質(zhì)量。

下圖所示為搜索上線流程,創(chuàng)建應(yīng)用、上傳數(shù)據(jù)并進(jìn)行簡(jiǎn)單調(diào)試后即可發(fā)布上線。若過程順利半天即可完成。

ia_6300000008.png

二、OpenSearch背景與核心能力介紹

OpenSearch是阿里巴巴自研的搜索引擎,過去一直支持并服務(wù)阿里內(nèi)部應(yīng)用,經(jīng)過千錘百煉才沉淀到可以賦能市場(chǎng)上其他企業(yè)。

ia_6300000009.png

搜索的核心是做召回、排序、業(yè)務(wù)需求以及功能擴(kuò)展,投入重、依賴多、周期長(zhǎng),一般企業(yè)難以投入大規(guī)模人力與資源。因此開發(fā)性能與體驗(yàn)優(yōu)秀的搜索引擎并非易事。

ia_6300000010.png

召回核心模塊為分析器與查詢分析。中文博大精深,易生歧義,分詞效果至關(guān)重要。召回內(nèi)置多種分析器,分析語言意圖。查詢分析提供同義詞、糾錯(cuò)、詞權(quán)重、實(shí)體識(shí)別、停用詞分析等必備功能。

排序方面支持二次排序,是大數(shù)據(jù)量召回的有效解決方式。還支持類目預(yù)測(cè)、人氣模型,支持表達(dá)式以及Cava排序定制。

根據(jù)業(yè)務(wù)需求需要支持混排、打散、詞典管理等功能實(shí)現(xiàn)。混排指在搜索召回結(jié)果中根據(jù)業(yè)務(wù)需求相應(yīng)展示視頻、文字、圖片等不同媒體類型結(jié)果。例如在淘寶搜索結(jié)果中,打散指品牌、價(jià)格等打散展示。

擴(kuò)展即功能性擴(kuò)展,如A/B Test、搜索框下拉提示、熱搜&底紋(默認(rèn)搜索詞)、飄紅、Debug工具等。

召回、排序、業(yè)務(wù)、擴(kuò)展都是為了服務(wù)客戶,使客戶能以最小成本、最短時(shí)間交付高質(zhì)量業(yè)務(wù)價(jià)值而提供的能力。

1.分析器

分析器是影響搜索效果的基礎(chǔ)模塊,不同業(yè)務(wù)場(chǎng)景需要使用不同分析器,需要用戶結(jié)合自身業(yè)務(wù)場(chǎng)景自行選擇。目前OpenSearch集成了12種分析器供用戶選擇,用戶也可上傳自己的分詞詞條個(gè)性化定制分析器。

ia_6300000011.png

下圖所示為阿里OpenSearch電商分析器與開源IK分析器對(duì)比數(shù)據(jù),可見OpenSearch分析器的分詞效果相對(duì)優(yōu)于IK開源分析器。該對(duì)比隨機(jī)抽取100個(gè)電商類Query,下圖列舉部分結(jié)果。例如925銀耳飾,開源IK分析器分詞有“銀耳”一項(xiàng),OpenSearch電商分詞理解顯然更優(yōu)。

ia_6300000012.png

2.類目預(yù)測(cè)

用戶搜索意圖可分為精搜、泛搜,類目預(yù)測(cè)即預(yù)測(cè)用戶搜索某一Query時(shí)目標(biāo)類目的結(jié)果。類目預(yù)測(cè)并非依靠個(gè)人體感,而需要符合市場(chǎng)需求,根據(jù)行為數(shù)據(jù)盡可能快速滿足用戶需求。

如下圖所示,使用類目預(yù)測(cè)前在淘寶搜索光明,可能出現(xiàn)米、面、奶等多種相關(guān)商品。而根據(jù)用戶點(diǎn)擊行為數(shù)據(jù),100個(gè)用戶搜索光明,絕大多數(shù)點(diǎn)擊的商品是光明牛奶,意味著用戶搜索光明通常是搜索光明牛奶,因此使用類目預(yù)測(cè)后前排推薦商品變化為光明牛奶。

類目預(yù)測(cè)也可使用純文本方式。

案例——雙面膠:多數(shù)時(shí)候搜索雙面膠指辦公用品,然而一段時(shí)間內(nèi)電視劇《雙面膠》很熱,出現(xiàn)了許多相關(guān)周邊產(chǎn)品。那么用戶在該階段搜索雙面膠想要的商品或許會(huì)發(fā)生變化,可通過用戶行為數(shù)據(jù)進(jìn)行類目預(yù)測(cè)。

案例——播、海賊王、柯南:“播”是一個(gè)服裝品牌,多數(shù)時(shí)候需要召回的內(nèi)容為該品牌服裝。海賊王、柯南等Query,需要根據(jù)市場(chǎng)需求,通過類目預(yù)測(cè)提供更合適的結(jié)果。

ia_6300000013.png

3.人氣模型

淘寶早期搜索結(jié)果排序方式非常簡(jiǎn)單,寶貝發(fā)布后上架試7天,剩余下架時(shí)間越短排序越靠前,所有賣家都有相同的機(jī)會(huì)獲得流量,對(duì)賣家、買家都相對(duì)公平。然而該模式無法將價(jià)值最大化,并不經(jīng)濟(jì)。

因此淘寶很早發(fā)布了人氣模型,盡可能與市場(chǎng)趨勢(shì)匹配,使用戶更加滿意,從而轉(zhuǎn)化為最大價(jià)值。用戶體驗(yàn)好,對(duì)優(yōu)質(zhì)賣家、商品也更公平,是當(dāng)前默認(rèn)模型。

ia_6300000014.png

4.熱搜&底紋

ia_6300000015.png

三、典型案例

1.召回

下圖所示站點(diǎn)是以UGC內(nèi)容為主的論壇。由于站內(nèi)搜索用戶地域表達(dá)與文化習(xí)慣差異大,易生歧義,導(dǎo)致搜索體驗(yàn)差。因此該類搜索場(chǎng)景要求搜索引擎具備較強(qiáng)的語義理解能力,根據(jù)搜索和文檔的真實(shí)語義進(jìn)行智能匹配。

詞權(quán)重分析:如下圖所示,搜索問題為“胎停有什么癥狀”,基于優(yōu)秀的召回質(zhì)量,通過詞權(quán)重分析能夠給出較好的結(jié)果排序。

拼寫糾錯(cuò)、同義詞擴(kuò)大召回:如下圖所示,由于用戶方言習(xí)慣等問題,搜索關(guān)鍵詞時(shí)將“剖腹產(chǎn)”誤輸入為“拋婦產(chǎn)”,通過拼寫糾錯(cuò)等功能,仍然可以正確識(shí)別用戶意圖,提供相關(guān)內(nèi)容。

**客戶評(píng)價(jià)-1:簡(jiǎn)單無門檻,連不懂技術(shù)的產(chǎn)品經(jīng)理都可以使用OpenSearch對(duì)業(yè)務(wù)進(jìn)行迭代,大大縮短了項(xiàng)目的迭代周期。

客戶評(píng)價(jià)-2:提高效率,目前技術(shù)團(tuán)隊(duì)沒有專職優(yōu)化搜索的技術(shù)人員,只是根據(jù)項(xiàng)目需求做臨時(shí)優(yōu)化即可,省力省心。**

ia_6300000016.png

2.技術(shù)類內(nèi)容社區(qū)

某國內(nèi)最大的中文IT內(nèi)容社區(qū),涉及眾多業(yè)務(wù)場(chǎng)景,由于是技術(shù)類內(nèi)容社區(qū),需要提供強(qiáng)大、優(yōu)秀的搜索服務(wù)。

該社區(qū)花一年時(shí)間基于開源自建搜索服務(wù),效果不佳。因此該社區(qū)試行OpenSearch。

下圖所示為基于開源自建搜索服務(wù)與基于OpenSearch服務(wù)的搜索效果對(duì)比。搜索同一關(guān)鍵詞Win10重裝,可見基于OpenSearch服務(wù)的搜索語義理解更優(yōu),提供的搜索結(jié)果相關(guān)性更高。

由于該社區(qū)搜索詞專業(yè)垂直度高,通用分詞不足以支持,需要自定義詞典,并結(jié)合了阿里NLP通用Query智能分析+人氣模型。

效果:對(duì)比基于開源自建的搜索服務(wù)CTR提升80%+,對(duì)比友商CTR提升3%。

ia_6300000017.png

原文鏈接:點(diǎn)擊前往 >
版權(quán)說明:本文內(nèi)容來自于云棲號(hào),本站不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。文章內(nèi)容系作者個(gè)人觀點(diǎn),不代表快出海對(duì)觀點(diǎn)贊同或支持。如有侵權(quán),請(qǐng)聯(lián)系管理員(zzx@kchuhai.com)刪除!
相關(guān)文章
阿里云助力《誅仙世界》端游正式開服!
阿里云助力《誅仙世界》端游正式開服!
近?,完美世界游戲歷時(shí)多年打造的新國?仙俠MMORPG端游《誅仙世界》在阿?云上正式開服。
阿里云
云服務(wù)
2024-12-29
一文詳解阿里云AI大基建
一文詳解阿里云AI大基建
面向AI時(shí)代,阿里云基礎(chǔ)設(shè)施是如何創(chuàng)新與發(fā)展的?計(jì)算、網(wǎng)絡(luò)、存儲(chǔ)、服務(wù)器、集群、可觀測(cè)等,阿里云全新升級(jí)的AI Infra到底有哪些重磅更新?
阿里云
云服務(wù)
2024-11-02
AI時(shí)代云安全新范式,阿里云安全能力全線升級(jí)!
AI時(shí)代云安全新范式,阿里云安全能力全線升級(jí)!
AI時(shí)代,云安全面臨著新的挑戰(zhàn),不僅要持續(xù)面對(duì)以往的傳統(tǒng)問題,更需要全新理念落地于產(chǎn)品設(shè)計(jì)、技術(shù)演進(jìn)、架構(gòu)設(shè)計(jì),才能實(shí)現(xiàn)效果、性能、和成本的最優(yōu)解。
AI
阿里云
云服務(wù)
2024-09-27
連續(xù)四年!阿里云領(lǐng)跑中國公有云大數(shù)據(jù)平臺(tái)
連續(xù)四年!阿里云領(lǐng)跑中國公有云大數(shù)據(jù)平臺(tái)
近日,國際數(shù)據(jù)公司(IDC)發(fā)布《中國大數(shù)據(jù)平臺(tái)市場(chǎng)份額,2023:數(shù)智融合時(shí)代的真正到來》報(bào)告——2023年中國大數(shù)據(jù)平臺(tái)公有云服務(wù)市場(chǎng)規(guī)模達(dá)72.2億元人民幣,其中阿里巴巴市場(chǎng)份額保持領(lǐng)先,占比達(dá)40.2%,連續(xù)四年排名第一。
阿里云
云服務(wù)
2024-09-18
個(gè)人VIP
小程序
快出海小程序
公眾號(hào)
快出海公眾號(hào)
商務(wù)合作
商務(wù)合作
投稿采訪
投稿采訪
出海管家
出海管家