騰訊的AI與產(chǎn)業(yè)互聯(lián)網(wǎng)已進(jìn)入全新發(fā)展階段,優(yōu)圖實(shí)驗(yàn)室的視覺(jué)智能在其中將發(fā)揮怎樣的作用?
「人工智能本身就是一場(chǎng)跨國(guó)跨學(xué)科的探索,正在將人類(lèi)的認(rèn)知推向更快更高更強(qiáng),也勢(shì)必帶給我們一場(chǎng)前所未見(jiàn)的科技和產(chǎn)業(yè)革命,」在近日在上海舉行的世界人工智能大會(huì)WAIC 2020上,馬化騰對(duì)人工智能的未來(lái)發(fā)出了這樣的預(yù)測(cè)。
今天,AI技術(shù)正變得無(wú)所不在,新基建和產(chǎn)業(yè)互聯(lián)網(wǎng)將為各行各業(yè)的發(fā)展帶來(lái)新增量。面對(duì)新的發(fā)展機(jī)遇,騰訊提出了全新的戰(zhàn)略,而騰訊優(yōu)圖實(shí)驗(yàn)室在其中正扮演著重要角色。
「我們可以看到,視覺(jué)AI相關(guān)應(yīng)用業(yè)務(wù)正在飛速增長(zhǎng),這反映了企業(yè)端的人工智能技術(shù)需求正在釋放,」騰訊優(yōu)圖實(shí)驗(yàn)室副總經(jīng)理黃飛躍表示。
四大AI平臺(tái)齊亮相
在7月10日的WAIC大會(huì)上,騰訊提出的「雙引擎+雙輪」驅(qū)動(dòng)人工智能發(fā)展新形式再次引來(lái)人們的關(guān)注。與此同時(shí),騰訊優(yōu)圖一口氣發(fā)布了應(yīng)用視覺(jué)AI能力的四大平臺(tái):AI泛娛樂(lè)平臺(tái)、廣電傳媒AI中臺(tái)、內(nèi)容審核平臺(tái)和工業(yè)AI平臺(tái),成為了大會(huì)的亮點(diǎn)。
在WAIC 2020上,騰訊優(yōu)圖實(shí)驗(yàn)室總經(jīng)理吳運(yùn)聲進(jìn)行了「新基建新生態(tài)下的計(jì)算機(jī)視覺(jué)」的主題演講。
首先是泛娛樂(lè)平臺(tái),依托騰訊在社交娛樂(lè)產(chǎn)品上的豐富實(shí)踐,優(yōu)圖在人臉融合、人像分割、人像變化、美顏美妝等方面積累了豐富的泛娛樂(lè)基礎(chǔ)能力,打造了泛娛樂(lè)全棧工具箱,其中包括AI互動(dòng)體驗(yàn)展解決方案、AI創(chuàng)意營(yíng)銷(xiāo)解決方案、美顏特效SDK三大解決方案。
在廣電傳媒行業(yè),通過(guò)引入AI技術(shù),騰訊可以將視頻處理效率提升至1:1(花費(fèi)1小時(shí)處理剪輯1小時(shí)長(zhǎng)度的視頻),實(shí)現(xiàn)符合標(biāo)準(zhǔn)的結(jié)果輸出。在智能審核場(chǎng)景中,AI能幫助媒體內(nèi)容管控效率提升并降低漏檢率。
廣電媒體AI中臺(tái)支持多維度的視頻理解和智能處理,為視頻運(yùn)營(yíng)側(cè)提供結(jié)構(gòu)化的數(shù)據(jù)結(jié)果,建立了多模態(tài)搜索的基礎(chǔ),提升了素材再利用效率(如幫助視頻再生產(chǎn),打造內(nèi)容專(zhuān)欄)。另外,能夠通過(guò)視頻理解結(jié)果進(jìn)行內(nèi)容運(yùn)營(yíng),打造千人千面的媒體應(yīng)用。
騰訊優(yōu)圖內(nèi)容審核平臺(tái)可提供審核一站式服務(wù)。在常規(guī)審核系統(tǒng)基礎(chǔ)能力之上還包含ACG場(chǎng)景識(shí)別、兒童色情識(shí)別、低俗場(chǎng)景識(shí)別等功能。在識(shí)別效果上,鑒黃、監(jiān)控、鑒證的準(zhǔn)召率超過(guò)99%??蛻?hù)接入后,三天即可完成定制化模型訓(xùn)練,兩小時(shí)內(nèi)完成客戶(hù)定向策略運(yùn)營(yíng)。這一技術(shù)可以更好地滿足用戶(hù)的實(shí)時(shí)定制需求,目前已在電商、文創(chuàng)、廣電等行業(yè)解決方案中廣泛應(yīng)用。
面向傳統(tǒng)行業(yè)的工業(yè)AI平臺(tái)則可以快速滿足工業(yè)領(lǐng)域的缺陷檢測(cè)、備件拍照識(shí)別、工廠工效優(yōu)化等客戶(hù)需求。并提供數(shù)據(jù)管理、在線訓(xùn)練、效果評(píng)估、業(yè)務(wù)編排等全過(guò)程個(gè)性化訓(xùn)練服務(wù),滿足上述場(chǎng)景的差異化需求。平臺(tái)支持私有化及公有云部署,提供業(yè)界領(lǐng)先的加速、調(diào)度與容器服務(wù),以更少的硬件資源支持更復(fù)雜的業(yè)務(wù)。
騰訊表示,這些平臺(tái)具備靈活權(quán)限及可拓展能力,合作伙伴可直接使用平臺(tái)進(jìn)行工業(yè)AI項(xiàng)目交付,還可基于平臺(tái)進(jìn)行上層業(yè)務(wù)開(kāi)發(fā),實(shí)現(xiàn)AI技術(shù)與行業(yè)能力的能力互補(bǔ),合作共建各領(lǐng)域的工業(yè)AI解決方案。
八年如一日,聚焦視覺(jué)AI
在人工智能領(lǐng)域里,感知智能的發(fā)展速度更快。根據(jù)清華大學(xué)的數(shù)據(jù)顯示,計(jì)算機(jī)視覺(jué)、語(yǔ)音技術(shù)及自然語(yǔ)言處理技術(shù)的市場(chǎng)規(guī)模占比分別為34.9%、24.8%和21%,視覺(jué)幾乎是落地最順利、商業(yè)化程度最高的領(lǐng)域,這也是騰訊優(yōu)圖一直以來(lái)的主要研究方向。
「在騰訊930業(yè)務(wù)組織調(diào)整之后,云與智慧產(chǎn)業(yè)事業(yè)群CSIG成為騰訊to B的戰(zhàn)略窗口,而優(yōu)圖是CSIG的主要實(shí)驗(yàn)室。對(duì)于優(yōu)圖來(lái)說(shuō),我們的定位已更加清晰——專(zhuān)注于視覺(jué)AI的技術(shù)研發(fā),」黃飛躍告訴我們。
2008年,從清華博士畢業(yè)的黃飛躍加入當(dāng)時(shí)的騰訊研究院,帶領(lǐng)5人小組投身開(kāi)發(fā)一款名為「QQ影像」的桌面處理軟件,他們是國(guó)內(nèi)大規(guī)模應(yīng)用計(jì)算機(jī)視覺(jué)先進(jìn)技術(shù)的最早一批從業(yè)者。今天這個(gè)團(tuán)隊(duì)已經(jīng)發(fā)展成為幾百人規(guī)模,算法人員比例超過(guò)60%的大型研究機(jī)構(gòu),成為了騰訊旗下,乃至計(jì)算機(jī)視覺(jué)領(lǐng)域鼎鼎有名的優(yōu)圖實(shí)驗(yàn)室。
優(yōu)圖從2012年成立至今,在技術(shù)從探索到落地的過(guò)程中,核心思路一直在發(fā)生轉(zhuǎn)變?!冈趦?yōu)圖團(tuán)隊(duì)剛剛成立時(shí),我們主要想的是怎樣把技術(shù)本身做好,」黃飛躍說(shuō)道?!肝覀兓ㄙM(fèi)大量時(shí)間深入理解了技術(shù)產(chǎn)生價(jià)值的方式,只有如此,才能夠把技術(shù)價(jià)值放大到最大。」
優(yōu)圖團(tuán)隊(duì)最初的任務(wù)是把其開(kāi)發(fā)的壓縮算法應(yīng)用到QQ空間里。在這里,技術(shù)產(chǎn)生了一定的價(jià)值,但主要是業(yè)務(wù)成本降低和體驗(yàn)優(yōu)化,仍沒(méi)有帶來(lái)最直接的用戶(hù)體驗(yàn)提升。
在2015年,優(yōu)圖把視覺(jué)AI技術(shù)應(yīng)用到微眾銀行的遠(yuǎn)程開(kāi)戶(hù),實(shí)現(xiàn)了業(yè)務(wù)的對(duì)外輸出。很快,優(yōu)圖實(shí)驗(yàn)室與騰訊云開(kāi)始了整合,技術(shù)落地走上了快速軌道。
迄今為止,優(yōu)圖已打造了超過(guò)15種行業(yè)解決方案,為騰訊公司內(nèi)部如QQ、QQ空間、微信、微視、騰訊云等超過(guò)90余個(gè)產(chǎn)品業(yè)務(wù)提供計(jì)算機(jī)視覺(jué)AI算法支持,并聯(lián)合騰訊云、微信等騰訊內(nèi)外部合作伙伴,向工業(yè)、教育、交通、文旅等領(lǐng)域共同輸出行業(yè)解決方案。
騰訊優(yōu)圖在發(fā)展新技術(shù)時(shí),一直以技術(shù)的應(yīng)用價(jià)值為導(dǎo)向?!肝覀?cè)谶M(jìn)行新技術(shù)研發(fā)時(shí)都會(huì)思考這個(gè)維度,這意味著它們必然是有業(yè)務(wù)基礎(chǔ)的。這也是和團(tuán)隊(duì)基因有關(guān)系,初始團(tuán)隊(duì)成員很多都具有相關(guān)的業(yè)務(wù)背景?!裹S飛躍介紹道。
在業(yè)務(wù)落地后,優(yōu)圖會(huì)持續(xù)關(guān)注技術(shù)的實(shí)際價(jià)值和用戶(hù)體驗(yàn),根據(jù)反饋需求和發(fā)現(xiàn)的問(wèn)題,不斷迭代優(yōu)化技術(shù)成果。隨著工具不斷升級(jí),技術(shù)會(huì)越來(lái)越好,適用場(chǎng)景越來(lái)越多,更多用戶(hù)也會(huì)為此買(mǎi)單,實(shí)現(xiàn)良性循環(huán)的正反饋過(guò)程。
在探索方向上,騰訊優(yōu)圖團(tuán)隊(duì)的技術(shù)研發(fā)非常聚焦——不傾向于發(fā)散放大技術(shù),而是不斷積累技術(shù),將一些方向做深做透。優(yōu)圖傾向于在成功技術(shù)的基礎(chǔ)上不斷拓展范圍,從而保證自己在一定方向上保持最好。
目前,優(yōu)圖旗下最熱門(mén)的技術(shù)之一人臉核身,支持了北京、上海等全國(guó)多地的健康碼,以及一些銀行大額轉(zhuǎn)賬的過(guò)程中的核身過(guò)程,這項(xiàng)技術(shù)在市場(chǎng)占有率上保持了絕對(duì)領(lǐng)先。
優(yōu)圖核身技術(shù)的領(lǐng)先,正是不斷迭代優(yōu)化的結(jié)果。「我們自2014年就開(kāi)始了身份識(shí)別技術(shù)的研發(fā),從微眾銀行、騰訊云慧眼,再到微信小程序。我們接觸到了大量客戶(hù)和場(chǎng)景,在這個(gè)過(guò)程中不斷提升了技術(shù)能力?!裹S飛躍表示。
核身技術(shù)中,除了識(shí)別人臉之外,活體檢測(cè)是重中之重:黑產(chǎn)會(huì)不斷嘗試在各個(gè)方面進(jìn)行攻擊。據(jù)介紹,從2014年至今,優(yōu)圖已經(jīng)迭代了5個(gè)不同的解決方案,從最開(kāi)始的動(dòng)作唇語(yǔ),到交互檢測(cè),到騰訊獨(dú)創(chuàng)的光線核體方案,再到現(xiàn)在更加先進(jìn)的解決方案,通過(guò)海量用戶(hù)觸達(dá),不斷更新的技術(shù),優(yōu)圖把身份檢測(cè)這件事做到了極致。
目前優(yōu)圖人臉核身技術(shù)的流程。
「今年優(yōu)圖上線的全新人臉安全技術(shù)對(duì)于物理攻擊、模型合成攻擊、深度學(xué)習(xí)對(duì)抗樣本都有很強(qiáng)的防御能力。我們的多模態(tài)活體檢測(cè)技術(shù)已經(jīng)通過(guò)了國(guó)家銀行卡檢測(cè)中心BCTC的人臉識(shí)別技術(shù)檢測(cè),達(dá)到了金融支付級(jí)安全標(biāo)準(zhǔn)?!裹S飛躍說(shuō)道。
不僅如此,優(yōu)圖也在不斷探索前沿技術(shù)。優(yōu)圖公開(kāi)發(fā)表的論文涵蓋ICCV,CVPR,AAAI等各類(lèi)頂級(jí)會(huì)議,僅2020年即被國(guó)際計(jì)算機(jī)視覺(jué)頂級(jí)會(huì)議CVPR接收了17篇論文。此外,優(yōu)圖與中科院軟件所、中科院自動(dòng)化所、上海交通大學(xué)、廈門(mén)大學(xué)、密西根州立大學(xué)、中山大學(xué)等國(guó)內(nèi)外高校開(kāi)展高校合作項(xiàng)目,在人臉人體基礎(chǔ)技術(shù)、神經(jīng)網(wǎng)絡(luò)模型壓縮、視覺(jué)內(nèi)容檢索、智能硬件平臺(tái)、視頻內(nèi)容分析等研究方向上進(jìn)行合作研究。
轉(zhuǎn)向B端,成為新生產(chǎn)力
2017年,騰訊正式提出AI in All戰(zhàn)略,并逐漸搭建了以人工智能實(shí)驗(yàn)室、前沿科技實(shí)驗(yàn)室為雙引擎,消費(fèi)互聯(lián)網(wǎng)和產(chǎn)業(yè)互聯(lián)網(wǎng)為雙輪的AI戰(zhàn)略布局。在930組織結(jié)構(gòu)變革之后,優(yōu)圖成為了騰訊云與智慧產(chǎn)業(yè)事業(yè)群(CSIG)旗下的成員,該事業(yè)群成為騰訊To B的戰(zhàn)略窗口,是騰訊20余年歷史上首次出現(xiàn)完全面向企業(yè)客戶(hù)的大業(yè)務(wù)單元。
目前,騰訊為工業(yè)制造、醫(yī)療、政務(wù)、文旅、金融等行業(yè)提供了90余種互聯(lián)網(wǎng)解決方案,其中80%應(yīng)用到了人工智能技術(shù)。
黃飛躍認(rèn)為,產(chǎn)業(yè)互聯(lián)網(wǎng)最終的目的還是服務(wù)好C端用戶(hù):「C to B是騰訊產(chǎn)業(yè)互聯(lián)網(wǎng)的優(yōu)勢(shì),騰訊擁有超過(guò)10億用戶(hù),也有長(zhǎng)期積累的洞察和經(jīng)驗(yàn)。我們會(huì)把對(duì)于C端的服務(wù)經(jīng)驗(yàn)輸出給合作伙伴,幫助企業(yè)更好地觸達(dá)用戶(hù)?!?/span>
從面向消費(fèi)者轉(zhuǎn)為面向企業(yè),是否會(huì)影響未來(lái)技術(shù)創(chuàng)新的思路?其實(shí)在優(yōu)圖內(nèi)部,人們對(duì)此也有疑問(wèn)?!冈谵D(zhuǎn)型的過(guò)程中,我們有很多人都在思考這個(gè)問(wèn)題,研究團(tuán)隊(duì)承擔(dān)的角色不僅是業(yè)務(wù)落地的支持——這對(duì)于優(yōu)圖來(lái)說(shuō)缺少持續(xù)發(fā)展的動(dòng)力,」黃飛躍說(shuō)道?!肝覀儾粌H要支持業(yè)務(wù)發(fā)展,另一方面也要不斷探索,尋找業(yè)界、學(xué)術(shù)界的技術(shù)趨勢(shì),能夠產(chǎn)生更大價(jià)值的技術(shù)。我們會(huì)花費(fèi)更多精力進(jìn)行研發(fā)?!?/span>
在WAIC大會(huì)上,騰訊公司副總裁、騰訊研究院院長(zhǎng)司曉正式發(fā)布了《騰訊人工智能白皮書(shū):泛在智能》,作為騰訊第一份全面介紹AI、闡述騰訊AI布局和思考的白皮書(shū),該書(shū)從宏觀環(huán)境、技術(shù)研究、落地應(yīng)用、創(chuàng)新經(jīng)濟(jì)、制度保障五個(gè)維度,描繪了泛在智能的全景。計(jì)算機(jī)視覺(jué)是白皮書(shū)的重要內(nèi)容:隨著5G等技術(shù)的發(fā)展,工業(yè)視覺(jué)正在成為新的生產(chǎn)力,而人們對(duì)于視頻內(nèi)容的需求將催生更為廣泛的市場(chǎng)。
騰訊在白皮書(shū)中指出,疫情之后的近未來(lái)將是全球經(jīng)濟(jì)重建的重要時(shí)期,也是社會(huì)轉(zhuǎn)型的重要時(shí)期。這為人工智能的發(fā)展打開(kāi)了新的窗口期,并將提供豐富的實(shí)踐場(chǎng),一個(gè)「泛在智能」的世界正在加速成為現(xiàn)實(shí)。
5月26日,騰訊宣布未來(lái)五年將投入5000億,用于新基建項(xiàng)目的進(jìn)一步布局,人工智能是重點(diǎn)投入的領(lǐng)域。現(xiàn)在,騰訊希望讓人工智能發(fā)揮產(chǎn)業(yè)互聯(lián)網(wǎng)「中央處理器」的作用。