你坐飛機的時候有沒有想過一個問題:「為什么我坐的飛機總是不靠廊橋,還要拿著行李去擠擺渡車?」
通常,相關(guān)人員會告訴你:廊橋資源比較珍貴,因此飛機靠橋的幾率要低于停在遠機位的幾率。
其實,這個答案只說出了一部分原因。
隨著機場航班數(shù)量的不斷增加,「靠橋率」成為了衡量機場運行管理水平的重要指標。要在這個指標上有所提高,除了改善硬件之外,「調(diào)度」也是一個突破口。
在國內(nèi),深圳機場率先找準了這個「突破口」。
深圳機場的廊橋機位與遠機位的比例為1:3。按照這個比例,很大一部分乘客都需要乘坐擺渡車。那么,如何讓更多的航班停靠在廊橋呢?深圳機場給出的解決方案是:AI智能調(diào)度。
在2018年之前,深圳機場使用的調(diào)度方案主要是人工和系統(tǒng)配合的,每天1000多個航班的機位分配需要花掉4個小時。從2018年11月開始,深圳機場開始建設(shè)機位資源智能分配系統(tǒng),2019年正式上線。該系統(tǒng)將靠橋率提升了10個百分點,每個廊橋每天能多保障一個航班,一年之內(nèi)為400萬旅客省去了坐擺渡車的麻煩。同時,它還將機位分配的時間縮短為1分鐘。
在剛剛結(jié)束的華為云TechWave人工智能專題日上,華為云人工智能領(lǐng)域首席科學家、IEEE Fellow田奇向我們講述了華為云EI運用AI技術(shù)帶來的諸多智能化變革,深圳機場智能機位分配只是其中的一個例子。類似的例子還有很多,比如通過智能調(diào)配路上的信號燈縮短停車等待時間、利用智能防暴力卸貨方案防止工作人員對快遞進行暴力分揀等。
華為云人工智能領(lǐng)域首席科學家、IEEE Fellow田奇
AI是一個需要長期積累的行業(yè),事實上華為早就開始了AI相關(guān)研究,但一直比較低調(diào),諾亞方舟等實驗室也很少出現(xiàn)在「臺前」。與之形成鮮明反差的是,華為手機的AI技術(shù)卻屢次成為大眾熱議的話題。近幾年,華為云全棧全場景AI強大的行業(yè)落地能力,在華為云EI企業(yè)智能體現(xiàn)得淋漓盡致。雖然成立還不到三年,華為云EI已經(jīng)在10多個行業(yè)的600多個項目探索和落地。
而這一切,都離不開AI基礎(chǔ)研究的支撐。
作為一個橫跨學界和業(yè)界的研究者,田奇博士的加入為華為云EI的基礎(chǔ)研究制定了新的規(guī)劃。在他的帶領(lǐng)下,華為云EI將專注于計算機視覺、決策優(yōu)化和語音語義三大方向,并于近期在這三個方向上取得了多項世界第一的成績。
計算機視覺:頂會論文近百篇,登頂ImageNet、COCO等權(quán)威數(shù)據(jù)集
計算機視覺是AI領(lǐng)域應(yīng)用最廣泛的技術(shù)之一,很多行業(yè)痛點都可以通過計算機視覺算法來解決,如道路擁堵診斷分析等。為了解決這些痛點,田奇博士帶領(lǐng)的視覺研究團隊從圖像分類、檢測、分割、多模態(tài)數(shù)據(jù)處理等多個方向入手,在基礎(chǔ)研究領(lǐng)域取得了多項突破,有近百篇論文被ICCV、ECCV、CVPR等頂會收錄。
圖像分類:登頂ImageNet、WebVision數(shù)據(jù)集
作為人類最基本的能力,大腦可以對眼睛看到的常見目標進行精準的識別,比如貓、狗、車等。但是,由于每個人知識的局限性,常人很難完成成千上萬類的物體識別。
為了解決這個問題,華為視覺團隊從2019年年底開始發(fā)力,自研出了基于知識蒸餾與數(shù)據(jù)增強的分類算法,大幅提升了圖像分類的性能。今年3月份,在ImageNet-1000大規(guī)模圖像分類數(shù)據(jù)集上,該團隊的EffNet+CAKD算法top-1精度達到了85.8%,超越了長期以來霸榜的谷歌。
其實,圖像分類并沒有看起來那么簡單,標注數(shù)據(jù)中會存在很多噪聲。在這些噪聲的「誤導」下,模型很容易出錯。
為了讓AI像人類一樣更魯棒地去處理有噪聲數(shù)據(jù)的任務(wù),華為視覺團隊提出了新的AI模型學習范式,旨在提升AI模型對數(shù)據(jù)中錯誤樣本的容忍度。
在由蘇黎世聯(lián)邦理工、Google Research、卡內(nèi)基梅隆大學等共同組織的人工智能「世界杯」——WebVision大規(guī)模網(wǎng)絡(luò)圖像數(shù)據(jù)識別競賽中,華為以82.97%的精度擊敗了來自世界各地的94支參賽隊伍,達到業(yè)界第一。
在無監(jiān)督學習方面,華為視覺團隊自研的無監(jiān)督學習算法在無標簽的ImageNet數(shù)據(jù)集上達到了72.4%的精度,比Facebook何愷明組的MOCO v2(71.1%)還要高出1.3個百分點。
圖像檢測與分割:登頂COCO數(shù)據(jù)集
不同于圖像分類技術(shù),圖像檢測和分割旨在讓計算機可以像人一樣識別到圖片中更高層次的語義信息,比如檢測目標的位置、理解目標的相互關(guān)系等。
為了解決這一類問題,華為視覺團隊自研了自適應(yīng)數(shù)據(jù)增強技術(shù),在包含16萬張圖像的COCO數(shù)據(jù)集上實現(xiàn)了單模型56.8%、多模型58.8%的檢測精度,兩項指標均達到了世界第一,打破了谷歌等公司在該領(lǐng)域多年的壟斷。
在這次疫情的大考中,原來只能依靠人類專家完成的新冠肺炎檢測任務(wù),華為云依靠領(lǐng)先的圖像分割技術(shù)實現(xiàn)了肺炎更精準、更快速的檢測,可以達到CT量化結(jié)果秒級輸出,大大提升了輔助診療的質(zhì)量和效率。
多模態(tài)數(shù)據(jù)處理:登頂NuScenes數(shù)據(jù)集
前面提到的圖像分類、檢測、分割等都是相對獨立的任務(wù),但在現(xiàn)實生活中,人們處理的往往是多個維度、多個模態(tài)的數(shù)據(jù)(如聊天時同時面對人臉和聲音),計算機也不例外。
為了挖掘和整合不同模態(tài)數(shù)據(jù)之間的知識,華為視覺團隊提出了圖像底層信息融合技術(shù),來處理語義分割信息和激光點云等多模態(tài)數(shù)據(jù)。在全世界最大規(guī)模的3D目標檢測數(shù)據(jù)集NuScenes上,該團隊擊敗了來自世界各地的92支隊伍,達到了64.2%的檢測精度,取得業(yè)界第一,領(lǐng)先第二名3.1%。
在該項多模態(tài)技術(shù)的推動下,華為云EI提出了交通智能體,來解決「你今天堵車了嗎」這個靈魂質(zhì)問。
這些成果的取得和田奇博士的加入不無關(guān)系。田奇博士畢業(yè)于伊利諾伊大學香檳分校,師從計算視覺之父Thomas S.Huang教授。在加入華為之前,他在德州大學圣安東尼奧分校任教17年。目前,他已累計發(fā)表文章超過550篇,其中250多篇入圍IEEE TPAMI、IJCV、CVPR/ICCV/ECCV、NeurIPS等國際頂級期刊和會議。
在2018年加入華為之后,田奇博士迅速適應(yīng)了學界和業(yè)界的巨大差異,認識到「工業(yè)界更注重于商業(yè)價值以及方法的實用性,針對某一個特定的問題,提升用戶體驗,帶來實際的價值」。在這種信念的指引下,他帶領(lǐng)華為的視覺團隊取得了多項基礎(chǔ)研究突破,并將其落地到華為云EI的多個項目中。
針對視覺領(lǐng)域存在的諸多問題,田奇博士在今年3月份的華為開發(fā)者大會2020(Cloud)上發(fā)布了《華為視覺研究計劃》,旨在為小樣本訓練、多模態(tài)學習、端側(cè)模型瘦身等提供解決方案。
決策優(yōu)化:在ESICUP上達到世界最優(yōu)
將一塊大玻璃切成不同的形狀,怎么切才能最大程度上減少浪費?將裝有貨物的箱子裝進集裝箱,如何實現(xiàn)空間利用的最大化?這些都是現(xiàn)實生活中普遍存在的決策優(yōu)化問題,也是華為云EI重點發(fā)力的一大方向。
為了在工業(yè)生產(chǎn)過程中盡可能減少材料浪費、降低生產(chǎn)成本,華為云EI提出了業(yè)界頂尖的決策優(yōu)化方案,在業(yè)內(nèi)公開數(shù)據(jù)集ESICUP上達到世界最優(yōu),用最少的投入獲得了最大程度的收益。
除了文章開頭提到的飛機靠橋率,這類問題在其他行業(yè)也非常常見。以物流行業(yè)為例,在路線優(yōu)化問題上,華為云的智能系統(tǒng)改變了人工查詢距離、匹配車型等操作,改為系統(tǒng)自動測算。相比于模擬人工編排路徑得到的初始解,優(yōu)化后的結(jié)果的整體運費下降了20-30%。
語音語義:DiggScience全球第一
華為云EI語音語義團隊著力于發(fā)展私人定制化的語義服務(wù),不斷訓練機器并自動學習,賦予機器認知、意識和推理的能力。同時,團隊還開發(fā)出了世界頂尖的知識圖譜平臺,完成了從感知智能到認知智能的躍變。
這些成果也得到了海內(nèi)外機構(gòu)的高度認可。在2019年10月的DiggScience科學數(shù)據(jù)挖掘大賽(學術(shù)論文搜索匹配大賽)上,華為云以58.7%的準確率奪冠,超過第二名5個百分點。在今年2月的第13屆網(wǎng)絡(luò)搜索與數(shù)據(jù)挖掘國際會議(WSDM 2020)上,華為云帶領(lǐng)的聯(lián)合團隊摘得WSDM Cup 2020大賽「論文引用意圖識別任務(wù)」金牌。
落地的背后
從以上研究成果和應(yīng)用案例我們可以看出,華為云在AI基礎(chǔ)研究的落地上是非常成功的。但有一點不可忽視:前沿研究和業(yè)務(wù)落地之間總是存在巨大的差異,田奇博士稱之為「AI使能鴻溝」。
從華為云EI落地的領(lǐng)域中我們不難發(fā)現(xiàn),華為的團隊挑的都是一些「硬骨頭」。以工業(yè)視覺場景為例,在學術(shù)界,研究者面臨的往往是標注準確、畫質(zhì)清晰的圖像,但在工業(yè)界,標注錯誤、圖像模糊是非常常見的,而且數(shù)據(jù)量也要大幾個量級。同樣嚴重的問題還有醫(yī)療領(lǐng)域的小樣本訓練以及端側(cè)的模型瘦身等,而這些都是華為云EI發(fā)力的領(lǐng)域。
橫跨學界和業(yè)界的雙重身份使得田奇博士能夠更加敏銳地感受到這些差異。在加入華為之后,他帶領(lǐng)團隊不斷克服這些挑戰(zhàn),探索出了一系列解決方案。
除了技術(shù)層面的攻關(guān)之外,田奇博士在接受機器之心采訪時還提到了華為云的團隊合作機制及人才的選拔標準。
在團隊合作方面,他表示,華為有著一套完整的促進研究組和產(chǎn)品線合作的機制,二者可以通過公司內(nèi)部各種各樣的活動進行交流,比如羅馬廣場、松鼠會等。研究組分享前沿的科研成果,產(chǎn)品線提出自身的業(yè)務(wù)痛點問題,一旦發(fā)現(xiàn)合作的機會,兩者就可以通過聯(lián)合項目組的形式進行攻關(guān)。同時,公司還創(chuàng)建了訪問學者等機制,以期更好地促進研究組和產(chǎn)品線的溝通。
在人才方面,他指出,華為云EI團隊需要的是既懂算法,又懂平臺,而且還能了解行業(yè)的人。為什么這么講?首先從研究方向來看,越來越多的行業(yè)要求為AI模型融入知識,將從業(yè)人員的經(jīng)驗系統(tǒng)化為行業(yè)知識圖譜,使模型具備推理的能力,從感知智能過渡到認知智能。從行業(yè)需求來講,不懂行業(yè)的研究者很容易陷入偽需求的漩渦,做出的產(chǎn)品與真實場景不匹配,無法解決行業(yè)痛點。
田奇博士還指出,在人才方面,除了鼓勵算法研究者去向行業(yè)人員學習背景知識外,還要說服行業(yè)專家去分享自己的行業(yè)知識,使其接受AI,這就要在溝通上多下功夫。
在談到華為云EI的下一個技術(shù)發(fā)力點時,田奇表示,華為云EI將聚焦于兩個方向:華為云體系架構(gòu)和核心算法在行業(yè)中的落地。在體系架構(gòu)方面,華為云希望將來端、邊、云能夠更好地協(xié)同,引入更多樣化的端,同時結(jié)合華為在5G和IoT的連接優(yōu)勢,賦能更多的行業(yè)。在算法方面,華為希望能跟行業(yè)相結(jié)合,解決行業(yè)中的實際問題,使得核心算法落地行業(yè)。
面向分布式AI開發(fā)及計算場景,華為云推出ModelArts Edge智能小站
在研究和產(chǎn)業(yè)部門的密切配合下,華為云EI克服了落地的重重挑戰(zhàn),不僅將上述業(yè)界頂級的AI技術(shù)用到了自己產(chǎn)品中,還將其帶到了各個行業(yè)。
而這一切,都是通過一個叫ModelArts的一站式AI開發(fā)管理平臺實現(xiàn)的。該平臺為機器學習與深度學習提供海量數(shù)據(jù)預處理及半自動化標注、大規(guī)模分布式Training、自動化模型生成,及端-邊-云模型按需部署能力,幫助用戶快速創(chuàng)建和部署模型,管理全周期AI工作流。
如今,這一平臺又有了新的延伸——ModelArts Edge智能小站。
ModelArts Edge智能小站主要面向分布式AI開發(fā)以及計算場景的需求,解決用戶在自建AI平臺過程中存在的一些痛點,如平臺部署難度高;建設(shè)周期長,無法跟上快速變化的業(yè)務(wù)趨勢等。
ModelArts Edge沉淀了華為云EI在計算機視覺、決策優(yōu)化、語音語義等領(lǐng)域的核心技術(shù),以一體化全棧方式交付完整的ModelArts平臺服務(wù)能力,是公有云服務(wù)在邊緣側(cè)的延伸,也是業(yè)界首個AI訓練及推理邊緣小站方案。
華為云人工智能領(lǐng)域首席科學家田奇在華為云TechWave人工智能專題日發(fā)布ModelArts Edge智能小站。
為了讓智能小站為客戶提供與華為云上ModelArts一致的服務(wù),該小站與ModelArts平臺保持了3個統(tǒng)一:統(tǒng)一硬件平臺、統(tǒng)一軟件架構(gòu)、統(tǒng)一平臺服務(wù)。
在數(shù)據(jù)安全方面,智能小站部署在客戶數(shù)據(jù)中心,通過物理隔離以確保安全合規(guī),實現(xiàn)了數(shù)據(jù)本地存儲、本地訓練、本地推理。
在運維方面,小站通過專線接入華為云運維中心,實現(xiàn)統(tǒng)一運維。用戶可以通過云上完成訓練作業(yè)下發(fā),而數(shù)據(jù)存儲、訓練、推理均在客戶機房完成。
華為云的技術(shù)專家在采訪中介紹了小站的一些具體應(yīng)用案例。以某大型電網(wǎng)公司為例,該公司在各個省都有節(jié)點,但各省數(shù)據(jù)量不夠大,因此需要在中心訓練后再推到省節(jié)點進行迭代。這種情況下,更好的方案是在總的節(jié)點上建一個中心的「云」,每個省節(jié)點部署ModelArts Edge智能小站。各個省之間可以通過聯(lián)邦共享數(shù)據(jù)。醫(yī)院的場景也是如此。
田奇表示,未來,華為云EI還將持續(xù)把華為AI前沿算法產(chǎn)品化,并開放給各行業(yè)的AI開發(fā)者使用,通過技術(shù)創(chuàng)新驅(qū)動產(chǎn)業(yè)智能升級。