【環(huán)球網(wǎng)智能綜合報道】近日,在第四屆國際圖像識別競賽WebVision中,華為云EI以82.97%的準確率擊敗來自全世界的94支參賽隊伍獲得冠軍。WebVision競賽由蘇黎世聯(lián)邦理工(ETH)、Google Research、卡耐基梅隆大學(xué)(CMU)等共同組織,是目前圖像識別領(lǐng)域最權(quán)威的競賽之一,被業(yè)界譽為人工智能“世界杯”,接棒曾經(jīng)推動計算機物體分類準確率超過人類的ImageNet競賽。
WebVision競賽要求參賽的AI模型將1600萬+張圖片精準分類到5000個類目中。大賽所用數(shù)據(jù)集直接從互聯(lián)網(wǎng)爬取,沒有經(jīng)過人工標注。因此數(shù)據(jù)中含有很多噪音,且數(shù)據(jù)類別的數(shù)量存在著極大不平衡,相較于ImageNet,WebVision難度提高許多,同時也更加貼近于實際應(yīng)用中的場景。
WebVision競賽展示了人工智能技術(shù)發(fā)展的另外一種可能性:基于弱監(jiān)督學(xué)習,深度學(xué)習可以不再以人工標注數(shù)據(jù)為基礎(chǔ),人工智能有望真正擺脫“人工”。
此次競賽中,華為云EI基于ModelArts訓(xùn)練大規(guī)模圖像分類模型,基于先進的分布式訓(xùn)練方法,可以縮短超大規(guī)模數(shù)據(jù)集的訓(xùn)練時間。利用伴隨圖像數(shù)據(jù)的文本描述信息,融合文本與視覺多模態(tài)特征,通過訓(xùn)練過程中的動態(tài)評估識別并剔除大量噪聲數(shù)據(jù),并進一步通過知識蒸餾降低噪聲對模型訓(xùn)練的影響,最終在完全沒有人工標注的情況下,從互聯(lián)網(wǎng)上自動爬取的大規(guī)模數(shù)據(jù)集上進行學(xué)習,訓(xùn)練得到準確率82.97%高精度模型。
華為云EI在本次比賽中運用的圖像識別技術(shù),可廣泛用于通用物品識別、圖像/視頻標簽等領(lǐng)域。近十年來計算機視覺取得的進展離不開大量人工標注的數(shù)據(jù)集,但由于人工標注需要較高的成本,幾乎不太可能構(gòu)建包羅萬象的超級數(shù)據(jù)集。互聯(lián)網(wǎng)上存在幾乎取之不盡的無標注圖像數(shù)據(jù),利用這些數(shù)據(jù)的周邊文本等信息作為帶噪聲的弱標注數(shù)據(jù)進行學(xué)習,能夠在很大程度上降低圖像識別對人工標注的依賴。
華為云EI在視覺研究領(lǐng)域有著豐富的技術(shù)積累,在6月14日-19日舉辦的CVPR2020(國際計算機視覺和模式識別大會)中,華為貢獻論文34篇,涵蓋遷移學(xué)習、半監(jiān)督學(xué)習、網(wǎng)絡(luò)架構(gòu)搜索、模型算子優(yōu)化、知識蒸餾、對抗樣本生成等前沿領(lǐng)域。展示了華為在計算機視覺領(lǐng)域強大的人才儲備、科研底蘊和創(chuàng)新能力。
華為云EI在行業(yè)應(yīng)用上亦有豐富的商用實踐經(jīng)驗。目前,華為云EI內(nèi)容審核、人臉識別、圖像搜索、視頻分析等服務(wù)已經(jīng)成功應(yīng)用于互聯(lián)網(wǎng)、媒資、園區(qū)、物流、工業(yè)等行業(yè)。華為云還將圖像識別技術(shù)應(yīng)用于天文、氣象等領(lǐng)域。2019年基于華為云圖像識別能力,在上海天文臺與國際組織SKA(平方公里陣列射電望遠鏡)合作的項目中,科學(xué)家們僅用10.02秒即完成了對20萬顆星體的識別,同時可以準確地對某一類星體進行定位,傳統(tǒng)方式完成如此大量的星體識別工作需要169天時間。