頭圖|CSDN下載自東方IC
關(guān)注AI開發(fā)的朋友們一定還記得,今年在HUAWEICONNECT2020上華為云業(yè)務(wù)總裁鄭葉來揭秘ModelArts 3.0一站式AI開發(fā)平臺(tái)發(fā)布。華為云的表現(xiàn)也沒有讓人失望,經(jīng)過2年時(shí)間的打磨,歷經(jīng)3次迭代,ModelArts 3.0帶來了一些實(shí)用性很強(qiáng)的新功能和新特性,其中最受開發(fā)者關(guān)注的莫過于四大“黑科技”。
ModelArts 3.0的四大“黑科技”,分別指EI骨干模型、聯(lián)邦學(xué)習(xí)、模型智能評(píng)估與診斷,以及高性能AI計(jì)算,可以讓開發(fā)者可以更簡(jiǎn)單、便捷地在各行業(yè)中部署AI。它們究竟神奇在什么地方?通過這篇文章,我們來深度了解一下ModelArts 3.0的新特性將會(huì)為大家?guī)淼脑鯓拥母淖儭?/span>
解讀四大“黑科技”
作為HUAWEICONNECT2020的重頭戲,華為云人工智能領(lǐng)域首席科學(xué)家、IEEE Fellow田奇將ModelArts 3.0描述為華為云針對(duì)“如何用極少數(shù)據(jù)訓(xùn)練出高精度模型”、“如何降低企業(yè)應(yīng)用AI門檻”、“如何解決企業(yè)對(duì)數(shù)據(jù)安全使用顧慮等問題的回答,是面向AI行業(yè)落地的AI開發(fā)平臺(tái)。
EI骨干模型——小樣本數(shù)據(jù)訓(xùn)練高精度模型,提供AI開發(fā)的新范式
華為云骨干模型EI-Backbone是華為云EI開發(fā)的通用預(yù)訓(xùn)練模型架構(gòu),目的是打造通用的預(yù)訓(xùn)練模型,通過整合模型、數(shù)據(jù)、算力和知識(shí),可以進(jìn)行模型選擇自動(dòng)設(shè)計(jì),參數(shù)配置自動(dòng)調(diào)優(yōu),在分鐘級(jí)內(nèi)完成模型訓(xùn)練,顯著降低AI使用門檻,縮短開發(fā)流程,提升開發(fā)性能。
以醫(yī)療影像分割為例,以往的醫(yī)療影像標(biāo)注需要大量數(shù)據(jù)樣本,“喂飽”訓(xùn)練數(shù)據(jù),AI訓(xùn)練才能得到較高精度的結(jié)果。而現(xiàn)在,依靠EI-Backbone,只需要幾十例甚至十幾例標(biāo)注數(shù)據(jù)即可完成醫(yī)療影像標(biāo)注,節(jié)省標(biāo)注成本90%以上。
聯(lián)邦學(xué)習(xí)——打破數(shù)據(jù)孤島,實(shí)現(xiàn)數(shù)據(jù)不出戶的行業(yè)自由聯(lián)合建模
一直以來,數(shù)據(jù)隱私都是AI行業(yè)應(yīng)用落地的難題和瓶頸,受限于隱私、安全等問題,各個(gè)企業(yè)自身的數(shù)據(jù)之間往往無法打通,形成一個(gè)個(gè)“數(shù)據(jù)孤島”,無法發(fā)揮數(shù)據(jù)的最大潛能。解決數(shù)據(jù)隱私安全問題,是打破“數(shù)據(jù)孤島”困境最有效的途徑。
為解決“數(shù)據(jù)孤島”問題,在ModelArts 3.0下,用戶可以各自利用本地?cái)?shù)據(jù)訓(xùn)練,不交換數(shù)據(jù)本身,只用加密方式交換更新的模型參數(shù),實(shí)現(xiàn)云邊協(xié)同訓(xùn)練,保護(hù)用戶數(shù)據(jù)隱私安全。此外,ModelArts 3.0不僅支持橫向聯(lián)邦學(xué)習(xí),處理對(duì)齊的數(shù)據(jù),還支持縱向聯(lián)邦學(xué)習(xí),對(duì)于訓(xùn)練樣本ID重疊多的數(shù)據(jù),也可以輕松處理。
模型智能評(píng)估診斷——直觀了解模型各方面性能,針對(duì)性調(diào)優(yōu)或部署
ModelArts 3.0提供全面的可視化評(píng)估以及智能診斷功能,使得開發(fā)者可以從精度、性能、對(duì)抗性和可解釋性方面對(duì)模型的綜合能力進(jìn)行智能評(píng)估與診斷,增強(qiáng)模型的可信度,并針對(duì)可能存在的問題給出改進(jìn)模型能力的建議,進(jìn)而輔助開發(fā)者進(jìn)行針對(duì)性的調(diào)優(yōu),讓模型更易達(dá)標(biāo)。
高性能AI計(jì)算——超大算力AI平臺(tái)底座,資源調(diào)度靈活
ModelArts 3.0在集群規(guī)模、任務(wù)數(shù)量,以及分布式訓(xùn)練各個(gè)環(huán)節(jié)做了針對(duì)性優(yōu)化,并支持彈性訓(xùn)練,可以根據(jù)模型訓(xùn)練速度的需求自適應(yīng)實(shí)現(xiàn)資源的最佳分配。
在ModelArts 3.0的加持下,訓(xùn)練的速度提升10倍,性價(jià)比提升30%。通過優(yōu)化服務(wù)框架,ModelArts 3.0還能支持10萬級(jí)別的作業(yè)同時(shí)進(jìn)行,以及萬級(jí)芯片大規(guī)模分布式任務(wù)。
效果如何,數(shù)據(jù)說話!
可以看到,ModelArts 3.0無論從模型計(jì)算、超參調(diào)優(yōu),到底層訓(xùn)練框架上都有了一些列的優(yōu)化。但實(shí)際效果如何,還需要用數(shù)據(jù)和落地實(shí)踐說話。
此外,在圖像分類技術(shù)上,ModelArts 3.0在ImageNet上的分類準(zhǔn)確率達(dá)到了85.8%,刷新了谷歌此前精度85.5%的紀(jì)錄,2020年3月以來在這方面也一直保持領(lǐng)先水平。
在圖像檢測(cè)、分割技術(shù)方面,ModelArts 3.0在業(yè)界權(quán)威的目標(biāo)檢測(cè)數(shù)據(jù)集MS-COCO數(shù)據(jù)集測(cè)試中,單模型和多模型均排名第一。
除了專業(yè)測(cè)試,ModelArts 3.0在眾多行業(yè)中的落地實(shí)踐,也可以驗(yàn)證ModelArts在開發(fā)者中的接受度。
金融領(lǐng)域
金融領(lǐng)域是AI落地最早的行業(yè)之一,復(fù)雜的場(chǎng)景對(duì)AI平臺(tái)的處理能力提出了高要求。比如在金融票據(jù)OCR識(shí)別上,由于金融票據(jù)格式多樣,差別細(xì)微,需要AI專家進(jìn)行長(zhǎng)時(shí)間的票據(jù)AI訓(xùn)練,因此業(yè)界識(shí)別準(zhǔn)確率普遍不夠精準(zhǔn)。針對(duì)票據(jù)模型開發(fā)訓(xùn)練數(shù)據(jù)標(biāo)注、模型訓(xùn)練、調(diào)優(yōu)和部署上的諸多難點(diǎn),ModelArts通過數(shù)據(jù)集分類、自動(dòng)學(xué)習(xí)、遷移學(xué)習(xí)等方法,讓初級(jí)AI開發(fā)者無需調(diào)參等操作,輕松操作數(shù)據(jù)標(biāo)注工具,完成部署。
醫(yī)療領(lǐng)域
針對(duì)新冠肺炎疫情,華為云推出AI+CT醫(yī)學(xué)影像分析服務(wù),在AI-CT輔助篩查中實(shí)現(xiàn)了自動(dòng)智能檢測(cè),而且已經(jīng)在各大醫(yī)院成功部署。華為云運(yùn)用計(jì)算機(jī)視覺與醫(yī)學(xué)影像分析技術(shù),對(duì)患者肺部CT多發(fā)磨玻璃密度影(GGO)以及肺實(shí)變進(jìn)行分割以及量化評(píng)價(jià),并結(jié)合臨床信息和實(shí)驗(yàn)室結(jié)果,輔助醫(yī)生更高效、精準(zhǔn)地區(qū)分早期、進(jìn)展期與重癥期,有利于新冠肺炎的早期篩查和早期防控。
這項(xiàng)服務(wù)依托于華為云EI醫(yī)療智能體——醫(yī)學(xué)影像分析平臺(tái)開發(fā)構(gòu)建,而這個(gè)平臺(tái),就是基于華為云AI昇騰集群服務(wù)和ModelArts一站式AI開發(fā)與管理平臺(tái),可以提供一站式醫(yī)學(xué)影像數(shù)據(jù)治理、數(shù)據(jù)標(biāo)注、模型訓(xùn)練、模型評(píng)估、可視化渲染等能力,為高校、醫(yī)院等提供海量AI算力、平臺(tái)以及算法的強(qiáng)有力支持。
智能交通領(lǐng)域
無人駕駛也是AI落地的熱門領(lǐng)域,ModelArts為開發(fā)者提供全流程的AI開發(fā)服務(wù),包括數(shù)據(jù)準(zhǔn)備、算法開發(fā)、模型訓(xùn)練、調(diào)參優(yōu)化、模型部署以及AI開發(fā)全流程管理。在自動(dòng)駕駛開發(fā)過程中,ModelArts支持計(jì)算機(jī)視覺、自然語(yǔ)言處理、音視頻等多種AI場(chǎng)景的數(shù)據(jù)標(biāo)注,并通過預(yù)置算法和用戶自定義算法可實(shí)現(xiàn)數(shù)據(jù)自動(dòng)標(biāo)注,僅需人工進(jìn)行少量的手工修正,開發(fā)者就可以借助ModelArts AI可視化全流程管理工具,完成檢測(cè)算法開發(fā)并部署至無人車。
當(dāng)然,除了以上領(lǐng)域,ModelArts在零售、IoT、物流等行業(yè)中進(jìn)行AI落地均有成功案例,并不斷開拓新的應(yīng)用場(chǎng)景。隨著5G時(shí)代的到來,可以預(yù)見AI將在越來越廣泛的場(chǎng)景中有用武之地,而作為簡(jiǎn)單易用AI開發(fā)套件的典型代表,ModelArts將會(huì)是更多開發(fā)者的不二選擇。
2018年,ModelArts推出1.0版本,為開發(fā)者帶來了一個(gè)好用的一站式AI開發(fā)平臺(tái)。至今,ModelArts經(jīng)過兩個(gè)大的版本變動(dòng),但致力于打造普惠AI的宗旨沒有改變,只是隨著5G和云時(shí)代的變化,不斷增加新能力,以適應(yīng)不斷改變的AI業(yè)務(wù)落地需求,比如自動(dòng)學(xué)習(xí)的能力、端邊云協(xié)同的能力、端到端生產(chǎn)的的能力。
用更少的操作,完成更復(fù)雜的AI任務(wù),ModelArts還在不斷探索。來年在華為一年一度最大的開發(fā)者盛會(huì)上,ModelArts還會(huì)帶來怎樣的驚喜?開發(fā)者不妨提前期待一下。