IBM發(fā)布了開源工具包UQ360(Uncertainty Quantification 360),供資料科學(xué)家使用先進(jìn)的算法,來量化、評估和改進(jìn)機(jī)器學(xué)習(xí)不確定性,以提高人工智能系統(tǒng)的安全性。
深度學(xué)習(xí)人工智能系統(tǒng),可能在錯(cuò)誤的情況,做出過于自信的預(yù)測,過去已經(jīng)有自動(dòng)駕駛汽車,因?yàn)槿斯ぶ悄芟到y(tǒng)的失誤,而導(dǎo)致人員傷亡,不只是自動(dòng)駕駛車,IBM提到,應(yīng)用在醫(yī)療上的人工智能系統(tǒng),也可能因?yàn)槟P鸵缘痛_定性做出預(yù)測,而造成病患死亡。
常見的可解釋技術(shù),能夠描述人工智能模型的工作原理,讓像是預(yù)測房價(jià)系統(tǒng)模型用戶,知道預(yù)測誤差范圍,以估計(jì)收益或是損失,而產(chǎn)品經(jīng)理也可能利用人工智能模型,來預(yù)測不同功能的平均表現(xiàn),以及對于KPI的影響。IBM提到,不確定性量化則能進(jìn)一步披露模型的局限性和潛在的故障點(diǎn),因此可以改善更多人與人工智能協(xié)作的需求。
不確定性可以讓人們知道,是否該信任模型的預(yù)測結(jié)果,像是護(hù)理師可以使用人工智能系統(tǒng)來幫助診斷皮膚病,當(dāng)人工智能可信度很高,則醫(yī)護(hù)人員便能接受人工智能的決定,反之,當(dāng)人工智能建議不被采信,就可將病患轉(zhuǎn)診至皮膚科醫(yī)生。IBM提到,不確定性是人工智能系統(tǒng)和人類用戶間的溝通形式,能夠?qū)崿F(xiàn)最佳的準(zhǔn)確性、強(qiáng)健性和公平性。
UQ360是一個(gè)開源工具包,提供不確定性量化的評估、測量、改進(jìn)和溝通。不確定性量化的方法取決于許多因素,包括基礎(chǔ)模型、機(jī)器學(xué)習(xí)任務(wù)的類型、資料的特征和用戶的目標(biāo)等,IBM提到,部分時(shí)候資料科學(xué)家所選用的不確定性量化方法,可能無法產(chǎn)生高品質(zhì)的不確定性評估,因而誤導(dǎo)用戶,所以在部署人工智能系統(tǒng)之前,必需要評估并且改進(jìn)不確定性量化品質(zhì)。
而UQ360可以協(xié)助資料科學(xué)家解決這個(gè)問題,借由使用UQ360工具包,就可以評估、測量、改進(jìn)和溝通不確定性量化。官方提到,這是目前第一個(gè)不確定性量化開源工具包,提供了一套算法來量化模型不確定性,并且助用戶評估和改進(jìn)不確定性量化,以簡化模型開發(fā)過程。
另外,UQ360也能協(xié)助團(tuán)隊(duì)高性能的進(jìn)行溝通,因?yàn)閁Q360將不確定性量化的溝通方法,集成到了人工智能生命周期中,并且對每種不確定性量劃算法提供UQ360 Python組件,開發(fā)者可以按照指引,選擇適當(dāng)?shù)臏贤ㄐ问?,進(jìn)行簡明描述或是詳細(xì)的可視化呈現(xiàn)。
IBM表示,UQ360不僅是Python函數(shù)庫工具包,而是能夠作為人工智能不確定性和局限性的溝通透明平臺(tái)。IBM創(chuàng)建了交互式體驗(yàn),來供用戶了解生成高品質(zhì)不確定性量化的方法,同時(shí)也提供許多教學(xué)內(nèi)容,展示在人工智能周期中使用不確定性量化的方法。
UQ360采用通用接口設(shè)計(jì),適用于不同的不確定性量化功能,期望可以推動(dòng)社群的負(fù)責(zé)任人工智能應(yīng)用加速創(chuàng)新。