Unity 近日發(fā)布了 Unity 計算機視覺數(shù)據(jù)集,該數(shù)據(jù)集將有效降低計算機視覺應(yīng)用的開發(fā)成本,加快為制造業(yè)、零售業(yè)和安防行業(yè)訓(xùn)練人工智能(AI)的速度。計算機視覺方案提供商現(xiàn)在可以為其 AI 訓(xùn)練需求購買定制化的數(shù)據(jù)集,同時保證符合嚴(yán)格的隱私和監(jiān)管標(biāo)準(zhǔn)。
對于人工智能訓(xùn)練來說合成數(shù)據(jù)非常重要,因為往往現(xiàn)實世界所收集的真實數(shù)據(jù)無法滿足特定的條件或需求。比如隱私規(guī)定限制了真實數(shù)據(jù)的可用性,或規(guī)定了數(shù)據(jù)只能以何種方式被使用。合成數(shù)據(jù)的一種常見用途是用于預(yù)發(fā)布的產(chǎn)品測試,此時現(xiàn)實數(shù)據(jù)可能不存在或無法被測試人員獲取。此外,機器學(xué)習(xí)需要大量的數(shù)據(jù)用于訓(xùn)練算法,這也有賴于合成數(shù)據(jù)。因為在現(xiàn)實生活中,尤其是在自動駕駛汽車行業(yè),生成能夠用于算法訓(xùn)練的數(shù)據(jù)非常昂貴。如今 Unity 已經(jīng)推出了計算機視覺數(shù)據(jù)集,未來在獲取用于人工智能和機器學(xué)習(xí)訓(xùn)練的高質(zhì)量合成數(shù)據(jù)集上,成本將不再是障礙。
由 Unity 引擎合成的逼真圖像可以描繪自動駕駛場景中可能發(fā)生的各種低概率事件,從而改善自動駕駛系統(tǒng)的訓(xùn)練效果
“通過提供符合隱私規(guī)定且如實反映真實世界的合成數(shù)據(jù),我們能夠讓這些具有開創(chuàng)性的數(shù)據(jù)集為更多創(chuàng)新者所用。根本上來說,這些數(shù)據(jù)集能幫助企業(yè)規(guī)劃和模擬尚未出現(xiàn)過的場景,甚至能夠模擬真實世界的用戶增長來不斷調(diào)整訓(xùn)練數(shù)據(jù)。因此,隨著客戶應(yīng)用領(lǐng)域的擴展,我們將能看到更智能的室內(nèi)環(huán)境,比如全自助無人零售店等等?!?Unity 人工智能和機器學(xué)習(xí)高級副總裁 Danny Lange 博士表示,“合成數(shù)據(jù)正在徹底改變機器學(xué)習(xí)模型的訓(xùn)練方式,它彌補了人工收集和標(biāo)記真實世界數(shù)據(jù)的許多不足之處。我們正在探索一切可能性,幫助創(chuàng)作者們獲取他們決策所需、并且負(fù)擔(dān)得起的數(shù)據(jù),推動 Unity 技術(shù)在各個領(lǐng)域的應(yīng)用。這也是為什么我們推出這些數(shù)據(jù)集,并竭力幫助客戶滿足他們的需求。”
給物品“帖上”正確的標(biāo)簽
圖像掃描而成的物品
合成數(shù)據(jù)擁有諸多優(yōu)勢,但是上手可能并不輕松:該技術(shù)本身對許多機器學(xué)習(xí)從業(yè)者來說都略顯新鮮,而為研究對象制作一整套的 3D 資源也是耗時耗力。
而由我們制作的 3D 資源皆為定制資源,每個導(dǎo)入 Unity 的數(shù)據(jù)集都會匹配模型的具體訓(xùn)練需求。有 3D 模型的,可轉(zhuǎn)換成 CAD 模型,沒有模型的,我們會使用先進的圖像掃描技術(shù)來掃描現(xiàn)實物品,或交由專業(yè)藝術(shù)團隊制作 3D 數(shù)字孿生。
各類帶標(biāo)簽的合成圖像數(shù)據(jù)
在制作完 3D 模型后,我們再制定資源每幀上的行為、加上正確的標(biāo)簽。Unity 使用“域隨機化”(domain randomization)技術(shù)來創(chuàng)建各種計算機視覺數(shù)據(jù)集,以此來提高數(shù)據(jù)質(zhì)量并控制實際應(yīng)用中的偏差值。在合成數(shù)據(jù)的過程中,該技術(shù)將對目標(biāo)物體的位置和朝向進行各種排列組合,還有光照和攝像機角度的變化,以及可能實現(xiàn)的 Unity 環(huán)境的無數(shù)變量配置等。而且,Unity 的合成數(shù)據(jù)集還可以避免真實數(shù)據(jù)獲取過程中可能存在的隱私違規(guī)或不可控的人工偏差。比如有些包含真實的人或地點的圖像是直接從互聯(lián)網(wǎng)上非法抓取的,或是花費大量人力從真實世界中拍攝獲得。
動態(tài)的環(huán)境
環(huán)境隨機化
數(shù)據(jù)集項目中的每個環(huán)境要素都可以隨機化:光照、紋理、攝像機位置、鏡頭屬性、信號噪波等等皆可改變,用多樣化的數(shù)據(jù)集來應(yīng)對最為廣泛的用例。
在使用合成數(shù)據(jù)時,組成數(shù)據(jù)環(huán)境的背景并不一定要反映現(xiàn)實。部分計算機視覺的應(yīng)用可能還需高度隨機的背景,當(dāng)然也有需要一定背景結(jié)構(gòu)的情況存在,比如建筑或住宅內(nèi)部。
無結(jié)構(gòu)與結(jié)構(gòu)化的合成環(huán)境
我們團隊已開發(fā)出一系列針對各種應(yīng)用的無結(jié)構(gòu)與結(jié)構(gòu)化合成環(huán)境制作方法,專家們將針對不同的問題、情景和數(shù)據(jù)范圍推薦環(huán)境類型。
數(shù)據(jù)集規(guī)??纱罂尚?/strong>
不同的應(yīng)用有不同的數(shù)據(jù)要求,圖像的數(shù)量取決于場景復(fù)雜度、物品品類數(shù)和方案精確度。我們將深入理解客戶的需求,幫助劃定項目的框架,與客戶多次交流來保證數(shù)據(jù)集達到標(biāo)準(zhǔn)。
我們計劃在未來提供一個自助式接口,讓用戶能自行生成額外數(shù)據(jù),不必再依賴 Unity 團隊。
服務(wù)價格分為多個階梯,不同數(shù)據(jù)量報價不同,幫助你掌控預(yù)算。對于真實世界的數(shù)據(jù),標(biāo)注的價格隨著標(biāo)注類型的復(fù)雜性而增加。Unity 則提供了一個適用于任何標(biāo)簽類型的較低價格,客戶無論是為簡單還是復(fù)雜的行業(yè)標(biāo)準(zhǔn)都將支付相同的標(biāo)簽價格,如 2D 和 3D 邊框盒、類別分割和實例分割。合成數(shù)據(jù)集是按等級定價模型收費的,客戶所需合成的圖像數(shù)量越多,每幅圖像的價格越低。
了解更多關(guān)于 Unity 人工智能數(shù)據(jù)集,請訪問:
https://unity.com/products/computer-vision