Amazon SageMaker,為什么它是AWS機(jī)器學(xué)習(xí)服務(wù)優(yōu)勢的最佳體現(xiàn)?

來源: 百家號
作者:DTValue
時間:2021-01-04
17388
Amazon SageMaker是一項完全托管的服務(wù),可消除機(jī)器學(xué)習(xí)過程各個階段的挑戰(zhàn),從而使日常開發(fā)人員和數(shù)據(jù)科學(xué)家能夠更加輕松快捷地構(gòu)建、訓(xùn)練和部署機(jī)器學(xué)習(xí)模型。

機(jī)器學(xué)習(xí)正變得越來越主流,但它仍處于行業(yè)發(fā)展的早期。

為了創(chuàng)建機(jī)器學(xué)習(xí)模型,開發(fā)人員需要從高度手動的數(shù)據(jù)準(zhǔn)備過程開始,經(jīng)過可視化、選擇算法、設(shè)置框架、訓(xùn)練模型、調(diào)整數(shù)百萬個可能的參數(shù)、部署模型并監(jiān)視其性能,這個過程往往需要重復(fù)多次。

960a304e251f95ca48b3c56e2e71a93966095216.jpg

Amazon SageMaker改變了這一點(diǎn)。

Amazon SageMaker是一項完全托管的服務(wù),可消除機(jī)器學(xué)習(xí)過程各個階段的挑戰(zhàn),從而使日常開發(fā)人員和數(shù)據(jù)科學(xué)家能夠更加輕松快捷地構(gòu)建、訓(xùn)練和部署機(jī)器學(xué)習(xí)模型。目前數(shù)以萬計的客戶利用SageMaker加速機(jī)器學(xué)習(xí)部署。

AWS大中華區(qū)云服務(wù)產(chǎn)品管理總經(jīng)理顧凡表示,AWS機(jī)器學(xué)習(xí)服務(wù)的特點(diǎn)主要有三:

其一,整個機(jī)器學(xué)習(xí)服務(wù)的寬度和深度,AWS倡導(dǎo)Right tools for the right job(合適的工具做合適的事兒,一把鑰匙開一把鎖),無論客戶運(yùn)行什么樣的工作,在什么樣的場景下,工具箱就應(yīng)該有最適合的工具。

其二,AWS在云計算以及在機(jī)器學(xué)習(xí)領(lǐng)域始終懷抱開放心態(tài),可以跟客戶的生產(chǎn)環(huán)境做到非常好的集成。

其三,AWS堅持兩個原則,一個原則是“授人以魚不如授人以漁”,AWS更多希望幫助客戶建立能力,提供并教會客戶使用工具?!暗诙窃诋a(chǎn)品原型實(shí)現(xiàn)、客戶需要幫忙的時候,我們會幫客戶‘扶上馬再送一程’,真正幫他快速的把一些業(yè)務(wù)難題,先用產(chǎn)品原型的方式把它實(shí)現(xiàn)出來”,顧凡表示。

SageMaker則充分體現(xiàn)了AWS機(jī)器學(xué)習(xí)的優(yōu)勢,成為AWS歷史增長最快的服務(wù)之一,過去一年SageMaker發(fā)布了接近50個新功能。在2020 AWSre:Invent上,SageMaker再次推出九項新功能,包括更快的數(shù)據(jù)準(zhǔn)備,專用于準(zhǔn)備數(shù)據(jù)的存儲庫,工作流自動化,訓(xùn)練數(shù)據(jù)更大的透明度以減輕偏差和解釋預(yù)測,分布式訓(xùn)練功能將大型模型的訓(xùn)練速度提高兩倍,以及在邊緣設(shè)備上進(jìn)行模型監(jiān)控等功能。

今年SageMaker迭代的主要思路在哪?

首先是幫助企業(yè)客戶快速從原始數(shù)據(jù)轉(zhuǎn)化成模型里面的核心特征,企業(yè)不再需要使用大量代碼開發(fā)。

5243fbf2b21193133791eb6c825edad093238d8e.jpg

無論是單一特征還是復(fù)合特征,怎么把原始數(shù)據(jù)不同的數(shù)據(jù)源、不同的格式,快速地提取特征,這是AWS Data Wrangler所要解決的。它預(yù)制了超過300個數(shù)據(jù)轉(zhuǎn)換模板,可以一鍵對接Amazon Athena、Amazon S3、Amazon Redshift。

其次,在訓(xùn)練和推理這兩個場景當(dāng)中,企業(yè)對特征數(shù)據(jù)的使用和訪問延遲都不一樣,在訓(xùn)練時候希望所有特征數(shù)據(jù)都放進(jìn)去,使得模型更準(zhǔn)確,在推理時只需一個小子集的輸入判斷預(yù)測結(jié)果。

SageMaker推出了新功能Amazon SageMaker Feature Store來徹底解決這個問題。Feature Store是一個集中的、專門為特征存儲開發(fā)的存儲工具,而這個工具既可以解決特征的一致性問題,在訓(xùn)練和預(yù)測方面兩邊用的都是同一套特征。又能解決訓(xùn)練和預(yù)測針對特征數(shù)據(jù)存儲不一樣的需求。一套工具在滿足延遲的同時,也能夠滿足針對訓(xùn)練方面大批量加載更多特征數(shù)據(jù)的需求。

如果統(tǒng)計數(shù)據(jù)本身存在偏差,如何更早發(fā)現(xiàn)?這就是Amazon SageMaker Clarify的目標(biāo)。SageMakerClarify能夠在機(jī)器學(xué)習(xí)整個工作流中鑒別由于數(shù)據(jù)統(tǒng)計產(chǎn)生的偏差,同時SageMaker升級了Debugger工具,新增Deep Profiling功能,實(shí)現(xiàn)CPU、GPU、IO、內(nèi)存等資源使用情況的可視化。

“SageMaker始終沿著兩個方向迭代,一個就是每一個步驟做得越來越細(xì)、做得越來越易用。另外就是怎么把復(fù)雜的機(jī)器學(xué)習(xí)的工作流串聯(lián)起來。SageMaker在每一步給到更多的工具,同時將這些步驟點(diǎn)對點(diǎn)聯(lián)接,使得工作流更加自動化,反復(fù)迭代,反復(fù)演進(jìn)?!鳖櫡舱f道。

立即登錄,閱讀全文
AWS
版權(quán)說明:
本文內(nèi)容來自于百家號,本站不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。文章內(nèi)容系作者個人觀點(diǎn),不代表快出海對觀點(diǎn)贊同或支持。如有侵權(quán),請聯(lián)系管理員(zzx@kchuhai.com)刪除!
優(yōu)質(zhì)服務(wù)商推薦
更多
掃碼登錄
打開掃一掃, 關(guān)注公眾號后即可登錄/注冊
加載中
二維碼已失效 請重試
刷新
賬號登錄/注冊
個人VIP
小程序
快出海小程序
公眾號
快出海公眾號
商務(wù)合作
商務(wù)合作
投稿采訪
投稿采訪
出海管家
出海管家