AWS的秘密武器:徹底改變計(jì)算架構(gòu)

來源: 百家號
作者:云科技時(shí)代
時(shí)間:2021-07-03
17248
AWS正在為計(jì)算系統(tǒng)架構(gòu)的變革指明方向。就像AWS在上個(gè)十年定義了云計(jì)算運(yùn)營模式一樣,Wikibon相信它將再次引領(lǐng)未來計(jì)算系統(tǒng)的發(fā)展。支撐這些創(chuàng)新的秘訣是專門的設(shè)計(jì),用于打破低效和臃腫的集中式處理架構(gòu)的束縛。這些舉措使AWS能夠適應(yīng)跨越云、數(shù)據(jù)中心以及近端和遠(yuǎn)端工作負(fù)載的多樣性。Wikibon深入探討了AWS一直在采取的舉措,解釋他們是如何走到這一步的,為什么認(rèn)為這對行業(yè)來說是變革性的,以及這對客戶、合作伙伴和 AWS 的眾多競爭對手意味著什么。

AWS正在為計(jì)算系統(tǒng)架構(gòu)的變革指明方向。就像AWS在上個(gè)十年定義了云計(jì)算運(yùn)營模式一樣,Wikibon相信它將再次引領(lǐng)未來計(jì)算系統(tǒng)的發(fā)展。支撐這些創(chuàng)新的秘訣是專門的設(shè)計(jì),用于打破低效和臃腫的集中式處理架構(gòu)的束縛。這些舉措使AWS能夠適應(yīng)跨越云、數(shù)據(jù)中心以及近端和遠(yuǎn)端工作負(fù)載的多樣性。Wikibon深入探討了AWS一直在采取的舉措,解釋他們是如何走到這一步的,為什么認(rèn)為這對行業(yè)來說是變革性的,以及這對客戶、合作伙伴和 AWS 的眾多競爭對手意味著什么。

AWS的架構(gòu)之旅——通往Nitro和Graviton之路

AWS發(fā)起的IaaS革命為訪問VM提供了便利,可以根據(jù)需要部署和停止VM。亞馬遜使用了一個(gè)高度定制的Xen版本,允許多個(gè)VM在一臺物理機(jī)器上運(yùn)行,系統(tǒng)管理程序功能由x86控制。

根據(jù)Werner Vogels的說法,多達(dá)30%的處理能力被浪費(fèi)了,意思是這30%被用于支持管理程序功能和管理系統(tǒng)的其它部分,包括存儲和網(wǎng)絡(luò)。這些開銷導(dǎo)致了AWS開發(fā)定制的ASIC芯片,來幫助加速工作負(fù)載。

2013 年,AWS開始交付定制芯片,并與AMD合作發(fā)布 EC2 C3 實(shí)例。但隨著AWS云的擴(kuò)展,亞馬遜對性能提升并不滿意,他們看到了架構(gòu)上的限制。

這促使AWS在2014年開始與Annapurna Labs建立合作伙伴關(guān)系,并于2015年推出EC2 C4實(shí)例。 C4中的ASIC優(yōu)化了存儲和網(wǎng)絡(luò)的卸載功能,但仍依賴英特爾至強(qiáng)作為控制點(diǎn)。

據(jù)報(bào)道,AWS在2015年斥資3.5億美元收購了Annapurna——這筆微薄的資金用于獲得其未來系統(tǒng)設(shè)計(jì)的秘密武器。這次收購促成了2017年的現(xiàn)代版本的Project Nitro(Nitro 卸載卡于2013年首次推出)。這時(shí),AWS引入了C5實(shí)例,用KVM代替了Xen,并且將管理程序與ASIC更緊密地耦合在一起。去年,Vogels 表示,這一里程碑式的舉措卸載了其余的組件,包括控制平面和其余的I/O部分,并啟用近100%的處理能力來支持客戶工作負(fù)載。C5實(shí)例還引入了裸機(jī)版本,從而催生了與VMware的合作伙伴關(guān)系,以在AWS上推出 VMware Cloud。

然后在2018年,AWS邁出了新的一步,推出了Graviton,這是其定制設(shè)計(jì)的基于Arm的芯片。這打破了對x86的依賴,開啟了架構(gòu)的新時(shí)代,現(xiàn)在支持各種配置,支持?jǐn)?shù)據(jù)密集型工作負(fù)載。這些舉措為其他AWS的創(chuàng)新奠定了框架,包括針對ML、訓(xùn)練、AI、推理優(yōu)化的新芯片。

最重要的是,AWS設(shè)計(jì)了一種方法,可以卸載當(dāng)前由中央處理器完成的工作。它為未來奠定了基礎(chǔ),允許共享內(nèi)存、內(nèi)存分解和獨(dú)立資源,這些資源可以配置為支持從云到邊緣的工作負(fù)載——其成本遠(yuǎn)低于通用方法。

Nitro是這個(gè)架構(gòu)的關(guān)鍵。簡而言之——AWS Nitro是一組自定義硬件和軟件,運(yùn)行在Annapurna衍生的基于Arm的芯片上。AWS已將管理程序、網(wǎng)絡(luò)和存儲虛擬化轉(zhuǎn)移到專用硬件上,釋放出CPU,使其更有效地運(yùn)行。這一點(diǎn)之所以如此引人注目,是因?yàn)锳WS現(xiàn)在已經(jīng)有了一個(gè)架構(gòu),可以在由公共云、內(nèi)部數(shù)據(jù)中心以及近端和遠(yuǎn)端組成的大規(guī)模TAM(可觸達(dá)的市場)的各個(gè)層面進(jìn)行競爭。

為整個(gè)行業(yè)設(shè)定方向

下圖是從ETR數(shù)據(jù)集中提取的數(shù)據(jù)。它展示了為云計(jì)算、數(shù)據(jù)中心和邊緣的未來而競爭的關(guān)鍵角色。Wikibon在其中也加入了英偉達(dá)和英特爾,它們沒有直接出現(xiàn)在ETR調(diào)查中,但它們顯然是組合中的平臺參與者。

數(shù)據(jù)在縱軸上顯示凈得分——這是衡量支出速度的指標(biāo)。市場份額位于橫軸上,它是數(shù)據(jù)集中普遍性的衡量標(biāo)準(zhǔn)。Wikibon不打算在這里糾結(jié)于相對位置,而是評論一下參與者,首先是AWS,Wikibon相信AWS正在為未來設(shè)定方向。

AWS

AWS確實(shí)在大力推動從x86平臺向基于Arm的平臺遷移。在Six Five峰會上,AWS的EC2負(fù)責(zé)人David Brown談?wù)摿藦膞86遷移到AWS基于Arm的Graviton 2的問題,他還宣布了一項(xiàng)新的開發(fā)者挑戰(zhàn),以加速向Arm遷移。Brown為客戶準(zhǔn)備的產(chǎn)品,其性價(jià)比要好40%。他舉例說,一個(gè)運(yùn)行100個(gè)服務(wù)器實(shí)例的客戶通過遷移到Graviton2實(shí)例,可以用60個(gè)服務(wù)器做同樣的工作??蛻粜枰鲆恍┻w移工作,但回報(bào)是很大的。

一般來說,客戶對遷移的想法很反感。遷移的商業(yè)價(jià)值是由現(xiàn)有的利益減去遷移成本,必須考慮到任何業(yè)務(wù)中斷、代碼凍結(jié)、重新培訓(xùn)和時(shí)間價(jià)值的變量。但在這種情況下,AWS似乎正在將遷移的痛苦降到最低。

根據(jù)Brown的說法,對客戶的好處是,AWS目前提供了大約400種不同的EC2實(shí)例,去年推出的新EC2實(shí)例中有近50%是基于Arm的,而且AWS正在努力加快從x86遷移到自己設(shè)計(jì)的步伐。

英特爾

英特爾終于對市場力量做出了認(rèn)真的回應(yīng)?;旧嫌⑻貭栒诮梃bArm的玩法。2015年,英特爾為FPGA制造商Altera支付了167億美元。同樣在Six Five峰會上,英特爾的Navin Shenoy詳細(xì)介紹了英特爾所謂的 IPU(基礎(chǔ)設(shè)施處理單元)。這與英特爾的規(guī)范背道而馳,在英特爾規(guī)范中,一切都由中央處理單元控制。IPU 基本上就是個(gè)智能 NIC,DPU 也是如此,這完全是關(guān)于卸載工作、分解內(nèi)存和不斷發(fā)展的 SoC(片上系統(tǒng)和 SoP)的系統(tǒng)級封裝。

但是,讓這個(gè)問題沉淀一下。英特爾在過去一段時(shí)間的行動,顯然是為了創(chuàng)建一個(gè)平臺,使其合作伙伴能夠建立類似Nitro的卸載能力。而這個(gè)平臺的基礎(chǔ)是167億美元的收購,與AWS對Annapurna的3.5億美元的收購相比,這是令人難以置信的。

現(xiàn)在Shenoy在他的演講中說:“我們已經(jīng)在Microsoft Azure上大量部署了使用FPGA的 IPU,我們最近宣布與百度、京東云和VMware建立合作伙伴關(guān)系?!?/p>

VMware

VMware是這場競賽中另一個(gè)真正突出的平臺參與者。2020年,VMware宣布了Monterey 項(xiàng)目,這是一個(gè)類似于Nitro的架構(gòu),它聲稱不依賴于任何特定的FPGA或SoC。VMware 正在與英特爾的 FPGA、 Nvidia基于ARM的Bluefield NIC和Pensando的智能NIC等新技術(shù)合作,并打算適應(yīng)這些新技術(shù)。它還與戴爾、 HPE和聯(lián)想合作,推動這些公司各自解決方案的端到端整合。

因此,VMware正堅(jiān)定地參與其中。然而現(xiàn)在還處于早期階段,Monterey是一個(gè)項(xiàng)目,而不是一個(gè)產(chǎn)品。VMware選擇與英特爾合作可能有多種原因,包括在VMware上運(yùn)行的大多數(shù)軟件都是為x86構(gòu)建的。另外當(dāng)時(shí)Pat Gelsinger領(lǐng)導(dǎo)著VMware,他可能非常清楚地看到了未來——包括公司的和他自己的。盡管與英特爾有關(guān),Monterey的架構(gòu)設(shè)計(jì)似乎允許VMware納入其它供應(yīng)商的創(chuàng)新,包括AMD和如Bluefield這種基于Arm的平臺。

最重要的是,VMware有這樣一個(gè)項(xiàng)目,使其朝著類似于Nitro的產(chǎn)品發(fā)展,而且在這一趨勢方面,它似乎在非云競爭中處于領(lǐng)先地位。

作為智能NIC的“中立國”,VMware目前只是邁出了完全控制架構(gòu)的第一步,正如AWS之于Nitro一樣。具體來說,VMware可能會設(shè)計(jì)一個(gè)為VMWare優(yōu)化的底層解決方案,將計(jì)算與其它組件完全分離,也許這就是VMware的意圖,但目前還缺乏細(xì)節(jié)。

下一個(gè)主要步驟是設(shè)計(jì)一個(gè)像AWS Graviton這樣的定制芯片。VMware 會采取行動嗎?目前尚不清楚,但VMWare不需要這樣做,因?yàn)樗梢耘cAmpere之類的公司合作來實(shí)現(xiàn)類似的結(jié)果。

其它超大規(guī)模玩家

微軟、谷歌和阿里巴巴呢?可以說,盡管英特爾和微軟之間存在關(guān)系,但堅(jiān)信微軟和谷歌以及阿里巴巴將跟隨AWS的腳步,開發(fā)一個(gè)像Nitro這樣的基于Arm的平臺。在Wikibon看來,他們必須與AWS保持同步。

數(shù)據(jù)中心的其余廠商——戴爾、思科、HPE、IBM 和Oracle

戴爾有VMware,這是一記“將軍”。盡管兩家公司拆分了,但其實(shí)上Wikibon并不期望在業(yè)務(wù)上有任何真正的改變。戴爾將利用VMware所做的一切,并比其它任何廠商做得更好。思科很有趣,因?yàn)樗鼊倓偢倪M(jìn)了它的UCS,但沒有看到任何證據(jù)表明它的路線圖中有類似Nitro的計(jì)劃。HPE也一樣。這兩家公司都有芯片研發(fā)方面的歷史和能力——思科今天為運(yùn)營商級別的用例設(shè)計(jì)自己的芯片,而 HPE可能還有小型機(jī)的遺留。但這兩家公司很可能會效仿VMware的做法,采用基于英特爾的設(shè)計(jì)。

IBM呢?Wikibon認(rèn)為IBM能做得最好的事情,是將IBM云轉(zhuǎn)移到基于Arm的Nitro平臺上。Wikibon認(rèn)為大型機(jī)也應(yīng)該轉(zhuǎn)向Arm,現(xiàn)在建造一個(gè)專門的大型機(jī)CPU實(shí)在是太貴了。

Wikibon建議Oracle構(gòu)建或合作構(gòu)建基于Arm的、類似Nitro的數(shù)據(jù)庫云。與運(yùn)行 Oracle 的任何其他平臺相比,Oracle自己平臺的運(yùn)行成本更低、速度更快并且消耗的能源更少。Wikibon還建議更進(jìn)一步,對Oracle云中運(yùn)行的競爭型數(shù)據(jù)庫進(jìn)行優(yōu)化,想象一下在Oracle云中運(yùn)行Snowflake的場景!

關(guān)于FPGA

Wikibon從來沒有對FPGA市場過度興奮,也從來沒有覺得這些大規(guī)模的收購是合理的。英特爾對Altera的收購和AMD以350億美元收購Xilinx,這兩件事都被夸大了,特別是當(dāng)把它們與AWS的Annapurna收購案相比較時(shí)。Wikibon從The Next Platform 中找到了一份不錯(cuò)的FPGA市場概述,它將FPGA定位為一個(gè)正在下降的市場,這并不驚人。

老實(shí)說,Arm生態(tài)系統(tǒng)將通過使其更簡單、更快速地轉(zhuǎn)移到具有更好的性能、靈活性、集成度和移動性的SoC上而抹殺FPGA市場。FPGA是低容量的,遠(yuǎn)不如來自Arm生態(tài)系統(tǒng)的可編程創(chuàng)新有吸引力。

針對AMD Xilinx交易,考慮到膨脹的市場和AMD股票,它在財(cái)務(wù)上是可行的。如果AMD專注于將Arm組件集成到他們的設(shè)計(jì)中,可以加速其業(yè)務(wù)。

當(dāng)然,仍然不能忽視亞馬遜以3.5億美元收購Annapurna的輝煌,這確實(shí)令人驚訝。

英特爾對未來數(shù)據(jù)中心的愿景?

下面是Shenoy展示的一張圖表,描述了英特爾對未來的愿景:

對它分解一下。在上面看到的是IPU,它們是嵌入在所顯示的四個(gè)區(qū)塊中的智能NIC,并通過一個(gè)結(jié)構(gòu)進(jìn)行通信。左上角是通用計(jì)算,左下角是機(jī)器智能,右上角是存儲服務(wù),然后在右下角是各種替代處理器。

這是英特爾對共享資源的看法,從一個(gè)所有都由中央處理單元控制的世界,到一個(gè)更獨(dú)立的、可以并行工作的資源集合。

Gelsinger 談到了所有很酷的技術(shù),這將使英特爾納入其中,包括使內(nèi)存共享和分解的PCIe-Gen5和CXL內(nèi)存接口,以及5G和6G連接等等。

Arm如何看待未來

首先,Arm的營銷傾向于真正的技術(shù)性。但是正如在下圖看到的,與英特爾的愿景有明顯的相似之處,特別是在右側(cè)的紅色虛線區(qū)域所強(qiáng)調(diào)的,已經(jīng)有了不同類型的處理器塊,這些“塊”是可編程的。請注意兩側(cè)的“高帶寬內(nèi)存”HBM3+DDR5,對“塊”進(jìn)行支撐——這是在整個(gè)系統(tǒng)中共享的,它通過PCIe-Gen5、CXL或CCIX、多芯片/插槽連接。

這兩組方塊圖雖然在分解、隱含共享內(nèi)存和使用高級標(biāo)準(zhǔn)方面有相似之處,但也有一些顯著的差異。

特別是,Arm處于SoC級別,而Intel正在談?wù)?FPGA。Arm的架構(gòu)Neoverse正在以測試模式交付,到2022年底將有產(chǎn)品進(jìn)入終端市場。英特爾談?wù)摰淖疃嗍?025年或2024年。Arm的路線圖要清晰得多?,F(xiàn)在英特爾說它將在10月份發(fā)布更多細(xì)節(jié),所以也許Wikibon會在那個(gè)時(shí)候重新調(diào)整,但Arm顯然走得更遠(yuǎn)。

另一個(gè)主要區(qū)別是數(shù)量。英特爾是從高端數(shù)據(jù)中心開始的,并可能計(jì)劃將市場向下推至邊緣。Arm則是從邊緣開始的,低成本、低功率、高性價(jià)比。Arm已經(jīng)在邊緣市場取得了勝利,根據(jù)之前分享的來自AWS的數(shù)據(jù),它顯然在企業(yè)市場中獲得了地位。

歷史強(qiáng)烈地表明,批量的方法將獲勝。

對客戶和生態(tài)系統(tǒng)的影響

這對客戶和合作伙伴的生態(tài)系統(tǒng)意味著什么?

第一點(diǎn)是關(guān)注消費(fèi)者應(yīng)用程序。消費(fèi)者應(yīng)用程序中的能力,如圖像處理、NLP、面部識別、語音翻譯——這些今天在移動領(lǐng)域進(jìn)行的推理能力將進(jìn)入企業(yè)生態(tài)系統(tǒng)。

與云中的機(jī)器學(xué)習(xí)相關(guān)的90%的成本都是圍繞推理的。在未來,企業(yè)中的大部分人工智能,當(dāng)然還有邊緣的人工智能,將是實(shí)時(shí)推理。這在今天的企業(yè)中沒有發(fā)生,因?yàn)樗嘿F了,而且在消費(fèi)者用例之外也不成熟。這就是為什么AWS正在制造用于推理的定制芯片,它希望降低成本,增加采用率。

第二點(diǎn)是應(yīng)該開始試驗(yàn),看看可以用基于Arm的平臺做什么。摩爾定律正在加速發(fā)展,Arm在性能、價(jià)格表現(xiàn)、成本和能耗方面處于領(lǐng)先地位。例如,通過將一些工作負(fù)載轉(zhuǎn)移到Graviton上,會看到可以推動哪些類型的成本節(jié)約,或者是可以交付給企業(yè)的新應(yīng)用程序(基于Arm)。讓幾個(gè)工程師來完成這項(xiàng)任務(wù),看看他們在兩到三周內(nèi)能做什么,可能會發(fā)現(xiàn)——你可能會淘到“金礦”。

Wikibon還建議與混合云供應(yīng)商談?wù)?,看看他們是否有Nitro。VMware有一條清晰的道路,那其它戰(zhàn)略供應(yīng)商呢?他們的路線圖是什么?從他們現(xiàn)在的狀態(tài)轉(zhuǎn)變?yōu)轭愃朴?Nitro 和更具吸引力的軟件模型的時(shí)間框架是什么?他們?nèi)绾慰紤]降低成本并大規(guī)模支持新工作負(fù)載?

對于ISV來說,所有這些移動應(yīng)用和智能汽車應(yīng)用以及生物識別等技術(shù)都需要注意,此外機(jī)器智能功能將進(jìn)入軟件里。而競爭對手正在積極地移植到Arm,他們正在將這些類似消費(fèi)者的能力嵌入到應(yīng)用程序中。Wikibon強(qiáng)烈建議ISV與云供應(yīng)商談?wù)?,看看能做些什么來幫助?chuàng)新、加快運(yùn)行和降低成本。

有的時(shí)候,什么都不做,靜觀市場變化,這也是一種可行的策略。但Wikibon認(rèn)為,這一策略不適用于現(xiàn)在的市場情況。


立即登錄,閱讀全文
AWS
版權(quán)說明:
本文內(nèi)容來自于百家號,本站不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。文章內(nèi)容系作者個(gè)人觀點(diǎn),不代表快出海對觀點(diǎn)贊同或支持。如有侵權(quán),請聯(lián)系管理員(zzx@kchuhai.com)刪除!
優(yōu)質(zhì)服務(wù)商推薦
更多
掃碼登錄
打開掃一掃, 關(guān)注公眾號后即可登錄/注冊
加載中
二維碼已失效 請重試
刷新
賬號登錄/注冊
個(gè)人VIP
小程序
快出海小程序
公眾號
快出海公眾號
商務(wù)合作
商務(wù)合作
投稿采訪
投稿采訪
出海管家
出海管家