后摩爾時代,通用處理器越來越不合時宜,越來越多的嘗試在讓軟件和硬件做更深入的配合,通俗地說,就是面向場景做優(yōu)化,與另起爐灶的AWS不同,谷歌打算讓x86面向特定場景做優(yōu)化,從僅有的信息來看,效果還不錯。
剛剛過去的十年中,CPU、GPU、FPGA以及ASIC的分工越來越明確,讓計算變得原來越專業(yè)化。好處是,在云計算的技術創(chuàng)新和商業(yè)競爭的推動下,企業(yè)可以根據(jù)自己的實際需求量體裁衣,尋找最(挑剔)合適的計算方式。
谷歌云最近發(fā)布的Tau實例也是一個很好的例子。Tau是一個希臘字符,表示的是黃金分割比。谷歌工程副總裁烏爾斯·赫茲勒 (Urs Holzle)表示,這個名字表達了谷歌想面向特定負載實現(xiàn)計算、內存和I/O之間一個恰到好處的平衡。t2d是一個Tau系列實例中的第一個,t2d使用的處理器都經(jīng)過了特殊調整,使得在一些非常特定的工作負載上能提供更好的性價比。t2d實例基于AMD的“米蘭”單路Epyc 7003處理器打造,該處理器最多可提供64個核心,但在t2d的實現(xiàn)中,用戶最多可激活60個內核,還有4個內核用來運行KVM hypervisior以及存儲和網(wǎng)絡等功能。聽到這里,忍不住又想起了AWS的Nitro卡,阿里云神龍架構的MoC卡,英偉達的DPU,還有前不久英特爾宣布推出的IPU。目前為止,谷歌并沒有自研專用硬件來運行KVM hypervisior以及存儲和網(wǎng)絡等功能,從而讓所有核心全新全意運行應用負載,AWS的Nitro除了有自研的Nitro,還能讓改良版的KVM hypervisior運行在Nitro上。不過,谷歌很有可能也有某種SmartNIC,它也可以Offload一些存儲和網(wǎng)絡功能,不用非得是DPU那種。因為,我們看到Tau t2d實例的64個內核中有60個內核可用于運行實際工作負載,如果谷歌沒有類似的Offload方案的話,運行Hypervisior、存儲和網(wǎng)絡就需要占用大約30%的內核。
谷歌通過運行SPECrate2017_int_base整數(shù)基準測試,對AWS的Graviton2實例和Azure的至強Cascade Lake實例做了一個對比,測試結果發(fā)現(xiàn)谷歌的t2d實例的性能比AWS的Graviton2實例高56%,性價比比AWS的Graviton2實例高42%,比Azure基于至強的方案表現(xiàn)就強的更多了。
下圖中是谷歌自己做的SPEC測試得到的性能對比數(shù)據(jù):
下圖是性價比對比數(shù)據(jù):
測試中,谷歌選擇的是AWS的Graviton2 m6g.8xlarge實例,32 vCPU和128GB內存,成本是1.232美金每小時,Tau實例也是32vCPU,128GB內存,成本是1.352美金每小時,雖然比AWS貴一點,但性能要高很多。
不過,目前還不清楚t2d上使用的AMD 64核米蘭的成本情況,但谷歌愿意強調的是性價比的提升。
另外,上圖測試中,谷歌選擇的是Azure的D32s_v4實例,32vCPU加128GB內存,成本是1.536美金每小時。
D32s_v4實例使用的不是英特爾最新的Ice Lake至強可擴展處理器,如果是Ice Lake的話,英特爾方案的性價比也會有所提升,與前兩者的差距應該會有所縮小。
Azure從四月份就公開預覽的了新一代基于Ice Lake至強的主機——DS_v5,DS_v5也是32vCPU加128GB內存的配置,但成本只有每小時0.768美金,性能方面,特別是單核原始整數(shù)性能方面在提升20%的同時,價格只有原來的一半,仔細對比一下,結果如下圖:
看起來,微軟可能在Ice Lake至強可擴展處理器上拿到了非常大的折扣,微軟在Ice Lake 實例的發(fā)布細則中也提到,這是特殊的預覽版定價。
考慮這個價格水平,再考慮到從Cascade Lake到Ice Lake帶來的整數(shù)性能提升,Azure的Ice Lake主機才是性價比之王,所以這也就能理解為什么谷歌不用Azure的Ice Lake實例做對比了。
到此為止,可以肯定的是,谷歌肯定也算了一筆賬,谷歌也想知道微軟在這種性價比之下,最后要怎么定價,答案很可能是:每小時不到 1.00 美元。至于結果如何,我們且拭目以待吧。
競爭是好事兒,所有的云廠商都需要為怎么才能更省錢(怎么優(yōu)雅滴降價吸引客戶)展開技術競賽。
順便提一下,t2d相對于AWS主機56%的性能優(yōu)勢是因為使用了AMD優(yōu)化過的C/C++ (AOCC) 編譯器,該編譯器針對 Epyc(霄龍)架構進行了許多調整,就像英特爾編譯器針對其至強可擴展處理器芯片進行的優(yōu)化一樣。
谷歌也承認,使用開源GCC 11 編譯器時,它的性能僅比 Graviton2 高了25%,所以說,有一半的性能優(yōu)勢來自編譯器,一半則來自芯片。之所以價格下降是因為 Tau 實例沒有將內存配置拉滿,還可能有一些功能特性有所精簡。
以下是三個不同的主機在 CoreMark 基準測試中的情況,CoreMark 基準測試也是衡量 CPU 性能的一種比較常用的方法,然而,谷歌在這里只討論性價比數(shù)據(jù):
Tau t2d 實例將在第三季度上架,同時也將作為谷歌Kubernetes Engine容器平臺的底層計算平臺。
谷歌工程副總裁烏爾斯·赫茲勒表示未來可能會采用別的芯片組方案來打造適合特定用戶的配置。(這里是暗示英特爾呢嗎?不應該不是英特爾吧?)
與AWS不同,谷歌是希望依靠x86本身來進行提升,不強迫用戶面向別的架構重新編譯和應用。(這里肯定是說AWS的Graviton2)
ARM類型的實例確實是一個競爭方案,但目前基于AMD的方案能在特定工作負載中取得可見的優(yōu)勢,如您所見,包括AWS的Graviton2在內。