云計(jì)算的發(fā)展離不開(kāi)可靠的底層基礎(chǔ)設(shè)施平臺(tái),而對(duì)于構(gòu)建一個(gè)強(qiáng)有力的基礎(chǔ)設(shè)施平臺(tái)各家云計(jì)算廠商則各有各的特點(diǎn)和優(yōu)勢(shì)。這個(gè)對(duì)于亞馬遜云(AWS)來(lái)說(shuō)可以說(shuō)優(yōu)勢(shì)更加明顯。
“沒(méi)有什么東西是一成不變永遠(yuǎn)不會(huì)發(fā)生故障的,我們只是需要去考慮如何在故障發(fā)生時(shí)把故障對(duì)客戶的影響降到最低。”這是AWS在面對(duì)云服務(wù)當(dāng)中基礎(chǔ)設(shè)施平臺(tái)構(gòu)建與發(fā)展的目標(biāo)和態(tài)度。
筆者認(rèn)為,態(tài)度決定一切,同時(shí)也直接影響著企業(yè)在技術(shù)創(chuàng)新與戰(zhàn)略制定的規(guī)劃走向。對(duì)此,AWS在為用戶全面提供具有前瞻性的云服務(wù)過(guò)程當(dāng)中,在很大程度上通過(guò)不斷的技術(shù)創(chuàng)新,通過(guò)構(gòu)建強(qiáng)有力的底層基礎(chǔ)設(shè)施平臺(tái),從而保證了云服務(wù)的強(qiáng)大擴(kuò)展性和應(yīng)用性。
從構(gòu)建到運(yùn)營(yíng)AWS扎根用戶需求
今年的亞馬遜re:Invent 2020大會(huì)上AWS全球基礎(chǔ)架構(gòu)和客戶支持資深副總裁Peter DeSantis圍繞著AWS基礎(chǔ)架構(gòu)底層的構(gòu)建和運(yùn)維的維度上全面展示了AWS如何去思考、去規(guī)劃和去構(gòu)建的。
眾所周知,在企業(yè)上云的過(guò)程當(dāng)中,一個(gè)最大的挑戰(zhàn)就是數(shù)據(jù)安全性的問(wèn)題,近些年一些云計(jì)算廠商頻繁出現(xiàn)的宕機(jī)事件給企業(yè)上云帶來(lái)了不小的困擾和壓力,企業(yè)用戶對(duì)于云平臺(tái)的安全性和穩(wěn)定性開(kāi)始了重新的考量。
畢竟,對(duì)于云服務(wù)來(lái)說(shuō),安全性和穩(wěn)定性這兩點(diǎn)如果都有問(wèn)題的話,那其他的一切功能和性能也就無(wú)從談起了。
在AWS看來(lái),任何關(guān)于用戶業(yè)務(wù)安全性和穩(wěn)定性的事情和步驟,都沒(méi)有捷徑可以走,云計(jì)算廠商需要扎扎實(shí)實(shí)的做好底層基礎(chǔ)設(shè)施平臺(tái)構(gòu)建的每一件事情,只有這樣才可能為用戶不斷的提供強(qiáng)有力的服務(wù)保障。
AWS是這么說(shuō)的,也是這么做的。從平臺(tái)最底層、最基礎(chǔ)的構(gòu)建,AWS就像蓋房子一樣,用多年時(shí)間,一塊磚一塊磚累積出了一個(gè)全面、可靠的云服務(wù)平臺(tái),對(duì)所有細(xì)節(jié)親力親為,其目的就是為了保障客戶的數(shù)據(jù)安全和數(shù)據(jù)利益,一切以客戶需求作為出發(fā)點(diǎn)和落腳點(diǎn)。
構(gòu)建底層基礎(chǔ)設(shè)施AWS更有料
正如文章開(kāi)篇筆者講的那樣,在AWS的基礎(chǔ)設(shè)施構(gòu)建與發(fā)展邏輯來(lái)說(shuō),任何東西都會(huì)發(fā)生故障,這是毋庸置疑的,我們無(wú)法保證數(shù)據(jù)中心里面的每一個(gè)設(shè)備永遠(yuǎn)不會(huì)發(fā)生故障,但是我們可以通過(guò)技術(shù)的創(chuàng)新去盡可能的減小故障給用戶帶來(lái)的損失和影響,這點(diǎn)是至關(guān)重要的。
從供電角度來(lái)說(shuō),發(fā)電機(jī)、UPS電源、供電開(kāi)關(guān)控制系統(tǒng)、電網(wǎng)等幾大部分組成了數(shù)據(jù)中心基礎(chǔ)設(shè)施架構(gòu)中的供電模組。發(fā)電機(jī)設(shè)備只要定期進(jìn)行維護(hù)和保養(yǎng),再加上冗余備份的解決方案,相對(duì)就可以大大減少因故障帶來(lái)的影響。
而對(duì)于難度最大的配電開(kāi)關(guān)控制系統(tǒng)來(lái)說(shuō),由于像ABB、施耐德、GE等企業(yè)已經(jīng)事先將軟件控制系統(tǒng)內(nèi)嵌到設(shè)備當(dāng)中,那么當(dāng)設(shè)備出現(xiàn)問(wèn)題和故障的時(shí)候,處理起來(lái)需要的時(shí)間相對(duì)就要拉長(zhǎng)。
面對(duì)此類問(wèn)題,AWS將自身多年的軟件應(yīng)用優(yōu)勢(shì)以及基礎(chǔ)設(shè)施運(yùn)營(yíng)優(yōu)勢(shì)進(jìn)行融合,從用戶的實(shí)際業(yè)務(wù)需求出發(fā),將一些不匹配的功能去掉,對(duì)管理系統(tǒng)、管理手段、流程等方面進(jìn)行不斷的優(yōu)化,從而不斷提升整個(gè)數(shù)據(jù)中心的管理能效。
此外,對(duì)于數(shù)據(jù)中心當(dāng)中復(fù)雜程度較高的UPS來(lái)說(shuō),數(shù)量龐大、重量巨大,并且在很多時(shí)候UPS的復(fù)雜性不能得到很好的解決。AWS通過(guò)簡(jiǎn)化開(kāi)關(guān)控制系統(tǒng),進(jìn)一步降低Switch Gear的復(fù)雜程度,通過(guò)構(gòu)建冗余系統(tǒng),AWS把數(shù)據(jù)中心安全性提升到了99.99997%。
將鉛酸電池分成小部分,每一個(gè)都做成五千瓦的容量放到機(jī)架當(dāng)中,和冗余電源搭配起來(lái),當(dāng)每一個(gè)單元出現(xiàn)問(wèn)題的時(shí)候,故障造成的破壞就被分散開(kāi)來(lái),同時(shí)每一個(gè)電池發(fā)生故障的時(shí)候,更換起來(lái)的時(shí)間也大大縮短,復(fù)雜程度大幅度降低。
值得一提的是,AWS在數(shù)據(jù)中心的選址和構(gòu)建過(guò)程當(dāng)中,通過(guò)對(duì)火災(zāi)、雷電、龍卷風(fēng)、地震、海嘯等人為和自然災(zāi)害進(jìn)行綜合考量及分析,以“兩地三中心”的方式進(jìn)行數(shù)據(jù)中心選址和構(gòu)建,獨(dú)立的網(wǎng)絡(luò)、獨(dú)立的連接,AWS所構(gòu)建的任何一個(gè)數(shù)據(jù)中心網(wǎng)絡(luò)均來(lái)自兩個(gè)不同的電信運(yùn)營(yíng)商,并且由四個(gè)不同的路徑進(jìn)入到數(shù)據(jù)中心機(jī)房,每套配線系統(tǒng)都是獨(dú)立的,極為嚴(yán)苛的要求,使得AWS所構(gòu)建的數(shù)據(jù)中心將自然和人為原因的故障率大大降低,從而保證了云服務(wù)的高效運(yùn)行。
除了基礎(chǔ)架構(gòu)的設(shè)計(jì)和部署之外,AWS還不斷強(qiáng)化供應(yīng)鏈能力,以不斷實(shí)現(xiàn)多元化等方式提升了數(shù)據(jù)中心抵抗各種風(fēng)險(xiǎn)的能力。今年全球的疫情就是一個(gè)典型的例子,在不同的時(shí)間段、不同的國(guó)家、城市當(dāng)中,由于疫情影響,均不同程度的造成了供應(yīng)鏈問(wèn)題,AWS通過(guò)多年構(gòu)建的供應(yīng)鏈體系和能力,在7個(gè)國(guó)家和地區(qū),已經(jīng)擁有了86個(gè)供應(yīng)商,這一數(shù)字還在不斷的增長(zhǎng),這也是此次疫情期間AWS仍然可以頂住壓力,持續(xù)為用戶提供高效服務(wù)的原因。
從長(zhǎng)遠(yuǎn)來(lái)看,數(shù)據(jù)中心等基礎(chǔ)設(shè)施的發(fā)展,芯片半導(dǎo)體的技術(shù)創(chuàng)新是一個(gè)繞不開(kāi)的話題,自從2015年收購(gòu)Annapurnalabs公司開(kāi)始,AWS就在半導(dǎo)體領(lǐng)域進(jìn)行不斷的深耕和創(chuàng)新,其中Nitro從第一代的1000兆到萬(wàn)兆、100G的不斷飛躍就是一個(gè)很好的寫照。通過(guò)性能和功能的不斷強(qiáng)化和提升,使得AWS在推動(dòng)發(fā)展Amazon EC2的過(guò)程當(dāng)中得到了非常大的助力,性能的成倍提升使得AWS在EC2的實(shí)例數(shù)量大幅度增加。
在談到基礎(chǔ)設(shè)施的綠色環(huán)保層面時(shí),AWS大中華區(qū)產(chǎn)品部計(jì)算與存儲(chǔ)總監(jiān)周舸告訴筆者,通過(guò)在數(shù)據(jù)中心當(dāng)中進(jìn)行一系列的技術(shù)創(chuàng)新,減少空置設(shè)備的運(yùn)行,將數(shù)據(jù)中心的耗電量大大降低,使得AWS數(shù)據(jù)中心的整個(gè)碳排放量降低了88%,長(zhǎng)遠(yuǎn)來(lái)看,AWS的所有數(shù)據(jù)中心將在2025年之前全部使用再生能源。
可見(jiàn),豐富、全面、可靠的云平臺(tái)其背后所依靠的一定是一個(gè)強(qiáng)大的基礎(chǔ)設(shè)施支撐,AWS將技術(shù)創(chuàng)新應(yīng)用于云計(jì)算服務(wù)的每一個(gè)細(xì)節(jié)當(dāng)中,不錯(cuò)過(guò)、不漏掉任何一個(gè)細(xì)分領(lǐng)域,通過(guò)構(gòu)建一個(gè)可靠的底層基礎(chǔ)設(shè)施平臺(tái),從而讓更豐富的云端服務(wù)迭代的更加高效,更符合用戶的實(shí)際需求。