云韌性,現(xiàn)代云服務(wù)不可或缺的組成部分

來(lái)源:亞馬遜云科技
作者:亞馬遜云科技
時(shí)間:2024-10-21
1219
韌性,一個(gè)物理學(xué)概念,表示材料在變形或者破裂過(guò)程中吸收能量的能力。韌性越好,則發(fā)生脆性斷裂的可能性越小。

9245383D-9F86-4183-9EFA-BB5AD1206697.jpeg

韌性,一個(gè)物理學(xué)概念,表示材料在變形或者破裂過(guò)程中吸收能量的能力。韌性越好,則發(fā)生脆性斷裂的可能性越小。

如今,韌性也延伸到企業(yè)特質(zhì)、產(chǎn)品特征之中,用于形容企業(yè)、產(chǎn)品乃至服務(wù)的優(yōu)劣。同樣,隨著云計(jì)算在全球范圍內(nèi)的普及與應(yīng)用,云計(jì)算的韌性亦十分重要。所謂云韌性,即云應(yīng)用程序抵御中斷或從中恢復(fù)的能力,包括與基礎(chǔ)設(shè)施、依賴(lài)服務(wù)、錯(cuò)誤配置、網(wǎng)絡(luò)問(wèn)題和負(fù)載激增相關(guān)的中斷。

云韌性既是云廠商眾多服務(wù)中的重要組成部分,也是其自身技術(shù)能力的體現(xiàn),更是用戶(hù)選擇云服務(wù)的關(guān)鍵參考標(biāo)準(zhǔn)。

全球云服務(wù)故障的頻發(fā),更是引起眾多用戶(hù)對(duì)于云韌性的關(guān)注。作為全球云計(jì)算市場(chǎng)的佼佼者,亞馬遜云科技如何看待云韌性的重要性?如何建設(shè)和實(shí)踐自身的云韌性?云韌性未來(lái)有哪些關(guān)鍵趨勢(shì)?

近日,亞馬遜云科技在《2024亞馬遜云科技云端韌性之道》溝通會(huì)上詳細(xì)闡述了這一切。

云韌性體現(xiàn)在哪些方面

IDC認(rèn)為,在數(shù)字化的世界中,韌性是指利用數(shù)字化迅速適應(yīng)業(yè)務(wù)中斷的能力,不僅可以快速恢復(fù)業(yè)務(wù)運(yùn)營(yíng),還可以利用變化的環(huán)境,通過(guò)創(chuàng)新尋找新的商業(yè)機(jī)會(huì)。在快速變化的市場(chǎng)環(huán)境中,企業(yè)通常希望云服務(wù)具備出色業(yè)務(wù)連續(xù)性。尤其是隨著企業(yè)業(yè)務(wù)變得愈發(fā)復(fù)雜之際,當(dāng)變化、故障或者風(fēng)險(xiǎn)發(fā)生時(shí),企業(yè)更加希望云韌性保障自身業(yè)務(wù)不受影響。

那么,一家云服務(wù)商的云韌性主要體現(xiàn)在哪些方面?在亞馬遜云科技大中華區(qū)解決方案架構(gòu)總經(jīng)理代聞看來(lái),云韌性主要包括基礎(chǔ)設(shè)施、系統(tǒng)架構(gòu)和運(yùn)營(yíng)機(jī)制三個(gè)方面來(lái)實(shí)現(xiàn)。

例如,像數(shù)據(jù)中心等基礎(chǔ)設(shè)施發(fā)生的鋰電池著火事件,在現(xiàn)實(shí)中很難避免,一旦發(fā)生可能就會(huì)造成云服務(wù)商單點(diǎn)故障的影響范圍擴(kuò)大化。因此,通常云服務(wù)商將基礎(chǔ)設(shè)施布局到多個(gè)地理區(qū)域,并且通過(guò)設(shè)置可用區(qū)來(lái)提升基礎(chǔ)設(shè)施的可用性,一旦某個(gè)基礎(chǔ)設(shè)施發(fā)生故障或者風(fēng)險(xiǎn)能夠快速切換。

代聞介紹,云服務(wù)韌性的建設(shè)并非是一次性工作,而是一個(gè)持續(xù)的過(guò)程,并且需要在業(yè)務(wù)需求、可靠性、成本和系統(tǒng)復(fù)雜度之間找到平衡點(diǎn)。亞馬遜云科技在其云服務(wù)的設(shè)計(jì)與實(shí)現(xiàn)中,始終將韌性作為核心考量因素之一。

具體來(lái)看,在基礎(chǔ)設(shè)施方面,亞馬遜云科技在全球34個(gè)地理區(qū)域部署108個(gè)可用區(qū),包括在中國(guó)的北京和寧夏兩大區(qū)域,每個(gè)區(qū)域均包含三個(gè)或更多獨(dú)立電力、制冷及物理安全設(shè)施的可用區(qū),且這些可用區(qū)之間距離適中,約同一區(qū)域內(nèi)的可用區(qū)之間的物理距離也經(jīng)過(guò)精心計(jì)算——通常是100公里以?xún)?nèi)。可用區(qū)的這種隔離機(jī)制,既能防止如供電、冷卻等常見(jiàn)故障點(diǎn),也能避免同時(shí)受到如地震、洪水等大規(guī)模災(zāi)害的影響。

“亞馬遜云科技在基礎(chǔ)設(shè)施的冗余、穩(wěn)定性等方面一直都采用業(yè)界最高標(biāo)準(zhǔn),處于絕對(duì)領(lǐng)先?!?/p>

“亞馬遜云科技在基礎(chǔ)設(shè)施方面非常重視中國(guó)用戶(hù)的需求。除了國(guó)內(nèi)基礎(chǔ)設(shè)施之外,考慮到中國(guó)企業(yè)出海的趨勢(shì),亞馬遜云科技剛剛在馬來(lái)西亞新的可用區(qū),在基礎(chǔ)設(shè)施的選址、設(shè)計(jì)、網(wǎng)絡(luò)等均采用極高標(biāo)準(zhǔn)。”

——代聞

亞馬遜云科技大中華區(qū)

解決方案架構(gòu)總經(jīng)理

在系統(tǒng)架構(gòu)設(shè)計(jì)方面,亞馬遜云科技通過(guò)四大核心要素——區(qū)域隔離與多可用區(qū)布局、控制面與數(shù)據(jù)面的獨(dú)立設(shè)計(jì)、單元化架構(gòu)策略以及隨機(jī)分片技術(shù),確保云服務(wù)的高度穩(wěn)定性和可用性。其中,區(qū)域隔離與多可用區(qū)策略依據(jù)故障隔離邊界將服務(wù)精細(xì)劃分為可用區(qū)級(jí)、區(qū)域級(jí)和全球級(jí)。

例如,通過(guò)將服務(wù)的控制面和數(shù)據(jù)面分離設(shè)計(jì),即使控制面發(fā)生故障,數(shù)據(jù)面也能繼續(xù)運(yùn)行,這類(lèi)似于出行系統(tǒng)中的指揮中心與車(chē)輛運(yùn)行的關(guān)系。

代聞介紹,控制面和數(shù)據(jù)面的隔離,類(lèi)似于叫車(chē)軟件和打車(chē),兩者其實(shí)是相對(duì)獨(dú)立的。當(dāng)你坐上車(chē)以后,如果一段時(shí)間叫車(chē)軟件沒(méi)有信號(hào)無(wú)法響應(yīng),也不影響司機(jī)將你送到預(yù)定的目的地。很多故障失效的情況關(guān)鍵在于沒(méi)有把數(shù)據(jù)面和控制面做到很好的隔離。此外,亞馬遜云科技還采用了“單元架構(gòu)”設(shè)計(jì)模式,將服務(wù)分割為多個(gè)獨(dú)立的單元,每個(gè)單元間不共享資源,從而進(jìn)一步降低了故障發(fā)生時(shí)的影響范圍。

在運(yùn)營(yíng)機(jī)制方面,亞馬遜云科技采取服務(wù)責(zé)任模型、運(yùn)營(yíng)就緒審查、持續(xù)安全部署及糾錯(cuò)流程四大模塊的核心機(jī)制。例如,在發(fā)布新服務(wù)前,嚴(yán)格的運(yùn)營(yíng)就緒性審查流程可保障服務(wù)復(fù)原力及最佳實(shí)踐達(dá)標(biāo),隨后通過(guò)每周運(yùn)營(yíng)會(huì)議持續(xù)監(jiān)控性能與潛在問(wèn)題。又如,糾錯(cuò)流程也很關(guān)鍵,一旦錯(cuò)誤發(fā)現(xiàn),如何快速糾錯(cuò)就成為恢復(fù)業(yè)務(wù)的關(guān)鍵能力。亞馬遜云科技面對(duì)問(wèn)題,糾錯(cuò)流程迅速啟動(dòng),通過(guò)深入分析根本原因并推動(dòng)全公司范圍內(nèi)的改進(jìn),不僅即時(shí)解決問(wèn)題,還將其轉(zhuǎn)化為未來(lái)服務(wù)優(yōu)化的寶貴經(jīng)驗(yàn),避難重復(fù)錯(cuò)誤。

“亞馬遜云科技推行DevOps文化,強(qiáng)調(diào)開(kāi)發(fā)與運(yùn)維的緊密聯(lián)系。通過(guò)打破傳統(tǒng)開(kāi)發(fā)與運(yùn)維之間的壁壘,亞馬遜云科技提升整體運(yùn)營(yíng)效率。此外,亞馬遜云科技還提供資源部署、配置管理、性能監(jiān)控、故障排查等豐富的自動(dòng)化工具來(lái)支持運(yùn)營(yíng)機(jī)制的實(shí)施,”代聞表示。

通過(guò)云韌性真正賦能用戶(hù)

作為云計(jì)算的領(lǐng)頭羊,亞馬遜云科技已經(jīng)積累了豐富的云韌性建設(shè)經(jīng)驗(yàn),并且基于不斷積累的經(jīng)驗(yàn)開(kāi)發(fā)出韌性系統(tǒng)建設(shè)生命周期框架,包括設(shè)定目標(biāo)、設(shè)計(jì)和實(shí)施、驗(yàn)證和測(cè)試、持續(xù)運(yùn)營(yíng)以及響應(yīng)和改進(jìn),通過(guò)正向循環(huán),不斷強(qiáng)化自身暈韌性,以應(yīng)對(duì)不斷變化的環(huán)境和需求。

毫無(wú)疑問(wèn),當(dāng)前的市場(chǎng)中,結(jié)構(gòu)性不確定性正在陡增,錯(cuò)綜復(fù)雜的外部環(huán)境、極速發(fā)展的數(shù)字化技術(shù)浪潮都可能對(duì)產(chǎn)業(yè)格局帶來(lái)根本性影響。如何與不確定性共存,甚至在不確定性的市場(chǎng)中保持高韌性、獲得逆勢(shì)成長(zhǎng),這是所有企業(yè)都在積極思考的話題。面對(duì)市場(chǎng)種種不確定性,企業(yè)需要具備“抗擊打能力”,能夠抵御各種沖擊。

因此,亞馬遜云科技在積極賦能客戶(hù)利用“云韌性”提升“云中韌性”。亞馬遜云科技致力于不斷為客戶(hù)提供一套全面而深入的架構(gòu)策略、高效運(yùn)營(yíng)的最佳實(shí)踐服務(wù)、前沿的技術(shù)工具以及專(zhuān)業(yè)的指導(dǎo)方案,旨在全方位助力客戶(hù)在云端環(huán)境中構(gòu)建出既穩(wěn)定靈活,又能夠迅速適應(yīng)各種挑戰(zhàn)與變化的韌性應(yīng)用程序。

例如,客戶(hù)可以使用Amazon Resilience Hub來(lái)設(shè)置目標(biāo),根據(jù)這些目標(biāo)評(píng)估韌性狀況,并根據(jù)Amazon Well-Architected Framework和Amazon Trusted Advisor的建議實(shí)施改進(jìn)措施。

奇瑞捷豹路虎是亞馬遜云科技賦能客戶(hù)的典型例子。通過(guò)將SAP系統(tǒng)遷移至亞馬遜云科技上,利用亞馬遜云科技獨(dú)有的一個(gè)區(qū)域三個(gè)可用區(qū)特性,以及特有的自適應(yīng)跨可用區(qū)高可用集群進(jìn)行整體切換,實(shí)現(xiàn)高可用和同城災(zāi)備融合,最大限度地減少了停機(jī)時(shí)間和保障零數(shù)據(jù)丟失,故障切換時(shí)間從半小時(shí)縮短至3分鐘。

故障總在情理之中、意料之外?!皝嗰R遜云科技將持續(xù)為客戶(hù)提供廣泛、深入的架構(gòu)及運(yùn)營(yíng)最佳實(shí)踐的服務(wù)、工具和指導(dǎo),幫助客戶(hù)在云中構(gòu)建和運(yùn)行韌性的應(yīng)用程序。”代聞表示。

立即登錄,閱讀全文
原文鏈接:點(diǎn)擊前往 >
文章來(lái)源:亞馬遜云科技
版權(quán)說(shuō)明:本文內(nèi)容來(lái)自于亞馬遜云科技,本站不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。文章內(nèi)容系作者個(gè)人觀點(diǎn),不代表快出海對(duì)觀點(diǎn)贊同或支持。如有侵權(quán),請(qǐng)聯(lián)系管理員(zzx@kchuhai.com)刪除!
優(yōu)質(zhì)服務(wù)商推薦
更多
掃碼登錄
打開(kāi)掃一掃, 關(guān)注公眾號(hào)后即可登錄/注冊(cè)
加載中
二維碼已失效 請(qǐng)重試
刷新
賬號(hào)登錄/注冊(cè)
個(gè)人VIP
小程序
快出海小程序
公眾號(hào)
快出海公眾號(hào)
商務(wù)合作
商務(wù)合作
投稿采訪
投稿采訪
出海管家
出海管家