亞馬遜AWS今天再次遭遇故障,這起事件影響了眾多在線服務(wù),包括Twitch、Zoom、PSN、Xbox Live、Doordash、Quickbooks Online和Hulu等。
據(jù)AWS的狀態(tài)頁(yè)面顯示,這起故障始于太平洋標(biāo)準(zhǔn)時(shí)間上午7點(diǎn)43分左右,影響了US-WEST-1和US-WEST-2這兩個(gè)區(qū)域。
據(jù)報(bào)道,這起事件已造成了嚴(yán)重的互聯(lián)網(wǎng)連接問題,導(dǎo)致一大批在線平臺(tái)和網(wǎng)站隨之癱瘓。
AWS的工程師們正在努力搞清楚這次故障背后的根本原因,并表示他們已經(jīng)采取措施,以恢復(fù)互聯(lián)網(wǎng)連接。
AWS狀態(tài)頁(yè)面顯示:“我們已查明了通向US-WEST-2區(qū)域的互聯(lián)網(wǎng)連接出問題的根本原因,并已采取措施以恢復(fù)連接?!?/p>
“在過去的幾分鐘里,我們看到互聯(lián)網(wǎng)連接有了一定的改善,但繼續(xù)努力實(shí)現(xiàn)全面恢復(fù)。”
受這次AWS故障影響的在線服務(wù)
而僅僅一周前,另一次大規(guī)模的AWS故障影響了US-EAST-1區(qū)域,該區(qū)域?yàn)槊绹?guó)東北部地區(qū)的人員和公司企業(yè)提供連接。
因此,通過Netflix、Roku和Amazon Prime提供的流媒體服務(wù)立即受到了影響。Ring設(shè)備也隨之癱瘓,無法訪問,據(jù)用戶聲稱他們?cè)僖矡o法連接到自己的攝像頭。
亞馬遜送貨員工們也表示,他們無法訪問內(nèi)部應(yīng)用程序,而掃描包裹、訪問送貨路線或查看任何即將到來的時(shí)間表都需要使用這些應(yīng)用程序。
正如AWS后來解釋的那樣,這起事件是“為托管在主AWS網(wǎng)絡(luò)中的其中一項(xiàng)AWS服務(wù)自動(dòng)擴(kuò)展容量的活動(dòng)”引起的,這“導(dǎo)致連接活動(dòng)大量激增,從而使內(nèi)部網(wǎng)絡(luò)與主AWS網(wǎng)絡(luò)之間的網(wǎng)絡(luò)設(shè)備不堪重負(fù)”。
這些故障并不是獨(dú)特的事件,因?yàn)樽?011年以來此前已發(fā)生過多起另外的類似事件,包括2020年11月影響了US-EAST-1區(qū)域的大規(guī)模故障事件。
當(dāng)時(shí),在亞馬遜用于實(shí)時(shí)處理流數(shù)據(jù)的Kinesis服務(wù)開始遇到問題后,數(shù)量眾多的網(wǎng)站和在線平臺(tái)紛紛癱瘓。
而在之前一年的2019年9月,AWS在北弗吉尼亞州的US-EAST-1數(shù)據(jù)中心遭遇了斷電,因而導(dǎo)致沒有可用備份來恢復(fù)文件的所有亞馬遜客戶的數(shù)據(jù)丟失。
太平洋標(biāo)準(zhǔn)時(shí)間上午8點(diǎn)10分:AWS表示影響US-WEST-1和US-WEST-2這兩個(gè)區(qū)域的故障背后的問題已得到解決。
我們已經(jīng)解決了影響通向US-WEST-1區(qū)域的互聯(lián)網(wǎng)連接的問題。該區(qū)域內(nèi)部的連接并未受到該事件的影響。問題已得到解決,服務(wù)運(yùn)行正常。
太平洋標(biāo)準(zhǔn)時(shí)間中午12點(diǎn)14分:上午7點(diǎn)14分到7點(diǎn)59分之間,客戶們遇到了網(wǎng)絡(luò)數(shù)據(jù)包丟失增加的情況,這影響了通向一部分互聯(lián)網(wǎng)目的地的連接。AWS區(qū)域內(nèi)部的流量、AWS區(qū)域之間的流量以及通向互聯(lián)網(wǎng)上其他目的地的流量則并未受到影響。這個(gè)問題是由AWS主干網(wǎng)(AWS Backbone)的一部分與一小批互聯(lián)網(wǎng)服務(wù)提供商之間的網(wǎng)絡(luò)擁塞引起的,網(wǎng)絡(luò)擁塞是由AWS流量工程觸發(fā)的,這是為了應(yīng)對(duì)我們網(wǎng)絡(luò)外面的擁塞而執(zhí)行的。該流量工程錯(cuò)誤地將比預(yù)期更多的流量轉(zhuǎn)移到了AWS主干網(wǎng)的一部分,結(jié)果影響了通向一部分互聯(lián)網(wǎng)目的地的連接。問題已得到解決,我們預(yù)計(jì)不會(huì)再次發(fā)生。