[故障]歐洲最大云服務商遭遇火災,阿里云、騰訊云、華為云有哪些宕機故事?

來源:網(wǎng)易
作者:科技da事件
時間:2021-03-19
2771
近日,歐洲最大的云服務商——OVH位于法國斯特拉斯堡的數(shù)據(jù)中心遭遇了嚴重的火災。

k_ve_office_work_iphone_communication_mobile_smartphone_table-906379.jpg

近日,歐洲最大的云服務商——OVH位于法國斯特拉斯堡的數(shù)據(jù)中心遭遇了嚴重的火災。

據(jù)悉,OVH在該區(qū)域共有4個數(shù)據(jù)中心,發(fā)生起火的SBG2數(shù)據(jù)中心被完全燒毀,SBG1的建筑物部分受損,SBG3因受到消防保護暫未受影響,SBG4則確認沒有受到波及。但出于安全起見,OVH將其位于斯特拉斯堡的全部數(shù)據(jù)中心都暫時關閉了服務。

公開信息顯示,OVH在全球共有27個數(shù)據(jù)中心,15個位于歐洲。此次的火災據(jù)稱已導致超過350萬個網(wǎng)站下線,影響波及政府機構、門戶網(wǎng)站、銀行、商店、新聞網(wǎng)站等。值得注意的是,在這之前兩天,OVH剛啟動了IPO計劃……

360se_picture.jpg

截圖自Twitter

OVH創(chuàng)始人兼董事長Oktave Klaba建議客戶啟動容災恢復計劃,OVH將在接下來的1-2周對服務器作緊急修復,完全恢復時間待定。

對于此次火災的影響,卡巴斯基實驗室(Kaspersky Lab)全球研究與分析團隊主任Costin Raiu表示,他們追蹤了140臺OVH服務器,這些服務器在火災后下降了36%(應該是指正常使用數(shù)量)。

一款游戲的「慘態(tài)」可能有一定的代表性。Rust旗下的游戲工作室Facepunch Studios證實,他們的數(shù)據(jù)已在這場大火中完全滅失,他們正在尋求替代受影響的服務器,但即使替換完成,數(shù)據(jù)也無法恢復。

360se_picture (1).jpg

截圖自Twitter

OVH及其客戶的遭遇并不特殊,云服務行業(yè)數(shù)據(jù)丟失的案例不少,以中國云服務商的幾大代表——阿里云、騰訊云、華為云——身上就可見一斑:

阿里云

2018年6月27日,阿里云官方控制臺和部分阿里云產品出現(xiàn)了故障,受影響范圍包括阿里云官網(wǎng)控制臺,以及MQ、NAS、OSS等產品功能。問題當天得到了解決。

阿里云在官方聲明中表示,故障原因是一項運維操作導致的,「……工程師團隊在上線一個自動化運維新功能中,執(zhí)行了一項變更驗證操作。這一功能在測試環(huán)境驗證中并未發(fā)生問題,上線到自動化運維系統(tǒng)后,觸發(fā)了一個未知代碼bug,錯誤代碼禁用了部分內部IP,導致部分產品訪問鏈路不通……」。

2019年3月3日,阿里云出現(xiàn)大規(guī)模宕機故障,影響了眾多華北地區(qū)的互聯(lián)網(wǎng)公司。阿里云官方表示,「華北2地域可用區(qū)C部分ECS服務器等實例出現(xiàn)IO HANG」,經(jīng)緊急排查處理后逐步恢復,將根據(jù)協(xié)議盡快賠償。

僅2周多之后的3月20日,阿里系多款產品又一次出現(xiàn)短時間無法正常運作的情況,致使阿里系多款產品癱瘓,涵蓋App包括淘寶、天貓、淘寶直播、閑魚等。

一天后的3月21日,阿里云再一次發(fā)生故障,涉及的是部署在阿里云上的鐵路12306部分服務,當用戶搜索車票時系統(tǒng)顯示「很抱歉,查詢失敗,您可以稍后點擊下面按鈕重試」。

騰訊云

2018年7月24日,多名網(wǎng)友反映騰訊云服務出現(xiàn)異常宕機事故。騰訊云客服表示,控制臺登錄異常,故障是因騰訊云廣州一區(qū)的主備兩條運營商網(wǎng)絡鏈路同時中斷所導致,騰訊表示今后騰訊將重新梳理網(wǎng)絡架構,引入更多維度的容災機制,力爭將故障隱患降到最低。

2018年8月5日,北京一家使用了騰訊云服務器的企業(yè),云服務器上包括備份的數(shù)據(jù)全部丟失,導致其幾年內的平臺數(shù)據(jù)全部丟失,聲稱造成「近千萬元損失」。隔日,騰訊云向該公司表達歉意,同時表示安排專人積極溝通,制定「賠償+補償」方案,以期將用戶損失降最低。

對于故障原因,騰訊云稱是因受所在物理硬盤固件版本bug導致的靜默錯誤使得文件系統(tǒng)元數(shù)據(jù)損壞。騰訊云聲明,后續(xù)針對云盤產品會額外實行定期強災備措施,進一步保障用戶數(shù)據(jù)的可靠性。

華為云

2020年4月10日,一直對外宣稱「不宕機的云才是好云」的華為云服務歷史上首次大面積故障。不少使用云服務的后臺都出現(xiàn)了「服務器暫時過載或處于維護中,請稍后重試」、「建立數(shù)據(jù)庫連接時出錯」等提示。

華為云官微回應稱,檢測到部分主機異常,故障基本修復,部分客戶的業(yè)務正在配合恢復中。但截至該條微博發(fā)布之時,仍有不少業(yè)內人士反映尚無法訪問華為云的服務器。

當然,國內的阿里云、騰訊云、華為云之外,全球排行前列的亞馬遜AWS、谷歌云、微軟Azure等,也都無一幸免,出現(xiàn)過相關故障……

立即登錄,閱讀全文
原文鏈接:點擊前往 >
版權說明:本文內容來自于網(wǎng)易,本站不擁有所有權,不承擔相關法律責任。文章內容系作者個人觀點,不代表快出海對觀點贊同或支持。如有侵權,請聯(lián)系管理員(zzx@kchuhai.com)刪除!
掃碼關注
獲取更多出海資訊的相關信息
優(yōu)質服務商推薦
更多
掃碼登錄
打開掃一掃, 關注公眾號后即可登錄/注冊
加載中
二維碼已失效 請重試
刷新
賬號登錄/注冊
個人VIP
小程序
快出海小程序
公眾號
快出海公眾號
商務合作
商務合作
投稿采訪
投稿采訪
出海管家
出海管家