AWS 2024年度re:Invent會議在美國拉斯維加斯舉行,席間隆重宣布數(shù)據(jù)中心組件將會升級,結合了電源、冷卻和硬件設計方面的創(chuàng)新,令可用性和效率都大大提升。大會宣布的新數(shù)據(jù)中心組件,旨在支持新一代AI創(chuàng)新和客戶與日俱增的需求。AWS基礎設施服務副總裁Prasad Kalyanaraman表示:“這些數(shù)據(jù)中心功能代表著進一步提高能源效率和靈活支持新興工作負載?!?/p>
時至今日,AWS的數(shù)據(jù)中心支持全球數(shù)百萬活躍客戶,包括使用AWS AI和機器學習服務的客戶。AWS數(shù)據(jù)中心正支持更高的功率密度,以應對需求。而數(shù)據(jù)中心設計改進包括簡化電力分配和機械系統(tǒng),使基礎設施可用性達到99.9%。系統(tǒng)經(jīng)簡化后,機架可因電力問題受影響的機會便減少了89%。
數(shù)據(jù)中心的電力在到達IT設備之前要經(jīng)過多次轉換和分配系統(tǒng),每個步驟都自然有機會故障。新設計簡化了電力分配,從而將潛在故障點的數(shù)量減少了20%。簡化又包括將備用電源帶到機架附近,減少使用散熱風扇。AWS利用自然壓力差來排出熱量,改善了可用于服務器的電量。以上變化都有助減少耗電,同時最小化故障風險。
AWS創(chuàng)建了一系列新的和增強的功能,為客戶提供最高性能、可用性和能源效率的基礎設施。其中包括液體冷卻技術,新一代AI服務器受益于液體冷卻,以更有效地冷卻高密度運算芯片。AWS開發(fā)了創(chuàng)新的機械冷卻解決方案,在新建和現(xiàn)有數(shù)據(jù)中心中提供可配置的液體到芯片冷卻。某些AWS技術利用無需液體冷卻的網(wǎng)絡和存儲基礎設施,因此更新的冷卻系統(tǒng)將無縫結合空氣和液體冷卻功能,以滿足最強大的AI芯片組(如AWS Trainium2)以及AWS的網(wǎng)絡交換機和存儲服務器的需求。這種靈活的多模式冷卻設計令AWS能以最低成本提供最大的性能和效率,加快AI工作負載的上市時間。
AWS又通過改善機架在數(shù)據(jù)中心的位置來提升功率使用,減少閑置電力。這種設計為AI工作負載提供所需的新一代硬件和高密度機架。此外,AWS還改善了電源傳輸系統(tǒng),令未來兩年內(nèi)支持機架功率密度增加6倍,并在未來再增加3倍。部分得益于新的電源架,它能夠有效地將數(shù)據(jù)中心電力傳遍整個機架,減少電力轉換損失。這些創(chuàng)新使AWS能夠為客戶工作負載提供再多12%的運算能力,同時減少實現(xiàn)相同運算能力所需的數(shù)據(jù)中心數(shù)量。
據(jù)研究估計,AWS的基礎設施目前的效率最高可達自建基礎設施的4.1倍,當工作負載在AWS上得到改善時,相關碳足跡可減少高達99%。AWS的新組件在能源效率和可持續(xù)性都有所提升,包括更高效的冷卻系統(tǒng),在每兆瓦用水量不增加的情況下,機械能源消耗減少高達46%。另外,AWS采用了低碳鋼和混凝土,并改善結構設計以減少使用鋼材。這使數(shù)據(jù)中心建筑物外殼混凝土中的隱含碳,與行業(yè)平均水平相比減少高達35%。同時,數(shù)據(jù)中心的備用發(fā)電機將能夠使用可再生柴油,相比化石柴油,其全生命周期的溫室氣體排放量可減少高達90%。AWS也已開始在歐美現(xiàn)有數(shù)據(jù)中心的備用發(fā)電機轉用可再生柴油。
新數(shù)據(jù)中心組件將在全球范圍內(nèi)擴展到AWS的所有基礎設施。預計于2025年初,美國將率先建設具有完整組件組件的新AWS數(shù)據(jù)中心。