上新了!亞麻云|聚焦高性能算力,基于英偉達(dá) H200 GPU 的新一代實例正式可用!

來源:亞馬遜云科技
作者:亞馬遜云科技
時間:2024-09-17
3092
亞馬遜云科技特別推出《上新了!亞麻云》,每月與您相約,一文快速了解重磅產(chǎn)品動態(tài)!

亞馬遜云科技特別推出《上新了!亞麻云》,每月與您相約,一文快速了解重磅產(chǎn)品動態(tài)!

90E0C9C6-85FC-4EF7-8143-F46463664B53.jpeg

01

「重磅上新」

亞馬遜云科技本月重磅新品聚焦高性能算力,不僅上線了基于NVIDIA H200及L40S構(gòu)建的兩款最新GPU實例,同時也帶來全新發(fā)布的高性能計算托管服務(wù)Amazon Parallel Computing Service,全力加速生成式AI及高性能計算。

基于H200的Amazon EC2 P5e

實例及基于L40s的

Amazon EC2 G6e實例正式發(fā)布

亞馬遜云科技推出全新的Amazon EC2 G6e實例,由NVIDIA L40S Tensor Core GPU提供加速支持。相比上一代G5實例,Amazon EC2 G6e實例的計算性能可提升高達(dá)2.5倍,而與P4d實例相比,推理成本則可降低20%左右。

Amazon EC2 G6e實例旨在服務(wù)于機器學(xué)習(xí)和空間計算等GPU密集型工作負(fù)載。它能夠支持部署大型語言模型(參數(shù)量高達(dá)130億)、生成式AI模型(圖像/視頻/音頻擴散模型)以及創(chuàng)建大規(guī)模3D模擬和數(shù)字孿生體等應(yīng)用場景。

Amazon EC2 G6e實例目前在美國東部(弗吉尼亞北部、俄亥俄州)和美國西部(俄勒岡州)三個區(qū)域開放,提供按需、預(yù)留、競價實例以及節(jié)省計劃等多種購買模式。開發(fā)者可通過亞馬遜云科技管理控制臺、Amazon CLI和Amazon SDK等渠道啟動使用。

亞馬遜云科技正式推出全新Amazon EC2 P5e實例,由NVIDIA H200 Tensor Core GPU提供加速支持。相較上代P5實例,Amazon EC2 P5e實例的GPU顯存容量提升1.7倍,內(nèi)存帶寬提升1.5倍。

Amazon EC2 P5e實例專為大型語言模型(LLM)、生成式AI模型以及高性能計算(HPC)等GPU密集型工作負(fù)載而設(shè)計。在LLM推理方面,Amazon EC2 P5e實例可實現(xiàn)顯著性能提升和成本節(jié)省。

例如,在單個Amazon EC2 P5e實例上部署4050億參數(shù)的Meta LLaMa 3.1模型,吞吐量可比雙P5實例提高1.72倍,成本降低69%。此外,Amazon EC2 P5e實例適用于模擬、藥物發(fā)現(xiàn)、天氣預(yù)報等內(nèi)存密集型HPC應(yīng)用。亞馬遜云科技還預(yù)告將推出Amazon EC2 P5en實例,采用PCIe Gen5連接CPU和GPU,網(wǎng)絡(luò)延遲更低。

Amazon EC2 P5e實例現(xiàn)已在美國俄亥俄州區(qū)域通過Amazon EC2 Capacity Blocks for Machine Learning開放使用??偟膩碚f,Amazon EC2 P5e是亞馬遜云科技面向人工智能和機器學(xué)習(xí)及HPC工作負(fù)載推出的新一代GPU加速實例。

開啟HPC云端新時代,亞馬遜云科技

推出Amazon Parallel Computing Service

為解決傳統(tǒng)HPC集群建設(shè)和運維成本高昂且缺乏彈性擴展能力的痛點,亞馬遜云科技推出了全新Amazon Parallel Computing Service(Amazon PCS)。這是一項全托管服務(wù),可以使您基于亞馬遜云科技輕松運行和擴展高性能計算(HPC)工作負(fù)載。

Amazon PCS為用戶構(gòu)建并管理整個Slurm集群環(huán)境,包括控制節(jié)點、計算節(jié)點、作業(yè)隊列、遠(yuǎn)程可視化等。Slurm作業(yè)調(diào)度系統(tǒng)是HPC領(lǐng)域事實上的標(biāo)準(zhǔn),現(xiàn)被全球眾多科研機構(gòu)和企業(yè)廣泛使用,它提供強大的作業(yè)調(diào)度、監(jiān)控和資源管理功能,支持在大規(guī)模節(jié)點上高效展開并行作業(yè)。Amazon PCS使用戶可以在熟悉的Slurm環(huán)境中工作,而無需操心底層基礎(chǔ)設(shè)施。

同時,借助亞馬遜云科技的彈性云資源,Amazon PCS根據(jù)需求無縫擴展HPC集群的計算規(guī)模,支持從零擴展至數(shù)千個實例,以高性價比的方式滿足各種大規(guī)模計算需求。Amazon PCS也支持構(gòu)建一體化的HPC集群,可與Amazon EFS、Amazon FSx、Amazon EC2等亞馬遜云科技核心服務(wù)深度集成,讓用戶可以無縫接入高性能云存儲、GPU加速實例等資源,構(gòu)建更強大的HPC環(huán)境。

Amazon PCS為廣泛的計算密集型或數(shù)據(jù)密集型工程和科學(xué)工作負(fù)載而設(shè)計,涉及計算流體動力學(xué)、天氣模擬、有限元分析、電子設(shè)計自動化等領(lǐng)域。目前,Amazon PCS已幫助全球多家科研機構(gòu)高效運行HPC負(fù)載。

Marvel Fusion是一家總部位于德國的聚變能源初創(chuàng)公司,致力于創(chuàng)造無限零排放能源。Marvel Fusion的首席執(zhí)行官莫里茨·馮德林登說:“我們很高興Amazon PCS服務(wù)將提供高可用性和易于升級的HPC集群管理能力。它將使我們的科學(xué)家和IT員工能夠在幾小時內(nèi)利用PCS的最新功能,而不是之前需要的數(shù)周計劃和額外開銷?!?/p>

02

「更多新品」

Amazon Bedrock支持跨區(qū)域推理

Amazon Bedrock現(xiàn)已支持跨區(qū)域推理,這一新功能可在不同亞馬遜云科技區(qū)域間動態(tài)分配計算資源,應(yīng)對突發(fā)流量高峰。

開啟該功能后,按需付費模式的客戶可獲得高達(dá)2倍的區(qū)域配額上限,并在高峰期獲得更出色的服務(wù)可用性和性能表現(xiàn)??蛻艨蛇x擇數(shù)據(jù)流向的區(qū)域范圍,滿足數(shù)據(jù)駐留和合規(guī)要求,請求會優(yōu)先分配至最近區(qū)域以降低延遲??鐓^(qū)域推理無需額外路由費用,計費遵循請求發(fā)出區(qū)域標(biāo)準(zhǔn)。該功能可顯著提升應(yīng)用的可靠性、性能和效率。

Amazon OpenSearch Service

支持Amazon Graviton3實例部署

(中國區(qū)域新品)

Amazon OpenSearch Service新增支持基于Amazon Graviton3處理器的實例類型,包括計算優(yōu)化C7g、通用M7g和內(nèi)存優(yōu)化R7g實例。

與上一代Graviton2相比,Graviton3實例性能提升高達(dá)25%,提供高達(dá)30Gbps的增強網(wǎng)絡(luò)帶寬和20Gbps的Amazon EBS帶寬。新實例類型支持所有OpenSearch版本及Elasticsearch 7.9和7.10開源版本。用戶可通過Amazon OpenSearch Service控制臺或API無縫將域名升級到新的Graviton3實例類型。

Amazon Backup新增

SAP HANA on Amazon EC2的跨區(qū)域、

跨賬戶備份復(fù)制功能

Amazon Bedrock現(xiàn)已支持跨區(qū)域推理,這一新功能可在不同亞馬遜云科技區(qū)域間動態(tài)分配計算資源,應(yīng)對突發(fā)流量高峰。

通過此功能,客戶可以通過Amazon Backup,在亞馬遜云科技不同區(qū)域和賬戶中,生成并存儲額外的SAP HANA快照副本。這些快照副本為源賬戶提供了額外的保護(hù),以防意外或惡意刪除、災(zāi)難或勒索軟件導(dǎo)致業(yè)務(wù)中斷??蛻艨墒褂脕嗰R遜云科技Backup控制臺、API或CLI開始使用SAP HANA的跨區(qū)域和跨賬戶備份,并可按需還原或創(chuàng)建跨區(qū)域跨賬戶副本,降低停機風(fēng)險,確保滿足災(zāi)難恢復(fù)和業(yè)務(wù)連續(xù)性要求。

原文鏈接:點擊前往 >
文章來源:亞馬遜云科技
版權(quán)說明:本文內(nèi)容來自于亞馬遜云科技,本站不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。文章內(nèi)容系作者個人觀點,不代表快出海對觀點贊同或支持。如有侵權(quán),請聯(lián)系管理員(zzx@kchuhai.com)刪除!
個人VIP
小程序
快出海小程序
公眾號
快出海公眾號
商務(wù)合作
商務(wù)合作
投稿采訪
投稿采訪
出海管家
出海管家