一文詳解如何統(tǒng)籌管理Azure HPC資源

來源:Azure云科技
作者:Azure云科技
時間:2023-02-08
1613
本文詳解Azure Batch與Azure HPC Cache,拉滿計算性能。

640 (3).jpg

NO.5

云籌決算專刊?Azure計算系列

CPU、GPU、RAM……

高性能計算(HPC)涉及的基礎(chǔ)設(shè)施紛繁多樣

應(yīng)該如何統(tǒng)籌管理

本文詳解Azure Batch

與Azure HPC Cache

拉滿計算性能

01

Azure Batch

通過Azure Batch在Azure中高效運行大規(guī)模并行和高性能計算(HPC)批處理作業(yè)。Azure Batch創(chuàng)建和管理計算節(jié)點(虛擬機)池,安裝要運行的應(yīng)用程序,并安排作業(yè)在節(jié)點上運行。無需安裝、管理或擴展集群或作業(yè)調(diào)度程序軟件。相反,用戶可以使用Batch API和工具、命令行腳本或Azure門戶來配置、管理和監(jiān)視用戶的作業(yè)。Azure Batch不會將用戶數(shù)據(jù)移出或存儲到其部署的區(qū)域之外。

開發(fā)人員可以使用Batch作為平臺服務(wù)來構(gòu)建需要大規(guī)模執(zhí)行的SaaS應(yīng)用程序或用戶端應(yīng)用程序。例如,用戶可以使用Batch構(gòu)建一個服務(wù)來為金融服務(wù)公司運行蒙特卡羅風(fēng)險模擬,或者構(gòu)建一個服務(wù)來處理許多圖像。使用Batch不收取額外費用。用戶只需為消耗的底層資源付費,及計算單元虛擬機、存儲和網(wǎng)絡(luò)。

通過使用渲染工具(包括Autodesk Maya、3ds Max、Arnold和V-Ray),Batch支持大規(guī)模渲染工作負(fù)載。用戶還可以將Batch作業(yè)作為更大的Azure工作流的一部分來運行,以轉(zhuǎn)換由其他工具管理的數(shù)據(jù),如Azure數(shù)據(jù)工廠等。

Batch可以很好地處理本質(zhì)上并行(也稱為“令人尷尬的并行”)工作負(fù)載。這些工作負(fù)載具有可以獨立運行的應(yīng)用程序,每個部分完成總工作流的部分工作。當(dāng)應(yīng)用程序正在執(zhí)行時,程序可能會需要訪問一些公共數(shù)據(jù),但這些正在運行的程序不會與應(yīng)用程序的其他實例進行通信。因此,本質(zhì)上并行的工作負(fù)載可以大規(guī)模運行就取決于是否可以同時運行應(yīng)用程序的計算資源量。

用戶通過使用Batch來運行的一些本質(zhì)上并行的工作負(fù)載的示例:

·使用蒙特卡羅模擬的金融風(fēng)險建模

·VFX和3D圖像渲染

·圖像分析與處理

·媒體轉(zhuǎn)碼

·基因序列分析

·光學(xué)字符識別(OCR)

·數(shù)據(jù)攝取、處理和ETL操作

·軟件測試執(zhí)行

Batch的一個常見使用場景涉及在計算節(jié)點池上擴展本質(zhì)上并行的工作,例如3D場景的圖像渲染。這個池可以是用戶的“渲染農(nóng)場”,為用戶的渲染工作提供數(shù)十、數(shù)百甚至數(shù)千個內(nèi)核。下圖顯示了常見Batch工作流中的步驟,其中用戶端應(yīng)用程序或托管服務(wù)使用Batch運行并行工作負(fù)載。

640 (5).png

使用Batch的一種通用流程:

1.將輸入文件和處理這些文件的應(yīng)用程序上傳到用戶的Azure存儲帳戶。

2.在用戶的Batch帳戶中創(chuàng)建一個Batch計算節(jié)點池,一個在池上運行工作負(fù)載的作業(yè),以及作業(yè)中的任務(wù)。

3.將輸入文件和應(yīng)用程序下載到Batch

4.監(jiān)控任務(wù)執(zhí)行及進度

5.上傳任務(wù)輸出

6.下載輸出文件

更多Azure Batch詳細(xì)信息請參考:

https://learn.microsoft.com/en-us/azure/batch/

02

Azure HPC Cache(緩存)

Azure HPC緩存可加快對高性能計算(HPC)任務(wù)數(shù)據(jù)的訪問速度。通過在Azure中緩存文件,Azure HPC緩存將云計算的可擴展性帶入用戶現(xiàn)有的工作流程。該服務(wù)甚至可以用于通過WAN鏈接存儲的數(shù)據(jù)的工作流,如在用戶的本地數(shù)據(jù)中心網(wǎng)絡(luò)附加存儲(NAS)環(huán)境中。

Azure HPC緩存能很容易得從Azure門戶啟動和監(jiān)控?,F(xiàn)有的NFS存儲或新的Blob容器均可以成為其聚合命名空間的一部分,這使得用戶端訪問變得簡單,即使用戶更改了后端存儲目標(biāo)。

Azure HPC緩存最適合以下類型的工作流,以提高工作效率:

·讀取密集型文件訪問工作流

·存儲在NFS可訪問存儲、Azure Blob或兩者中均有的數(shù)據(jù)

·多達75,000個CPU內(nèi)核的計算場

Azure HPC緩存可以添加到許多行業(yè)的各種工作流中。任何需要大量機器以低延遲大規(guī)模訪問一組文件的系統(tǒng)都將從該服務(wù)中受益。以下給出了具體示例:在媒體和娛樂領(lǐng)域,Azure HPC緩存可以加快時間關(guān)鍵渲染項目的數(shù)據(jù)訪問。VFX渲染工作流程通常需要大量通過計算節(jié)點進行的“最后時刻“運算。這些工作流的數(shù)據(jù)通常位于本NAS環(huán)境中。Azure HPC緩存可以在云中緩存該文件數(shù)據(jù),以減少延遲并增強按需渲染的靈活性。其他具有具體案例的細(xì)分領(lǐng)域包括生命科學(xué)、半導(dǎo)體設(shè)計檢驗、金融服務(wù)分析等。

Azure HPC Cache駐留在單個區(qū)域中。如果用戶將它連接到位于其他區(qū)域的Blob容器,HPC Cafche可以訪問存儲在其他區(qū)域中的數(shù)據(jù)。Cache不會永久存儲用戶數(shù)據(jù)。

更多Azure HPC Cache詳細(xì)信息請參考:

https://learn.microsoft.com/en-us/azure/hpc-cache/

「云」籌決算

計算資源上云融合,性能不斷攀高。微軟Azure特推出「云」籌決算???,詳解Azure HPC高性能云計算產(chǎn)品服務(wù)矩陣,如何集成計算、網(wǎng)絡(luò)和存儲資源,為應(yīng)用程序和并行工作負(fù)載釋放超強算力。

立即登錄,閱讀全文
原文鏈接:點擊前往 >
文章來源:Azure云科技
版權(quán)說明:本文內(nèi)容來自于Azure云科技,本站不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。文章內(nèi)容系作者個人觀點,不代表快出海對觀點贊同或支持。如有侵權(quán),請聯(lián)系管理員(zzx@kchuhai.com)刪除!
優(yōu)質(zhì)服務(wù)商推薦
更多