IT之家 5月28日消息,據(jù)MSPoweruser報道,Meta于2021年首次使用微軟Azure虛擬機。由于其更快的分布式AI訓練,Meta將NVIDIA A100 80GB GPU應用于其大規(guī)模AI研究,例如訓練其OPT-175B語言模型。顯然,它還可以做更多事情,因此Meta決定為其AI研究提供更多機器學習訓練工作負載。
“作為這種更深層次關系的一部分,Meta將擴大其對Azure超級計算能力的使用,以加速其Meta AI團隊的人工智能研發(fā),”Azure HPC和AI高級項目經(jīng)理Sherry Wang指出?!癕eta將使用Azure中最新的虛擬機(VM)系列(NDm A100 v4系列,配備NVIDIA A100 Tensor Core 80GB GPU),5400個GPU的專用Azure集群用于他們的一些大規(guī)模AI研究工作負載?!?/p>
微軟和Meta的合作并不止于此。兩家公司還計劃在Azure上擴展PyTorch的使用。Wang表示,微軟將創(chuàng)建PyTorch開發(fā)加速器,以便在Azure上快速實施基于PyTorch的解決方案。此外,該公司承諾將持續(xù)提供PyTorch企業(yè)級支持,“以使客戶和合作伙伴能夠在云和邊緣的生產(chǎn)環(huán)境中部署PyTorch模型?!?/p>
Meta人工智能副總裁Jerome Pesenti表示:“我們很高興能夠加深與Azure的合作,以推動Meta的人工智能研究、創(chuàng)新和開源工作,從而使全球更多的開發(fā)人員受益?!薄皯{借Azure的計算能力和每臺VM 1.6TB/s的互連帶寬,我們能夠加速不斷增長的培訓需求,以更好地適應更大、更具創(chuàng)新性的AI模型。此外,我們很高興與微軟合作,將我們的經(jīng)驗擴展到使用PyTorch從研究到生產(chǎn)的客戶?!?/p>