GPT-4o mini：OpenAI全新更快速模型現(xiàn)已在Azure AI（國際版）發(fā)布

來源：Azure云科技

作者：Azure云科技

時(shí)間：2024-07-21

GPT-4o mini支持用戶以更低的成本、更快的速度交付出色的應(yīng)用程序。

GPT-4o mini支持用戶以更低的成本、更快的速度交付出色的應(yīng)用程序。GPT-4o mini的智能水平顯著高于GPT-3.5 Turbo——在“大規(guī)模多任務(wù)語言理解”（MMLU）中得分為82%，而GPT-3.5 Turbo為70%——且成本降低了60%以上。GPT-4o mini提供了擴(kuò)展的128K上下文窗口，并集成了GPT-4o改進(jìn)的多語言能力，帶來了更高質(zhì)量的全球語言支持。

OpenAI發(fā)布的GPT-4o mini現(xiàn)已在Azure AI（國際版）上同步推出，以卓越的速度支持文本處理功能。圖像、音頻和視頻處理功能將在不久之后推出。您可在Azure OpenAI Studio（國際版）Playground中免費(fèi)試用。

我們對利用GPT-4o mini提升的新用戶體驗(yàn)尤為興奮，特別是助手、代碼解釋器和檢索等流媒體場景，這些場景將受益于GPT-4o mini模型的強(qiáng)大能力。例如，我們在GitHub Copilot智能副駕駛?測試時(shí)看到了GPT-4o mini的驚人速度。GitHub Copilot智能副駕駛?是一個(gè)AI編程助手，會在用戶代碼輸入的停頓間隙提供代碼補(bǔ)全建議，并伴隨著每個(gè)新字符的輸入迅速更新代碼建議。

我們還宣布了對Azure OpenAI服務(wù)（國際版）的更新，包括為GPT-4o mini擴(kuò)展默認(rèn)安全功能、擴(kuò)展的數(shù)據(jù)駐留、全球“即用即付”以及性能升級。

安全性始終是高效使用和信任的關(guān)鍵因素，這是我們和用戶所共同期望的。

我們很高興地宣布，Azure AI內(nèi)容安全功能（包括提示詞屏蔽和受保護(hù)內(nèi)容檢測）已"默認(rèn)開啟"，供您在Azure OpenAI服務(wù)（國際版）上安全使用GPT-4o mini。

我們已針對Azure AI內(nèi)容安全的吞吐量和速度提升進(jìn)行了投入——包括引入異步篩選，以便在不影響安全性的前提下，最大限度地提高模型速度。Azure AI內(nèi)容安全支持各行各業(yè)的開發(fā)人員保護(hù)其生成式AI技術(shù)應(yīng)用程序，包括游戲開發(fā)行業(yè)（Unity）、稅務(wù)行業(yè)（H&R Block）和教育行業(yè)（南澳大利亞教育部）。

此外，我們的“用戶版權(quán)承諾”也適用于GPT-4o mini，微軟將保護(hù)客戶免受第三方對輸出內(nèi)容的知識產(chǎn)權(quán)索賠，讓用戶免除后顧之憂。

640 （1）.png

Azure AI支持客戶靈活控制數(shù)據(jù)的存儲和處理位置，提供完整的數(shù)據(jù)駐留解決方案，幫助客戶滿足其特殊的合規(guī)要求。我們還提供符合業(yè)務(wù)、應(yīng)用程序和合規(guī)性要求的托管選項(xiàng)。區(qū)域性“即用即付”模式和預(yù)置吞吐量單元（PTUs）提供對數(shù)據(jù)處理和存儲的控制。

我們很高興地宣布，Azure OpenAI服務(wù)（國際版）現(xiàn)已在包括西班牙在內(nèi)的27個(gè)區(qū)域可用。本月初上線的西班牙區(qū)域是我們在歐洲的第九個(gè)區(qū)域。

640 （2）.png

GPT-4o mini現(xiàn)已可用全球“即用即付”部署，價(jià)格為每百萬input token 15美分、每百萬output token 60美分，與之前的前沿模型相比更具性價(jià)比。

我們很高興地宣布，全球即用即付部署選項(xiàng)將于本月全面推出，客戶可以根據(jù)所消耗的資源付費(fèi)，以便靈活應(yīng)對各種工作負(fù)載。同時(shí)在全球范圍內(nèi)路由流量，以提供更高的吞吐量，并仍然可以控制數(shù)據(jù)的靜態(tài)駐留位置。

此外，我們意識到客戶在使用新模型時(shí)面臨的一個(gè)挑戰(zhàn)是：無法在現(xiàn)有部署所在的區(qū)域內(nèi)直接升級模型版本。現(xiàn)在，通過全球即用即付部署，這一問題將徹底解決，客戶可以直接從現(xiàn)有模型升級到最新模型。

全球即用即付模式為客戶提供盡可能高的規(guī)模，為GPT-4o mini提供每分鐘1500萬個(gè)token的吞吐量，為GPT-4o提供每分鐘3000萬個(gè)token的吞吐量。Azure OpenAI服務(wù)（國際版）為GPT-4o mini提供99.99%的可用性，并與OpenAI對齊，提供一致的行業(yè)領(lǐng)先速度。

640 （3）.png

我們持續(xù)對Azure AI投入，以提高Azure OpenAI服務(wù)（國際版）中AI工作負(fù)載的效率。

GPT-4o mini本月將通過我們的Batch服務(wù)并在Azure AI上線。Batch通過使用非高峰容量資源，以50%的折扣、24小時(shí)周轉(zhuǎn)交付高吞吐量作業(yè)。借助微軟Azure AI，我們將能夠向客戶提供非高峰期的容量資源。

本月我們還將發(fā)布GPT-4o mini的微調(diào)功能，讓客戶能夠根據(jù)具體用例和場景進(jìn)一步定制模型，以前所未有的速度提供卓越的價(jià)值和質(zhì)量。我們在上個(gè)月更新了用于模型訓(xùn)練的基于token的計(jì)費(fèi)模式，將托管費(fèi)用降低了43%。再加上我們的低推理價(jià)格，這使得Azure OpenAI服務(wù)（國際版）微調(diào)部署成為客戶在處理生產(chǎn)工作負(fù)載最具性價(jià)比的選擇。

截止目前，已有超過53,000家客戶正在使用Azure AI以驚人的規(guī)模進(jìn)行交付，超過一半的財(cái)富500強(qiáng)企業(yè)正在使用Azure OpenAI服務(wù)（國際版）構(gòu)建其應(yīng)用程序。我們很高興看到沃達(dá)豐（客戶代理解決方案）、悉尼大學(xué)（AI助手）和GigXR（AI虛擬患者）等企業(yè)借助Azure AI實(shí)現(xiàn)創(chuàng)新。

（本文翻譯自微軟全球官方網(wǎng)站）

AI Azure 微軟云

上一篇：通過Phi-3 SLMs模型及服務(wù)實(shí)現(xiàn)高性價(jià)比創(chuàng)新

原文鏈接：點(diǎn)擊前往 >

文章來源：Azure云科技

版權(quán)說明：本文內(nèi)容來自于Azure云科技，本站不擁有所有權(quán)，不承擔(dān)相關(guān)法律責(zé)任。文章內(nèi)容系作者個(gè)人觀點(diǎn)，不代表快出海對觀點(diǎn)贊同或支持。如有侵權(quán)，請聯(lián)系管理員（zzx@kchuhai.com）刪除！

相關(guān)文章