GPT-4o mini支持用戶以更低的成本、更快的速度交付出色的應(yīng)用程序。GPT-4o mini的智能水平顯著高于GPT-3.5 Turbo——在“大規(guī)模多任務(wù)語(yǔ)言理解”(MMLU)中得分為82%,而GPT-3.5 Turbo為70%——且成本降低了60%以上。GPT-4o mini提供了擴(kuò)展的128K上下文窗口,并集成了GPT-4o改進(jìn)的多語(yǔ)言能力,帶來(lái)了更高質(zhì)量的全球語(yǔ)言支持。
OpenAI發(fā)布的GPT-4o mini現(xiàn)已在Azure AI(國(guó)際版)上同步推出,以卓越的速度支持文本處理功能。圖像、音頻和視頻處理功能將在不久之后推出。您可在Azure OpenAI Studio(國(guó)際版)Playground中免費(fèi)試用。
我們對(duì)利用GPT-4o mini提升的新用戶體驗(yàn)尤為興奮,特別是助手、代碼解釋器和檢索等流媒體場(chǎng)景,這些場(chǎng)景將受益于GPT-4o mini模型的強(qiáng)大能力。例如,我們?cè)贕itHub Copilot智能副駕駛?測(cè)試時(shí)看到了GPT-4o mini的驚人速度。GitHub Copilot智能副駕駛?是一個(gè)AI編程助手,會(huì)在用戶代碼輸入的停頓間隙提供代碼補(bǔ)全建議,并伴隨著每個(gè)新字符的輸入迅速更新代碼建議。
我們還宣布了對(duì)Azure OpenAI服務(wù)(國(guó)際版)的更新,包括為GPT-4o mini擴(kuò)展默認(rèn)安全功能、擴(kuò)展的數(shù)據(jù)駐留、全球“即用即付”以及性能升級(jí)。
安全性始終是高效使用和信任的關(guān)鍵因素,這是我們和用戶所共同期望的。
我們很高興地宣布,Azure AI內(nèi)容安全功能(包括提示詞屏蔽和受保護(hù)內(nèi)容檢測(cè))已"默認(rèn)開啟",供您在Azure OpenAI服務(wù)(國(guó)際版)上安全使用GPT-4o mini。
我們已針對(duì)Azure AI內(nèi)容安全的吞吐量和速度提升進(jìn)行了投入——包括引入異步篩選,以便在不影響安全性的前提下,最大限度地提高模型速度。Azure AI內(nèi)容安全支持各行各業(yè)的開發(fā)人員保護(hù)其生成式AI技術(shù)應(yīng)用程序,包括游戲開發(fā)行業(yè)(Unity)、稅務(wù)行業(yè)(H&R Block)和教育行業(yè)(南澳大利亞教育部)。
此外,我們的“用戶版權(quán)承諾”也適用于GPT-4o mini,微軟將保護(hù)客戶免受第三方對(duì)輸出內(nèi)容的知識(shí)產(chǎn)權(quán)索賠,讓用戶免除后顧之憂。
Azure AI支持客戶靈活控制數(shù)據(jù)的存儲(chǔ)和處理位置,提供完整的數(shù)據(jù)駐留解決方案,幫助客戶滿足其特殊的合規(guī)要求。我們還提供符合業(yè)務(wù)、應(yīng)用程序和合規(guī)性要求的托管選項(xiàng)。區(qū)域性“即用即付”模式和預(yù)置吞吐量單元(PTUs)提供對(duì)數(shù)據(jù)處理和存儲(chǔ)的控制。
我們很高興地宣布,Azure OpenAI服務(wù)(國(guó)際版)現(xiàn)已在包括西班牙在內(nèi)的27個(gè)區(qū)域可用。本月初上線的西班牙區(qū)域是我們?cè)跉W洲的第九個(gè)區(qū)域。
GPT-4o mini現(xiàn)已可用全球“即用即付”部署,價(jià)格為每百萬(wàn)input token 15美分、每百萬(wàn)output token 60美分,與之前的前沿模型相比更具性價(jià)比。
我們很高興地宣布,全球即用即付部署選項(xiàng)將于本月全面推出,客戶可以根據(jù)所消耗的資源付費(fèi),以便靈活應(yīng)對(duì)各種工作負(fù)載。同時(shí)在全球范圍內(nèi)路由流量,以提供更高的吞吐量,并仍然可以控制數(shù)據(jù)的靜態(tài)駐留位置。
此外,我們意識(shí)到客戶在使用新模型時(shí)面臨的一個(gè)挑戰(zhàn)是:無(wú)法在現(xiàn)有部署所在的區(qū)域內(nèi)直接升級(jí)模型版本?,F(xiàn)在,通過(guò)全球即用即付部署,這一問題將徹底解決,客戶可以直接從現(xiàn)有模型升級(jí)到最新模型。
全球即用即付模式為客戶提供盡可能高的規(guī)模,為GPT-4o mini提供每分鐘1500萬(wàn)個(gè)token的吞吐量,為GPT-4o提供每分鐘3000萬(wàn)個(gè)token的吞吐量。Azure OpenAI服務(wù)(國(guó)際版)為GPT-4o mini提供99.99%的可用性,并與OpenAI對(duì)齊,提供一致的行業(yè)領(lǐng)先速度。
我們持續(xù)對(duì)Azure AI投入,以提高Azure OpenAI服務(wù)(國(guó)際版)中AI工作負(fù)載的效率。
GPT-4o mini本月將通過(guò)我們的Batch服務(wù)并在Azure AI上線。Batch通過(guò)使用非高峰容量資源,以50%的折扣、24小時(shí)周轉(zhuǎn)交付高吞吐量作業(yè)。借助微軟Azure AI,我們將能夠向客戶提供非高峰期的容量資源。
本月我們還將發(fā)布GPT-4o mini的微調(diào)功能,讓客戶能夠根據(jù)具體用例和場(chǎng)景進(jìn)一步定制模型,以前所未有的速度提供卓越的價(jià)值和質(zhì)量。我們?cè)谏蟼€(gè)月更新了用于模型訓(xùn)練的基于token的計(jì)費(fèi)模式,將托管費(fèi)用降低了43%。再加上我們的低推理價(jià)格,這使得Azure OpenAI服務(wù)(國(guó)際版)微調(diào)部署成為客戶在處理生產(chǎn)工作負(fù)載最具性價(jià)比的選擇。
截止目前,已有超過(guò)53,000家客戶正在使用Azure AI以驚人的規(guī)模進(jìn)行交付,超過(guò)一半的財(cái)富500強(qiáng)企業(yè)正在使用Azure OpenAI服務(wù)(國(guó)際版)構(gòu)建其應(yīng)用程序。我們很高興看到沃達(dá)豐(客戶代理解決方案)、悉尼大學(xué)(AI助手)和GigXR(AI虛擬患者)等企業(yè)借助Azure AI實(shí)現(xiàn)創(chuàng)新。
(本文翻譯自微軟全球官方網(wǎng)站)