降價后！有頭部企業(yè)調(diào)用量翻了100倍

來源：阿里云

作者：阿里云

時間：2024-06-02

上周，阿里云在武漢AI峰會上宣布阿里云通義千問大模型通義9款主力大模型大幅降價。其中，通義千問GPT-4級主力模型Qwen-Long的API輸入價格低至1塊錢可以買200萬tokens。

距離大降價不到一周，企業(yè)和開發(fā)者用自己的積極響應(yīng)表示了對通義大模型的支持。近日在阿里云青島AI峰會上，阿里云智能集團(tuán)副總裁、公共云華北大區(qū)總經(jīng)理高飛表示已有頭部企業(yè)調(diào)用量翻了100倍，并列舉了通義大模型降價后的一周的三大變化。

公共云+API，直接調(diào)用大模型更便捷

一家制造業(yè)龍頭企業(yè)，降價前基于開源模型做私有化部署，降價后CTO決定調(diào)整公司策略，以公共云+API調(diào)用通義的形式為主，進(jìn)一步提效降本。

不管是開源模型還是商業(yè)化模型，公共云+API都將成為企業(yè)使用大模型的主流方式。最近的一份調(diào)查顯示，70%的組織正在使用這種方式。

為了更好的支持生成式人工智能的創(chuàng)新，阿里云已經(jīng)建立了“以模型為中心”的完整技術(shù)棧，進(jìn)一步發(fā)揮公共云的成本和性能優(yōu)勢。自研的異構(gòu)芯片互聯(lián)、高性能網(wǎng)絡(luò)HPN7.0、高性能存儲CPFS、人工智能平臺PAI等核心技術(shù)和產(chǎn)品，構(gòu)建了極致彈性的AI算力調(diào)度系統(tǒng)。同時，百煉分布式推理加速引擎，也壓縮了模型推理成本，并加快模型推理速度。

投入產(chǎn)出比更好，大規(guī)模應(yīng)用更輕松

降價后，一家頭部招聘企業(yè)將大模型從簡歷篩查推廣到更多創(chuàng)新業(yè)務(wù)場景。以往，人工和智能的成本難分高下，降價后高下立判。一周內(nèi)，該企業(yè)的大模型調(diào)用量翻了100倍，但數(shù)百萬調(diào)用量的成本不到200元，成本大幅下降。

即便是同樣的開源模型，在公共云上的調(diào)用價格也遠(yuǎn)遠(yuǎn)低于私有化部署。以使用Qwen-72B開源模型、每月1億tokens用量為例，在阿里云百煉上直接調(diào)用API每月僅需600元，私有化部署的成本平均每月超1萬元。

未來，相較于模型的私有化部署，公共云上調(diào)用的成本優(yōu)勢會持續(xù)擴(kuò)大，這是由公共云的規(guī)模化優(yōu)勢決定的。

調(diào)用接近“免費”，“先跑起來”更容易

用大模型做業(yè)務(wù)創(chuàng)新，對中小企業(yè)和開發(fā)者來說，是非常友好的方式。沒有很高的技術(shù)門檻，也沒有很重的技術(shù)投入，接近“免費”的使用成本，打消了他們最后的顧慮——不用考慮先算錢，還是先做應(yīng)用。

同時，阿里云百煉平臺還內(nèi)置了大模型定制與應(yīng)用開發(fā)工具鏈，開發(fā)者可以便捷地測試比較不同模型，開發(fā)專屬大模型，并輕松搭建RAG等應(yīng)用。從調(diào)模型、搭應(yīng)用到對外服務(wù)，一站式搞定。

阿里云云服務(wù)

上一篇：聽說墨西哥Hot Sale直接讓商家賣斷貨？看這里！

原文鏈接：點擊前往 >

版權(quán)說明：本文內(nèi)容來自于阿里云，本站不擁有所有權(quán)，不承擔(dān)相關(guān)法律責(zé)任。文章內(nèi)容系作者個人觀點，不代表快出海對觀點贊同或支持。如有侵權(quán)，請聯(lián)系管理員（zzx@kchuhai.com）刪除！

相關(guān)文章