降價后!有頭部企業(yè)調(diào)用量翻了100倍

來源:阿里云
作者:阿里云
時間:2024-06-02
3856
上周,阿里云在武漢AI峰會上宣布阿里云通義千問大模型通義9款主力大模型大幅降價。其中,通義千問GPT-4級主力模型Qwen-Long的API輸入價格低至1塊錢可以買200萬tokens。

0627089B-2208-4DEE-816A-B5E8E0955862.jpeg

上周,阿里云在武漢AI峰會上宣布阿里云通義千問大模型通義9款主力大模型大幅降價。其中,通義千問GPT-4級主力模型Qwen-Long的API輸入價格低至1塊錢可以買200萬tokens。

距離大降價不到一周,企業(yè)和開發(fā)者用自己的積極響應表示了對通義大模型的支持。近日在阿里云青島AI峰會上,阿里云智能集團副總裁、公共云華北大區(qū)總經(jīng)理高飛表示已有頭部企業(yè)調(diào)用量翻了100倍,并列舉了通義大模型降價后的一周的三大變化。

公共云+API,直接調(diào)用大模型更便捷

一家制造業(yè)龍頭企業(yè),降價前基于開源模型做私有化部署,降價后CTO決定調(diào)整公司策略,以公共云+API調(diào)用通義的形式為主,進一步提效降本。

不管是開源模型還是商業(yè)化模型,公共云+API都將成為企業(yè)使用大模型的主流方式。最近的一份調(diào)查顯示,70%的組織正在使用這種方式。

為了更好的支持生成式人工智能的創(chuàng)新,阿里云已經(jīng)建立了“以模型為中心”的完整技術棧,進一步發(fā)揮公共云的成本和性能優(yōu)勢。自研的異構(gòu)芯片互聯(lián)、高性能網(wǎng)絡HPN7.0、高性能存儲CPFS、人工智能平臺PAI等核心技術和產(chǎn)品,構(gòu)建了極致彈性的AI算力調(diào)度系統(tǒng)。同時,百煉分布式推理加速引擎,也壓縮了模型推理成本,并加快模型推理速度。

投入產(chǎn)出比更好,大規(guī)模應用更輕松

降價后,一家頭部招聘企業(yè)將大模型從簡歷篩查推廣到更多創(chuàng)新業(yè)務場景。以往,人工和智能的成本難分高下,降價后高下立判。一周內(nèi),該企業(yè)的大模型調(diào)用量翻了100倍,但數(shù)百萬調(diào)用量的成本不到200元,成本大幅下降。

即便是同樣的開源模型,在公共云上的調(diào)用價格也遠遠低于私有化部署。以使用Qwen-72B開源模型、每月1億tokens用量為例,在阿里云百煉上直接調(diào)用API每月僅需600元,私有化部署的成本平均每月超1萬元。

未來,相較于模型的私有化部署,公共云上調(diào)用的成本優(yōu)勢會持續(xù)擴大,這是由公共云的規(guī)?;瘍?yōu)勢決定的。

調(diào)用接近“免費”,“先跑起來”更容易

用大模型做業(yè)務創(chuàng)新,對中小企業(yè)和開發(fā)者來說,是非常友好的方式。沒有很高的技術門檻,也沒有很重的技術投入,接近“免費”的使用成本,打消了他們最后的顧慮——不用考慮先算錢,還是先做應用。

同時,阿里云百煉平臺還內(nèi)置了大模型定制與應用開發(fā)工具鏈,開發(fā)者可以便捷地測試比較不同模型,開發(fā)專屬大模型,并輕松搭建RAG等應用。從調(diào)模型、搭應用到對外服務,一站式搞定。

立即登錄,閱讀全文
原文鏈接:點擊前往 >
版權說明:本文內(nèi)容來自于阿里云,本站不擁有所有權,不承擔相關法律責任。文章內(nèi)容系作者個人觀點,不代表快出海對觀點贊同或支持。如有侵權,請聯(lián)系管理員(zzx@kchuhai.com)刪除!
優(yōu)質(zhì)服務商推薦
更多