“霸榜CLUE”,華為云剛剛發(fā)布全球最大中文語言預訓練模型!

來源: 網(wǎng)易
作者:來一壺瀧井
時間:2021-04-28
18033
4月25日,華為云聯(lián)合循環(huán)智能、鵬城實驗室發(fā)布了全球最大規(guī)模的中文語言預訓練模型——盤古NLP大模型。盤古NLP大模型是業(yè)界首個千億參數(shù)中文語言預訓練模型,由華為云、循環(huán)智能和鵬城實驗室聯(lián)合開發(fā),預訓練階段學習了40TB中文文本數(shù)據(jù),并通過行業(yè)數(shù)據(jù)的樣本調優(yōu)提升模型在不同場景中的應用性能。

4月25日,華為云聯(lián)合循環(huán)智能、鵬城實驗室發(fā)布了全球最大規(guī)模的中文語言預訓練模型——盤古NLP大模型。盤古NLP大模型是業(yè)界首個千億參數(shù)中文語言預訓練模型,由華為云、循環(huán)智能和鵬城實驗室聯(lián)合開發(fā),預訓練階段學習了40TB中文文本數(shù)據(jù),并通過行業(yè)數(shù)據(jù)的樣本調優(yōu)提升模型在不同場景中的應用性能。

1.jpg

  盤古NLP大模型具備領先的語言理解和模型生成能力:在權威的中文語言理解評測基準CLUE榜單中,總成績及分類、閱讀理解單項均排名第一,刷新三項榜單歷史紀錄;總排行榜得分83.046,多項子任務評分業(yè)界領先。

2.jpg

  3.jpg

  3.jpg

  盤古NLP大模型的中文理解和生成能力“現(xiàn)場考”

  CLUE是中文社區(qū)權威的預訓練語言模型評測的Benchmark,三項榜單第一的成績無疑顯示了盤古NLP大模型的超強性能。那么,盤古NLP在具體場景中的中文理解和生成能力如何?華為開發(fā)者大會(Cloud)現(xiàn)場,華為云人工智能首席科學家、IEEE Fellow田奇現(xiàn)場問了它幾個問題:

  Q:Hi盤古,什么樣的車沒有油也可以跑?

  盤古新能源車和自行車沒有油都可以跑,當然,還有玩具車。

點評:這個問答體現(xiàn)了盤古的常識推理能力。

  Q:Hi盤古,什么是碳中和?碳排放主要來自于哪些行業(yè)?

  盤古碳中和就是把人為排放的二氧化碳,通過植樹造林、節(jié)能減排等形式抵消掉,從而使得釋放到大氣中的總碳量凈值為零。

  盤古:目前發(fā)電和供熱行業(yè)、制造和建筑業(yè)是主要的碳排放行業(yè),請見下圖: 

點評:這段對話背后,盤古模型閱讀和理解了大量相關文章,通過小樣本學習對意圖進行識別,轉化為知識庫和數(shù)據(jù)庫查詢,并根據(jù)返回的結果生成最終的回答。這種方式與GPT-3等僅基于端到端生成的方式不同,可以更準確地處理復雜場景,結合領域知識,具備更大的商業(yè)價值,這種方式未來會進一步完善我們搜索和推薦系統(tǒng)的效果。

  Q:Hi盤古,為什么要實現(xiàn)碳中和?目標是什么?有哪些挑戰(zhàn)?

  盤古過度的碳排放會導致溫室效應,它是冰川融化、森林火災等一系列自然災害背后的共同元兇。2015年在巴黎舉行的氣候變化大會上,協(xié)議在本世紀后半葉,實現(xiàn)全球碳中和。

  盤古:各國家的目標,請見下圖:

  4.jpg

  盤古:面臨的主要挑戰(zhàn)有:1. 能源需求還沒有達到峰值,人均用電量還在升高。2. 煤炭是電力供給的主要來源,煤炭燃燒產(chǎn)生大量的二氧化碳,轉型難度比較大。3. 綠色能源技術仍然不成熟。

點評:針對提問中的三個意圖,盤古都能準確地識別出來,并逐一解答,這就是盤古所具備的多重意圖識別的能力,這也是阻礙智能客服等應用大面積推廣的最大痛點。

  Q:Hi盤古,我們個人在平常生活中做哪些事會有幫助?

  盤古推薦以下低碳生活方式:

5.jpg

點評:提問中并沒有提到“碳中和”三個字,但是盤古基于我們聊天的上下文,推斷出我想問的幫助對象是降低二氧化碳而不是其它問題。長文中指代理解能力的提升會讓人與機器在交流中更為自然、更為便捷。

  Q:Hi盤古,AI技術能給碳中和帶來哪些貢獻?具體我們怎么實現(xiàn)碳中和?

  盤古AI賦能數(shù)據(jù)分析和行業(yè)數(shù)字化轉型,不僅可以幫助企業(yè)監(jiān)測和預測碳排放,還可以有效提高企業(yè)生產(chǎn)效率,并實現(xiàn)節(jié)約成本和節(jié)能減排。

  盤古:第一、明確碳總量排放的逐年遞減目標。第二、推動電力市場改革,大力扶持綠色能源產(chǎn)業(yè)。第三、企業(yè)要進行碳核算,同時通過技術轉型加速行業(yè)節(jié)能減排目標。

點評:盤古發(fā)表了它個人對于碳中和的看法,這就是“生成與理解能力領先”,給它一定的空間進行自由發(fā)揮創(chuàng)造出自己的觀點。

  盤古NLP大模型在三個方面實現(xiàn)突破性進展

  眾所周知人工智能已經(jīng)進入千行百業(yè),盤古大模型的目標是沉淀行業(yè)知識,解決商業(yè)環(huán)境中低成本大規(guī)模復制的問題。具體而言,希望提升小樣本學習能力,為更廣泛的商業(yè)場景賦能。比如說,服務機器人多輪對話上下文理解能力,多重語義識別能力等。

  為了實現(xiàn)這個目標,盤古NLP大模型預訓練階段學習了40TB中文文本數(shù)據(jù),并通過行業(yè)數(shù)據(jù)的樣本調優(yōu)提升模型在場景中的應用性能。

  模型架構方面,之前的預訓練模型大多基于decoder結構開發(fā),比如Open-AI的GPT-3模型和智源的CPM模型,他們主要用來做生成類任務。盤古NLP大模型采用了deep encoder (深編碼)和 shallow decoder (淺解碼)結構,目的是為了保證模型在生成和理解兩個方面的性能都表現(xiàn)優(yōu)異, 同時加速生成過程。

  相對于業(yè)界其他NLP大模型,盤古NLP大模型在三個方面獲得了突破性進展:

  第一,大模型在預訓練階段沉淀了大量的通用知識,同時既能做生成又能做理解的特性讓大模型有能力支持行業(yè)知識庫和數(shù)據(jù)庫的嵌入,進而對接行業(yè)經(jīng)驗。大模型可以靈活扮演系統(tǒng)的不同模塊,使能全場景的快速適配與擴展。比如在循環(huán)智能與華為合作共建的金融客服場景中,大模型能更好的賦能銷售環(huán)節(jié),提升200%的銷售轉化率。

  第二,在encoder-decoder的架構基礎上植入了特有的訓練技巧和方法,性能上取得了優(yōu)異的效果。在中文權威CLUE榜單中分類任務、閱讀理解任務,和總成績都排名第一。CLUE主要檢測的是模型理解能力。NLPCC2018文本摘要任務可以全方位的檢測一個模型的生成能力,盤古同樣取得了Rouge Score平均分0.53的業(yè)界最佳成績,超越第二名百分之六十。

  第三,過往發(fā)布的預訓練大模型基本上不調優(yōu),或者做non-gradient(非梯度下降)調優(yōu),著眼于泛化能力而犧牲了一些場景的性能。為了改變這一缺陷,盤古NLP大模型選擇走大模型小樣本調優(yōu)的路線,基于提示(prompt-based)的調優(yōu)、動態(tài)冰化等一系列正則化技術,實現(xiàn)了小樣本學習任務上超越GPT系列。

  華為云盤古大模型怎么做出來的?

  盤古NLP大模型涉及千億參數(shù)、40TB中文文本訓練數(shù)據(jù),對算法、算力、海量數(shù)據(jù)處理、并行優(yōu)化都提出了很大挑戰(zhàn)。

  在算法方面,華為云的算法團隊和循環(huán)智能(Recurrent AI)的NLP團隊經(jīng)過數(shù)月的聯(lián)合攻關,成功突破了大模型微調的難題。

  鵬城實驗室的國內最大規(guī)模AI訓練集群鵬城云腦II,在盤古NLP大模型訓練中展示出強大的AI算力和數(shù)據(jù)吞吐能力,為盤古NLP大模型訓練打下了堅實的基礎。

  另一方面,華為底層軟件、訓練框架、ModelArts平臺協(xié)同優(yōu)化,充分釋放算力,達成全棧性能最優(yōu)。首先,針對底層算子性能,基于華為CANN采用了算子量化、算子融合優(yōu)化等技術,將單算子性能提升30%以上。其次,華為MindSpore創(chuàng)新性地采用了“流水線并行、模型并行和數(shù)據(jù)并行”的多維自動混合并行技術,大幅降低了手動編碼的工作量,并提升集群線性度20%。同時,華為云ModelArts平臺提供E級算力調度,同時結合物理網(wǎng)絡拓撲,提供動態(tài)路由規(guī)劃能力,為大模型訓練提供了最優(yōu)的網(wǎng)絡通信能力。此外,借助ModelArts平臺的高效處理海量數(shù)據(jù)能力,僅用7天就完成了40TB文本數(shù)據(jù)處理。

  華為云傾力打造了一系列盤古大模型(NLP、CV、多模態(tài)、科學計算),同時配套了100+基礎算法,最終會落在華為云一站式AI開發(fā)平臺ModelArts上給客戶與廣大開發(fā)者使用。華為云盤古大模型,改變了過去作坊式的定制化AI開發(fā)模式,實現(xiàn)了模型的通用、泛化、和復制,極大地提升了AI開發(fā)效率 ,開啟了AI工業(yè)化開發(fā)新模式。

立即登錄,閱讀全文
版權說明:
本文內容來自于網(wǎng)易,本站不擁有所有權,不承擔相關法律責任。文章內容系作者個人觀點,不代表快出海對觀點贊同或支持。如有侵權,請聯(lián)系管理員(zzx@kchuhai.com)刪除!
相關文章
HDC 2025耀星·領航出海高峰論壇:以全域生態(tài)協(xié)同重構出海增長曲線
HDC 2025耀星·領航出海高峰論壇:以全域生態(tài)協(xié)同重構出海增長曲線
6月21日,HDC 2025耀星·領航出海高峰論壇在東莞三丫坡舉辦,吸引了全球開發(fā)者、企業(yè)及生態(tài)出海專家共同參與。論壇聚焦2025年重點區(qū)域行業(yè)生態(tài)趨勢,通過歐洲、歐亞、中東、亞太、拉美等差異化市場的掘金案例,提供從獲量到變現(xiàn)的可持續(xù)發(fā)展新思路。
華為云
開發(fā)者
企業(yè)出海
2025-06-212025-06-21
近6成金融機構的選擇!華為云GaussDB加快金融核心系統(tǒng)轉型
近6成金融機構的選擇!華為云GaussDB加快金融核心系統(tǒng)轉型
當前,數(shù)據(jù)庫在金融機構的應用正在從辦公、一般系統(tǒng)逐步邁入核心系統(tǒng)應用的深水區(qū)。如何構建安全可靠、高效穩(wěn)定的核心系統(tǒng)數(shù)據(jù)庫,支持業(yè)務運營和管理決策,成為了眾多金融機構關注的焦點問題。
華為云
2024-07-042024-07-04
華為云以系統(tǒng)性創(chuàng)新加速千行萬業(yè)智能化升級
華為云以系統(tǒng)性創(chuàng)新加速千行萬業(yè)智能化升級
華為云全球銷售收入達553億元人民幣,是全球增長最快的主流云廠商之一。
華為云
2024-04-222024-04-22
華為云發(fā)布新型工業(yè)互聯(lián)網(wǎng)平臺參考架構
華為云發(fā)布新型工業(yè)互聯(lián)網(wǎng)平臺參考架構
近日,在華為分析師大會上,華為混合云副總裁胡玉海重磅發(fā)布《新型工業(yè)互聯(lián)網(wǎng)平臺參考架構》白皮書,在傳統(tǒng)工業(yè)互聯(lián)網(wǎng)的基礎上,融入大模型的能力,讓智能化賦能新型工業(yè)化。
華為云
云服務
2024-04-222024-04-22
掃碼登錄
打開掃一掃, 關注公眾號后即可登錄/注冊
加載中
二維碼已失效 請重試
刷新
賬號登錄/注冊
個人VIP
小程序
快出海小程序
公眾號
快出海公眾號
商務合作
商務合作
投稿采訪
投稿采訪
出海管家
出海管家