近日,由華為云、華為諾亞方舟實驗室以及哈爾濱工業(yè)大學組成的聯(lián)合團隊(EIHealth-NLP)在中文醫(yī)療信息處理挑戰(zhàn)榜CBLUE中取得總分第一的佳績,這也是華為云知識計算解決方案繼能源、政務、金融、工業(yè)等領域之后,在醫(yī)療領域的又一次嘗試和突破。
中文醫(yī)療信息處理挑戰(zhàn)榜CBLUE(Chinese Biomedical Language Understanding Evaluation) 是國內(nèi)首個權威的中文生物醫(yī)學NLP多任務榜單,為醫(yī)療AI研究者們提供了真實場景數(shù)據(jù)和統(tǒng)一評測,包括醫(yī)學實體識別、醫(yī)學實體關系抽取、醫(yī)學術語歸一化、醫(yī)學文本分類、醫(yī)學句子關系判定和醫(yī)學文本匹配共5類技術方向8個任務數(shù)據(jù)集,具有任務量大、技術點廣、數(shù)據(jù)噪聲大及任務難度高等特點。CBLUE榜單綜合考慮了任務類型和任務難度兩個維度,旨在建設一個任務類型覆蓋廣、同時也保證任務難度的benchmark,促進研究者們提升醫(yī)療AI模型整體的魯棒性和泛化能力。
聯(lián)合團隊(EIHealth-NLP)在CBLUE榜單中斬獲冠軍
在本次挑戰(zhàn)賽中,聯(lián)合團隊在將醫(yī)療領域知識與AI模型融合方面發(fā)力,創(chuàng)新性地提出KGMask方法,在各任務中取得關鍵突破?;卺t(yī)療領域知識圖譜和語言預訓練模型,聯(lián)合團隊將醫(yī)療領域知識充分融合到模型的建模和求解中,同時吸收跨任務領域知識,對各任務的模型結(jié)構進行了導向型優(yōu)化。基于KGMask方法,聯(lián)合團隊在信息抽取CMeEE、文本分類CHIP-CTC和語義匹配KUAKE-QQR單項任務中取得大幅領先,最終榮登總成績榜首。
此外,在國內(nèi)外多項AI領域的權威比賽中,華為云也取得矚目成果,奪得包括DiggScience 科學數(shù)據(jù)挖掘、NLPCC預訓練模型、CFF BDCI 金融實體情感分析、WSDM網(wǎng)絡搜索與數(shù)據(jù)挖掘、WMT 2021醫(yī)學翻譯任務等在內(nèi)的多項冠軍。
華為云醫(yī)療智能體EIHealth聚焦于醫(yī)療領域研發(fā)的前沿技術,目標為醫(yī)院和生物醫(yī)藥公司提供安全可靠的企業(yè)級AI研發(fā)平臺,助力醫(yī)院和生物醫(yī)藥公司快速培養(yǎng)和建立AI研發(fā)能力。除了在中文醫(yī)療信息處理和輔助診斷領域,華為云醫(yī)療智能體EIHealth在AI基因測序和AI輔助藥物研發(fā)領域也不斷創(chuàng)新突破,例如華為云盤古藥物分子大模型在20多項藥物研發(fā)任務(包括新分子生成、屬性預測、結(jié)構優(yōu)化等)實現(xiàn)業(yè)界頂級水平(SOTA),幫助醫(yī)藥企業(yè)大幅提升藥物研發(fā)效率。
未來,華為云醫(yī)療智能體EIHealth將在AI服務上持續(xù)創(chuàng)新,繼續(xù)攜手生態(tài)伙伴,聚焦醫(yī)療研發(fā)領域的前沿技術,助力提升醫(yī)療領域研發(fā)的效率和創(chuàng)新能力,為守護人類生命健康貢獻更多力量。