IBM準(zhǔn)備在其人工智能開(kāi)發(fā)平臺(tái)watsonx.ai,上架稱為Granite的商用基礎(chǔ)模型,這些基礎(chǔ)模型主要用于處理語(yǔ)言以及程序代碼。Granite基礎(chǔ)模型由IBM研究院開(kāi)發(fā),擁有130億個(gè)參數(shù),官方提到,Granite模型剛好能使用單一V100-32GB GPU執(zhí)行。
IBM使用多種數(shù)據(jù)集來(lái)訓(xùn)練Granite系列模型,總量為7 TB的原始數(shù)據(jù),經(jīng)過(guò)預(yù)處理后仍有2.4 TB,這些數(shù)據(jù)擁有1兆個(gè)Token,IBM根據(jù)商業(yè)使用需求,挑選涵蓋網(wǎng)絡(luò)、學(xué)術(shù)、程序代碼、法律和財(cái)務(wù)領(lǐng)域的數(shù)據(jù)集訓(xùn)練模型,因此Granite系列模型能夠熟悉這些領(lǐng)域的語(yǔ)言和術(shù)語(yǔ),并根據(jù)相關(guān)產(chǎn)業(yè)知識(shí)提供決策。
Granite模型可以被廣泛地應(yīng)用在各種產(chǎn)業(yè),除了商業(yè)領(lǐng)域上的摘要、問(wèn)答和分類之外,Granite模型也支持諸如內(nèi)容生成、分析、增強(qiáng)檢索生成(Retrieval Augmented Generation,RAG)與專有名詞識(shí)別(Named Entity Recognition,NER)等功能。
官方強(qiáng)調(diào),模型訓(xùn)練使用的數(shù)據(jù)集經(jīng)過(guò)治理、風(fēng)險(xiǎn)和法遵審查流程,因此用戶可以將Granite模型用于自家的應(yīng)用程序。而且Granite模型訓(xùn)練資訊集經(jīng)過(guò)IBM HAP偵測(cè)器處理,該偵測(cè)器能夠偵測(cè)并移除仇恨等內(nèi)容,減少Granite模型生成不適當(dāng)輸出的可能性。