原名推特的X正式加入了聊天機(jī)器人戰(zhàn)局,上周宣布聊天機(jī)器人Grok開放美國(guó)用戶試用,強(qiáng)調(diào)Grok的回應(yīng)具有別的聊天機(jī)器人沒有的幽默感,而且別人拒絕回答的問題,它也會(huì)回答。
X首席技術(shù)官暨幕后老板馬斯克(Elon Musk)上周五公布Grok已經(jīng)結(jié)束早期Beta測(cè)試,Grok未來會(huì)提供給月費(fèi)16美元的X Premium Plus訂閱戶,且Grok將以內(nèi)置在X App及獨(dú)立App兩種形式出現(xiàn)。
目前Grok提供美國(guó)地區(qū)部分用戶測(cè)試。有興趣的用戶可先加入等候清單。
根據(jù)X介紹,Grok靈感來源是英國(guó)作家Douglas Adams的科幻小說《銀河系漫游指南》(Hitchhike's Guide to the Galaxy),企圖回答所有問題,甚至提供建議。Grok相較其他模型的一大優(yōu)勢(shì)是可以從X平臺(tái)訪問即時(shí)資訊。此外,X作為聊天機(jī)器人的后進(jìn)者,不只滿足于提供精確資訊,而是在其回應(yīng)中加入一點(diǎn)機(jī)智及不羈精神,強(qiáng)調(diào)帶有幽默感。它甚至連大部分AI系統(tǒng)拒絕回答的辛辣問題也都會(huì)回答。
圖片來源_Elon Musk via X
這也是馬斯克年初簽署一份宣言,呼吁OpenAI等企業(yè)暫停開發(fā)高端AI語言模型,及7月宣布旗下AI公司xAI后,這位科技大亨對(duì)AI的投入成果。
Grok底層大型語言模型Grok-1,是xAI團(tuán)隊(duì)四個(gè)月訓(xùn)練的結(jié)果。xAI 7月問世后,團(tuán)隊(duì)就訓(xùn)練330億個(gè)參數(shù)的原型LLM Grok-0,強(qiáng)調(diào)僅用了Meta LLaMA 2一半的訓(xùn)練資源就達(dá)到其能力。9月份xAI就完成了Grok-1的訓(xùn)練,它在基準(zhǔn)測(cè)試HumanEval編程任務(wù)及MMLU中,分別達(dá)到63.2%及73%。
X引用GSM8k、MML、HumanEval、MATH的四項(xiàng)基準(zhǔn)測(cè)試數(shù)據(jù),顯示Grok-1表現(xiàn)都超越OpenAI的GPT-3.5,及Inflection-1,4項(xiàng)測(cè)試都比它優(yōu)異的只有訓(xùn)練數(shù)據(jù)及資源都大得多的GPT-4。不過Google Palm2及Anthropic Claude 2也都在3個(gè)項(xiàng)目中超越Grok-1。
X強(qiáng)調(diào)Grok-1訓(xùn)練過程以明確而可驗(yàn)證的場(chǎng)景來發(fā)展理解力,以確保AI模型的安全性、穩(wěn)定性,現(xiàn)在也具理解上下文(context)能力以提供相關(guān)答案,不過目前只支持文本輸入/輸入。團(tuán)隊(duì)目前正在強(qiáng)化Grok-1應(yīng)需求發(fā)現(xiàn)及檢索資訊、防止惡意濫用的能力,以及視覺及聲音輸出/輸入的支持能力。X公司說新功能會(huì)于未來幾個(gè)月內(nèi)陸續(xù)公布。