Google為Alphabet幫手型機器人強化語言理解能力

來源:十輪網(wǎng)
作者:十輪網(wǎng)
時間:2022-08-18
1965
Google本周宣布新的機器人AI模型PaLM-SayCan,讓Alphabet開發(fā)的事務幫手型(helper)機器人更能理解用戶的指令,并且更聰明執(zhí)行任務。

0817-palm-saycan-google_research-everyday_robots-960.jpg

Google本周宣布新的機器人AI模型PaLM-SayCan,讓Alphabet開發(fā)的事務幫手型(helper)機器人更能理解用戶的指令,并且更聰明執(zhí)行任務。

Alphabet X于2019年11月公布通用型學習機器人項目Everyday Robot Project,旨在開發(fā)日常任務用機器人,可執(zhí)行倒垃圾、擦桌子、整理家具、長遠目標是能幫助獨居長者自理家務等高端任務。去年Alphabet也展示Every Robot已在公司內(nèi)員工餐廳擦桌子、或在辦公室整理會議室。

0817-everyday-robots-by-alphabet-xcompany.jpg

圖片來源/Google

Google指出,過去幾年公司雖然在應用機器學習技術于機器人有一些進展,但到目前為止,這類機器人仍僅能執(zhí)行硬編寫的短指令,像是“拿起一顆蘋果”,在簡單明白、且反饋快速的任務上效果比較好。但它們不太能首席執(zhí)行官串指令,或理解抽象目標,像是“我剛運動完,你能幫我準備健康的點心嗎?”

Google同時說明,先前訓練語言模型的方法,由于語言模型并不和實體世界互動,也未觀察其反應造成的結果,因此現(xiàn)行模型如GPT-3可能會出現(xiàn)令人啼笑皆非的回應,像是如果用戶表示“我飲料灑出來了,你能幫忙嗎?”他會給出“你可以試試吸塵器”等不安全、不實用的“建議”,而FLAN模型的反應則是“對不起,我不是有意灑出來的?!?/p>

而Google則發(fā)展出名為PaLM-SayCan的模型。其名稱來自它利用語言模型的知識(理解用戶說話的動機,即Say)來決定和評估有用的行動。這個做法也利用“可供性”(affordance)功能做選擇在其周邊環(huán)境條件下可行的做法(Can)。

SayCan和機器人的關系是,機器人提供PaLM-SayCan語言模型的手和眼睛,而語言模型則提供任務的高端語義知識。系統(tǒng)執(zhí)行過程好比是由語言模型推動的人、機對話過程。一開始用戶發(fā)出指令,語言模型將之轉(zhuǎn)化成一系列機器人執(zhí)行的步驟。這個步驟串行是由機器人技能過濾,并依據(jù)當時環(huán)境條件決定最高可行性的計劃。此外,本模型也加入任務對應性(即技能語言描述),及和真實世界的對應性(即技能可行性)兩種幾率來決定完成指令的成功率。

因此在用戶說出打翻飲料時,PaLM-SayCan可以做出幾率計算后,在尋找吸塵器、找海綿、找垃圾筒、撿起蘋果等行為選項中,最后選擇拿來一塊海綿。

0817-PaLM-SayCan-Google-Research-Everyday-Robots-600.jpg

圖片來源/Google

Google也公開了機器人模擬設置的技術資源和文件,供有興趣的團隊測試這個PaLM-SayCan模型。

立即登錄,閱讀全文
原文鏈接:點擊前往 >
文章來源:十輪網(wǎng)
版權說明:本文內(nèi)容來自于十輪網(wǎng),本站不擁有所有權,不承擔相關法律責任。文章內(nèi)容系作者個人觀點,不代表快出海對觀點贊同或支持。如有侵權,請聯(lián)系管理員(zzx@kchuhai.com)刪除!
優(yōu)質(zhì)服務商推薦
更多