Google本周宣布新的機(jī)器人AI模型PaLM-SayCan,讓Alphabet開發(fā)的事務(wù)幫手型(helper)機(jī)器人更能理解用戶的指令,并且更聰明執(zhí)行任務(wù)。
Alphabet X于2019年11月公布通用型學(xué)習(xí)機(jī)器人項(xiàng)目Everyday Robot Project,旨在開發(fā)日常任務(wù)用機(jī)器人,可執(zhí)行倒垃圾、擦桌子、整理家具、長(zhǎng)遠(yuǎn)目標(biāo)是能幫助獨(dú)居長(zhǎng)者自理家務(wù)等高端任務(wù)。去年Alphabet也展示Every Robot已在公司內(nèi)員工餐廳擦桌子、或在辦公室整理會(huì)議室。
圖片來(lái)源/Google
Google指出,過(guò)去幾年公司雖然在應(yīng)用機(jī)器學(xué)習(xí)技術(shù)于機(jī)器人有一些進(jìn)展,但到目前為止,這類機(jī)器人仍僅能執(zhí)行硬編寫的短指令,像是“拿起一顆蘋果”,在簡(jiǎn)單明白、且反饋快速的任務(wù)上效果比較好。但它們不太能首席執(zhí)行官串指令,或理解抽象目標(biāo),像是“我剛運(yùn)動(dòng)完,你能幫我準(zhǔn)備健康的點(diǎn)心嗎?”
Google同時(shí)說(shuō)明,先前訓(xùn)練語(yǔ)言模型的方法,由于語(yǔ)言模型并不和實(shí)體世界互動(dòng),也未觀察其反應(yīng)造成的結(jié)果,因此現(xiàn)行模型如GPT-3可能會(huì)出現(xiàn)令人啼笑皆非的回應(yīng),像是如果用戶表示“我飲料灑出來(lái)了,你能幫忙嗎?”他會(huì)給出“你可以試試吸塵器”等不安全、不實(shí)用的“建議”,而FLAN模型的反應(yīng)則是“對(duì)不起,我不是有意灑出來(lái)的?!?/p>
而Google則發(fā)展出名為PaLM-SayCan的模型。其名稱來(lái)自它利用語(yǔ)言模型的知識(shí)(理解用戶說(shuō)話的動(dòng)機(jī),即Say)來(lái)決定和評(píng)估有用的行動(dòng)。這個(gè)做法也利用“可供性”(affordance)功能做選擇在其周邊環(huán)境條件下可行的做法(Can)。
SayCan和機(jī)器人的關(guān)系是,機(jī)器人提供PaLM-SayCan語(yǔ)言模型的手和眼睛,而語(yǔ)言模型則提供任務(wù)的高端語(yǔ)義知識(shí)。系統(tǒng)執(zhí)行過(guò)程好比是由語(yǔ)言模型推動(dòng)的人、機(jī)對(duì)話過(guò)程。一開始用戶發(fā)出指令,語(yǔ)言模型將之轉(zhuǎn)化成一系列機(jī)器人執(zhí)行的步驟。這個(gè)步驟串行是由機(jī)器人技能過(guò)濾,并依據(jù)當(dāng)時(shí)環(huán)境條件決定最高可行性的計(jì)劃。此外,本模型也加入任務(wù)對(duì)應(yīng)性(即技能語(yǔ)言描述),及和真實(shí)世界的對(duì)應(yīng)性(即技能可行性)兩種幾率來(lái)決定完成指令的成功率。
因此在用戶說(shuō)出打翻飲料時(shí),PaLM-SayCan可以做出幾率計(jì)算后,在尋找吸塵器、找海綿、找垃圾筒、撿起蘋果等行為選項(xiàng)中,最后選擇拿來(lái)一塊海綿。
圖片來(lái)源/Google
Google也公開了機(jī)器人模擬設(shè)置的技術(shù)資源和文件,供有興趣的團(tuán)隊(duì)測(cè)試這個(gè)PaLM-SayCan模型。