翻車的不只谷歌？微軟必應(yīng)聊天演示被指存在事實性錯誤

來源：新浪科技

作者：新浪科技

時間：2023-02-16

幾天前，谷歌聊天機器人演示活動現(xiàn)場翻車導(dǎo)致其股價當天暴跌逾7%，但微軟的演示活動同樣出現(xiàn)了事實性錯誤。

新浪科技訊北京時間2月15日上午消息，幾天前，谷歌聊天機器人演示活動現(xiàn)場翻車導(dǎo)致其股價當天暴跌逾7%，但微軟的演示活動同樣出現(xiàn)了事實性錯誤。

在微軟進行演示時，這項嵌入在必應(yīng)搜索中的類ChatGPT技術(shù)分析了Gap和Lululemon的財報。但業(yè)內(nèi)人士將其給出的答案與財報原文對比后卻發(fā)現(xiàn)，這款聊天機器人遺漏了一些數(shù)據(jù)，甚至會杜撰一些內(nèi)容。

“必應(yīng)AI在演示過程中給出了一些完全錯誤的答案，但卻沒人注意到?！豹毩⑺阉饕嫜芯繂T德米特里·布里爾頓（Dmitri Brereton）寫道，“相反，大家都對必應(yīng)的宣傳歡欣鼓舞?！?/p>

布里爾頓發(fā)現(xiàn)，除了財務(wù)數(shù)據(jù)上的錯誤外，微軟在演示中針對吸塵器規(guī)格和墨西哥旅行計劃的回答可能存在事實性錯誤。布里爾頓最初并不是為了給微軟“挑刺”，他只是在細致對比微軟和谷歌的答案時意外發(fā)現(xiàn)了這些問題。

人工智能專家稱這一現(xiàn)象為“幻覺”，也就是說，基于大語言模型生成的工具有杜撰內(nèi)容的傾向。上周，谷歌推出了一款與之競爭的人工智能工具，演示過程中同樣存在事實性錯誤——但當時的錯誤很快就被人發(fā)現(xiàn)。

這兩家公司都在加緊將新型生成式人工智能整合進搜索引擎，希望在ChatGPT引爆行業(yè)熱潮后向世人展示自己在這方面的優(yōu)勢。ChatGPT是去年11月由創(chuàng)業(yè)公司OpenAI推出的，他們已經(jīng)通過微軟融資百億美元，與之競爭的Stability AI和Hugging Face等創(chuàng)業(yè)公司也在融資中獲得了數(shù)十億美元的估值。

谷歌與微軟對待這項技術(shù)的態(tài)度差異明顯：由于擔心聲譽風險和安全問題，谷歌遲遲不愿將AIGC（人工智能生成內(nèi)容）技術(shù)整合進搜索引擎，而微軟卻在上周強調(diào)，有可能在短期內(nèi)向部分公眾開放這項技術(shù)。

“我認為不能讓這項技術(shù)躺在實驗室里，”納德拉說，“應(yīng)該安全地推廣出去?！?/p>

但在必應(yīng)AI的演示過程中，的確在公司財報數(shù)據(jù)上出現(xiàn)了一些問題。

微軟營銷高管約瑟夫·梅赫蒂（Yusuf Mehdi）在演示過程中訪問了Gap的投資者關(guān)系網(wǎng)站，然后讓必應(yīng)AI根據(jù)這家零售商11月發(fā)布的第三季財報總結(jié)出“要點”。

“很酷，節(jié)約了大量時間。”梅赫蒂說。

下面是微軟演示過程的屏幕截圖：