“還差1人開局,你來不來?”“啥,陪對象呢?!”
“不是,這人怎么進(jìn)房間就走了?。 ?/p>
“又是個(gè)掛機(jī)的,服了,下把直接ttt!”
社交策略類游戲最怕遇到上面的情景,要么少人游戲永遠(yuǎn)無法開局,要么有人掛機(jī)影響游戲體驗(yàn)。不慌,有AI就行,這局要么穩(wěn)贏,要么過癮!
隨著AIGC在泛娛樂領(lǐng)域應(yīng)用的逐漸深入,現(xiàn)階段不少游戲場景中都加入了AI NPC的角色。AI NPC可以為玩家提供各種任務(wù)和對話,不僅能夠幫助玩家擺脫游戲人數(shù)的硬性限制,很好地參與其中,成為合格的游戲搭子,還能通過其智能行為和反應(yīng)為游戲增加更多的挑戰(zhàn)性和互動(dòng)性,讓游戲更刺激。
早于今年5月,聲網(wǎng)就推出了AI+誰是臥底的玩法,由AI來充當(dāng)其中一名玩家,在游戲中學(xué)習(xí)、提煉其他玩家的發(fā)言格式,對自己的關(guān)鍵詞進(jìn)行描述發(fā)言,并能通過分析其他玩家的發(fā)言,做出“誰是臥底”的判斷并進(jìn)行投票。此類AI對話游戲?qū)ι舷挛南?shù)的支持需要用到大模型token能力,像狼人殺、誰是臥底這種人數(shù)多、回合多且發(fā)言多的游戲,對token能力有很高的要求,而聲網(wǎng)已經(jīng)選型集成的大模型能夠很好地支持游戲的順暢推進(jìn)。
此外,聲網(wǎng)AIGC解決方案能夠支持各類AI+音視頻互動(dòng)場景,除了上面提到的AI+誰是臥底玩法,聲網(wǎng)還能夠提供AI版本的海龜湯和你說我猜玩法,企業(yè)也可以根據(jù)實(shí)際需求定制玩法,持續(xù)挖掘AI NPC在社交游戲場景中的更多應(yīng)用潛力。在海龜湯游戲中,AI將充當(dāng)出題者,提出一個(gè)難以理解的事件,玩家可以提出任何問題以縮小范圍并找出事件背后真正的原因,但出題者(AI)僅能以“是(對)”、“不是(不對)”或“沒有關(guān)系”來作答。當(dāng)玩家收集到足夠的信息,能夠描述出完整故事時(shí),AI便會(huì)對玩家的最終答案進(jìn)行判斷,并宣布游戲結(jié)果。
在你說我猜游戲中,AI將充當(dāng)出題人,設(shè)置一個(gè)游戲謎底并根據(jù)玩家的描述給予“是”與“不是”的回復(fù),直至玩家給出正確答案。此類小游戲,特別適合語聊房、陌生人交友等線上社交場景,起到迅速破冰的效果,為平臺(tái)帶來一定增益。
游戲社交此類場景對互動(dòng)實(shí)時(shí)性要求極高,市面上已有的方案要么是離線的本地?cái)?shù)字人方案,要么是全鏈路延時(shí)過高(6-7s)無法滿足游戲中的實(shí)時(shí)互動(dòng),影響用戶體驗(yàn)。而聲網(wǎng)更專注于提供實(shí)時(shí)音頻對話的更優(yōu)體驗(yàn),低延時(shí)、更沉浸。
更沉浸,用戶體驗(yàn)拉滿
實(shí)時(shí)音視頻互動(dòng)相比輸入文字,操作更便捷,且能夠與其它多模態(tài)互動(dòng)方式結(jié)合,提升用戶體驗(yàn)。聲網(wǎng)提供的實(shí)時(shí)音視頻+實(shí)時(shí)消息+虛擬形象方案能夠帶來更真實(shí)自然的互動(dòng)體驗(yàn),更好地表達(dá)情感和傳達(dá)用戶的個(gè)性化意圖。
響應(yīng)延時(shí)低至1.9秒內(nèi)
針對目前市面上大多數(shù)AI生成式對話響應(yīng)慢的問題,聲網(wǎng)對AIGC場景下音視頻互動(dòng)的延時(shí)做了很多技術(shù)優(yōu)化,從用戶發(fā)言到AI對話響應(yīng)平均延時(shí)僅為1.9s,而市場上絕大部分AI互動(dòng)延遲還停留在6-7s。
3h快速上線,節(jié)省開發(fā)時(shí)間
在場景開發(fā)層面,聲網(wǎng)提供封裝完整的SDK,包含實(shí)時(shí)音視頻、實(shí)時(shí)消息、語音轉(zhuǎn)文字(STT)/文字轉(zhuǎn)語音(TTS)、語音驅(qū)動(dòng)虛擬人嘴型等多種能力,并支持API快速調(diào)用,提供開箱即用的場景化Demo,最快3h即可實(shí)現(xiàn)方案快速驗(yàn)證。尤其對于想快速驗(yàn)證新場景的企業(yè)與開發(fā)者而言,可以節(jié)省很多開發(fā)時(shí)間。
此外,聲網(wǎng)還可以提供以下RTE X AIGC一站式產(chǎn)品能力:
1.國內(nèi)外多種商用大模型靈活切換
聲網(wǎng)與熱門的國內(nèi)外大模型廠商進(jìn)行合作,支持企業(yè)根據(jù)自身需求進(jìn)行靈活切換。此外,聲網(wǎng)在開源大模型層面也有在嘗試做私有化部署,以滿足部分企業(yè)對數(shù)據(jù)安全及網(wǎng)絡(luò)的要求。
2.支持豐富的語言能力
對STT+TTS模型精細(xì)化調(diào)優(yōu),實(shí)現(xiàn)人聲分離,斷句優(yōu)化,讓整個(gè)語言體驗(yàn)更加流暢。此外,聲網(wǎng)還支持AI實(shí)時(shí)變聲、定制化聲音克隆,讓聲音聽起來更具真實(shí)感。
3.場景人設(shè)定制化
聲網(wǎng)在1V1語音、多人語音、視頻直播等場景還對AI角色進(jìn)行了人設(shè)定制,通過Prompt的方式設(shè)置AI角色的名字、職業(yè)、性格等豐富的人設(shè)屬性并支持定制形象與聲音。例如在誰是臥底、海龜湯等多人游戲的場景中,AI可以作為一個(gè)玩家角色參與到游戲中。
4.多輪對話記憶,交互體驗(yàn)再升級(jí)
聲網(wǎng)提供多輪對話記憶功能,對于需要AI精準(zhǔn)回答特定行業(yè)知識(shí)、企業(yè)專業(yè)知識(shí)、多維度知識(shí)的客戶,聲網(wǎng)AIGC解決方案都可以給予響應(yīng)。比如誰是臥底游戲中的AI NPC既可以充當(dāng)臥底又可以扮演隊(duì)友,響應(yīng)敏捷。