大多數(shù)人對(duì)AI語音助手的印象,可能還停留在“Hi xxx,幫我播放歌曲”和“打開電視、關(guān)閉電視”,更進(jìn)一步也就是“幫我導(dǎo)航最近的蘭州牛肉面館”。
簡單的問題回復(fù)及時(shí),稍微難一點(diǎn)的似乎只能回答“我不明白”。TA只會(huì)對(duì)特定的提問反應(yīng),簡單的陪聊甚至前言不搭后語,反應(yīng)的話術(shù)也都是預(yù)設(shè)的。
試想一下,如果有一種AI語音助手,能夠與你進(jìn)行實(shí)時(shí)語音互動(dòng),甚至TA的人設(shè)也能夠根據(jù)你的需求而變,那會(huì)是多么爽的事情。比如你想練口語,TA就化身一口純正英腔的英倫大叔與你對(duì)話;你失戀了想找個(gè)人傾訴,TA一定是情緒最穩(wěn)定的那個(gè);你也不用再做旅游攻略了,沒有TA不知道的;TA可以當(dāng)你的二次元“戀人”,甚至給你提供專業(yè)咨詢?
好家伙,這AI看上去幾乎全知全能,任勞任怨,不得不說,TA人還怪好的嘞!
以上dream的AI語音助手,聲網(wǎng)已經(jīng)搞定了!相較于市面上的文本互動(dòng)生成式AI對(duì)話或者離線的本地?cái)?shù)字人方案,聲網(wǎng)AIGC解決方案更專注于實(shí)時(shí)音頻對(duì)話的更優(yōu)體驗(yàn),支持體驗(yàn)者與AI語音助手進(jìn)行超低延遲的語音互動(dòng),并提供泛娛樂、教育、政企等細(xì)分業(yè)務(wù)場景的定制化。
聲網(wǎng)AIGC一站式解決方案
更沉浸、低延時(shí)、易開發(fā)
1.更沉浸,用戶體驗(yàn)up:相比傳統(tǒng)的通過IM文字聊天與AI角色實(shí)現(xiàn)交互的方案,聲網(wǎng)提供的實(shí)時(shí)音視頻+實(shí)時(shí)消息+虛擬形象方案能夠帶來更真實(shí)自然的互動(dòng)體驗(yàn),更好地表達(dá)情感和傳達(dá)用戶的個(gè)性化意圖。
2.低延時(shí),響應(yīng)延時(shí)低至1.9秒內(nèi):針對(duì)目前市面上大多數(shù)AI生成式對(duì)話響應(yīng)慢的問題,聲網(wǎng)的研發(fā)團(tuán)隊(duì)對(duì)AIGC場景下音視頻互動(dòng)的延時(shí)做了技術(shù)優(yōu)化,從用戶發(fā)言到AI對(duì)話響應(yīng)平均延時(shí)僅為1.9s,比市面上絕大部分AI互動(dòng)延遲在6-7s的方案要低很多。
3.易開發(fā),3h快速上線:在場景開發(fā)層面,聲網(wǎng)提供封裝完整的SDK,包含實(shí)時(shí)音視頻、實(shí)時(shí)消息、語音轉(zhuǎn)文字(STT)/文字轉(zhuǎn)語音(TTS)、語音驅(qū)動(dòng)虛擬人嘴型等多種能力,并支持API快速調(diào)用,提供開箱即用的場景化Demo,最快3h即可實(shí)現(xiàn)方案快速驗(yàn)證。尤其對(duì)于想快速驗(yàn)證新場景的企業(yè)與開發(fā)者而言,可以節(jié)省很多開發(fā)時(shí)間。
此外,聲網(wǎng)還可以提供以下RTE X AIGC一站式產(chǎn)品能力:
1.國內(nèi)外多種商用大模型靈活切換
聲網(wǎng)與熱門的國內(nèi)外大模型廠商進(jìn)行合作,根據(jù)業(yè)務(wù)場景集成測試了多個(gè)大模型的能力,支持企業(yè)根據(jù)自身需求進(jìn)行靈活切換。此外,聲網(wǎng)在開源大模型層面也有在嘗試做私有化部署,以滿足部分企業(yè)對(duì)數(shù)據(jù)安全及網(wǎng)絡(luò)的要求。
2.支持豐富的語言能力
對(duì)STT+TTS模型精細(xì)化調(diào)優(yōu),實(shí)現(xiàn)人聲分離,斷句優(yōu)化,讓整個(gè)語言體驗(yàn)更加流暢。此外,聲網(wǎng)還支持AI實(shí)時(shí)變聲、定制化聲音克隆,讓聲音聽起來更具真實(shí)感。
3.場景人設(shè)定制化
聲網(wǎng)對(duì)AI角色進(jìn)行了人設(shè)定制,通過Prompt的方式設(shè)置AI角色的名字、職業(yè)、性格等豐富的人設(shè)屬性并支持定制形象與聲音,例如設(shè)定不同性格人設(shè)的AI語音助手,比如口語陪練老師、虛擬戀人、客服人員、銷售專家等。
4.多輪對(duì)話記憶,交互體驗(yàn)再升級(jí)
聲網(wǎng)提供的多輪對(duì)話記憶功能,可以更好的應(yīng)用在AI情感陪聊、智能辦公助手等場景。對(duì)于需要AI精準(zhǔn)回答特定行業(yè)知識(shí)、企業(yè)專業(yè)知識(shí)的客戶,聲網(wǎng)AIGC解決方案都能夠提供實(shí)時(shí)語音回答。比如政務(wù)大廳的AI問答助手可以回答公積金、社保等問題;AI英語老師可以針對(duì)不同年級(jí)提供不同難易程度的詞庫指導(dǎo)等。
更多好玩的應(yīng)用場景等你來發(fā)現(xiàn)!