8月23日消息,微軟Azure AI語音服務允許開發(fā)者構建多語言生成式AI語音應用,Azure AI語音服務最新推出了文本到語音虛擬人功能,可以將簡單的文本轉換為人類自然說話視頻。
今天,微軟宣布全面推出Text to Speech Avatar功能。這項新功能使開發(fā)者能夠為其用戶創(chuàng)建個性化虛擬人。該服務的輸出視頻分辨率為1920 x 1080,每秒25幀。IT之家附示例如下:
微軟Azure AI語音服務推出虛擬人形象,支持文本轉視頻
Text to Speech Avatar具有以下功能:
-將文本轉換為由Azure AI文本轉語音提供支持的人類說話視頻,該視頻具有自然的聲音。
-提供不同的人物預設形象。
-形象的聲音由Azure AI文本轉語音生成。
-使用批量合成API異步或實時合成文本到語音人像視頻。
-在Speech Studio中提供內(nèi)容創(chuàng)建工具,無需編碼即可創(chuàng)建視頻內(nèi)容。
-通過Speech Studio中的實時聊天頭像工具啟用實時人像對話。
定價方面,文本轉視頻服務的收費將根據(jù)視頻輸出的長度計算并按秒收費。該服務現(xiàn)已在東南亞、北歐、西歐、瑞典中部、美國中南部和美國西部地區(qū)推出。