AWS更新其通信服務Amazon Chime的軟件開發(fā)工具包,加入即時語音通話分析功能,可執(zhí)行包括語音轉(zhuǎn)錄、情感分析和說話者搜索任務,而且開發(fā)者只要操作管理控制臺,就能夠在音頻應用程序簡單地集成這些機器學習功能。
Amazon Chime SDK新提供的語音通話分析功能,分別為情感分析和說話者搜索。情感分析可以判斷說話者的語氣,像是積極、中立或是消極態(tài)度。該情感分析技術應用機器學習,對詞匯、語言資訊,諸如字詞選擇和語法結(jié)構(gòu),以及聲學和語調(diào)上的資訊,像是音高、音量和語速進行綜合分析,以進一步判斷語音中的情感。
除了情感分析之外,用戶還可以使用Amazon Chime SDK開發(fā)說話者搜索應用,通過在現(xiàn)有語音數(shù)據(jù)庫比對說話者語音特征,找出錯含說話者的聯(lián)系歷史和轉(zhuǎn)錄文本。說話者搜索僅需要一個簡短的語音樣本,系統(tǒng)便可以迅速找出相關的音頻記錄,這項功能的應用除了可以查詢特定說話者的相關資料外,也能夠應用在即時通信中,替不同的說話者添加標記。
用戶在AWS管理控制臺就能簡單集成這些功能,不需要編寫任何集成程序代碼,只要選擇轉(zhuǎn)錄或是語音分析等服務,AWS系統(tǒng)便會自動處理人工智能服務與應用程序的集成,用戶在控制臺中可以定義分析資料發(fā)送的位置,同時語音分析也可以向Lambda函數(shù)和SNS等服務發(fā)送即時通知。
用戶可以使用Amazon QuickSight或Tableau構(gòu)建儀表板,以獲取即時的語音分析結(jié)果,而語音分析也可以通過事件,發(fā)布到Amazon EventBridge生成即時警示,將這些事件路由到用戶選擇的目標。音頻分析功能的付費方式,根據(jù)用戶使用情況收費,收費基礎為每分鐘所分析的資料,目前用戶已經(jīng)可以在AWS美東、美西和歐洲地區(qū)使用到該新功能。