Google宣布在BigQuery中預(yù)覽Vertex AI語(yǔ)音轉(zhuǎn)文本模型,這項(xiàng)新功能可讓用戶更簡(jiǎn)單地轉(zhuǎn)錄語(yǔ)音文件,并將其與其他結(jié)構(gòu)化數(shù)據(jù)結(jié)合,整合分析并構(gòu)建創(chuàng)新人工智能用例。這項(xiàng)功能更新使得用戶得以通過(guò)SQL根據(jù)數(shù)據(jù)微調(diào)轉(zhuǎn)錄模型,在BigQuery中執(zhí)行語(yǔ)音轉(zhuǎn)文本工作。
過(guò)去Google云計(jì)算用戶要轉(zhuǎn)錄語(yǔ)音數(shù)據(jù),需要自己創(chuàng)建獨(dú)立的人工智能工作管線,這些工作管線并沒有與BigQuery直接集成,客戶需要編寫自定義基礎(chǔ)設(shè)施,再將轉(zhuǎn)錄的數(shù)據(jù)傳輸?shù)紹igQuery進(jìn)行分析。而新的Google的語(yǔ)音轉(zhuǎn)文本V2 API提供多功能轉(zhuǎn)錄服務(wù),用戶可以針對(duì)不同類型的語(yǔ)音音頻,像是客服通話或醫(yī)療錄音,選擇合適的專門模型。此外,模型也可以根據(jù)用戶的數(shù)據(jù)進(jìn)行調(diào)整,以提高轉(zhuǎn)錄準(zhǔn)確性。
在BigQuery中,用戶可以創(chuàng)建對(duì)象表格,這些表格和Cloud Storage中的語(yǔ)音文件相關(guān)聯(lián),如此便能夠提供高精細(xì)度的訪問(wèn)控制,允許管理員設(shè)置列級(jí)的訪問(wèn)政策強(qiáng)化數(shù)據(jù)安全。當(dāng)要進(jìn)行轉(zhuǎn)錄時(shí),用戶需要在BigQuery中注冊(cè)現(xiàn)成或是經(jīng)微調(diào)的轉(zhuǎn)錄模型,并使用SQL通過(guò)對(duì)象表格調(diào)用激活,轉(zhuǎn)錄結(jié)果會(huì)以BigQuery表格的文本字段回傳。
當(dāng)語(yǔ)音轉(zhuǎn)換成為文本之后,用戶有三種方式可以對(duì)文本數(shù)據(jù)進(jìn)行分析,第一是使用BigQuery ML進(jìn)行自然語(yǔ)言處理,像是識(shí)別客戶支持通話中的情緒或是產(chǎn)品反饋分類,第二種則是將轉(zhuǎn)錄的元數(shù)據(jù)和存儲(chǔ)在BigQuery表格中的其他結(jié)構(gòu)數(shù)據(jù)進(jìn)行集成分析,例如識(shí)別出在通話中表現(xiàn)出負(fù)面情緒,但是高終身價(jià)值的客戶,或是從客戶反饋中篩選出最受歡迎的產(chǎn)品特性,第三種則是從BigQuery調(diào)用語(yǔ)言模型PaLM API,執(zhí)行摘要、分類,以及針對(duì)轉(zhuǎn)錄的文本進(jìn)行問(wèn)答等操作。