當(dāng)身邊有人在狂歡時,聊天降噪功能必不可少

來源: 時光譜Skype
作者:時光譜Skype
時間:2022-04-07
12099
無論是在交談的人們、在玩耍的孩子、隔壁的建筑工人,還是想把想象中的怪物從前廊嚇跑的寵物狗,當(dāng)嘗試在Skype上進(jìn)行通話時,背景噪聲確實(shí)會讓人聽不清。

無論是在交談的人們、在玩耍的孩子、隔壁的建筑工人,還是想把想象中的怪物從前廊嚇跑的寵物狗,當(dāng)嘗試在Skype上進(jìn)行通話時,背景噪聲確實(shí)會讓人聽不清。

但是,這種情況在Skype中會得到大大改善!

今天為大家介紹的是

Skype桌面應(yīng)用的最新背景降噪功能

在當(dāng)你使用Skype與對方對話時,分級別的消除除你的聲音外的幾乎所有聲音。

59BC07E4-830C-47A9-99ED-4108EC907D5A.png

在"設(shè)置"中,點(diǎn)擊"音頻和視頻",找到“噪音取消”選項,調(diào)節(jié)周邊聲音大小。

噪聲取消-調(diào)整呼叫的Skype選項。

有以下選項可供選擇:

自動(默認(rèn))-Skype應(yīng)用將根據(jù)您的環(huán)境調(diào)整噪聲抑制級別。

低-將抑制低級別的持久背景噪音,例如計算機(jī)風(fēng)扇或空調(diào)。但是,如果你想要共享正在播放的音樂,可以使用此設(shè)置。

高-將取消所有背景聲音,語音除外。

關(guān)-已禁用噪音消除。

注意:啟用此選項會使用更多計算機(jī)資源,因為降噪發(fā)生在使用的設(shè)備上,而不是在Skype上。

真的如此神奇嗎?

如果你想了解它的工作原理,請繼續(xù)往下看。

其工作原理是分析音頻源,然后使用經(jīng)過專門訓(xùn)練的深度神經(jīng)網(wǎng)絡(luò)來過濾掉噪聲,而不影響說話者的聲音。盡管傳統(tǒng)的降噪算法可以解決簡單、一致的噪聲(如風(fēng)扇發(fā)出的噪聲),但是這些神經(jīng)網(wǎng)絡(luò)可以學(xué)習(xí)語音和更復(fù)雜、不一致的噪聲(比如鍵盤上的打字聲、食物包裝紙的嘎吱聲,是的,還有那只狗的嚎叫聲)之間的區(qū)別。

此技術(shù)依靠機(jī)器學(xué)習(xí)(ML)來學(xué)習(xí)純凈語音和噪聲之間的區(qū)別,通常被稱為人工智能(AI)。使用一個具有代表性的數(shù)據(jù)集來訓(xùn)練ML模型,使其在我們的Skype用戶遇到的大多數(shù)情況下都能工作。就純凈語音、噪聲類型以及用戶加入在線電話的環(huán)境而言,該數(shù)據(jù)集中需要有足夠的多樣性。

為了實(shí)現(xiàn)這種多樣性,我們使用的數(shù)據(jù)集包含約760小時的純凈語音數(shù)據(jù)和180小時的噪聲數(shù)據(jù)。為了符合Microsoft嚴(yán)格的隱私標(biāo)準(zhǔn),未針對此數(shù)據(jù)集收集任何客戶數(shù)據(jù)。相反,我們使用公開提供的數(shù)據(jù)或眾包來收集特定場景。對于純凈語音,我們均衡使用了男女語音。我們還收集了10多種語言(包括聲調(diào)語言)的數(shù)據(jù),以幫助確保該模型不會曲解詞語的聲調(diào),從而改變句子的含義。對于噪聲數(shù)據(jù),我們包括了150種噪聲類型,以涵蓋用戶可能遇到的從鍵盤輸入、流水到打鼾等各種場景。我們還在純凈語音中包含了情感,以免諸如笑聲或哭泣聲之類的表達(dá)受到抑制。用戶加入Skype會議時所處環(huán)境的特征對語音信號也有很大的影響。為了捕獲這種多樣性,我們使用來自3,000多個真實(shí)房間環(huán)境和115,000多個合成房間的數(shù)據(jù)來訓(xùn)練我們的模型。

由于我們采用深度學(xué)習(xí),因此擁有功能強(qiáng)大的模型訓(xùn)練基礎(chǔ)結(jié)構(gòu)很重要。我們使用Microsoft Azure,使團(tuán)隊能夠開發(fā)ML模型的改進(jìn)版本。從噪聲中提取原始純凈語音的另一個挑戰(zhàn)需要以一種人耳認(rèn)為是自然和愉悅的方式。由于沒有與人類感知高度相關(guān)的客觀指標(biāo),因此我們開發(fā)了一個框架,該框架使我們能夠?qū)⑻幚砗蟮囊纛l樣本發(fā)送給眾包供應(yīng)商,由人類聽眾按照一到五星的等級對其音頻質(zhì)量進(jìn)行評分,以得出平均意見分?jǐn)?shù)(MOS)。借助這些人類評分,我們能夠開發(fā)出一種新的感知指標(biāo),再加上人類的主觀評分,讓我們在改善深度學(xué)習(xí)模型的質(zhì)量方面取得了快速的進(jìn)步。為了推進(jìn)這一領(lǐng)域的研究,我們開源了我們的數(shù)據(jù)集和感知質(zhì)量眾包框架。

最后,我們創(chuàng)建了深度學(xué)習(xí)模型,以在Skype桌面應(yīng)用上實(shí)時高效運(yùn)行。通過針對人類感知進(jìn)行優(yōu)化,我們能夠在質(zhì)量和復(fù)雜性之間實(shí)現(xiàn)良好的折衷,這意味著用戶使用的大多數(shù)Windows設(shè)備都可以利用基于AI的降噪功能。

立即登錄,閱讀全文
版權(quán)說明:
本文內(nèi)容來自于時光譜Skype,本站不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。文章內(nèi)容系作者個人觀點(diǎn),不代表快出海對觀點(diǎn)贊同或支持。如有侵權(quán),請聯(lián)系管理員(zzx@kchuhai.com)刪除!
優(yōu)質(zhì)服務(wù)商推薦
更多