當(dāng)身邊有人在狂歡時，聊天降噪功能必不可少

來源：時光譜Skype

作者：時光譜Skype

時間：2022-04-07

無論是在交談的人們、在玩耍的孩子、隔壁的建筑工人，還是想把想象中的怪物從前廊嚇跑的寵物狗，當(dāng)嘗試在Skype上進(jìn)行通話時，背景噪聲確實(shí)會讓人聽不清。

但是，這種情況在Skype中會得到大大改善！

今天為大家介紹的是

Skype桌面應(yīng)用的最新背景降噪功能

在當(dāng)你使用Skype與對方對話時，分級別的消除除你的聲音外的幾乎所有聲音。

在"設(shè)置"中，點(diǎn)擊"音頻和視頻"，找到“噪音取消”選項(xiàng)，調(diào)節(jié)周邊聲音大小。

噪聲取消-調(diào)整呼叫的Skype選項(xiàng)。

有以下選項(xiàng)可供選擇：

自動(默認(rèn))-Skype應(yīng)用將根據(jù)您的環(huán)境調(diào)整噪聲抑制級別。

低-將抑制低級別的持久背景噪音，例如計(jì)算機(jī)風(fēng)扇或空調(diào)。但是，如果你想要共享正在播放的音樂，可以使用此設(shè)置。

高-將取消所有背景聲音，語音除外。

關(guān)-已禁用噪音消除。

注意：啟用此選項(xiàng)會使用更多計(jì)算機(jī)資源，因?yàn)榻翟氚l(fā)生在使用的設(shè)備上，而不是在Skype上。

真的如此神奇嗎？

如果你想了解它的工作原理，請繼續(xù)往下看。

其工作原理是分析音頻源，然后使用經(jīng)過專門訓(xùn)練的深度神經(jīng)網(wǎng)絡(luò)來過濾掉噪聲，而不影響說話者的聲音。盡管傳統(tǒng)的降噪算法可以解決簡單、一致的噪聲（如風(fēng)扇發(fā)出的噪聲），但是這些神經(jīng)網(wǎng)絡(luò)可以學(xué)習(xí)語音和更復(fù)雜、不一致的噪聲（比如鍵盤上的打字聲、食物包裝紙的嘎吱聲，是的，還有那只狗的嚎叫聲）之間的區(qū)別。

此技術(shù)依靠機(jī)器學(xué)習(xí)(ML)來學(xué)習(xí)純凈語音和噪聲之間的區(qū)別，通常被稱為人工智能(AI)。使用一個具有代表性的數(shù)據(jù)集來訓(xùn)練ML模型，使其在我們的Skype用戶遇到的大多數(shù)情況下都能工作。就純凈語音、噪聲類型以及用戶加入在線電話的環(huán)境而言，該數(shù)據(jù)集中需要有足夠的多樣性。

為了實(shí)現(xiàn)這種多樣性，我們使用的數(shù)據(jù)集包含約760小時的純凈語音數(shù)據(jù)和180小時的噪聲數(shù)據(jù)。為了符合Microsoft嚴(yán)格的隱私標(biāo)準(zhǔn)，未針對此數(shù)據(jù)集收集任何客戶數(shù)據(jù)。相反，我們使用公開提供的數(shù)據(jù)或眾包來收集特定場景。對于純凈語音，我們均衡使用了男女語音。我們還收集了10多種語言（包括聲調(diào)語言）的數(shù)據(jù)，以幫助確保該模型不會曲解詞語的聲調(diào)，從而改變句子的含義。對于噪聲數(shù)據(jù)，我們包括了150種噪聲類型，以涵蓋用戶可能遇到的從鍵盤輸入、流水到打鼾等各種場景。我們還在純凈語音中包含了情感，以免諸如笑聲或哭泣聲之類的表達(dá)受到抑制。用戶加入Skype會議時所處環(huán)境的特征對語音信號也有很大的影響。為了捕獲這種多樣性，我們使用來自3,000多個真實(shí)房間環(huán)境和115,000多個合成房間的數(shù)據(jù)來訓(xùn)練我們的模型。

由于我們采用深度學(xué)習(xí)，因此擁有功能強(qiáng)大的模型訓(xùn)練基礎(chǔ)結(jié)構(gòu)很重要。我們使用Microsoft Azure，使團(tuán)隊(duì)能夠開發(fā)ML模型的改進(jìn)版本。從噪聲中提取原始純凈語音的另一個挑戰(zhàn)需要以一種人耳認(rèn)為是自然和愉悅的方式。由于沒有與人類感知高度相關(guān)的客觀指標(biāo)，因此我們開發(fā)了一個框架，該框架使我們能夠?qū)⑻幚砗蟮囊纛l樣本發(fā)送給眾包供應(yīng)商，由人類聽眾按照一到五星的等級對其音頻質(zhì)量進(jìn)行評分，以得出平均意見分?jǐn)?shù)(MOS)。借助這些人類評分，我們能夠開發(fā)出一種新的感知指標(biāo)，再加上人類的主觀評分，讓我們在改善深度學(xué)習(xí)模型的質(zhì)量方面取得了快速的進(jìn)步。為了推進(jìn)這一領(lǐng)域的研究，我們開源了我們的數(shù)據(jù)集和感知質(zhì)量眾包框架。

最后，我們創(chuàng)建了深度學(xué)習(xí)模型，以在Skype桌面應(yīng)用上實(shí)時高效運(yùn)行。通過針對人類感知進(jìn)行優(yōu)化，我們能夠在質(zhì)量和復(fù)雜性之間實(shí)現(xiàn)良好的折衷，這意味著用戶使用的大多數(shù)Windows設(shè)備都可以利用基于AI的降噪功能。

立即登錄，閱讀全文

Skype

上一篇：eBay再次延長保護(hù)時間的政策通知

版權(quán)說明：

本文內(nèi)容來自于時光譜Skype，本站不擁有所有權(quán)，不承擔(dān)相關(guān)法律責(zé)任。文章內(nèi)容系作者個人觀點(diǎn)，不代表快出海對觀點(diǎn)贊同或支持。如有侵權(quán)，請聯(lián)系管理員（zzx@kchuhai.com）刪除！

相關(guān)文章