你在直播間看到的高清1080P，可能還沒(méi)720P畫質(zhì)好

來(lái)源：聲網(wǎng)

作者：聲網(wǎng)

時(shí)間：2023-08-04

在不同的直播間，長(zhǎng)相甜美的主播小玉與主播小美同樣是1080P高清分辨率，但小玉由于開(kāi)播環(huán)境比較暗，直播設(shè)備比較差，美顏功能不夠自然等原因，導(dǎo)致看到的畫面視覺(jué)效果卻遠(yuǎn)遠(yuǎn)不及小美。

經(jīng)?？粗辈サ呐笥?，可能有過(guò)這樣的經(jīng)歷：

長(zhǎng)此以往，小玉的直播間人氣下滑，粉絲越來(lái)越少。

為了提供更好的直播體驗(yàn)，彌補(bǔ)不同硬件和開(kāi)播環(huán)境的缺陷，聲網(wǎng)最新發(fā)布的“實(shí)時(shí)高清·超級(jí)畫質(zhì)”就解決了這一難題。

這其中涵蓋了不少視頻黑科技，比如畫質(zhì)增強(qiáng)算法、人眼感知優(yōu)化、移動(dòng)端實(shí)時(shí)多倍超分等，能夠?qū)崿F(xiàn)360P的視頻秒變1080P，視頻畫質(zhì)的智能補(bǔ)光、色彩增強(qiáng)，全面提升視頻畫面的分辨率、畫質(zhì)和流暢體驗(yàn)。

智能調(diào)節(jié)畫面色彩、智能補(bǔ)光：

榜一大哥看了都說(shuō)好

不管是直播還是音視頻通話中，視頻畫質(zhì)在很大程度上決定了用戶體驗(yàn)的好壞，對(duì)此，聲網(wǎng)的視頻技術(shù)團(tuán)隊(duì)在過(guò)去幾年深耕實(shí)時(shí)視頻畫質(zhì)增強(qiáng)，上線了AI畫質(zhì)。

AI畫質(zhì)充分利用了視頻采集播放端設(shè)備的平臺(tái)能力，在影響視頻畫質(zhì)的色彩、清晰度、風(fēng)格化等方向上提供了一站式的解決方案，其中就包括暗光增強(qiáng)、色彩增強(qiáng)、視頻降噪等多維度的畫質(zhì)增強(qiáng)算法組合。

智能補(bǔ)光：很多主播在直播時(shí)經(jīng)常會(huì)遭遇光照條件較暗或者背光的開(kāi)播環(huán)境，這會(huì)導(dǎo)致成像的場(chǎng)景中畫面較暗且不清晰，有效的細(xì)節(jié)信息看不到。對(duì)此，聲網(wǎng)的暗光增強(qiáng)算法在面臨光照條件較暗、背光、光照不均勻的環(huán)境時(shí)會(huì)進(jìn)行智能補(bǔ)光，自適應(yīng)提升視頻畫面的亮度，恢復(fù)畫面細(xì)節(jié)輪廓和增加畫面清晰度。

主播在使用補(bǔ)光燈等設(shè)備時(shí)，經(jīng)常還會(huì)遭遇曝光過(guò)強(qiáng)的問(wèn)題，聲網(wǎng)“暗光增強(qiáng)”算法就規(guī)避了這一問(wèn)題，避免過(guò)度增強(qiáng)正常曝光的區(qū)域，最大化平衡性能和畫質(zhì)效果。該算法還支持了智能場(chǎng)景檢測(cè)，根據(jù)光照條件動(dòng)態(tài)自適應(yīng)地開(kāi)啟和關(guān)閉。

智能調(diào)節(jié)色彩飽和度：在直播中，用戶有時(shí)會(huì)看到主播的畫面變灰，并出現(xiàn)失真，這時(shí)候往往是畫面的色彩飽和度出了問(wèn)題。對(duì)此，色彩增強(qiáng)算法可以智能調(diào)節(jié)視頻畫面的飽和度，改善畫質(zhì)，使得畫面色彩更加豐富和逼真，提升人的視覺(jué)主觀感受。該算法還融合了多種膚色識(shí)別算法，確保人物膚色不會(huì)因色彩增強(qiáng)而變得突兀。

視頻降噪帶來(lái)雙BUFF增益：當(dāng)我們?cè)诠饩€不足的情況下拍攝視頻時(shí)，手機(jī)為了彌補(bǔ)缺少的光線，會(huì)自動(dòng)增加ISO值，從而導(dǎo)致畫面出現(xiàn)噪點(diǎn)。在視頻直播/通話的場(chǎng)景中，同樣會(huì)出現(xiàn)噪點(diǎn)，聲網(wǎng)的“視頻降噪”功能可以在低端采集設(shè)備和暗光場(chǎng)景，大幅減少閃爍的噪點(diǎn)，并最小化“拖影”等視頻降噪最常見(jiàn)的負(fù)作用。

此外，視頻降噪還具備另一層buff，開(kāi)啟后可節(jié)省28-35%的傳輸碼率，進(jìn)一步提升視頻接收端的畫面質(zhì)量和清晰度。

人眼感知優(yōu)化：

你關(guān)注的更高清

我們?cè)谟^看視頻或圖像時(shí)，往往會(huì)希望主觀關(guān)注及感興趣區(qū)域能夠擁有較高的清晰度，而對(duì)于非關(guān)注區(qū)域，只需要達(dá)到基本視覺(jué)要求即可。

基于人類的視覺(jué)特點(diǎn)，在視頻編碼中，通過(guò)對(duì)感興趣區(qū)域進(jìn)行低壓縮比，甚至是無(wú)損壓縮編碼，以獲得高質(zhì)量的重建圖像，而對(duì)非關(guān)注區(qū)域采用較高壓縮率，這就是ROI（Regions of Interest，感興趣區(qū)域）視頻編碼技術(shù)。

在直播/視頻通話場(chǎng)景中，聲網(wǎng)通過(guò)ROI和PVC算法，提升人眼感知畫面的細(xì)節(jié)效果，ROI主要凸顯畫面細(xì)節(jié)，PVC凸顯色彩優(yōu)化，以綜合提升觀眾對(duì)畫質(zhì)的主觀體驗(yàn)。由于聲網(wǎng)的SDK主要面向直播/視頻社交/會(huì)議類應(yīng)用，畫面中往往人臉就是感興趣區(qū)域或者視覺(jué)聚焦區(qū)域，因此聲網(wǎng)AI感知處理算法是基于人臉檢測(cè)的視頻編碼技術(shù)。

實(shí)現(xiàn)原理是通過(guò)檢測(cè)到人臉區(qū)域確定感興趣區(qū)域，在編碼過(guò)程中，對(duì)圖像中人臉的區(qū)域降低量化參數(shù)值，從而分配更多碼率，以提升感興趣區(qū)域的畫面質(zhì)量，而對(duì)非人臉區(qū)域的區(qū)域則提高量化參數(shù)值，分配更少碼率，在不損失圖像整體主觀質(zhì)量的前提下，降低視頻碼率，提高視頻質(zhì)量。

經(jīng)ROI編碼處理后的圖像對(duì)比

360P秒變720P：

畫質(zhì)跨越式提升

不管是色彩、暗光增強(qiáng)還是ROI人眼感知優(yōu)化，都是在視頻分辨率不變的基礎(chǔ)上進(jìn)行畫質(zhì)效果的提升。而在一些欠發(fā)達(dá)的海外地區(qū)或智能硬件終端中，受到設(shè)備性能、傳輸成本、用戶帶寬等限制，傳輸?shù)耐堑头直媛实囊曨l，因此為了提升視頻畫質(zhì)質(zhì)量，進(jìn)而提升用戶的觀看體驗(yàn)，需要借助拯救分辨率的“魔法“：

視頻超分辨率技術(shù)，在用戶端將接收到的低分辨率視頻重建成紋理豐富、細(xì)節(jié)清晰、觀看體驗(yàn)佳的高分辨率的視頻，簡(jiǎn)稱為超分技術(shù)。

目前業(yè)內(nèi)很多主流的終端實(shí)時(shí)超分算法更集中在PC端，PC端的設(shè)備相對(duì)可以提供更強(qiáng)的算力，實(shí)現(xiàn)高性能的視頻畫質(zhì)實(shí)時(shí)增強(qiáng)。

但當(dāng)下直播、視頻通話等場(chǎng)景都逐漸集中在移動(dòng)端，在移動(dòng)端用戶設(shè)備性能參差不齊，這就要求移動(dòng)端實(shí)時(shí)超分的復(fù)雜度必須極低，這樣才能在大部分移動(dòng)設(shè)備中做到實(shí)時(shí)處理，并在超低計(jì)算量的情況下還能保持較好的視頻超分效果。

對(duì)此，聲網(wǎng)的人工智能算法團(tuán)隊(duì)經(jīng)過(guò)持續(xù)的技術(shù)鉆研，推出了業(yè)內(nèi)首個(gè)基于移動(dòng)端的實(shí)時(shí)多倍超分算法，該算法的優(yōu)勢(shì)是成本低、功耗小，不需要部署GPU服務(wù)器，僅依靠移動(dòng)端設(shè)備自身的CPU、GPU或NPU來(lái)實(shí)時(shí)超分，以較小的算法計(jì)算量實(shí)現(xiàn)視頻分辨率的多倍超分，有效增強(qiáng)了視頻的畫質(zhì)，并降低視頻傳輸?shù)某杀?，普通?60P畫質(zhì)能夠通過(guò)超分實(shí)現(xiàn)對(duì)標(biāo)540P效果。

通過(guò)下面的視頻，可以更直觀的感受360P開(kāi)啟超分后的畫質(zhì)效果。

聲網(wǎng)移動(dòng)端實(shí)時(shí)超分的技術(shù)原理是基于深度學(xué)習(xí)算法進(jìn)行豐富的視頻數(shù)據(jù)訓(xùn)練，從大量的低分辨圖像和高分辨圖像對(duì)，有監(jiān)督地學(xué)習(xí)低分辨到高分辨率的映射關(guān)系，實(shí)現(xiàn)圖像放大后，細(xì)節(jié)豐富、畫面清晰的效果，其超分效果、自適應(yīng)能力明顯優(yōu)于傳統(tǒng)的超分方法。

在性能和適配方面，聲網(wǎng)多倍超分算法在中低端機(jī)型也能實(shí)時(shí)處理，能夠覆蓋95%以上的iOS視頻用戶，85%以上的安卓用戶。且CPU消耗、SDK內(nèi)存消耗低，單幀處理耗時(shí)平均在10ms以內(nèi)，在1對(duì)1視頻通話場(chǎng)景中開(kāi)啟多倍超分后，SDK的內(nèi)存消耗只增加10%左右。

伴隨視頻進(jìn)入超高清時(shí)代，人們?cè)谥辈?、視頻互動(dòng)中也在追求更高清、更美觀、更自然的視頻畫質(zhì)，APP廠商也應(yīng)與時(shí)俱進(jìn)，在保證視頻高分辨率的前提下，注重對(duì)畫質(zhì)細(xì)節(jié)的提升，才能搶占更多用戶市場(chǎng)，帶來(lái)更多流水。

需要實(shí)時(shí)提升直播/社交平臺(tái)的畫質(zhì)，可以用聲網(wǎng)“實(shí)時(shí)高清·超級(jí)畫質(zhì)”試試。

實(shí)時(shí)音視頻云通訊

上一篇：當(dāng)AIGC入局營(yíng)銷，有多少種增長(zhǎng)可能？

原文鏈接：點(diǎn)擊前往 >

版權(quán)說(shuō)明：本文內(nèi)容來(lái)自于聲網(wǎng)，本站不擁有所有權(quán)，不承擔(dān)相關(guān)法律責(zé)任。文章內(nèi)容系作者個(gè)人觀點(diǎn)，不代表快出海對(duì)觀點(diǎn)贊同或支持。如有侵權(quán)，請(qǐng)聯(lián)系管理員（zzx@kchuhai.com）刪除！

相關(guān)文章