要點問題概覽
語音房目前的競爭格局?
技術(shù)實現(xiàn)難點有哪些?解決方案是什么?
在技術(shù)驅(qū)動下有什么新的出海機會?
導語:
在2021開年伊始,相信所有的出海人都被音頻賽道升起的全球明星——Clubhouse抓走了眼球,CH不止一個,在許多海外著名音頻應用的背后,更有中國語音房模式和過硬的音頻底層技術(shù)服務的出?;蛑С帧3龊M瑢W會第32期圍繞“音頻應用與底層技術(shù)出?!敝黝}進行了探討。我們邀請了音視頻領(lǐng)域的重要技術(shù)提供者、音頻應用創(chuàng)業(yè)者、相關(guān)產(chǎn)業(yè)及投資人,小編為您精選整理了討論的重點部分。
文中涉及部分參與本場同學會討論的行業(yè)從業(yè)者:
不亦樂乎 CEO 李晨嘯
虎牙 副總經(jīng)理 李豪
首云 華東事業(yè)部總經(jīng)理 張雪松
JusTalk VP 疏駿
Starmaker VP 伍逸靜
Zego即構(gòu)科技 海外業(yè)務負責人 李振揚
以下的文字是與會嘉賓的精彩問答整理:
語音房目前的競爭格局
虎牙 李豪
我們做語音房模式比較久了。國內(nèi)主要把它作為一個交友、陪玩背后交易的平臺,套路非常清晰,模式極其的標準化,所以Arpu值很高,但是每一個語音房產(chǎn)品的DAU都不大。
我們發(fā)現(xiàn)把中國這一套模式帶到海外,剛開始的時候非常吃力,最早我們做西語市場,主要是像墨西哥、哥倫比亞、阿根廷那些國家,他們的付費能力相對比較弱,而且整個當?shù)赜譀]有很成熟的這種工會生態(tài),所有的這種主播,還有社區(qū)的這些玩法,都是靠自己去教育市場,我們就做得非常吃力。
后面其實也是有兩個重要的事件發(fā)生,第一個就是Yalla的上市,Yalla上市了以后給我們很大的一個啟示,就是語音房本質(zhì)上是要解決用戶跟用戶之間的社交關(guān)系,音頻只是更適合他們社交的一種形式,你只有去解決了客戶底層的這種訴求,才可能在商業(yè)變現(xiàn)上可持續(xù),用戶規(guī)模才逐漸擴大。
在紐交所上市的中國音頻社交Yalla
但是Yalla它是屬于在圈里面火,最近的Clubhouse是用熟人社交,用關(guān)系鏈的這種形式,一下子把他在這種c端的認知一下打開了。用戶知道了音頻這件事兒提他能做的事很多,想象空間就會比我們之前理解音頻大了很多。我們以前以為的音頻只是一種形式,它應該是一種一個容器,它可以裝很多內(nèi)容,它可以變成一個有爆發(fā)力的行業(yè)。一旦這樣的場景被教育出來了,同時又有清晰的商業(yè)模式,這個行業(yè)就會出現(xiàn)一個真正的井噴式的爆發(fā)。
Starmaker 伍逸靜
PC時期已經(jīng)有語音房形態(tài),首先它是一個基于興趣的社交形式,其次他是一個比較強的變現(xiàn)模式。其實延續(xù)到移動端之后也一直是這個狀態(tài)。然后直到clubhouse出來之后,可能說不管是對資本圈也好,還是對于就是說比較泛的大眾也好,可能對于語音產(chǎn)品的形態(tài)才有了一個比較新的認知。
我們?nèi)绻皇腔谡Z音房這個模式來做的話,很難支持大的DAU,所以我們一開始其實就非常重視怎樣通過其他業(yè)務形式來把我們的用戶規(guī)模做起來。在這個基礎(chǔ)上我們可能再加入語音房,再加入直播,這種就是變現(xiàn)的抓手,可能就是一個比較好的搭配。然后這也形成了現(xiàn)在Starmaker的一個業(yè)務模式,一個興趣或者是音樂撐起的DAU盤子,加上比較傳統(tǒng)市場驗證過的營收模式,這是我們目前的一個狀態(tài)。
市場上分兩類,一派可能就是盯著高arpu值,日韓歐美會比較多一些。韓日本地有語音房模式,做得很小清新,比如Spoon,他們有很好的聲優(yōu)形成了圈層。
韓日市場的產(chǎn)品 Spoon
然后還有一類不是純盯著營收的,比如Starmaker,我們非常重視用戶的規(guī)模和平臺化的能力。所以從這個角度的話,就會非常關(guān)注那些有潛力做大,有潛力做出大DAU的市場。比如說考慮到人口,印尼就是一個很好的市場。
Zego即構(gòu)科技 李振揚
即構(gòu)科技一直在深耕音視頻這個行業(yè),我也負責即構(gòu)海外市場的開拓工作。我們發(fā)現(xiàn)其實現(xiàn)在很多產(chǎn)品都是雨后春筍的一般涌出來,但是大的格局來看,短期內(nèi)仍舊是頭部競爭加劇,喜馬拉雅、蜻蜓、荔枝三強爭霸的格局。頭部的巨頭不斷的去收購小公司擴充流量。整個行業(yè)我認為是會平穩(wěn)增長的一個模式。
技術(shù)實現(xiàn)難點和需求?
Zego即構(gòu)科技 李振揚
音頻這個產(chǎn)品本身分很多個階段,第一個階段就是怎么把產(chǎn)品做出來,這是第一步。第二步就是優(yōu)化產(chǎn)品代碼和API接口,優(yōu)化自己的SDK包和產(chǎn)品包,提供更高的傳輸效率和穩(wěn)定性。
語音連麥,邊聊邊玩,邊聊邊做別的這種。一個粉絲和大家互動,在技術(shù)上實現(xiàn)比較簡單,但是主要的挑戰(zhàn)也是在于雙方多方通話時保證低延時,優(yōu)化傳輸?shù)牟呗?,?guī)避網(wǎng)絡的擁塞。ZEGO是通過UDP協(xié)議進行低延時傳輸?shù)模@背后也有一些關(guān)于底層的云,節(jié)點部署等等的關(guān)健節(jié)點解決。在一些特殊場景,大V出現(xiàn),雙十一這種場景下,服務器壓力也有陡增。這種情況如何保證網(wǎng)絡的穩(wěn)定性,也是一個巨大的挑戰(zhàn)。為了保證通話清晰流暢,我們Zego也有回音消除、噪聲消除、自動增益等等產(chǎn)品。
疫情居家用戶需要清晰的通話工具
從出海角度來說,我認為目前音頻出海很大的一個瓶頸是在于當?shù)氐陌鏅?quán)和IP支持,就相當于來中國我們需要ICP備案,需要資格認證。出海也是一樣。巨頭為什么能夠在海外立足?其實很多情況下它占據(jù)了一個市場的主要原因,是因為用這種商務關(guān)系以及各種的渠道,然后去鞏固了當?shù)氐囊粋€版權(quán)以及IP。市場維度上,我同意日韓歐美是一個趨勢。購買意愿強,消費能力高。
最后我想補充的是,我們遇到現(xiàn)在很多客戶,需要關(guān)注的一點是費用方面。客戶希望擁有一個全面的產(chǎn)品,但是這個往往被費用和收益的現(xiàn)狀所限制。雖然我們現(xiàn)在行業(yè)無論是CDN還是RTC這種計費模式已經(jīng)是非常透明的差不多到底價了。但是很多客戶仍然存在支出與收益模式?jīng)]有評估好,前期投入大量資源,但是跟不上現(xiàn)金流,運營一段時間就垮掉了,這是要注意的。
做出海的話,海外的不同的物理機房以及不同的數(shù)據(jù)中心價格也是不一樣的,需要注意。比如印度這種運營商比較封閉的狀態(tài),成本往往就比較偏高。
首云 張雪松
首云主要解決了一些客戶的幾個大的痛點,一是主要他的節(jié)點的要求,二是全球的一個網(wǎng)絡覆蓋,包括我們在各個節(jié)點里面做了大量的BGP的網(wǎng)絡優(yōu)化。剛才討論的像東南亞日韓,主要是這種人口密度或者付費意愿比較強的,我們都會在里面建立一個比較大的節(jié)點??鐕龊F髽I(yè)往往需要比較強的這種全球覆蓋能力。在價格方面,我們給客戶比較合適的方案是根據(jù)不同的客戶需求,不同的覆蓋面,選擇不同的網(wǎng)絡供應商組建定制化的BGP產(chǎn)品。
不亦樂乎 李晨嘯
很多公司有音樂內(nèi)容產(chǎn)生的一個需求。我們一直在做音樂科技這一塊,主要就包括像音樂的自動生成,主要解決音樂的license或者版權(quán)的問題。公司自己也在做 c端一些產(chǎn)品,比如嗓音克隆等,其實大的邏輯就是說希望在音樂的創(chuàng)作力這一塊,通過工具,然后讓音樂創(chuàng)作這件事情變得簡單,所以我們做了批量的生成音樂的類型的東西。也服務了soul、喜馬、inshot這些企業(yè)。
Justalk 疏駿
我們在六七年前做音視頻通訊的時候,挑戰(zhàn)比較大的是網(wǎng)絡方面的限制帶來的技術(shù)上挑戰(zhàn),那個時候帶寬還不是那么高,4G還不是那么普及,所以為了達到更好的通話效果,需要解決網(wǎng)絡抖動的問題,媒體壓縮算法怎么去做的更好等等,這些底層的技術(shù)的挑戰(zhàn)上更多一些。
隨著最近這幾年因為帶寬的問題已經(jīng)慢慢的弱化,更多的挑戰(zhàn)會集中在怎么把多場景的、實時的音視頻傳輸做的更好。比如說我們在做這種視頻會議的場景的時候,要保證發(fā)言人、互動人、聽眾等不同角色都要保證毫秒級的實時性傳輸,在分包、路由和算法上就做了很多的優(yōu)化。另一個方面在實踐中的挑戰(zhàn)是為不同的音頻應用場景,娛樂、會議、通話、直播等,提供一個更好的技術(shù)層封裝,讓業(yè)務層的開發(fā)和產(chǎn)品人員更多的專注在場景問題的解決上。
未來出海的機會?
虎牙 李豪
我還是極度看好語音房模式。我自己早期在長視頻網(wǎng)站,然后后面去到了短視頻。其實長視頻和短視頻它有一個共同的特點,就是流量屬性極強,但它們的優(yōu)勢是長視頻的供給是要靠機構(gòu)來供給,短視頻已經(jīng)UGC了,我離用戶很近了,我離生產(chǎn)用戶和消費用戶都很近。我真正的做直播了以后,發(fā)現(xiàn)離錢近真好,你知道整個商業(yè)閉環(huán)是怎么發(fā)生的?用戶會因為什么場景,因為什么訴求,因為你滿足了他的什么目的會付費,無論是在直播里面的電商還是有認可的關(guān)系去給他打賞。
語音房這樣的一種產(chǎn)品形態(tài)它在早期用戶剛進來的時候他是把它當做一個社交平臺來用,他需要找到自己感興趣的內(nèi)容,感興趣的對象。一旦這種關(guān)系建立起來了以后,它就變成了一個社區(qū),他在社區(qū)里面他有同好,這是一個大型的線上的真人扮演的游戲,開了一個語音房就是刷一個副本。
所以語音房早期大家只是把它看作一個功能,然后慢慢的衍生出了它的一個平臺屬性,最終發(fā)展到一個成熟的社區(qū)。這件事情看起來產(chǎn)品你什么都沒有變,但從創(chuàng)業(yè)者的角度看,用戶量、規(guī)模的發(fā)展、商業(yè)變現(xiàn)都是可以完整實現(xiàn)的,它是一個非常好的業(yè)務形態(tài)。
不亦樂乎 李晨嘯
很多人都在談一個場景叫做Audio first的概念,音頻可能更能先行完成一個頭號玩家這樣虛擬的世界。尤其是空間感的音頻,和體感結(jié)合很緊密的音頻體驗消費方式。像Clubhouse這類企業(yè)就能加入更多全場景的音頻體驗。
德國Sound Campus于2020年展示的音頻世界
Starmaker 伍逸靜
首先我認為我們做內(nèi)容也好,做社交也好,做的都是用戶的注意力。從這個層面來說的話,我認為視覺層面其實已經(jīng)沒什么空間了,大家已經(jīng)全球用戶已經(jīng)被瓜分的差不多了,但是音頻的話其實現(xiàn)在還是相對非常藍海的一個區(qū)域,就是說視覺跟聽覺這兩塊被占有率是完全不同的。
對于整個音頻賽道來說,我個人是非??春玫摹H缓髮τ诔龊5姆较虻脑?,音頻賽道簡單分類的話,一個是說一個是聽,聽的話可能以播放器也類似于喜馬拉雅這樣內(nèi)容分發(fā)平臺為主,然后說的話就包含語音房,包含就是K歌,包含所有需要你就是說靠嘴來生產(chǎn)內(nèi)容的這個領(lǐng)域,這兩個領(lǐng)域我覺得現(xiàn)在都不是一個飽和的狀態(tài)??梢匀ネ诰虻目臻g還非常大??隙ㄓ写笃脚_會產(chǎn)生。
如果說一個好的音頻產(chǎn)品,現(xiàn)階段可能相對來說大家比較認可的肯定是有變現(xiàn)能力的商業(yè)模式,完整的生態(tài)產(chǎn)品,我個人認為長久來看的話,現(xiàn)階段可能還是在一個幫助用戶殺時間kill time的。長期來看怎么做出長久價值,怎么幫助用戶save time,更高效的去獲取知識,獲取更有質(zhì)量的信息,達成更有質(zhì)量的關(guān)系,這個方向的嘗試將是一個有趣的方向。
Zego即構(gòu)科技 李振揚
那么在整個未來出海的計劃當中,我們底層服務服務短期內(nèi)可能要往東南亞或者中東這種地方這種弱網(wǎng)地區(qū)去發(fā)展,因為這些地方可能離中國較近,然后我們出海的話可以有更好的這種地緣的親密性。
短期內(nèi)歐美5g那邊可能會發(fā)展的比較好,對于這種弱網(wǎng)的4G或者次4G這種LTE這種時代,這種情況下該怎么辦?即構(gòu)這邊其實是對這種復雜網(wǎng)絡是有這種智能優(yōu)化的,比如像網(wǎng)絡自適應這種,它是提供這種端到端的全鏈路的有一種算法,它是能夠保證當前網(wǎng)絡情況下這種預測網(wǎng)速,然后并且自動進行一個流控,然后支持這種弱網(wǎng)的一個自適應和推拉流,然后另外就是智能的調(diào)節(jié)這種碼率真率的保證音畫質(zhì)的一種流暢性和平衡。
新興市場如印尼是音頻出海的重要目的地
Justalk 疏駿
音頻這種形式,它和視頻和文字的最大的一個區(qū)別的點是在哪里?我認為,實時的音頻能夠讓我們用戶能夠更多的聚焦在當下交流的內(nèi)容上面,相比視頻,少了視覺上的干擾,相比文字,多了實時性。人通過傾聽的,信息是更容易進到你的腦子里面,激活思考,這個是音頻很大的一個特點。
對于音頻業(yè)態(tài)的發(fā)展方向,我是這么看的,一個是像Clubhouse這類,向鐘愛知識分享和討論的告知高凈值人群去拓展。另外一個方向是向普通大眾人群的音頻交流互動方向上去拓展,這個方向會更關(guān)注娛樂性和情感訴求的滿足,往大眾的方向,規(guī)模和空間都很大,是一個很值得開拓的一個方向