為期兩天的Distributed Cloud|2020全球分布式云大會,為5G商用時(shí)代的到來,在新一輪云計(jì)算技術(shù)變革的關(guān)口,呈現(xiàn)出分布式云生態(tài)全景,影響2021年分布式云戰(zhàn)略科技趨勢,共享新商業(yè)引擎,共尋億萬級蒼穹,開創(chuàng)未來新篇。
在12月17日下午舉辦的“邊緣計(jì)算”論壇上,圍繞邊緣計(jì)算行業(yè)的發(fā)展背景、技術(shù)挑戰(zhàn)、阿里云邊緣計(jì)算產(chǎn)品以及對未來的展望等話題,阿里云高級技術(shù)專家李克帶來了題為《邊緣計(jì)算的發(fā)展趨勢與挑戰(zhàn)》的精彩演講。
李克首先對計(jì)算機(jī)計(jì)算的發(fā)展史作了回顧,在過去的20年,計(jì)算模式實(shí)現(xiàn)了一個(gè)輪回:
早期公司或者是客戶主要是自己租用IDC資源,自己部署業(yè)務(wù),這時(shí)使用的是分布式的IDC的機(jī)房,也是最早的邊緣場景,出現(xiàn)了最早的邊緣計(jì)算產(chǎn)品——“CDN”,可以說邊緣計(jì)算是CDN的基座,CDN是邊緣計(jì)算上層的應(yīng)用。
最開始大家使用CDN機(jī)房的時(shí)候業(yè)務(wù)規(guī)模都會增長,當(dāng)你用戶也有規(guī)模增長的時(shí)候,單一的IDC的機(jī)房很難應(yīng)對流量的增加和并發(fā)增加,這時(shí)云計(jì)算隨之出現(xiàn)。最近邊緣計(jì)算隨著5G、IOT的發(fā)展,又成為了技術(shù)關(guān)注的焦點(diǎn),背后原因是場景的要求以及對成本的訴求。首先在場景方面,5G的特征是大帶寬、低延時(shí)、大連接,是數(shù)據(jù)連接不可能承接大爆發(fā)的場景,這使得中心已經(jīng)出現(xiàn)了流量顛倒的情況,上下帶寬不像以前那樣,現(xiàn)在上傳的部分?jǐn)?shù)據(jù)已經(jīng)開始超過下行的帶寬了,對中心來講其實(shí)很難承載比較大帶寬的場景要求。
而混合邊緣節(jié)點(diǎn)大量提供的是類似CDN的業(yè)務(wù),這種業(yè)務(wù)的模型是晚高峰占用資源,其他時(shí)段的資源是空閑的,這時(shí)在大帶寬的場景下可以分用邊緣的資源。對低延時(shí)的場景,比如工業(yè)制造、云游戲是很難直接使用這個(gè)方案的。對大連接來講,類似物聯(lián)網(wǎng)和智能交通有非常多的設(shè)備需要連到云計(jì)算,這時(shí)就需要有更多的邊緣節(jié)點(diǎn)承載這些設(shè)備。
這時(shí)邊緣計(jì)算就出現(xiàn)在中心云和終端之間,起到了承上啟下的作用,把中心云的數(shù)據(jù)或者是服務(wù)向端下發(fā),把邊側(cè)上行的數(shù)據(jù)進(jìn)行接入,最終跟中心云形成互聯(lián)互通。未來會有80%以上的數(shù)據(jù)和計(jì)算發(fā)生在邊緣,邊緣計(jì)算將做為云計(jì)算的補(bǔ)充,和中心云計(jì)算協(xié)同起來賦能各行各業(yè)。
邊緣計(jì)算出現(xiàn)的因素是承載,客戶使用云計(jì)算關(guān)注的是成本、質(zhì)量、穩(wěn)定性,成本起到很重要的作用,中心云的流量已經(jīng)顛倒了,邊緣上的空閑資源包括空閑的CPU怎么高效的復(fù)用可以解決成本上的問題?有一個(gè)城市云大腦的項(xiàng)目,分析成本構(gòu)成的時(shí)候,有一半以上的成本都是帶寬類的成本,也就是數(shù)據(jù)中心BGP的帶寬非常高,如果把項(xiàng)目當(dāng)中的數(shù)據(jù)大量地在邊緣上進(jìn)行處理、卸載,在邊緣上計(jì)算,通過降低數(shù)據(jù)中心的數(shù)量可以有效降低成本的。
根據(jù)測算,如果數(shù)據(jù)可以壓縮到5%,項(xiàng)目成本可以節(jié)省一半以上。
另外,成本可以促進(jìn)邊緣計(jì)算的發(fā)展,邊緣計(jì)算也不是完全可以取代中心云計(jì)算的,兩者一定是相輔相成互相協(xié)同的關(guān)系。中心云可以提供大規(guī)模的節(jié)點(diǎn)部署,可以非常強(qiáng)的彈性以及有很強(qiáng)很好服務(wù)的SLLA,但是離客戶的終端是比較遠(yuǎn)的,邊緣云是分布式的節(jié)點(diǎn),離客戶比較近,但是節(jié)點(diǎn)的規(guī)模很難做到非常大,我們在極端的情況下有單服務(wù)器節(jié)點(diǎn)的情況。因此,中心和邊緣是一起解決5G場景,一方面是面向應(yīng)用場景,另一方面是面向垂直的行業(yè)。
在介紹了整個(gè)邊緣計(jì)算發(fā)展的歷程和背景之后,李克提到了邊緣技術(shù)面臨的挑戰(zhàn)。
首先,邊緣計(jì)算由于節(jié)點(diǎn)是分布式的,部署在很下沉的三四線城市,節(jié)點(diǎn)的網(wǎng)絡(luò)環(huán)境、服務(wù)器機(jī)型是各種各樣的,整個(gè)邊緣節(jié)點(diǎn)的基本穩(wěn)定性比不上中心,邊緣計(jì)算要基于邊緣的不穩(wěn)定性搭載服務(wù),首先在資源管理上無論是節(jié)點(diǎn)的架構(gòu)、網(wǎng)絡(luò)架構(gòu)或者是節(jié)點(diǎn)的服務(wù)器架構(gòu)是有各種各樣的,現(xiàn)在邊緣計(jì)算場景非常多,傳統(tǒng)的X86的服務(wù)器不能完全滿足,會出現(xiàn)很多異構(gòu)的資源像GPU的資源和服務(wù)器的資源進(jìn)行虛擬化和管控也好,有各種各樣適配的工作,整個(gè)資源管理是非常復(fù)雜的。
第二,在資源的使用上,中心云的方案是很難直接下沉到邊緣使用,一方面是中心云有大量的功耗,相當(dāng)于管控或者是數(shù)據(jù)處理的機(jī)器來做各種各樣的云產(chǎn)品。邊緣因?yàn)楸旧頇C(jī)器數(shù)量少,對邊緣資源的使用需要有更好的虛擬化的能力,更好的網(wǎng)絡(luò)切片的能力。另外邊緣要形成統(tǒng)一的“池化”,單個(gè)邊緣支撐用戶的時(shí)候,一般是滿足不了客戶,要把邊緣形成統(tǒng)一的整體,通過調(diào)度和智能的預(yù)測來很好地做資源的彈性。
第三,邊緣肯定不能獨(dú)立存在,要跟中心做協(xié)同,也就是所謂的云邊一體,不能簡單地做一個(gè)中心管控,要做分布式的管控,中心對各個(gè)節(jié)點(diǎn)進(jìn)行管理,每個(gè)子節(jié)點(diǎn)做自己的自治,自己有自己的一些配置或者是一些中臺。在出現(xiàn)跨節(jié)點(diǎn)操作的時(shí)候,尤其是一些有狀態(tài)服務(wù)的時(shí)候,也是需要做熱遷移的,保證業(yè)務(wù)什么時(shí)候延展,對使用虛機(jī)使用存儲的時(shí)候要讓數(shù)據(jù)具備高可用性,以實(shí)現(xiàn)技術(shù)的遷移。
第四,邊緣網(wǎng)絡(luò)。邊緣和中心比較大的區(qū)別是網(wǎng)絡(luò)上的差異,中心是在高可靠的機(jī)房內(nèi),邊緣是跨運(yùn)營商、省、大區(qū)的,網(wǎng)絡(luò)是基于公網(wǎng)做的不那么可靠的網(wǎng)絡(luò),在這上面需要做專網(wǎng)承載比較特殊的業(yè)務(wù)場景,確保任意一點(diǎn)到另外一點(diǎn)在系統(tǒng)成本上是可控的。
就以上提到的四個(gè)技術(shù)挑戰(zhàn),李克從兩個(gè)角度做了展開,一個(gè)是資源的使用會接入云原生的使用,另外是網(wǎng)絡(luò)方面,目前的云原生處在比較早期的階段,以前資源是基于物理服務(wù)器,現(xiàn)在的資源交互形態(tài)變成容器了,以其交付云原生的好處有很好的彈性和很好的業(yè)務(wù)編排以及應(yīng)用的注冊發(fā)現(xiàn)等機(jī)制,可以讓業(yè)務(wù)脫離繁重底層的IaaS層應(yīng)用。
目前資源是基于容器交付使用,離真正的云原生還有一定的距離,云原生是標(biāo)準(zhǔn)化提供比較標(biāo)準(zhǔn)的服務(wù)能力。在云原生的使用方面,上層可以做好對應(yīng)用的一些編排,像ESQIO管理自己的業(yè)務(wù),彈性方面是比較容易理解,原來基于服務(wù)器在上架、部署、運(yùn)維都是比較復(fù)雜的,現(xiàn)在云原生基于服務(wù)器做大量的資源,比如對于壓側(cè)系統(tǒng)在很短的時(shí)間內(nèi)給中心壓側(cè)進(jìn)行使用。
整個(gè)容器平臺,最下面是邊緣的節(jié)點(diǎn),節(jié)點(diǎn)上有各種各樣的邊緣的kubelet能力,通過邊緣網(wǎng)絡(luò)和邊緣的中間件打通形成統(tǒng)一的池化,下面是容器平臺,也是有按區(qū)域或者是按一定的邏輯結(jié)點(diǎn)劃分成不同的小的K8s的集群,上面做集群的管理,容器之上是云原生能力生態(tài)的建設(shè),可以基于應(yīng)用做一些應(yīng)用管理的事情。
由于邊緣網(wǎng)絡(luò)是一張大網(wǎng),承載了非常多的流量,需要做更好的規(guī)劃,可以按照節(jié)點(diǎn)以一段距離以及流量規(guī)模分成最下面的接入網(wǎng),也就是MEC節(jié)點(diǎn)的接入網(wǎng),包括三四線城市的節(jié)點(diǎn),包括上層核心網(wǎng)上的節(jié)點(diǎn),每一層網(wǎng)絡(luò)上的量級不一樣。每一層需要提供的核心能力也有差異,最下面主要提供結(jié)構(gòu)能力,確保客戶就近接入實(shí)現(xiàn)低延時(shí),在接入的時(shí)候有安全的能力,在ENS層做到很好的資源下沉能力,在地市級可以覆蓋,在POP層做到大網(wǎng)的調(diào)控,可以做到加速和安全防控的能力,邊緣云在終端和公有云做好端和邊緣的協(xié)同以及邊緣和中心的協(xié)同。
云邊端整體的一張網(wǎng)需要較好地建立起來,基于邊緣建立加速網(wǎng),需要在節(jié)點(diǎn)和節(jié)點(diǎn)之間形成比較透明的傳輸,整個(gè)網(wǎng)絡(luò)的鏈路是加密可靠的,整個(gè)加速效果也是確保在異常情況下可以快速且不斷連接完成盡可能低成本的遷移。
在第三部分,李克介紹了阿里云目前的邊緣云計(jì)算的產(chǎn)品形態(tài)。阿里云在邊緣計(jì)算領(lǐng)域發(fā)力較早,首先是資源方面,之前的CDN和視頻云做了很多年,具有一定市場規(guī)模,阿里云有大量的邊緣節(jié)點(diǎn)存在,可以快速復(fù)用,另外中心云的云計(jì)算能力,無論虛擬化還是存儲網(wǎng)絡(luò)上都可以做一些下沉的小型化改造。
整個(gè)阿里云邊緣云計(jì)算產(chǎn)品發(fā)展的脈絡(luò),剛開始是探索的階段,2017年做基于邊緣計(jì)算虛機(jī)計(jì)算的形式;2018-2019年覆蓋到節(jié)點(diǎn),目前有300多邊緣計(jì)算的節(jié)點(diǎn);再后來從IaaS層到PaaS層轉(zhuǎn)化,希望可以承接業(yè)務(wù)場景,真正幫客戶和行業(yè)解決具體問題,比較典型的類似城市大腦,智能電商,以及線下店的方案。近期主要是在上層提供更多的PaaS服務(wù)的能力,提供應(yīng)用的編排能力,在視頻場景打造視頻計(jì)算平臺,能夠把視頻直播編解碼的能力在邊緣實(shí)現(xiàn)PaaS的服務(wù),包括全球一張網(wǎng)的GRTN的網(wǎng)絡(luò),做到點(diǎn)對點(diǎn)快速的數(shù)據(jù)的傳輸,GRTN在雙十一的時(shí)候?qū)χ辈プ隽撕艽蟮膬?yōu)化,端到端五秒提升到一秒的延遲,效果還是比較明顯的。
目前整個(gè)產(chǎn)品的能力在資源的形態(tài)上是三種不同的形態(tài),虛機(jī)、容器、安全容器是對資源無感的,是對客戶之間云中間件的能力調(diào)度使用聚焦到業(yè)務(wù)形態(tài)就可以了,在存儲上也是多種存儲能力,有本地盤也有對象存儲、文件存儲以及把CDN的KV緩存抽象出來提供對外更大規(guī)模的存儲能力。
最后李克發(fā)表了對未來的展望,他說,邊緣計(jì)算最關(guān)鍵有兩個(gè)詞:標(biāo)準(zhǔn)化和開放生態(tài)的建設(shè)。標(biāo)準(zhǔn)化很重要,如果想做融合云計(jì)算,各自建立一套是很麻煩的事,需要統(tǒng)一標(biāo)準(zhǔn)屏蔽掉廠商之間的差異,大家可以向一些生態(tài)看齊的,比如云原生建立起來,可以很靈活地使用各種云廠商的資源。開放方面也是比較重要的,大家的能力可以更豐富地體現(xiàn),比如說內(nèi)部沉淀了很多比較好的中心云能力,邊緣上也要快速地建立起這些能力。