2009年,首屆雙11每秒交易訂單創(chuàng)建峰值400;2021年,雙11每秒交易訂單創(chuàng)建峰值58.3萬(wàn),12年交易數(shù)字量猛增的背后,是阿里云在龐大分布式系統(tǒng)上計(jì)算和IO能力的飛躍,更離不開阿里云基礎(chǔ)設(shè)施底層網(wǎng)絡(luò)技術(shù)的支撐。在這個(gè)萬(wàn)物智聯(lián)的時(shí)代,無(wú)論是在線網(wǎng)絡(luò)購(gòu)物,還是網(wǎng)絡(luò)強(qiáng)國(guó)、數(shù)字中國(guó)建設(shè),都離不開一張“看不見的網(wǎng)”——基礎(chǔ)設(shè)施網(wǎng)絡(luò)。
作為阿里云基礎(chǔ)設(shè)施的重要組成部分,阿里云基礎(chǔ)設(shè)施網(wǎng)絡(luò)團(tuán)隊(duì)負(fù)責(zé)整個(gè)阿里云全球基礎(chǔ)設(shè)施網(wǎng)絡(luò),包括大規(guī)模高性能數(shù)據(jù)中心網(wǎng)絡(luò),全球數(shù)據(jù)中心互聯(lián)網(wǎng)絡(luò),邊緣網(wǎng)絡(luò),運(yùn)營(yíng)商接入網(wǎng)絡(luò),光網(wǎng)絡(luò),DNS以及創(chuàng)新研究工作。在業(yè)務(wù)支撐上,覆蓋全球云計(jì)算以及基于云計(jì)算的電商、支付、物流、本地生活等服務(wù)。不但擁有業(yè)內(nèi)領(lǐng)先的超大規(guī)模網(wǎng)絡(luò)智能化運(yùn)營(yíng)能力,同時(shí)在諸多網(wǎng)絡(luò)技術(shù)領(lǐng)域?qū)崿F(xiàn)創(chuàng)新突破,是行業(yè)生態(tài)中有國(guó)際影響力、引領(lǐng)網(wǎng)絡(luò)技術(shù)變革的一支重要力量。 1 Network 智能化網(wǎng)絡(luò)運(yùn)營(yíng) 構(gòu)筑高效穩(wěn)定云計(jì)算底座 面對(duì)網(wǎng)絡(luò)規(guī)模持續(xù)數(shù)量級(jí)增長(zhǎng),過(guò)去五年,基礎(chǔ)設(shè)施網(wǎng)絡(luò)團(tuán)隊(duì)不斷推動(dòng)自主技術(shù)創(chuàng)新,打造了一個(gè)全智能化的AIOps運(yùn)營(yíng)體系,涵括自主研發(fā)的網(wǎng)絡(luò)設(shè)備、軟件、數(shù)據(jù)及算法,從網(wǎng)絡(luò)規(guī)劃到建設(shè)交付,從運(yùn)維管理到更新?lián)Q代的全網(wǎng)絡(luò)生命周期自動(dòng)化能力,為阿里云覆蓋全球的百萬(wàn)級(jí)服務(wù)器規(guī)模的云計(jì)算提供全球服務(wù)支撐,既提高了運(yùn)營(yíng)效率,又有效實(shí)現(xiàn)了網(wǎng)絡(luò)故障率的指數(shù)級(jí)下降。 在智能系統(tǒng)平臺(tái)基礎(chǔ)上,基礎(chǔ)設(shè)施網(wǎng)絡(luò)團(tuán)隊(duì)還建設(shè)了全球大規(guī)模“意圖驅(qū)動(dòng)網(wǎng)絡(luò)”管控體系,設(shè)計(jì)研發(fā)了高級(jí)抽象語(yǔ)言、編譯器、形式化驗(yàn)證、高精度仿真等先進(jìn)技術(shù),其中多項(xiàng)研究成果在網(wǎng)絡(luò)全球頂級(jí)會(huì)議ACM SIGCOMM論文中屢次發(fā)布。 2 Network 超大規(guī)模高性能 打造新型數(shù)據(jù)中心網(wǎng)絡(luò) 作為大型分布式系統(tǒng)內(nèi)部的高速公路,今天數(shù)據(jù)中心網(wǎng)絡(luò)承載著越來(lái)越多計(jì)算和存儲(chǔ)系統(tǒng)IO延伸的作用。阿里云新型數(shù)據(jù)中心網(wǎng)絡(luò)是基于阿里云自研交換機(jī)構(gòu)建的超大規(guī)模網(wǎng)絡(luò)系統(tǒng),scale out多平面架構(gòu)設(shè)計(jì)充分滿足了云計(jì)算分布式大規(guī)模系統(tǒng)的算力互聯(lián)以及資源彈性擴(kuò)展需求,單網(wǎng)絡(luò)集群支持可實(shí)現(xiàn)從幾百臺(tái)到10 萬(wàn)臺(tái)以上服務(wù)器連接的彈性擴(kuò)展能力。 在此基礎(chǔ)上,基于Sonic開源社區(qū)的阿里云自研網(wǎng)絡(luò)操作系統(tǒng)(AliNOS)有效打通了單設(shè)備與整網(wǎng)維度的監(jiān)管控能力,在快速迭代新功能的同時(shí)實(shí)現(xiàn)了監(jiān)管控一體化,全自研的硬件設(shè)備和光互聯(lián)組件完全契合阿里場(chǎng)景進(jìn)行模塊化設(shè)計(jì),實(shí)現(xiàn)了成本、供應(yīng)、運(yùn)維能力的多維度自主控制。 作為業(yè)內(nèi)最受歡迎的高性能網(wǎng)絡(luò)技術(shù),2016年,阿里巴巴開始投入專項(xiàng)研究RDMA(Remote Direct Memory Access),以改造RDMA、提高傳輸性能,目前已建成全球最大規(guī)模數(shù)據(jù)中心內(nèi)的“高速網(wǎng)”,將時(shí)延顯著降低90%,支撐了高性能存儲(chǔ)、AI計(jì)算等阿里云業(yè)務(wù)和阿里巴巴集團(tuán)內(nèi)部業(yè)務(wù),取得了巨大的商業(yè)價(jià)值。 同時(shí),通過(guò)大規(guī)模RDMA網(wǎng)絡(luò)部署實(shí)踐,阿里云基礎(chǔ)設(shè)施網(wǎng)絡(luò)團(tuán)隊(duì)自主研發(fā)了基于端網(wǎng)協(xié)同的Solar-RDMA高性能網(wǎng)絡(luò)協(xié)議和HPCC流控算法,并通過(guò)自研網(wǎng)卡實(shí)現(xiàn)了協(xié)議硬件卸載,極大的降低了端到端網(wǎng)絡(luò)延時(shí),提升了網(wǎng)絡(luò)IO吞吐能力,并有效規(guī)避和弱化了網(wǎng)絡(luò)故障、網(wǎng)絡(luò)黑洞等傳統(tǒng)網(wǎng)絡(luò)異常給上層應(yīng)用帶來(lái)的性能損失。 3 Network 云邊一體全網(wǎng)調(diào)度 實(shí)現(xiàn)網(wǎng)絡(luò)質(zhì)量可預(yù)期 阿里云全球網(wǎng)絡(luò)流量調(diào)度系統(tǒng)NetO采用中心控制與分布式處理有機(jī)結(jié)合,提供從中心到邊緣的全網(wǎng)流量調(diào)度能力,為業(yè)務(wù)提供了差異化和高品質(zhì)的網(wǎng)絡(luò)服務(wù)。通過(guò)采用行業(yè)最新的Segment Routing技術(shù),結(jié)合Anycast、BGP路由管理,全球網(wǎng)絡(luò)質(zhì)量探測(cè),以及各種場(chǎng)景優(yōu)化算法等真正實(shí)現(xiàn)了云邊一體的全球網(wǎng)絡(luò)調(diào)度能力。 同時(shí),阿里云NetO流量調(diào)度系統(tǒng)將精細(xì)化調(diào)度能力、網(wǎng)絡(luò)流量狀態(tài)分析能力以端網(wǎng)融合調(diào)度的方式提供給業(yè)務(wù),實(shí)現(xiàn)了符合業(yè)務(wù)特色需求的各種差異化網(wǎng)絡(luò)服務(wù)能力。 隨著泛邊緣分布式云的發(fā)展,云邊一體的網(wǎng)絡(luò)全域調(diào)度無(wú)論是從規(guī)模和靈活性角度都將面臨新的挑戰(zhàn),阿里云基礎(chǔ)設(shè)施網(wǎng)絡(luò)團(tuán)隊(duì)在SRv6、自研路由控制協(xié)議,以及調(diào)度模型算法等方面持續(xù)投入和創(chuàng)新,以更靈活多變的控制應(yīng)對(duì)邊緣云發(fā)展下的復(fù)雜流量管控,為業(yè)務(wù)提供質(zhì)量可預(yù)期的服務(wù)。 4 Network 開放光網(wǎng)絡(luò) 高速光互連 高速、靈活、開放、協(xié)同發(fā)展已成為光網(wǎng)絡(luò)領(lǐng)域重要技術(shù)發(fā)展趨勢(shì)。在光網(wǎng)絡(luò)技術(shù)領(lǐng)域,阿里云基礎(chǔ)設(shè)施網(wǎng)絡(luò)團(tuán)隊(duì)在業(yè)界率先開始開放解耦DCI技術(shù)的研發(fā)并實(shí)現(xiàn)規(guī)模部署,在光網(wǎng)絡(luò)模型、光網(wǎng)絡(luò)軟件和數(shù)字化、光網(wǎng)絡(luò)自動(dòng)化、開放解耦ROADM網(wǎng)絡(luò)方面做出多項(xiàng)創(chuàng)新性成果。在光互連技術(shù)方面,從光模塊、光電芯片、超百萬(wàn)級(jí)光模塊數(shù)字智能化運(yùn)營(yíng)等方面成果斐然。同時(shí),積極和行業(yè)、高校間進(jìn)行高質(zhì)量合作,對(duì)高速光互連、光交換技術(shù)及智能光網(wǎng)絡(luò)等領(lǐng)域的前沿技術(shù)進(jìn)行探索,致力于推動(dòng)產(chǎn)業(yè)實(shí)踐和學(xué)界理論的雙向發(fā)展。 過(guò)去三年,阿里云基礎(chǔ)設(shè)施網(wǎng)絡(luò)團(tuán)隊(duì)在光通信頂級(jí)學(xué)術(shù)會(huì)議如OFC、ECOC上發(fā)表學(xué)術(shù)論文16篇,在光通信頂級(jí)學(xué)術(shù)刊物(IEEE、OSA和Nature學(xué)術(shù)刊物)上發(fā)表學(xué)術(shù)論文10篇,用數(shù)字書寫著對(duì)行業(yè)挑戰(zhàn)性、前瞻性課題的不懈研究。 推薦閱讀 推動(dòng)光通信創(chuàng)新實(shí)踐合力 阿里云基礎(chǔ)設(shè)施網(wǎng)絡(luò)團(tuán)隊(duì)閃耀OFC2021 5 Network 日解析量超萬(wàn)億DNS 參與網(wǎng)絡(luò)強(qiáng)國(guó)基礎(chǔ)設(shè)施 DNS(Domain Name System)是互聯(lián)網(wǎng)訪問(wèn)的第一跳,是全球互聯(lián)互通關(guān)鍵網(wǎng)絡(luò)基礎(chǔ)設(shè)施,也是云服務(wù)的訪問(wèn)入口。隨著移動(dòng)APP、智能終端/IoT、家庭/企業(yè)網(wǎng)絡(luò)接入對(duì)DNS安全、穩(wěn)定和智能調(diào)度提出新的需求,阿里云DNS面向云上云下多樣化的連接場(chǎng)景幫助企業(yè)實(shí)現(xiàn)數(shù)字化轉(zhuǎn)型,面向各種終端用戶提供基礎(chǔ)解析服務(wù),目前平臺(tái)日均解析服務(wù)量突破萬(wàn)億。 2017年,阿里云DNS入選工信部評(píng)選的“2017網(wǎng)絡(luò)安全試點(diǎn)示范項(xiàng)目”;2020年3月,阿里云云解析DNS作為支撐疫情防控和復(fù)工復(fù)產(chǎn)的網(wǎng)絡(luò)安全公共服務(wù)平臺(tái)被工信部重點(diǎn)推薦。目前,阿里云DNS是國(guó)內(nèi)首家提供DNSSEC、IPv6、DoH/DoT等功能特性的DNS服務(wù)商。2021年6月,由下一代互聯(lián)網(wǎng)國(guó)家工程中心發(fā)布的公共DNS測(cè)試結(jié)果表明,阿里云滿足IPv6雙棧環(huán)境的各項(xiàng)功能,且在DNS響應(yīng)延遲這項(xiàng)指標(biāo)上全國(guó)領(lǐng)先。 6 Network 業(yè)務(wù)驅(qū)動(dòng)創(chuàng)新 引領(lǐng)生態(tài)行業(yè)發(fā)展 快速發(fā)展的業(yè)務(wù)驅(qū)動(dòng)技術(shù)不斷創(chuàng)新。過(guò)去幾年,阿里云基礎(chǔ)設(shè)施網(wǎng)絡(luò)團(tuán)隊(duì)始終堅(jiān)持軟硬一體優(yōu)化、自主可控的研發(fā)創(chuàng)新道路。在技術(shù)商業(yè)化上,阿里云自主研發(fā)的交換機(jī)、光網(wǎng)絡(luò)等設(shè)備已大規(guī)模部署并取得業(yè)務(wù)價(jià)值。在大規(guī)模部署實(shí)踐基礎(chǔ)上,同時(shí)積極回饋開源生態(tài)社區(qū),在SONiC社區(qū)、ODCC社區(qū)建設(shè)中做出了積極貢獻(xiàn),領(lǐng)導(dǎo)了S3IP白盒化標(biāo)準(zhǔn)、SRv6等項(xiàng)目的發(fā)展。 2021年7月16日,阿里云基礎(chǔ)網(wǎng)絡(luò)團(tuán)隊(duì)聯(lián)合騰訊,百度等組織發(fā)起了S3IP首屆行業(yè)發(fā)布會(huì),京東、快手等眾多互聯(lián)網(wǎng)行業(yè)伙伴加入,這項(xiàng)旨在標(biāo)準(zhǔn)化白盒網(wǎng)絡(luò)設(shè)備軟硬件設(shè)計(jì),解決用戶痛點(diǎn)的發(fā)布會(huì)共吸引了20萬(wàn)人次參與在線討論,會(huì)后,眾多白盒用戶和廠商紛紛郵件申請(qǐng)加入S3IP。