云原生已成為技術(shù)發(fā)展的必然趨勢,開發(fā)者和企業(yè)正全面擁抱。
據(jù)最新官方數(shù)據(jù)統(tǒng)計(jì),在 3200 萬 CSDN 注冊用戶中,閱讀和研究云原生技術(shù)的開發(fā)者已經(jīng)達(dá)到了 406 萬。云原生已成為技術(shù)發(fā)展的必然趨勢,開發(fā)者和企業(yè)正全面擁抱。這背后,源于云原生正在成為企業(yè)數(shù)字化轉(zhuǎn)型的助推器,有效提高 IT 資源規(guī)模化、節(jié)約化,降低計(jì)算成本,同時(shí)提升研發(fā)效率,幫助企業(yè)降本增效。這正暗合了11 年前著名硅谷投資人馬克·安德森的一句話“軟件正在吞噬世界”。以阿里為例,從 2019 年的核心系統(tǒng)上云到 2021 年阿里 100% 業(yè)務(wù)全面上云,再到今年走向全面云原生化的深度用云階段。深度用云正在幫助阿里打造綠色高效的雙 11,實(shí)現(xiàn)更好地增效降本,同時(shí)也在打破原來的天花板,為技術(shù)和業(yè)務(wù)帶來更多的增長動能。
全面上云后,阿里成為降本增效的受益者
伴隨電商業(yè)務(wù)的蓬勃發(fā)展,對傳統(tǒng) IT 技術(shù)提出了更高的需求,而云計(jì)算在成本控制、開發(fā)運(yùn)維、性能穩(wěn)定性等方面上比傳統(tǒng) IT 更勝一籌,能有效解決以下問題:一是解決服務(wù)器孤島問題。在 2007 年前后,消費(fèi)互聯(lián)網(wǎng)爆發(fā)式發(fā)展,那時(shí)算力遠(yuǎn)遠(yuǎn)滿足不了現(xiàn)實(shí)需求。在傳統(tǒng)模式下為解決算力不足問題,一般是依賴擴(kuò)大采購規(guī)模,然而機(jī)器成本巨大,且物理機(jī)磁盤、內(nèi)存各不相同,加上阿里業(yè)務(wù)需求多樣,導(dǎo)致有可能存在閑置物理機(jī)沒法使用,形成服務(wù)器孤島,造成資源浪費(fèi)。二是資源調(diào)度困難。業(yè)務(wù)需求不盡相同:有些業(yè)務(wù)需要白天被大量使用,有些則是晚上使用,沒有統(tǒng)一調(diào)度的話,無法做到分時(shí)、錯(cuò)峰使用。三是研發(fā)效能低,開發(fā)者應(yīng)用上線時(shí)非常謹(jǐn)慎,耗時(shí)較長,造成業(yè)務(wù)效率低下。四是助力云成長,作為用云的大規(guī)模實(shí)踐者,在2019年阿里也將核心系統(tǒng) 100% 上云,在每年雙 11 大規(guī)模實(shí)戰(zhàn)下,用全球最大規(guī)模的電商交易系統(tǒng)來協(xié)助打磨提升阿里云的核心能力,實(shí)現(xiàn)自研技術(shù)能力的提升,更好地服務(wù)外部客戶。當(dāng)把業(yè)務(wù)全面搬到云上后,阿里自身成為上云降本增效的受益者,據(jù)阿里巴巴集團(tuán) CTO 架構(gòu)部負(fù)責(zé)人楊華表示,當(dāng)阿里整體上云后擁有了四大收益∶一是統(tǒng)一資源,全部統(tǒng)一 CPU 和計(jì)算資源,節(jié)約數(shù)億成本。二是技術(shù)棧統(tǒng)一,大幅度降低溝通成本,讓上層研發(fā)、運(yùn)維、安全生產(chǎn)變得高效和統(tǒng)一。三是安全穩(wěn)定,連續(xù) 3 年雙 11 零重大事故,保障業(yè)務(wù)平穩(wěn)運(yùn)行。四是靈活創(chuàng)新,比如通過調(diào)用云數(shù)據(jù)庫Tair進(jìn)行云上優(yōu)化,雙11實(shí)現(xiàn)了淘寶購物車從120個(gè)到300個(gè)的擴(kuò)容,以輕量化連接、異步支持等技術(shù)支撐起超大連接數(shù),使單集群訪問流量達(dá)到100GB/s。
全面云原生深度用云 讓雙 11變得越來越綠色、經(jīng)濟(jì)
今年阿里集團(tuán)在 PaaS 支持的業(yè)務(wù)形態(tài)中支出占用云總成本達(dá) 43%,阿里已進(jìn)入全面云原生深度用云階段。據(jù)阿里財(cái)報(bào)披露,阿里用云規(guī)模支出 200 多億,如何讓這筆錢發(fā)揮更大的價(jià)值,對阿里來說是個(gè)需要解決的挑戰(zhàn),降本增效成為阿里必須直面的重要命題。阿里巴巴集團(tuán)技術(shù)風(fēng)險(xiǎn)與效能負(fù)責(zé)人張瓅玶表示,云原生深度用云是架構(gòu)和研發(fā)模式的全面升級,而云原生增效降本的核心是明確技術(shù)聚焦投入于自身的核心競爭力。如何通過聚焦自身核心競爭力來進(jìn)行降本增效?以雙 11 為例,正走在以大數(shù)據(jù)和 AI 驅(qū)動的前沿技術(shù)道路上。目前阿里擁有近千萬核在線計(jì)算,云上超大規(guī)模計(jì)算集群支持電商在線與離線業(yè)務(wù),MaxComute、Flink 大數(shù)據(jù)集群支持海量大數(shù)據(jù)計(jì)算,數(shù)萬卡機(jī)器學(xué)習(xí)和推理平臺支撐高效搜索推薦。如每次打開淘寶進(jìn)行搜索背后,是龐大的 AI 算力支持返回商品推薦。又如支撐商家增長的業(yè)務(wù),通過靈駿智能計(jì)算,用千億參數(shù)的超大規(guī)模模型訓(xùn)練,樣本數(shù)量達(dá)到萬億的規(guī)模,將以往需要兩周的訓(xùn)練時(shí)間縮短到如今的半周時(shí)間,訓(xùn)練效率提升 4 倍,資源消耗下降 50%。用戶體驗(yàn)方面,僅圖片搜索的模型從去年到今年擴(kuò)大 10 倍,算力增長非???,阿里通過云上機(jī)器學(xué)習(xí)平臺實(shí)現(xiàn)用更低的成本來滿足業(yè)務(wù)的需求在大數(shù)據(jù)+AI 驅(qū)動下,云產(chǎn)品支持業(yè)務(wù)的高效發(fā)展。在今年雙11期間,阿里開源了自研大規(guī)模分布式搜索引擎 Havenask,其為阿里電商搜索和推薦業(yè)務(wù)中最核心部分的圖化引擎之一,支持包括淘寶、天貓等在內(nèi)的阿里巴巴集團(tuán)的搜索業(yè)務(wù),支持千億級別數(shù)據(jù)實(shí)時(shí)檢索、百萬 QPS 查詢、百萬 TPS 高時(shí)效性寫入保障。阿里有數(shù)千萬核的CPU,從成本效能角度來講,CPU利用率的提升對阿里的成本效能能否綠色、高效地運(yùn)轉(zhuǎn)是非常關(guān)鍵的。近兩年,阿里混部集群CPU利用率持續(xù)提升,已達(dá)到業(yè)界領(lǐng)先水平。
“從節(jié)約網(wǎng)絡(luò)成本上,以往我們可能關(guān)注服務(wù)器的支出成本,但網(wǎng)絡(luò)成本占 IT 開銷也占相當(dāng)比重,通過云提供的外聯(lián)鏈路、靈活限速、入口部署優(yōu)化等策略,同時(shí)通過從統(tǒng)一調(diào)度到全面FinOps(云成本優(yōu)化)實(shí)踐,我們運(yùn)用成本管理體系支撐優(yōu)化,通過云計(jì)算的彈性能力實(shí)現(xiàn)了機(jī)器閑置率下降和支持峰值分配率的提升、以及存儲、網(wǎng)絡(luò)彈性成本下降,最終帶來業(yè)務(wù)整體單位算力成本下降?!睆埈|玶期待,未來兩年會再進(jìn)一步下降。
由此我們發(fā)現(xiàn),借助于全面深度用云,讓雙 11正在變得越來越綠色、經(jīng)濟(jì)。據(jù)了解,阿里自研 CPU 已有一定規(guī)模應(yīng)用于今年的雙 11,首次實(shí)現(xiàn)了芯片、計(jì)算架構(gòu)及操作系統(tǒng)的協(xié)同優(yōu)化,單位算力功耗降低 60%。在雙碳目標(biāo)下,阿里云五大超級數(shù)據(jù)中心全面啟用清潔能源,雙 11 期間,張北基地和南通基地清潔能源合計(jì)超 6000 萬千瓦時(shí),相比去年雙 11 同時(shí)段清潔能源交易量增加一倍以上。綜上我們觀察到,阿里依靠強(qiáng)大的技術(shù)競爭力,進(jìn)行全面云原生深度用云,同時(shí)也享受云上研發(fā)帶來的技術(shù)紅利,實(shí)現(xiàn)降本增效。云原生架構(gòu)升級,Serverless 開啟研發(fā)新模式盡管經(jīng)歷十多年來雙 11 的實(shí)戰(zhàn),伴隨業(yè)務(wù)、技術(shù)架構(gòu)、相互依賴將變得越來越復(fù)雜,未來開發(fā)者面臨的技術(shù)挑戰(zhàn)巨大。阿里早有所洞察,不僅是依靠云的能力來優(yōu)化成本,還應(yīng)全面升級研發(fā)模式和應(yīng)用架構(gòu),來幫助開發(fā)者提效。其中 Serverless 是關(guān)鍵的發(fā)展趨勢之一,今年,阿里巴巴內(nèi)部確立了以“云原生”作為集團(tuán)整體技術(shù)架構(gòu)的戰(zhàn)略,向 Serverless 化邁進(jìn),以實(shí)現(xiàn)更加彈性和敏捷的系統(tǒng)架構(gòu)。同時(shí)阿里云也在云棲大會宣布核心產(chǎn)品走向全面Serverless,云也在通過產(chǎn)品能力提升致力讓開發(fā)者用云就像用電一樣簡單,為云上業(yè)務(wù)敏捷提供更強(qiáng)力的支撐。基于 Serverless 架構(gòu),云上研發(fā)方式正在發(fā)生根本性的改變。開發(fā)者可無需關(guān)心過多的資源配置等工作,在云上高效進(jìn)行研發(fā)、運(yùn)維、部署、建站。Serverless 還可降低軟件開發(fā)門檻,提供更多的預(yù)制模塊,大幅提高軟件生產(chǎn)效率,開啟云上研發(fā)新模式。阿里 CTO 程立表示,云原生 Severless 化正在加速重塑阿里應(yīng)用架構(gòu)和研發(fā)模式。今年雙 11,淘寶首頁實(shí)現(xiàn) 100% Serverless 化,通過更輕量靈活規(guī)范地用云,實(shí)現(xiàn)了應(yīng)用輕量化和運(yùn)維效率的顯著提升,應(yīng)用部署時(shí)長縮短一半。未來,阿里將持續(xù)推進(jìn)應(yīng)用全面走向 Serverless 化,實(shí)現(xiàn)研發(fā)模式和應(yīng)用架構(gòu)的全面升級,讓應(yīng)用架構(gòu)更加輕量和彈性,充分利用云的彈性能力,讓應(yīng)用依賴標(biāo)準(zhǔn)化云服務(wù),讓應(yīng)用可以隨時(shí)在云上環(huán)境彈性部署、隨申隨用云資源,幫助開發(fā)者和企業(yè)實(shí)現(xiàn)敏捷創(chuàng)新。
立即登錄,閱讀全文