云原生已成為技術發(fā)展的必然趨勢,開發(fā)者和企業(yè)正全面擁抱。
據(jù)最新官方數(shù)據(jù)統(tǒng)計,在 3200 萬 CSDN 注冊用戶中,閱讀和研究云原生技術的開發(fā)者已經(jīng)達到了 406 萬。云原生已成為技術發(fā)展的必然趨勢,開發(fā)者和企業(yè)正全面擁抱。這背后,源于云原生正在成為企業(yè)數(shù)字化轉(zhuǎn)型的助推器,有效提高 IT 資源規(guī)?;?、節(jié)約化,降低計算成本,同時提升研發(fā)效率,幫助企業(yè)降本增效。這正暗合了11 年前著名硅谷投資人馬克·安德森的一句話“軟件正在吞噬世界”。以阿里為例,從 2019 年的核心系統(tǒng)上云到 2021 年阿里 100% 業(yè)務全面上云,再到今年走向全面云原生化的深度用云階段。深度用云正在幫助阿里打造綠色高效的雙 11,實現(xiàn)更好地增效降本,同時也在打破原來的天花板,為技術和業(yè)務帶來更多的增長動能。
全面上云后,阿里成為降本增效的受益者
伴隨電商業(yè)務的蓬勃發(fā)展,對傳統(tǒng) IT 技術提出了更高的需求,而云計算在成本控制、開發(fā)運維、性能穩(wěn)定性等方面上比傳統(tǒng) IT 更勝一籌,能有效解決以下問題:一是解決服務器孤島問題。在 2007 年前后,消費互聯(lián)網(wǎng)爆發(fā)式發(fā)展,那時算力遠遠滿足不了現(xiàn)實需求。在傳統(tǒng)模式下為解決算力不足問題,一般是依賴擴大采購規(guī)模,然而機器成本巨大,且物理機磁盤、內(nèi)存各不相同,加上阿里業(yè)務需求多樣,導致有可能存在閑置物理機沒法使用,形成服務器孤島,造成資源浪費。二是資源調(diào)度困難。業(yè)務需求不盡相同:有些業(yè)務需要白天被大量使用,有些則是晚上使用,沒有統(tǒng)一調(diào)度的話,無法做到分時、錯峰使用。三是研發(fā)效能低,開發(fā)者應用上線時非常謹慎,耗時較長,造成業(yè)務效率低下。四是助力云成長,作為用云的大規(guī)模實踐者,在2019年阿里也將核心系統(tǒng) 100% 上云,在每年雙 11 大規(guī)模實戰(zhàn)下,用全球最大規(guī)模的電商交易系統(tǒng)來協(xié)助打磨提升阿里云的核心能力,實現(xiàn)自研技術能力的提升,更好地服務外部客戶。當把業(yè)務全面搬到云上后,阿里自身成為上云降本增效的受益者,據(jù)阿里巴巴集團 CTO 架構部負責人楊華表示,當阿里整體上云后擁有了四大收益∶一是統(tǒng)一資源,全部統(tǒng)一 CPU 和計算資源,節(jié)約數(shù)億成本。二是技術棧統(tǒng)一,大幅度降低溝通成本,讓上層研發(fā)、運維、安全生產(chǎn)變得高效和統(tǒng)一。三是安全穩(wěn)定,連續(xù) 3 年雙 11 零重大事故,保障業(yè)務平穩(wěn)運行。四是靈活創(chuàng)新,比如通過調(diào)用云數(shù)據(jù)庫Tair進行云上優(yōu)化,雙11實現(xiàn)了淘寶購物車從120個到300個的擴容,以輕量化連接、異步支持等技術支撐起超大連接數(shù),使單集群訪問流量達到100GB/s。
全面云原生深度用云 讓雙 11變得越來越綠色、經(jīng)濟
今年阿里集團在 PaaS 支持的業(yè)務形態(tài)中支出占用云總成本達 43%,阿里已進入全面云原生深度用云階段。據(jù)阿里財報披露,阿里用云規(guī)模支出 200 多億,如何讓這筆錢發(fā)揮更大的價值,對阿里來說是個需要解決的挑戰(zhàn),降本增效成為阿里必須直面的重要命題。阿里巴巴集團技術風險與效能負責人張瓅玶表示,云原生深度用云是架構和研發(fā)模式的全面升級,而云原生增效降本的核心是明確技術聚焦投入于自身的核心競爭力。如何通過聚焦自身核心競爭力來進行降本增效?以雙 11 為例,正走在以大數(shù)據(jù)和 AI 驅(qū)動的前沿技術道路上。目前阿里擁有近千萬核在線計算,云上超大規(guī)模計算集群支持電商在線與離線業(yè)務,MaxComute、Flink 大數(shù)據(jù)集群支持海量大數(shù)據(jù)計算,數(shù)萬卡機器學習和推理平臺支撐高效搜索推薦。如每次打開淘寶進行搜索背后,是龐大的 AI 算力支持返回商品推薦。又如支撐商家增長的業(yè)務,通過靈駿智能計算,用千億參數(shù)的超大規(guī)模模型訓練,樣本數(shù)量達到萬億的規(guī)模,將以往需要兩周的訓練時間縮短到如今的半周時間,訓練效率提升 4 倍,資源消耗下降 50%。用戶體驗方面,僅圖片搜索的模型從去年到今年擴大 10 倍,算力增長非???,阿里通過云上機器學習平臺實現(xiàn)用更低的成本來滿足業(yè)務的需求在大數(shù)據(jù)+AI 驅(qū)動下,云產(chǎn)品支持業(yè)務的高效發(fā)展。在今年雙11期間,阿里開源了自研大規(guī)模分布式搜索引擎 Havenask,其為阿里電商搜索和推薦業(yè)務中最核心部分的圖化引擎之一,支持包括淘寶、天貓等在內(nèi)的阿里巴巴集團的搜索業(yè)務,支持千億級別數(shù)據(jù)實時檢索、百萬 QPS 查詢、百萬 TPS 高時效性寫入保障。阿里有數(shù)千萬核的CPU,從成本效能角度來講,CPU利用率的提升對阿里的成本效能能否綠色、高效地運轉(zhuǎn)是非常關鍵的。近兩年,阿里混部集群CPU利用率持續(xù)提升,已達到業(yè)界領先水平。
“從節(jié)約網(wǎng)絡成本上,以往我們可能關注服務器的支出成本,但網(wǎng)絡成本占 IT 開銷也占相當比重,通過云提供的外聯(lián)鏈路、靈活限速、入口部署優(yōu)化等策略,同時通過從統(tǒng)一調(diào)度到全面FinOps(云成本優(yōu)化)實踐,我們運用成本管理體系支撐優(yōu)化,通過云計算的彈性能力實現(xiàn)了機器閑置率下降和支持峰值分配率的提升、以及存儲、網(wǎng)絡彈性成本下降,最終帶來業(yè)務整體單位算力成本下降?!睆埈|玶期待,未來兩年會再進一步下降。
由此我們發(fā)現(xiàn),借助于全面深度用云,讓雙 11正在變得越來越綠色、經(jīng)濟。據(jù)了解,阿里自研 CPU 已有一定規(guī)模應用于今年的雙 11,首次實現(xiàn)了芯片、計算架構及操作系統(tǒng)的協(xié)同優(yōu)化,單位算力功耗降低 60%。在雙碳目標下,阿里云五大超級數(shù)據(jù)中心全面啟用清潔能源,雙 11 期間,張北基地和南通基地清潔能源合計超 6000 萬千瓦時,相比去年雙 11 同時段清潔能源交易量增加一倍以上。綜上我們觀察到,阿里依靠強大的技術競爭力,進行全面云原生深度用云,同時也享受云上研發(fā)帶來的技術紅利,實現(xiàn)降本增效。云原生架構升級,Serverless 開啟研發(fā)新模式盡管經(jīng)歷十多年來雙 11 的實戰(zhàn),伴隨業(yè)務、技術架構、相互依賴將變得越來越復雜,未來開發(fā)者面臨的技術挑戰(zhàn)巨大。阿里早有所洞察,不僅是依靠云的能力來優(yōu)化成本,還應全面升級研發(fā)模式和應用架構,來幫助開發(fā)者提效。其中 Serverless 是關鍵的發(fā)展趨勢之一,今年,阿里巴巴內(nèi)部確立了以“云原生”作為集團整體技術架構的戰(zhàn)略,向 Serverless 化邁進,以實現(xiàn)更加彈性和敏捷的系統(tǒng)架構。同時阿里云也在云棲大會宣布核心產(chǎn)品走向全面Serverless,云也在通過產(chǎn)品能力提升致力讓開發(fā)者用云就像用電一樣簡單,為云上業(yè)務敏捷提供更強力的支撐。基于 Serverless 架構,云上研發(fā)方式正在發(fā)生根本性的改變。開發(fā)者可無需關心過多的資源配置等工作,在云上高效進行研發(fā)、運維、部署、建站。Serverless 還可降低軟件開發(fā)門檻,提供更多的預制模塊,大幅提高軟件生產(chǎn)效率,開啟云上研發(fā)新模式。阿里 CTO 程立表示,云原生 Severless 化正在加速重塑阿里應用架構和研發(fā)模式。今年雙 11,淘寶首頁實現(xiàn) 100% Serverless 化,通過更輕量靈活規(guī)范地用云,實現(xiàn)了應用輕量化和運維效率的顯著提升,應用部署時長縮短一半。未來,阿里將持續(xù)推進應用全面走向 Serverless 化,實現(xiàn)研發(fā)模式和應用架構的全面升級,讓應用架構更加輕量和彈性,充分利用云的彈性能力,讓應用依賴標準化云服務,讓應用可以隨時在云上環(huán)境彈性部署、隨申隨用云資源,幫助開發(fā)者和企業(yè)實現(xiàn)敏捷創(chuàng)新。
立即登錄,閱讀全文