(文/鄒大斌)2020年“雙十一”已經(jīng)落幕。數(shù)據(jù)顯示,11月1日至11日天貓“雙十一”訂單創(chuàng)建峰值達(dá)58.3萬筆/秒,11月1日0點-11日零時30分,天貓成交額破3723億元,雙雙再創(chuàng)新高。阿里天貓系統(tǒng)再次通過這場一年一度的“大考”。
在每年的“大考”中,是否能平穩(wěn)地應(yīng)對訂單高峰時的流量,系統(tǒng)不崩潰、用戶體驗不下降,是通過“考試”的關(guān)鍵,為此,阿里的技術(shù)人員一直持續(xù)不斷地研發(fā)技術(shù)、打磨產(chǎn)品,云原生內(nèi)存數(shù)據(jù)庫Tair就是其中最關(guān)鍵的產(chǎn)品之一。從2009年Tair首次應(yīng)用在淘寶核心業(yè)務(wù)系統(tǒng),至今已經(jīng)連續(xù)11年為阿里“雙十一”提供了核心的在線訪問加速能力,承受住了最高每秒15億次的調(diào)用,是天貓“雙十一”的一大功臣。
今年年初,這個在阿里集團內(nèi)部服務(wù)多年,歷經(jīng)天貓“雙十一”、優(yōu)酷春晚、菜鳥、高德等業(yè)務(wù)場景磨練的產(chǎn)品被阿里云正式對外推出。盡管在內(nèi)存數(shù)據(jù)庫市場Tair才入場,但經(jīng)過阿里連續(xù)11年“雙十一”歷練的Tair注定與眾不同,其云原生加持下的存儲一體、結(jié)合英特爾傲騰提供的持久化能力等等,使得Tair一出場就成為業(yè)界的焦點。
數(shù)據(jù)處理新趨勢:實時、海量、低成本
今天的我們已經(jīng)進(jìn)入一個大數(shù)據(jù)時代,數(shù)據(jù)規(guī)模一直在快速增長。來自研究機構(gòu)的數(shù)據(jù)顯示,到2025年數(shù)據(jù)規(guī)模將是今年的4倍。與此同時,實時數(shù)據(jù)的處理占比會越來越高。據(jù)預(yù)測,到2022年50%以上的業(yè)務(wù)需要采用實時處理數(shù)據(jù)方法來支撐業(yè)務(wù)的在線化運營。另外,新增數(shù)據(jù)中非結(jié)構(gòu)性數(shù)據(jù)占比會大大提升,占比將會高達(dá)80%以上,同比增速超過50%。
應(yīng)對這些以非結(jié)構(gòu)化數(shù)據(jù)為主、實時在線的數(shù)據(jù)處理需求,傳統(tǒng)數(shù)據(jù)庫明顯力不從心,而內(nèi)存數(shù)據(jù)庫成為越來越多人的選擇。近幾年,隨著內(nèi)存價格持續(xù)走低,以Redis、Memcache為代表的內(nèi)存數(shù)據(jù)庫迅速普及。據(jù)Verified Market Research在2020年發(fā)布的市場研究報告顯示,全球內(nèi)存數(shù)據(jù)庫市場將以19.65%的復(fù)合年增長率增長。
不過,市場上現(xiàn)存的這些內(nèi)存數(shù)據(jù)并沒有充分滿足企業(yè)的需求,主要體現(xiàn)在以下方面:
首先是成本,在所有存儲介質(zhì)中內(nèi)存是最貴的,內(nèi)存的成本是用戶選擇內(nèi)存數(shù)據(jù)庫首要的考慮條件,昂貴的內(nèi)存成本也限制了內(nèi)存數(shù)據(jù)庫的普及。
其次是彈性。市場上現(xiàn)有的內(nèi)存數(shù)據(jù)庫產(chǎn)品普遍彈性不足,只能基于事先設(shè)好的參數(shù)值擴容,而無法根據(jù)業(yè)務(wù)的波峰、波谷的變化實時調(diào)整內(nèi)存大小。
第三,計算能力不夠豐富。大多數(shù)內(nèi)存數(shù)據(jù)庫數(shù)據(jù)模型以KV或者關(guān)系型為主,在非結(jié)構(gòu)化數(shù)據(jù)占比將達(dá)到80%以上的今天,人們希望其能提供更加豐富的計算能力,如向量分析、向量處理、圖數(shù)據(jù)類型臨近點分析等處理。
第四是企業(yè)級的能力。內(nèi)存數(shù)據(jù)庫除了能提供傳統(tǒng)緩存提供的數(shù)據(jù)訪問加速能力之外,還希望能夠提供持久化、智能分層存儲以及熱點打散等功能,這些都是企業(yè)級應(yīng)用需要的關(guān)鍵能力。
值得高興的是,隨著技術(shù)的不斷進(jìn)步,特別是云計算以及新一代存儲技術(shù)的出現(xiàn),內(nèi)存數(shù)據(jù)庫面臨的這些挑戰(zhàn)正在逐步得到解決,新一代的內(nèi)存數(shù)據(jù)庫也應(yīng)運而生,阿里云推出的云原生內(nèi)存數(shù)據(jù)庫Tair正是這樣的一個產(chǎn)品。
“內(nèi)存數(shù)據(jù)庫正進(jìn)入了新的階段,云原生、持久化、融合計算是三大特征。”阿里巴巴集團副總裁、阿里云智能數(shù)據(jù)庫產(chǎn)品事業(yè)部總經(jīng)理、高級研究員李飛飛表示。
阿里巴巴集團副總裁、阿里云智能數(shù)據(jù)庫產(chǎn)品事業(yè)部總經(jīng)理、高級研究員李飛飛
云原生加持的內(nèi)存數(shù)據(jù)庫Tair
阿里云推出的云原生內(nèi)存數(shù)據(jù)庫Tair是阿里自研的一個完全兼容Redis協(xié)議的KVS緩存系統(tǒng)。Tair誕生于2009年,最早應(yīng)用于淘寶核心業(yè)務(wù)系統(tǒng),隨后逐漸進(jìn)入阿里其他核心業(yè)務(wù)系統(tǒng),經(jīng)過多年持續(xù)不斷的打磨、完善和改進(jìn),如今已經(jīng)演進(jìn)到Tair 3.0。Tair也被阿里云稱為Redis企業(yè)版。部分原因在于其最早的設(shè)計思路來自Redis,很多功能設(shè)計也參考了Redis,但更為重要的原因是,它完全兼容Redis的數(shù)據(jù)結(jié)構(gòu)和接口API,原來采用Redis的應(yīng)用可以無縫遷移到Tair。
當(dāng)然,作為新一代內(nèi)存數(shù)據(jù)庫的代表,Tair已經(jīng)超過了Redis,實現(xiàn)了從緩存到一個真正內(nèi)存數(shù)據(jù)庫的角色轉(zhuǎn)變,越來越多核心應(yīng)用除了使用Tair的緩存模式之外,也使用Tair作為數(shù)據(jù)的持久化存儲方案。
在阿里云Tair實現(xiàn)從數(shù)據(jù)緩存到真正的內(nèi)存數(shù)據(jù)庫的角色轉(zhuǎn)變過程中,存儲技術(shù)的進(jìn)步發(fā)揮了重要作用,特別是英特爾傲騰技術(shù)。英特爾的傲騰是近幾年來存儲介質(zhì)的一次重大突破,傲騰數(shù)據(jù)中心級持久內(nèi)存(AEP)通過3DXpoint技術(shù)實現(xiàn)了存儲介質(zhì)在性能和成本上平衡,既提供了接近DRAM的訪問速度,同時還具有非易失性存儲的能力。
基于傲騰數(shù)據(jù)中心級持久內(nèi)存,Tair通過軟硬結(jié)合實現(xiàn)了成本、性能和功能上的突破。目前,針對用戶對訪問延時、持久化、整體成本這三個核心需求,基于DRAM、AEP和ESSD云盤存儲介質(zhì),Tair推出了多種不同形態(tài)的產(chǎn)品,通過為用戶提供更強的性能、更多的數(shù)據(jù)結(jié)構(gòu)和更靈活的存儲方式,來滿足不同場景下的業(yè)務(wù)需求。
軟硬一體實現(xiàn)突破
“結(jié)合傲騰AEP的特性,通過軟硬件的融合,Tair在成本、彈性、計算和企業(yè)級能力上都實現(xiàn)了突破?!崩铒w飛在接受記者采訪時表示。
首先在成本上,得益于新技術(shù)的應(yīng)用使得TCO有明顯下降。比如,Tair的持久內(nèi)存型形態(tài)單實例成本對比Redis社區(qū)版最高可降低30%,而容量存儲型形態(tài)的單實例成本對比Redis社區(qū)版最高可降低85%。而且,數(shù)據(jù)持久化不依賴傳統(tǒng)磁盤,保證每個操作持久化的同時提供近乎Redis社區(qū)版的吞吐和延時,極大提升業(yè)務(wù)數(shù)據(jù)可靠性。
其次,在彈性上,Tair通過計算和存儲的解耦以及存儲的池化,實現(xiàn)了無損的縮擴容,用戶可以根據(jù)業(yè)務(wù)訪問的波峰波谷動態(tài)、彈性地用一個池化的內(nèi)存池提供無縫彈性,這就避免了用戶為峰值“買單”,幫助用戶節(jié)約的成本。
“如果在沒有存儲和計算解耦,沒有存儲池化能力,內(nèi)存的容量一定要按照業(yè)務(wù)峰值進(jìn)行匹配,否則在峰值的時候就會出現(xiàn)內(nèi)存被擊穿,數(shù)據(jù)庫被涌來的請求沖垮。而在傳統(tǒng)架構(gòu)下,內(nèi)存數(shù)據(jù)庫必須按照峰值容量部署,因此使用成本一定高?!崩铒w飛解釋說。
第三,計算模型上,Tair提供了非常豐富的功能,能支持圖計算、文本計算、圖片計算等。
最后,也是非常關(guān)鍵的企業(yè)級能力,這也是Tair的一大優(yōu)勢所在。Tair提供了全分布式的能力、數(shù)據(jù)閃回的能力、數(shù)據(jù)洞察的能力、熱點打散的能力,以及智能數(shù)據(jù)分層存儲能力等。
比如,Tair可以跨多個可用區(qū)(AZ)部署和容災(zāi),不同AZ的數(shù)據(jù)可以自動實時同步,并且多點進(jìn)行讀取,從而實現(xiàn)對就近內(nèi)存數(shù)據(jù)的訪問。Tair的這種分布式能力對在線教育、娛樂、游戲、出海業(yè)務(wù)等業(yè)務(wù)非常關(guān)鍵,南瓜電影就使用了阿里云內(nèi)存數(shù)據(jù)庫Tair的企業(yè)級功能,實現(xiàn)了數(shù)據(jù)多地域同步,為3000萬終端用戶帶去了更極致的體驗。
另外,熱點打散也是Tair的一項非常關(guān)鍵的能力。在視頻直播可能會有突然爆發(fā)的情況,而這些很難預(yù)測也無法做足預(yù)案,如果熱點來了應(yīng)對不好很容易把緩存擊穿,通過Tair實時熱點打散能力就可以從容應(yīng)對這種突發(fā)的狀況。
云計算是最重要推手
回顧這些年數(shù)據(jù)庫進(jìn)步的演進(jìn),李飛飛表示,一個明顯的趨勢是大數(shù)據(jù)與數(shù)據(jù)庫正在融合,其邊界變得越來越模糊,同時離線、在線邊界也變得越來越模糊,因為人們希望將數(shù)據(jù)處理一體化,數(shù)據(jù)處理實時在線化。而這背后最大的推手就是云計算。
李飛飛解釋說,云計算本質(zhì)是資源池化?!巴ㄟ^資源的池化、存儲與計算分離、計算資源隔離這些云計算的能力,同時結(jié)合如傲騰這樣的最新硬件技術(shù),再和分布式數(shù)據(jù)庫技術(shù)融合起來,我們研發(fā)出了Tair這樣的新一代數(shù)據(jù)庫系統(tǒng)?!崩铒w飛說。
的確,云原生數(shù)據(jù)庫已經(jīng)成為行業(yè)發(fā)展趨勢。Gartner在去年發(fā)布的名為《The Future of the Database Management System(DBMS)Market Is Cloud》的報告中就明確提出,傳統(tǒng)的自己部署數(shù)據(jù)庫的方式已經(jīng)過時。云是未來,所有組織,無論大小,都將越來越多地使用云數(shù)據(jù)庫。而阿里云云數(shù)據(jù)庫產(chǎn)品的推出也正是順應(yīng)了這一趨勢。
值得一提的是,阿里云在云計算方面的整體技術(shù)實力為阿里云數(shù)據(jù)庫產(chǎn)品性能提供了重要支持,確保其有著更好的性能表現(xiàn)。神龍架構(gòu)就是一個很好的例子。神龍架構(gòu)是阿里云為提升云平臺整體性能而研發(fā)的新一代計算平臺,目前已經(jīng)發(fā)布了第三代。在神龍架構(gòu)中,阿里云研發(fā)了專用的芯片、定制的專用主板,開發(fā)了專用的MOC卡,甚至開發(fā)了整套配套的軟件——從BIOS到應(yīng)用層支撐軟件,再到整體調(diào)度軟件等一整套復(fù)雜的系統(tǒng)。其最終結(jié)果是,實現(xiàn)了全面支持ECS虛擬機、裸金屬、云原生容器等,在IOPS、PPS等方面提升5倍性能,在云上能獲得物理機100%的計算能力。
“這種基礎(chǔ)架構(gòu)級的改進(jìn)可以為上層的軟件提供直接的性能提升,很少或者幾乎不用做任何改動?!卑⒗镌浦悄芑A(chǔ)產(chǎn)品事業(yè)部技術(shù)戰(zhàn)略總監(jiān)陳旭在接受記者采訪時表示。
正是憑借阿里云自身在云計算方面的深厚技術(shù),以及阿里集團獨一無二的“雙十一”這個獨特的練兵場,使得阿里云在數(shù)據(jù)庫市場一年一個臺階,逐漸從一個市場的參與者變成了市場的領(lǐng)先者。
在今年11月份Gartner公布的2020年度全球數(shù)據(jù)庫魔力象限評估中,阿里云首次挺進(jìn)全球數(shù)據(jù)庫第一陣營——領(lǐng)導(dǎo)者象限,這也是中國數(shù)據(jù)庫40年來首次進(jìn)入全球頂級數(shù)據(jù)庫行列,標(biāo)志著國產(chǎn)數(shù)據(jù)庫正式進(jìn)入一線行列。另外,根據(jù)IDC的數(shù)據(jù),在公有云市場阿里云在云數(shù)據(jù)庫賽道上營收已經(jīng)位居全球第三,而就整個數(shù)據(jù)庫市場而言,在中國市場份額阿里云位居榜首。
展望未來,李飛飛表示,Tair會持續(xù)在成本、彈性、計算、企業(yè)級方面發(fā)力,重點是云原生、軟硬件技術(shù)結(jié)合、數(shù)據(jù)存儲和計算一體化等核心能力。
“我們對云原生內(nèi)存數(shù)據(jù)庫接下來的布局是,通過池化的內(nèi)存存儲來提供多種計算模型和計算能力的支撐,實現(xiàn)存儲計算在內(nèi)存層面真正的一體化?!崩铒w飛說。