AWS數(shù)據(jù)庫、緩存、數(shù)據(jù)倉庫邁向真正無服務器化與新量子芯片

來源:十輪網(wǎng)
作者:十輪網(wǎng)
時間:2023-11-30
3158
AWS re:Invent 2023今日(27)在美國拉斯維加斯展開,其公用運算部門(Utility Computing)資深副總裁Peter DeSantis在晚間首場主題演講中,首度披露旗下三款云計算服務在無服務器功能方面皆有新的進展,包括Aurora數(shù)據(jù)庫服務、ElastiCache緩存服務與Redshift數(shù)據(jù)倉庫服務,終于在技術持續(xù)精進之下,達到他們心目中真正無服務器化的里程碑;同時也如以往發(fā)布硬件芯片的慣例,首度披露錯誤率僅0.1%的新量子芯片。

reinvent2023_desantis_keynote.jpg

《美國拉斯維加斯現(xiàn)場報道》AWS re:Invent 2023今日(27)在美國拉斯維加斯展開,其公用運算部門(Utility Computing)資深副總裁Peter DeSantis在晚間首場主題演講中,首度披露旗下三款云計算服務在無服務器功能方面皆有新的進展,包括Aurora數(shù)據(jù)庫服務、ElastiCache緩存服務與Redshift數(shù)據(jù)倉庫服務,終于在技術持續(xù)精進之下,達到他們心目中真正無服務器化的里程碑;同時也如以往發(fā)布硬件芯片的慣例,首度披露錯誤率僅0.1%的新量子芯片。

Amazon Aurora是兼容于MySQL與PostgreSQL的云計算數(shù)據(jù)庫服務,AWS在2018年推出Aurora的首款無服務版本,接著在去年2022年推出Aurora Serverless V2第二版,賦予云計算數(shù)據(jù)庫服務更大的線上擴展能力,不過雖然訴求數(shù)據(jù)庫用戶可在服務不中斷的情況下擴展數(shù)據(jù)庫,但仍有一定容量的限制。

Aurora Serverless數(shù)據(jù)庫服務之所以能實現(xiàn)線上擴展容量,DeSantis表示,主要是依賴虛擬化技術。AWS開發(fā)了一個稱之為Caspian的虛擬層,由Caspian Heat Management System來管理實體主機如何分配虛擬內存給數(shù)據(jù)庫。Aurora所使用的每一臺實體主機配置容量256GB的內存,雖然Aurora數(shù)據(jù)庫打開服務可以使用256GB內存,但實體主機的內存并不會因此而被完全占用,Caspian管理軟件會依據(jù)每個Aurora數(shù)據(jù)庫服務運行所需配置適當?shù)奈锢韮却嫒萘浚虼嗣颗_實體主機皆可承載多個Aurora數(shù)據(jù)庫服務,如此就可以極大化利用計算資源。

在上述機制下,當一臺實體主機所承載的Aurora運行所需內存超過256GB,迫于內存物理限制就必須轉移到另一臺主機。DeSantis指出,如此機制尚無法達到無服務器化可以自動擴展調整的最高境界,因此AWS繼而運用數(shù)據(jù)庫分區(qū)(Sharding)技術,將單一數(shù)據(jù)庫分配到不同主機,以達到水平擴展的能力。

數(shù)據(jù)庫分區(qū)并不難實現(xiàn),DeSantis表示,但要達到自動分配的境界,最難突破的關鍵在于數(shù)據(jù)路由與數(shù)據(jù)庫分區(qū)彈性擴展的設計。為此AWS開發(fā)出一個數(shù)據(jù)請求路由層(Request Routing Layer),它采取輕量化設計,具有快速反應擴展的特性,加諸分區(qū)彈性擴展設計,則可達到跨區(qū)域執(zhí)行數(shù)據(jù)庫切片與重組,并確保數(shù)據(jù)庫的可靠度。

由于上述兩項技術的創(chuàng)新突破,DeSantis指出,AWS終于能在今年推出真正無服務器化的Aurora數(shù)據(jù)庫服務,稱之為Amazon Aurora Limitless Database,意指可不受單一數(shù)據(jù)庫的容量限制,皆可自動擴展配置而不影響數(shù)據(jù)庫運行。

IMG_0399-11.jpg

除了Aurora Limitless Database,AWS今天也推出緩存服務無服務器版本ElastiCache Serverless。DeSantis表示,這依賴第三項創(chuàng)新技術突破,也就是減少時鐘誤差范圍(Reducing Clock Error Bounds)。分布式運算系統(tǒng)的數(shù)據(jù)同步需要依賴同步計時,他指出主要的三種做法,分別為Wall Clock(現(xiàn)實世界時間)、Logical Clock(邏輯時間)與單一TimeKeeper服務器,其中Wall Clock方式會因不同時鐘的差異而導致計時同步不可靠。

為了提供準確的同步計時,AWS在2017年推出Amazon Time Sync Service,結合衛(wèi)星通信與原子鐘參照,提供與世界協(xié)調時間(UTC)誤差僅1毫秒(millisecond)的同步計時。但是,DeSantis指出,時間誤差1毫秒代表著總延遲時間是2毫秒,也即每秒500次交易的延遲速度,而這對于緩存的同步來說太慢了。為此,AWS以Nitro網(wǎng)絡加速芯片為基礎設計一個分布式計時網(wǎng)絡,并搭配備援電力模塊與原子鐘,安裝在一個標準48U機柜,終于將同步計時誤差由毫秒縮短至微秒(microsecond)等級,其ElastiCache Serverless p50的延遲僅500微秒,并可支持最大5TB內存容量。

IMG_0427-11.jpg

至于在2021年推出的數(shù)據(jù)庫倉儲服務無服務器版本Redshift Serverless,也有更進一步的精進。DeSantis表示,數(shù)據(jù)庫倉儲不只是要應對數(shù)據(jù)量,也得應對運算任務多樣化的需求。Redshift Serverless是由請求管理(Request Management)系統(tǒng)來判斷實體主機的負荷量,如果有運算需求較大的ETL(Extract,Transform,Load)任務產(chǎn)生,若既有的主機無法承擔,請求管理系統(tǒng)就會將其分配到新的主機,但若既有的主機可以承擔,雖然該ETL任務可以分配到既有主機,但由于運算需求大,完成運算的時間較久,也會因此牽累該主機的其他運算任務,導致時間拖延。

為了解決Redshift Serverless上述問題,AWS在請求管理系統(tǒng)導入機器學習預測功能,DeSantis指出,其實數(shù)據(jù)分析任務有80%是雷同的,因此先以機器學習創(chuàng)建好這80%任務的模型,將其內置在請求管理系統(tǒng)的緩存,加速其快速分析任務類型,同時,有另一個模型用來學習屬于個別企業(yè)組織慣用習慣的另外20%任務,讓請求管理層可以在接到任務時分析與預測其類型,據(jù)以分配合適的計算資源。而有了這項AI功能后,Amazon Redshift Serverless Next-generation AI-driven scaling and optimizations也提供用戶自行設置機器學習的政策,以在數(shù)據(jù)分析運算時間與運算成本之間有所取舍。

IMG_0543-11.jpg

此外,AWS歷年來皆會利用re:Invent的首日晚間主題演講發(fā)布其在硬件芯片的著墨,今年也不例外,DeSantis首度公開發(fā)布新的量子芯片,他表示,Aamzon量子運算團隊在量子糾錯有重大的進展,以邏輯量子位元的方式,將位元反轉(Bit-flip)與相位翻譯(Phase-flip)錯誤分開,DeSantis指出,借由被動糾錯方法,已可將錯誤率降低100倍,達到0.1%,也即千分之一的錯誤率,而硬件過熱也預期可減少6倍。不過,他也說,雖然新芯片在量子糾錯方面有重大的進展,但現(xiàn)在尚于量子運算發(fā)展非常早期的階段。

Amazon ElastiCache Serverless目前已可提供服務,Amazon Aurora Limitless Database與Amazon Redshift Serverless Next-generation AI-driven scaling and optimizations則提供預覽。

立即登錄,閱讀全文
原文鏈接:點擊前往 >
文章來源:十輪網(wǎng)
版權說明:本文內容來自于十輪網(wǎng),本站不擁有所有權,不承擔相關法律責任。文章內容系作者個人觀點,不代表快出海對觀點贊同或支持。如有侵權,請聯(lián)系管理員(zzx@kchuhai.com)刪除!
優(yōu)質服務商推薦
更多
掃碼登錄
打開掃一掃, 關注公眾號后即可登錄/注冊
加載中
二維碼已失效 請重試
刷新
賬號登錄/注冊
小程序
快出海小程序
公眾號
快出海公眾號
商務合作
商務合作
投稿采訪
投稿采訪
出海管家
出海管家