AWS在數(shù)據(jù)庫節(jié)點ra3.4xl和ra3.16xl,加入了,這是一個加速層,可將運算擺放到靠近數(shù)據(jù)儲存的地方執(zhí)行,以減少網絡流量和CPU的開銷,大幅提升查詢效率。
AWS提到,AQUA是一個分散式且硬件加速快取,可以讓Amazon Redshift數(shù)據(jù)倉儲在處理特定查詢時,比其他廠商的數(shù)據(jù)倉儲速度快上10倍,而且在ra3.4xl和ra3.16xl節(jié)點類型,用戶并不需要為AQUA額外支付費用。
AWS在2019年時,在Redshift提供了使用SSD儲存的節(jié)點類型RA3,并且在去年4月的時候,加入包括ra3.4xlarge等其他大小的節(jié)點,還在12月的時候,加入搭載托管儲存的RA3.xlplus節(jié)點,這些節(jié)點除了具有大帶寬的網絡連接外,還使用了復雜的數(shù)據(jù)管理模型。
AWS解釋,每個RA3節(jié)點都具有大容量且高性能的SSD儲存,并從底層的對象儲存服務S3,獲得儲存可縮放性、高耐用性和高性能等優(yōu)點,儲存系統(tǒng)會提供像是數(shù)據(jù)塊溫度、數(shù)據(jù)阻塞和工作負載模式等提示,來管理高性能快取,以實現(xiàn)高性能儲存,數(shù)據(jù)會自動被放到適當?shù)膬Υ鎸又?,用戶不需要介入,就能獲得最佳化配置。
用戶使用RA3節(jié)點來維護非常大的數(shù)據(jù)集,單個數(shù)據(jù)倉儲最多可儲存的數(shù)據(jù)達32 PB,AWS提到,當數(shù)據(jù)倉儲中的數(shù)據(jù)不斷成長,儲存成長的幅度超過CPU的性能增長,大量數(shù)據(jù)和網絡流量,可能使得網絡和CPU帶寬成為限制因子。
為了解決這個問題,AWS開發(fā)了AQUA,這是一個建立在RA3快取基礎上的加速器,其充分使用AWS Nitro系統(tǒng)和自定義FPGA加速功能,并將數(shù)據(jù)精簡(Reduction)和聚合查詢所需要的運算,放置在數(shù)據(jù)端附近執(zhí)行,借此減少網絡流量,減輕RA3節(jié)點中CPU的工作負擔,并允許AQUA將特定查詢的性能提高多達10倍。
這個新功能不需要額外支付費用,也不需要用戶更動任何程序碼,已經使用ra3.4xl或ra3.16xl節(jié)點托管數(shù)據(jù)倉儲的用戶,可以在數(shù)分鐘內開始使用AQUA,僅需要在叢集中啟用AQUA,并且重新啟動叢集,就可以在數(shù)據(jù)精簡和聚合查詢時,獲得極大的性能改善。
AWS提到,AQUA可以極大程度降低查詢時間,甚至可以讓部分新類型的查詢獲得即時的結果,而這些查詢可能在過去不可能實現(xiàn),或是不切實際。
AQUA快取的數(shù)據(jù)都會以用戶的金鑰加密,在執(zhí)行過濾和聚合操作之後,AQUA就會壓縮結果并且進行加密,然後把數(shù)據(jù)回傳至Redshift。目前該服務已經在美東、美西和歐洲地區(qū)提供,而亞太現(xiàn)在先在東京上線,2021上半年還會陸續(xù)在悉尼和新加坡提供。