AWS在其云計(jì)算數(shù)據(jù)倉庫服務(wù)Redshift加入AWS Data Exchange資料交換服務(wù),供用戶簡單地查詢、訂閱和使用第三方資料。資料訂閱者可以直接使用提供者的資料,而不需要進(jìn)行額外的處理,像是提取、轉(zhuǎn)換和加載等過程。
AWS在2019年的時候發(fā)布Data Exchange服務(wù),降低用戶取得和使用資料的障礙,在Data Exchange上,有多家資料供應(yīng)者,像是路透、Foursquare或是鄧白氏等,提供豐富的第三方商業(yè)資料。
之前用戶就可以將Data Exchange結(jié)合S3服務(wù)一同使用,在訂閱資料產(chǎn)品后,通過AWS Data Exchange API,將資料加載到S3中,并使用包括AWS Lambda函數(shù)或機(jī)器學(xué)習(xí)等服務(wù),進(jìn)行后續(xù)分析。
而現(xiàn)在這個方便使用資料的方法,波及到了Redshift上,AWS推出適用于Redshift的AWS Data Exchange,讓用戶也能夠在Redshift上取用第三方資料,而且用戶不需要經(jīng)過額外處理,就能夠在AWS Data Exchange上取用始終最新的資料。該項(xiàng)服務(wù)會由AWS管理資料的所有權(quán)和款項(xiàng),所有費(fèi)用都會直接加入AWS賬戶中,沒有額外付款給第三方的麻煩。
這項(xiàng)服務(wù)不只讓用戶能方便地使用資料,也讓資料供應(yīng)者能夠方便地提供資料產(chǎn)品。AWS提到,由于Redshift的存儲和運(yùn)算完全分離,并且具有內(nèi)置的資料共享功能,因此資料供應(yīng)者可以就使用的存儲支付費(fèi)用,而資料訂閱者可以支付用到的計(jì)算資源費(fèi)用,資料供應(yīng)者不需要因?yàn)橛脩粢?guī)模,而按比例擴(kuò)展集群。