Google云計算無服務器資料復制服務Datastream開始支持BigQuery

來源:十輪網(wǎng)
作者:十輪網(wǎng)
時間:2022-09-21
2234
Google宣布推出Datastream for BigQuery預覽版,這是一個可以讓用戶將AlloyDB for PostgreSQL、PostgreSQL、MySQL和Oracle等運營數(shù)據(jù)庫,順暢無縫復制資料到Google無服務器數(shù)據(jù)倉庫BigQuery的服務。

1341_serverless_replication_from_operational_databases_to_bigquery.jpg

Google宣布推出Datastream for BigQuery預覽版,這是一個可以讓用戶將AlloyDB for PostgreSQL、PostgreSQL、MySQL和Oracle等運營數(shù)據(jù)庫,順暢無縫復制資料到Google無服務器數(shù)據(jù)倉庫BigQuery的服務。

Google解釋了這項服務的適用場景,以零售業(yè)為例,每家連鎖分店都有自己的POS和庫存管理系統(tǒng),全天候收集商店交易和庫存資料,但為了要進一步分析這些連鎖分店的日常運營,提供更多的資料報表和統(tǒng)計資料協(xié)助分店運營,因此IT部門通常會在晚上設置批處理流程,以收集和集成分店的所有資料至中央數(shù)據(jù)倉庫,以便來得及在早上的時候,提供準備好的分析報表。

由于維護這個人信息料復制的程序,需要資料工程團隊付出許多心力,而且隨著分店規(guī)模以及需要處理的資料越來越多,這個負擔也會更重,復制資料時間也需要拉長,導致報表準備的時間越來越久。

而Datastream for BigQuery便是要解決這個問題,該服務可集成數(shù)據(jù)庫、分析和機器學習在同一個平臺中,供企業(yè)以大規(guī)模且高效的方式分析資料,受益于無服務器和自動擴展架構,Datastream讓用戶能夠簡單地配置ELT(Extract、Load、Transform)工作管線,執(zhí)行低延遲資料復制,以獲得即時資料分析結果。

Google提到,因為BigQuery的變更資料捕捉技術(CDC)以及Storage Write API的UPSERT新功能,因此Datastream可以高效地將更新直接從來源系統(tǒng),即時復制到BigQuery表格中,因此用戶也不需要花費資源構建工作管線,或是進行資料轉(zhuǎn)換等工作。

現(xiàn)在用戶只需要在BigQuery配置來源數(shù)據(jù)庫、連接類型和目的地,接下來Datastream便會處理剩余的工作,包括回填歷史資料,并且在資料更新出現(xiàn)在,持續(xù)地復制資料,當來源資料架構出現(xiàn)變化時,Datastream也能自動處理這些更改,將新表格和資料字段加入到BigQuery中。

立即登錄,閱讀全文
原文鏈接:點擊前往 >
版權說明:本文內(nèi)容來自于十輪網(wǎng),本站不擁有所有權,不承擔相關法律責任。文章內(nèi)容系作者個人觀點,不代表快出海對觀點贊同或支持。如有侵權,請聯(lián)系管理員(zzx@kchuhai.com)刪除!
優(yōu)質(zhì)服務商推薦
更多
掃碼登錄
打開掃一掃, 關注公眾號后即可登錄/注冊
加載中
二維碼已失效 請重試
刷新
賬號登錄/注冊
個人VIP
小程序
快出海小程序
公眾號
快出海公眾號
商務合作
商務合作
投稿采訪
投稿采訪
出海管家
出海管家