BigQuery可通過創(chuàng)建搜索索引,快速搜索非結(jié)構(gòu)化與半結(jié)構(gòu)化資料

來源: 十輪網(wǎng)
作者:十輪網(wǎng)
時(shí)間:2022-04-12
10173
Google在其云計(jì)算數(shù)據(jù)倉庫BigQuery加入搜索索引以及相關(guān)的SQL搜索函數(shù),讓用戶可以使用標(biāo)準(zhǔn)的BigQuery SQL,高速搜索非結(jié)構(gòu)化文本和半結(jié)構(gòu)JSON文件中,所存在的唯一資料元素。

pinpoint_unique_elements_with_bigquery_search_features.jpg

Google在其云計(jì)算數(shù)據(jù)倉庫BigQuery加入搜索索引以及相關(guān)的SQL搜索函數(shù),讓用戶可以使用標(biāo)準(zhǔn)的BigQuery SQL,高速搜索非結(jié)構(gòu)化文本和半結(jié)構(gòu)JSON文件中,所存在的唯一資料元素。搜索索引為無服務(wù)器服務(wù),并且完全由BigQuery管理,只要資料在BigQuery中可以使用,用戶就能利用新的搜索功能進(jìn)行資料檢索。

Google表示,這項(xiàng)BigQuery新功能讓用戶可以在單一資料平臺中,對欄式存儲和文本進(jìn)行搜索,可在用戶查詢資料列,而非聚合資料時(shí),發(fā)揮極大的性能和成本效益。像是識別特定用戶相關(guān)聯(lián)的資料列,以用于GDPR報(bào)告,或是從文本中尋找特定錯(cuò)誤碼,都可以利用該功能快速完成搜索工作。

BigQuery搜索索引功能,能夠避免觸發(fā)繁重的表格掃描工作,官方解釋,搜索索引主要采用反向索引(Reverse Index)技術(shù)來加速資料點(diǎn)的查詢。BigQuery通過反向索引,能夠深入了解特定資料元素在表格底層存儲的位置,因?yàn)橘Y料經(jīng)過標(biāo)記,因此在區(qū)分大小寫等細(xì)微差異的文本搜索上,比SQL具有更大的靈活性。

BigQuery現(xiàn)在能對超大量的文本資料進(jìn)行搜索,像是用戶可以將本地端、多云平臺和Kubernetes中的日志記錄,全部匯集到BigQuery中,快速地查詢特定資料元素。與其他的BigQuery功能相同,搜索索引是全托管功能,一旦用戶創(chuàng)建了索引,BigQuery便會在后臺處理剩余的工作。

同時(shí),搜索索引也能夠搜索半結(jié)構(gòu)化資料,Google提到,安全日志來自多個(gè)來源,具有不同的架構(gòu)、類型,而用戶現(xiàn)在可以將這些日志存儲成JSON,并且在BigQuery中使用SQL進(jìn)行查詢。

BigQuery搜索索引功能不額外收取費(fèi)用,但是用戶需要對索引所使用的存儲支付費(fèi)用,Google表示,適當(dāng)?shù)氖褂盟阉魉饕δ?,查詢掃描的資料將大幅減少,進(jìn)而節(jié)省成本。Google舉例,要從PB級的資料中,刪除所有Bob的資料,過去用戶可能需要掃描TB大小的表格,才能找到其中10筆包含Bob的記錄,而現(xiàn)在通過在BigQuery表格增加索引,就僅會觸及包含Bob的資料列子集,因而大幅降低成本。

立即登錄,閱讀全文
版權(quán)說明:
本文內(nèi)容來自于十輪網(wǎng),本站不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。文章內(nèi)容系作者個(gè)人觀點(diǎn),不代表快出海對觀點(diǎn)贊同或支持。如有侵權(quán),請聯(lián)系管理員(zzx@kchuhai.com)刪除!
相關(guān)文章
新版GKE可管理最多6.5萬集群節(jié)點(diǎn),超越AWS、Azure 10倍
新版GKE可管理最多6.5萬集群節(jié)點(diǎn),超越AWS、Azure 10倍
Google Cloud公布最新Google Kubernetes Engine版本,號稱可支持最高達(dá)65,000個(gè)節(jié)點(diǎn)的服務(wù)器集群,以執(zhí)行超大型AI模型。
Google Cloud
云服務(wù)
云計(jì)算
2024-11-152024-11-15
Google Cloud細(xì)說AI變現(xiàn)途徑:用戶一年暴增10倍
Google Cloud細(xì)說AI變現(xiàn)途徑:用戶一年暴增10倍
Google云計(jì)算平臺(Google Cloud)首席執(zhí)行官Thomas Kurian在高盛舉行的會議上,說明了該公司究竟是通過哪些途徑將AI變現(xiàn)。
Google Cloud
谷歌云
云計(jì)算
2024-09-132024-09-13
云計(jì)算平臺GCP的服務(wù)存在權(quán)限提升漏洞,未經(jīng)授權(quán)的攻擊者可借此訪問敏感數(shù)據(jù)
云計(jì)算平臺GCP的服務(wù)存在權(quán)限提升漏洞,未經(jīng)授權(quán)的攻擊者可借此訪問敏感數(shù)據(jù)
7月24日安全企業(yè)Tenable披露影響Google Cloud Platform(GCP)的權(quán)限提升漏洞ConfusedFunction,這項(xiàng)弱點(diǎn)發(fā)生在名為Cloud Functions的無服務(wù)器運(yùn)算服務(wù),以及稱作Cloud Build的CICD渠道服務(wù)。
Google Cloud
谷歌云
云計(jì)算
2024-07-272024-07-27
Gemini為核心,Google云計(jì)算AI戰(zhàn)略聚焦云服務(wù)和生產(chǎn)力GAI
Gemini為核心,Google云計(jì)算AI戰(zhàn)略聚焦云服務(wù)和生產(chǎn)力GAI
過去一年,企業(yè)GAI應(yīng)用的風(fēng)潮席卷全球,成了三大公有云積極搶攻的新戰(zhàn)場,微軟靠著OpenAI助攻,去年在這場云計(jì)算GAI大戰(zhàn)中取得先機(jī),而Google后來居上,靠著自家PaLM模型和GAI生產(chǎn)力工具來迎戰(zhàn),AWS則是到去年底年會上,對于企業(yè)GAI應(yīng)用布局才有比較完整的布局與披露。
Google Cloud
谷歌云
云計(jì)算
2024-05-042024-05-04
優(yōu)質(zhì)服務(wù)商推薦
更多