事件監(jiān)控和警報(bào)解決方案Prometheus,現(xiàn)在已經(jīng)成為監(jiān)控Kubernetes的標(biāo)準(zhǔn)配置,Google推出全托管Prometheus服務(wù),來(lái)滿足用戶的需求,解決用戶需要自行管理Prometheus或是Thanos堆棧的麻煩。
Google提到,雖然現(xiàn)在Kubernetes用戶,都會(huì)部署Prometheus來(lái)監(jiān)控系統(tǒng),但是要大規(guī)模管理Prometheus基礎(chǔ)設(shè)施存在挑戰(zhàn)。因此Google現(xiàn)在推出Prometheus全托管服務(wù),便是要來(lái)滿足企業(yè)對(duì)于監(jiān)控Kubernetes部署的需要,通過(guò)Prometheus服務(wù)來(lái)監(jiān)控大量指標(biāo)。
全托管Prometheus服務(wù)為一個(gè)Google云計(jì)算針對(duì)Prometheus指標(biāo),所創(chuàng)建的收集、存儲(chǔ)和查詢服務(wù),供用戶通過(guò)Prometheus接口,獲得全球可擴(kuò)展的監(jiān)控功能,并且同時(shí)維持開(kāi)源系統(tǒng)的兼容性和可移植性,目前這項(xiàng)服務(wù)仍在預(yù)覽階段,官方解釋,該服務(wù)構(gòu)建在Monarch之上,而Monarch是Google所開(kāi)發(fā)的全球規(guī)模內(nèi)存時(shí)間串行數(shù)據(jù)庫(kù),與Google用來(lái)監(jiān)控所有應(yīng)用程序使用的存儲(chǔ)系統(tǒng)相同。
全托管Prometheus服務(wù)讓用戶能夠使用Prometheus,監(jiān)控Kubernetes部署并發(fā)出警報(bào),且不需要用戶大規(guī)模手動(dòng)管理,或是操作Prometheus基礎(chǔ)設(shè)施。Google表示,這項(xiàng)服務(wù)可以直接作為T(mén)hanos或Cortex這類自我管理解決方案的替代品。
Google讓用戶能夠重用現(xiàn)有的Prometheus配置,來(lái)快速上手全托管Prometheus服務(wù),而且還可以選擇部署托管收集器,進(jìn)一步簡(jiǎn)化操作。Prometheus能夠用來(lái)監(jiān)控混合和多云環(huán)境,因此任何Prometheus可以運(yùn)行的地方,就能夠進(jìn)行監(jiān)控。
除了資料收集之外,用戶也可以將現(xiàn)有儀表板保留在Grafana中,PromQL為基礎(chǔ)的規(guī)則和警示都不需要額外修正查詢,Google提到,這代表用戶可以通過(guò)開(kāi)源兼容性接口,來(lái)維持可移植性,而這是專有托管解決方案通常不支持的部分。
全托管Prometheus服務(wù)創(chuàng)建在Google的全球可擴(kuò)展后端上,該服務(wù)收集了超過(guò)2萬(wàn)億活躍時(shí)間串行,幾乎可以支持用戶所有業(yè)務(wù)產(chǎn)生的任何指標(biāo)量。該系統(tǒng)支持在查詢時(shí),對(duì)地區(qū)存儲(chǔ)的原始指標(biāo)資料,進(jìn)行臨時(shí)全局聚合,而且用戶在默認(rèn)情況,可以獲得2年資料留存期,不需要支付額外費(fèi)用。
官方提到,與Google云計(jì)算其他監(jiān)控服務(wù)使用相同后端,代表著全托管Prometheus服務(wù)兼容于Cloud Monitoring,用戶可以在Cloud Monitoring中查詢Google云計(jì)算平臺(tái)指標(biāo),以及Prometheus托管服務(wù)指標(biāo)。