Druid是什么?Twitter應(yīng)用Druid都做了哪些?
Druid的主要特點(diǎn)是性能快,規(guī)模大,易用性好。
·性能可以達(dá)到1秒以下,真正實(shí)現(xiàn)了大數(shù)據(jù)的實(shí)時(shí)性計(jì)算;
·Druid單群可以擴(kuò)展至2000臺(tái)節(jié)點(diǎn)以上,很好的滿足了企業(yè)對(duì)大數(shù)據(jù)規(guī)模的要求;
·Druid的用戶界面非常友好,用戶常??梢酝ㄟ^(guò)拖拖拽拽進(jìn)行查詢,方便非技術(shù)類人員的應(yīng)用。
Twitter業(yè)務(wù)有很多實(shí)時(shí)的大數(shù)據(jù)需求,對(duì)比市場(chǎng)上現(xiàn)有的開(kāi)源方案,在穩(wěn)定性、擴(kuò)展性、性能和易用性方面Druid都有一定優(yōu)勢(shì)。
Twitter所有的user events都通過(guò)內(nèi)部Message Queue導(dǎo)入Druid,用戶可以實(shí)時(shí)對(duì)Druid進(jìn)行查詢,也可以在Druid基礎(chǔ)上設(shè)置各類的監(jiān)控和提醒。實(shí)時(shí)監(jiān)控很好的利用了Druid性能快和方便查詢的特性。
Twitter內(nèi)部用Druid很多,有三大類:其一,將用戶行為數(shù)據(jù)導(dǎo)入Druid,進(jìn)行實(shí)時(shí)用戶行為分析;其二,通過(guò)Druid為廣告商提供實(shí)時(shí)的廣告效果分析;其三,利用Druid的實(shí)時(shí)特性,做實(shí)時(shí)監(jiān)控和實(shí)時(shí)報(bào)表。
Druid是一個(gè)用于大數(shù)據(jù)實(shí)時(shí)查詢和分析的高容錯(cuò)、高性能開(kāi)源分布式系統(tǒng),旨在快速處理大規(guī)模的數(shù)據(jù),并能夠?qū)崿F(xiàn)快速查詢和分析。尤其是當(dāng)發(fā)生代碼部署、機(jī)器故障以及其他產(chǎn)品系統(tǒng)遇到宕機(jī)等情況時(shí),Druid仍能夠保持100%正常運(yùn)行。
Apache Druid社區(qū)在今年初發(fā)布了Druid 0.17.0。這是該項(xiàng)目自Apache Incubator畢業(yè)以來(lái)的第一個(gè)版本,因此也是一個(gè)重要的里程碑。
Twitter用Druid已經(jīng)有一年多了,從0.15到0.17,這幾個(gè)版本都比較穩(wěn)定,主要的變化有:
·設(shè)計(jì)并實(shí)現(xiàn)了Native Ingestion,徹底擺脫了對(duì)MapReduce的依賴,可以直接Ingest Parquet,ORC文件。
·Data Ingestion設(shè)計(jì)了Indexer Process。
·SQL功能持續(xù)加強(qiáng)。
·方便易用的用戶界面。
·更全面的Security and Privacy Support,例如LDAP Authentication and Authorization。