Azure數(shù)據(jù)目錄是完全托管的云服務(wù)。有了它,用戶可以發(fā)現(xiàn)所需的數(shù)據(jù)源并理解所找到的數(shù)據(jù)源。同時(shí),數(shù)據(jù)目錄還可幫助組織從其現(xiàn)有投資中獲取更多價(jià)值。
借助數(shù)據(jù)目錄,任何用戶(分析人員、數(shù)據(jù)科學(xué)家或開發(fā)者)都可以發(fā)現(xiàn)、了解和使用數(shù)據(jù)源。數(shù)據(jù)目錄包含元數(shù)據(jù)和批注的眾包模型。它是供組織的所有用戶貢獻(xiàn)其知識(shí)和構(gòu)建數(shù)據(jù)社區(qū)和文化的一個(gè)集中位置。
數(shù)據(jù)使用者面臨的數(shù)據(jù)發(fā)現(xiàn)難題
一直以來(lái),發(fā)現(xiàn)企業(yè)數(shù)據(jù)源都是基于部落知識(shí)的有機(jī)過(guò)程。對(duì)于想要從其信息資產(chǎn)中獲取最大價(jià)值的公司,這種方法存在許多挑戰(zhàn):
·用戶可能并不知道數(shù)據(jù)源的存在,除非在另一個(gè)過(guò)程中與之接觸。不存在一個(gè)統(tǒng)一注冊(cè)數(shù)據(jù)源的位置。
·除非用戶知道數(shù)據(jù)源的位置,否則其無(wú)法使用客戶端應(yīng)用程序連接到數(shù)據(jù)。要使用數(shù)據(jù),用戶需要知道連接字符串或路徑。
·除非用戶知道數(shù)據(jù)源的文檔的位置,否則其無(wú)法了解數(shù)據(jù)的預(yù)期用途。數(shù)據(jù)源和文檔可能位于各種位置,并通過(guò)各種方式使用。
·如果用戶對(duì)信息資產(chǎn)有疑問(wèn),他們必須找到負(fù)責(zé)數(shù)據(jù)的專家或團(tuán)隊(duì),并在線下向其進(jìn)行咨詢。數(shù)據(jù)與對(duì)其用途持有特定觀點(diǎn)的專家之間沒(méi)有明顯聯(lián)系。
·除非用戶了解請(qǐng)求訪問(wèn)數(shù)據(jù)源的過(guò)程,否則,發(fā)現(xiàn)數(shù)據(jù)源及其文檔仍無(wú)助于訪問(wèn)數(shù)據(jù)。
數(shù)據(jù)生成者面臨的數(shù)據(jù)發(fā)現(xiàn)難題
雖然數(shù)據(jù)使用者面臨上述難題,負(fù)責(zé)生成和維護(hù)信息資產(chǎn)的用戶也面臨著自身的難題:
·使用描述性元數(shù)據(jù)批注數(shù)據(jù)源通常是徒勞的??蛻舳藨?yīng)用程序通常會(huì)忽略存儲(chǔ)在數(shù)據(jù)源中的說(shuō)明。
·為數(shù)據(jù)源創(chuàng)建文檔通常也是徒勞的。讓文檔與數(shù)據(jù)源保持同步是一項(xiàng)需要持續(xù)進(jìn)行的工作。用戶可能對(duì)視為過(guò)期的文檔缺少信任。
·創(chuàng)建和維護(hù)數(shù)據(jù)源的文檔非常復(fù)雜且耗時(shí)。為了讓使用數(shù)據(jù)源的每個(gè)用戶可隨時(shí)獲取文檔,面臨的挑戰(zhàn)可能更加艱巨。
·限制對(duì)數(shù)據(jù)源的訪問(wèn),確保數(shù)據(jù)使用者知道如何請(qǐng)求訪問(wèn)是一個(gè)持續(xù)性的挑戰(zhàn)。
這些挑戰(zhàn)共同形成巨大的障礙,使得公司難以鼓勵(lì)和推動(dòng)企業(yè)數(shù)據(jù)的使用及了解。
Azure數(shù)據(jù)目錄的幫助
數(shù)據(jù)目錄旨在解決這些問(wèn)題,并幫助企業(yè)充分利用現(xiàn)有的信息資產(chǎn)。數(shù)據(jù)目錄可幫助管理數(shù)據(jù)的用戶更輕松地發(fā)現(xiàn)和理解數(shù)據(jù)源。
數(shù)據(jù)目錄提供基于云的服務(wù),可在其中注冊(cè)數(shù)據(jù)源。數(shù)據(jù)保留在現(xiàn)有位置,但其元數(shù)據(jù)的副本將連同數(shù)據(jù)源位置的引用一起添加到數(shù)據(jù)目錄。此元數(shù)據(jù)還會(huì)編制索引,方便通過(guò)搜索功能輕松發(fā)現(xiàn)每個(gè)數(shù)據(jù)源,并讓發(fā)現(xiàn)數(shù)據(jù)源的用戶理解該數(shù)據(jù)源。
注冊(cè)數(shù)據(jù)源之后,可以充實(shí)其元數(shù)據(jù)。注冊(cè)數(shù)據(jù)源的用戶或企業(yè)中的其他用戶可以添加元數(shù)據(jù)。任何用戶都可以提供描述、標(biāo)記或其他元數(shù)據(jù)(例如請(qǐng)求數(shù)據(jù)源訪問(wèn)權(quán)限的文檔和過(guò)程)來(lái)批注數(shù)據(jù)源。此描述性元數(shù)據(jù)可補(bǔ)充從數(shù)據(jù)源注冊(cè)的結(jié)構(gòu)化元數(shù)據(jù)(例如列名和數(shù)據(jù)類型)。
注冊(cè)源的主要目的是發(fā)現(xiàn)和理解數(shù)據(jù)源及其用途。企業(yè)用戶可能需要用于商業(yè)智能、應(yīng)用程序開發(fā)、數(shù)據(jù)科學(xué)或需要正確數(shù)據(jù)的任何其他任務(wù)的數(shù)據(jù)。他們可以使用“數(shù)據(jù)目錄發(fā)現(xiàn)”體驗(yàn)快速查找符合其需求的數(shù)據(jù)、了解數(shù)據(jù)以評(píng)估其適用性,并通過(guò)在其所選工具中打開數(shù)據(jù)源來(lái)使用數(shù)據(jù)。
與此同時(shí),用戶還可通過(guò)對(duì)已注冊(cè)的數(shù)據(jù)源進(jìn)行標(biāo)記、記錄和批注來(lái)參與目錄。他們還可以注冊(cè)新的數(shù)據(jù)源,隨后目錄用戶的社區(qū)可以發(fā)現(xiàn)、了解和使用這些數(shù)據(jù)源。