Azure Data Lake Storage Gen2 簡(jiǎn)介

來(lái)源: Microsoft Azure
作者:Microsoft Azure
時(shí)間:2021-01-27
17864
Azure Data Lake Storage Gen2是一組專(zhuān)用于大數(shù)據(jù)分析的功能,以Azure Blob存儲(chǔ)為基礎(chǔ)而構(gòu)建。

Azure Data Lake Storage Gen2是一組專(zhuān)用于大數(shù)據(jù)分析的功能,以Azure Blob存儲(chǔ)為基礎(chǔ)而構(gòu)建。

專(zhuān)為企業(yè)大數(shù)據(jù)分析而設(shè)計(jì)

Data Lake Storage Gen2使Azure存儲(chǔ)成為在A(yíng)zure上構(gòu)建企業(yè)Data Lake的基礎(chǔ)。Data Lake Storage Gen2從一開(kāi)始就設(shè)計(jì)為存儲(chǔ)數(shù)千萬(wàn)億字節(jié)的信息,同時(shí)保持?jǐn)?shù)百千兆位的吞吐量,允許你輕松管理大量數(shù)據(jù)。

Data Lake Storage Gen2的一個(gè)基本部分是向Blob存儲(chǔ)添加分層命名空間。分層命名空間將對(duì)象/文件組織到目錄層次結(jié)構(gòu)中,以便進(jìn)行有效的數(shù)據(jù)訪(fǎng)問(wèn)。常見(jiàn)的對(duì)象存儲(chǔ)命名約定在名稱(chēng)中使用斜杠來(lái)模擬分層目錄結(jié)構(gòu)。這種結(jié)構(gòu)在Data Lake Storage Gen2中得以真正實(shí)現(xiàn)。重命名或刪除目錄等操作會(huì)成為目錄上的單個(gè)原子元數(shù)據(jù)操作。無(wú)需枚舉和處理共享目錄名稱(chēng)前綴的所有對(duì)象。

Data Lake Storage Gen2在Blob存儲(chǔ)的基礎(chǔ)上構(gòu)建,并通過(guò)以下方式增強(qiáng)了性能、管理和安全性:

優(yōu)化了性能,因?yàn)槟悴恍枰獙?fù)制或轉(zhuǎn)換數(shù)據(jù)作為分析的先決條件。與Blob存儲(chǔ)上的平面命名空間相比,分層命名空間極大地提高了目錄管理操作的性能,從而提高了整體作業(yè)性能。

管理更為容易,因?yàn)槟憧梢酝ㄟ^(guò)目錄和子目錄來(lái)組織和操作文件。

安全性是可以強(qiáng)制實(shí)施的,因?yàn)榭梢栽谀夸浕騿蝹€(gè)文件上定義POSIX權(quán)限。

另外,Data Lake Storage Gen2非常經(jīng)濟(jì)高效,因?yàn)樗鼧?gòu)建在低成本的Azure Blob存儲(chǔ)之上。這些新增功能進(jìn)一步降低了在A(yíng)zure上運(yùn)行大數(shù)據(jù)分析的總擁有成本。

Data Lake Storage Gen2的主要功能

Hadoop兼容訪(fǎng)問(wèn):使用Data Lake Storage Gen2,可以像使用Hadoop分布式文件系統(tǒng)(HDFS)一樣管理和訪(fǎng)問(wèn)數(shù)據(jù)。新的ABFS驅(qū)動(dòng)程序(用于訪(fǎng)問(wèn)數(shù)據(jù))在所有Apache Hadoop環(huán)境中都可用。這些環(huán)境包括Azure HDInsight、Azure Databricks和Azure Synapse Analytics。

POSIX權(quán)限的超集:Data Lake Gen2的安全模型支持ACL和POSIX權(quán)限,以及特定于Data Lake Storage Gen2的一些額外粒度??梢酝ㄟ^(guò)存儲(chǔ)資源管理器或Hive和Spark等框架來(lái)配置設(shè)置。

經(jīng)濟(jì)高效:Data Lake Storage Gen2提供了低成本的存儲(chǔ)容量和事務(wù)。Azure Blob存儲(chǔ)生命周期等功能可在數(shù)據(jù)在其生命周期中進(jìn)行轉(zhuǎn)換時(shí)優(yōu)化成本。

優(yōu)化的驅(qū)動(dòng)程序:ABFS驅(qū)動(dòng)程序已針對(duì)大數(shù)據(jù)分析進(jìn)行專(zhuān)門(mén)優(yōu)化。相應(yīng)的REST API通過(guò)終結(jié)點(diǎn)dfs.core.chinacloudapi.cn進(jìn)行顯示。

可伸縮性

按照設(shè)計(jì),無(wú)論是通過(guò)Data Lake Storage Gen2還是Blob存儲(chǔ)接口進(jìn)行訪(fǎng)問(wèn),Azure存儲(chǔ)都可自如縮放。它可以存儲(chǔ)和處理許多百億億字節(jié)的數(shù)據(jù)。這種存儲(chǔ)量可用于在每秒高級(jí)別的輸入/輸出操作(IOPS)下以每秒千兆位(Gbps)的速度測(cè)量的吞吐量。會(huì)根據(jù)在服務(wù)、帳戶(hù)和文件級(jí)別上測(cè)量的近乎持續(xù)的按請(qǐng)求度量的延遲來(lái)進(jìn)行處理。

成本效益

因?yàn)镈ata Lake Storage Gen2是在A(yíng)zure Blob存儲(chǔ)基礎(chǔ)之上構(gòu)建的,所以存儲(chǔ)容量和事務(wù)成本較低。不同于其他云存儲(chǔ)服務(wù),在分析數(shù)據(jù)之前,無(wú)需移動(dòng)或轉(zhuǎn)換數(shù)據(jù)。有關(guān)定價(jià)的詳細(xì)信息,請(qǐng)參閱Azure存儲(chǔ)定價(jià)。

此外,分層命名空間等功能可顯著提高許多分析作業(yè)的整體性能。這一性能方面的提升意味著你需要較少的計(jì)算能力來(lái)處理相同數(shù)量的數(shù)據(jù),從而降低端到端分析作業(yè)的總擁有成本(TCO)。

一個(gè)服務(wù),多個(gè)概念

因?yàn)镈ata Lake Storage Gen2是在A(yíng)zure Blob存儲(chǔ)基礎(chǔ)之上構(gòu)建的,所以可以使用多個(gè)概念來(lái)描述相同的共享內(nèi)容。

以下是不同概念所描述的等效實(shí)體。除非另有說(shuō)明,否則這些實(shí)體是直接同義的:

一個(gè)服務(wù),多個(gè)概念

微信圖片_20210127102706.png

支持的Blob存儲(chǔ)功能

你的帳戶(hù)現(xiàn)在可使用診斷日志記錄、訪(fǎng)問(wèn)層和Blob存儲(chǔ)生命周期管理策略等Blob存儲(chǔ)功能。

有關(guān)受支持的Blob存儲(chǔ)功能的列表,請(qǐng)參閱Azure Data Lake storage Gen2中提供的Blob存儲(chǔ)功能。

支持的Azure服務(wù)集成

Data Lake Storage gen2支持多個(gè)Azure服務(wù)。可以使用它們來(lái)引入數(shù)據(jù)、執(zhí)行分析和創(chuàng)建可視化表示形式。有關(guān)受支持的Azure服務(wù)的列表,請(qǐng)參閱支持Azure Data Lake Storage Gen2的Azure服務(wù)。

支持的開(kāi)源平臺(tái)

多個(gè)開(kāi)源平臺(tái)支持Data Lake Storage Gen2。有關(guān)完整列表,請(qǐng)參閱支持Azure Data Lake Storage Gen2的開(kāi)源平臺(tái)。

立即登錄,閱讀全文
版權(quán)說(shuō)明:
本文內(nèi)容來(lái)自于Microsoft Azure,本站不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。文章內(nèi)容系作者個(gè)人觀(guān)點(diǎn),不代表快出海對(duì)觀(guān)點(diǎn)贊同或支持。如有侵權(quán),請(qǐng)聯(lián)系管理員(zzx@kchuhai.com)刪除!
相關(guān)文章
Azure Arc為企業(yè)構(gòu)建安全的云基礎(chǔ)
Azure Arc為企業(yè)構(gòu)建安全的云基礎(chǔ)
隨著人工智能技術(shù)持續(xù)重塑企業(yè)運(yùn)營(yíng)方式,企業(yè)需要能夠處理海量數(shù)據(jù)的系統(tǒng),以支持實(shí)時(shí)洞察,同時(shí)幫助他們應(yīng)對(duì)跨IT和OT環(huán)境(包括云端、邊緣和本地)中運(yùn)營(yíng)、應(yīng)用、數(shù)據(jù)和基礎(chǔ)設(shè)施的協(xié)作難題。
Azure
微軟云
云服務(wù)
2024-12-172024-12-17
釋放.NET 9和Azure的AI技術(shù)與云計(jì)算潛力:更快、更智能、面向未來(lái)
釋放.NET 9和Azure的AI技術(shù)與云計(jì)算潛力:更快、更智能、面向未來(lái)
.NET 9現(xiàn)已正式發(fā)布,它為.NET平臺(tái)的發(fā)展掀開(kāi)了嶄新的一頁(yè),突破了性能、云原生開(kāi)發(fā)和AI技術(shù)集成的邊界。
Azure
微軟云
云服務(wù)
2024-12-162024-12-16
Azure網(wǎng)絡(luò)管理現(xiàn)已具備智能Microsoft Copilot副駕駛能力
Azure網(wǎng)絡(luò)管理現(xiàn)已具備智能Microsoft Copilot副駕駛能力
智能Microsoft Copilot副駕駛for Azure網(wǎng)絡(luò)服務(wù)現(xiàn)已推出公共預(yù)覽版。
Azure
微軟云
云服務(wù)
2024-12-102024-12-10
Microsoft Fabric功能更新,借助AI驅(qū)動(dòng)的數(shù)據(jù)平臺(tái)加速應(yīng)用創(chuàng)新
Microsoft Fabric功能更新,借助AI驅(qū)動(dòng)的數(shù)據(jù)平臺(tái)加速應(yīng)用創(chuàng)新
一年前,我們正式推出了一款端到端數(shù)據(jù)平臺(tái),旨在幫助組織推動(dòng)人工智能轉(zhuǎn)型,并重新定義數(shù)據(jù)的連接、管理和分析方式。
Azure
微軟云
云服務(wù)
2024-12-092024-12-09
優(yōu)質(zhì)服務(wù)商推薦
更多
掃碼登錄
打開(kāi)掃一掃, 關(guān)注公眾號(hào)后即可登錄/注冊(cè)
加載中
二維碼已失效 請(qǐng)重試
刷新
賬號(hào)登錄/注冊(cè)
個(gè)人VIP
小程序
快出海小程序
公眾號(hào)
快出海公眾號(hào)
商務(wù)合作
商務(wù)合作
投稿采訪(fǎng)
投稿采訪(fǎng)
出海管家
出海管家