我們很高興地宣布
Azure Databricks
已在中國Azure北三區(qū)正式開放使用!
Azure Databricks是Azure云平臺上的第一方服務(wù),用于構(gòu)建、部署、共享和維護企業(yè)級的數(shù)據(jù)解決方案,幫助用戶進行大規(guī)模數(shù)據(jù)處理和使用機器學(xué)習(xí)。
Azure Databricks與Azure云平臺緊密結(jié)合,在Azure上通過PaaS方式提供服務(wù),按需計費,幫助用戶快速上線,解鎖數(shù)據(jù)價值。目前所有Azure的用戶都可以直接通過Azure Portal在北三區(qū)開通Azure Databricks服務(wù)。
Azure Databricks服務(wù)具有眾多優(yōu)點,包括:
1 新一代Lakehouse湖倉架構(gòu)
Databricks Lakehouse將數(shù)倉ACID事務(wù)和數(shù)據(jù)治理與數(shù)據(jù)湖的靈活性和成本效益相結(jié)合,以開源數(shù)據(jù)標(biāo)準將數(shù)據(jù)保存在對象存儲中,方便了數(shù)據(jù)的隨時調(diào)用,全面激活數(shù)據(jù)商業(yè)智能(BI)和機器學(xué)習(xí)(ML)。
2 性能強大
提供最新Photon Runtime高性能運行時,與Apache Spark API兼容,能夠更快地運行SQL和DataFrame API調(diào)用,降低總成本。
3 開源對接
提供最新版本的Apache Spark,用戶可以與開源代碼庫無縫集成。
4 快速啟動
可以在幾分鐘內(nèi)輕松設(shè)置和使用,無需擔(dān)心硬件和基礎(chǔ)架構(gòu)的問題。
5 簡化部署
自動化Spark集群的創(chuàng)建管理,讓開發(fā)人員專注數(shù)據(jù)處理和機器學(xué)習(xí)任務(wù)。
6 一站式集成
與其他Azure服務(wù)優(yōu)化集成,如Azure Blob存儲、Azure SQL數(shù)據(jù)庫、Azure Data Lake及Azure Synapse Analytics等。用戶可以輕松地將數(shù)據(jù)存儲在云中,并使用其他服務(wù)進行分析,滿足各種類型的數(shù)據(jù)工作負載。
7 全面的語言和框架支持
支持Python、Scala、R、Java和SQL,以及數(shù)據(jù)科學(xué)框架和庫,包括TensorFlow、PyTorch和scikit-learn等。
8 全面的安全、身份認證和訪問控制
基于Azure企業(yè)級的安全防護,與Azure活動目錄(Azure AD)集成,提供基于角色的訪問控制,無需拼接單獨的身份驗證方案,且身份和訪問管理可擴展到解決方案內(nèi)的其他Azure服務(wù)。Azure Databricks還支持用戶在Azure Key Vault安全存儲、管理保密信息,降低安全信息丟失的可能性。
Azure Databricks的使用場景也多種多樣,全面支持數(shù)據(jù)開發(fā)人員。Azure Databricks的常見使用場景包括:
構(gòu)建企業(yè)級數(shù)據(jù)湖倉
ETL和數(shù)據(jù)工程
機器學(xué)習(xí)、人工智能和數(shù)據(jù)科學(xué)
數(shù)據(jù)倉庫、分析和BI
數(shù)據(jù)治理和安全數(shù)據(jù)共享
DevOps、CI/CD和任務(wù)編排
實時和流數(shù)據(jù)分析
所有Azure用戶從即日起即可馬上登錄Azure門戶,創(chuàng)建新的Azure Databricks Workspace(工作區(qū))。在創(chuàng)建工作區(qū)后,就可使用Azure Databricks來開展數(shù)據(jù)處理和機器學(xué)習(xí)工作。
Azure Databricks是一個經(jīng)濟高效、功能強大的平臺,每天都在幫助全球的開發(fā)人員高效地進行大規(guī)模數(shù)據(jù)處理和機器學(xué)習(xí)。
Azure Databricks是Hadoop及所有Databricks工作負載的最佳遷移上云目的地,同時也大力增強了機器學(xué)習(xí)對大數(shù)據(jù)的處理能力。只需幾次點擊,數(shù)據(jù)團隊就可以建立Azure Databricks工作區(qū),立即開始跨團隊協(xié)作,收獲大數(shù)據(jù)的商業(yè)價值。