什么是 Azure 開放數(shù)據(jù)集?如何使用它們?

來(lái)源: Microsoft Azure
作者:Microsoft Azure
時(shí)間:2020-12-03
17185
Azure開放數(shù)據(jù)集是精選公共數(shù)據(jù)集,可用于將方案專屬特征添加到機(jī)器學(xué)習(xí)解決方案,以提高模型的準(zhǔn)確度。

Azure開放數(shù)據(jù)集是精選公共數(shù)據(jù)集,可用于將方案專屬特征添加到機(jī)器學(xué)習(xí)解決方案,以提高模型的準(zhǔn)確度。開放數(shù)據(jù)集位于云中的Microsoft Azure上并已集成到Azure機(jī)器學(xué)習(xí)中,隨時(shí)可供Azure Databricks和機(jī)器學(xué)習(xí)工作室(經(jīng)典版)使用。也可以通過(guò)API訪問(wèn)數(shù)據(jù)集,并在Power BI和Azure數(shù)據(jù)工廠等其他產(chǎn)品中使用它們。

數(shù)據(jù)集包括不受任何限制的天氣、人口普查、節(jié)假日、公共安全和位置數(shù)據(jù),有助于定型機(jī)器學(xué)習(xí)模型和擴(kuò)充預(yù)測(cè)解決方案。還可以共享Azure開放數(shù)據(jù)集中的公共數(shù)據(jù)集。

open-datasets-components.png

Azure開放數(shù)據(jù)集組件

準(zhǔn)備的精選數(shù)據(jù)集

Azure開放數(shù)據(jù)集中的精選開放公共數(shù)據(jù)集更適合用于機(jī)器學(xué)習(xí)工作流。

若要查看所有可用的數(shù)據(jù)集,請(qǐng)參閱Azure開放數(shù)據(jù)集目錄。

數(shù)據(jù)科學(xué)家通常將大部分時(shí)間花在清理和準(zhǔn)備數(shù)據(jù)上,以執(zhí)行高級(jí)分析。為了節(jié)省你的時(shí)間,開放數(shù)據(jù)集復(fù)制到Azure云中,并經(jīng)過(guò)預(yù)處理。系統(tǒng)將按固定的間隔從源提取數(shù)據(jù),例如,通過(guò)與美國(guó)海洋與大氣管理局(NOAA)建立FTP連接來(lái)提取數(shù)據(jù)。接下來(lái),將數(shù)據(jù)分析成結(jié)構(gòu)化格式,然后使用各種特征(例如最靠近的氣象站的郵政編碼或位置)相應(yīng)地?cái)U(kuò)充這些數(shù)據(jù)。

數(shù)據(jù)集通過(guò)Azure中的云計(jì)算共同托管,簡(jiǎn)化了訪問(wèn)和操作。

下面展示了可用數(shù)據(jù)集示例。

微信圖片_20201203100558.png

訪問(wèn)數(shù)據(jù)集

借助Azure帳戶,可以使用代碼或通過(guò)Azure服務(wù)界面訪問(wèn)開放數(shù)據(jù)集。數(shù)據(jù)與Azure云計(jì)算資源共置在一起,以供用于機(jī)器學(xué)習(xí)解決方案。

開放數(shù)據(jù)集通過(guò)Azure機(jī)器學(xué)習(xí)UI和SDK提供。開放數(shù)據(jù)集還提供Azure Notebooks和Azure Databricks筆記本,可用于將數(shù)據(jù)連接到Azure機(jī)器學(xué)習(xí)和Azure Databricks。也可以通過(guò)Python SDK訪問(wèn)數(shù)據(jù)集。

不過(guò),無(wú)需使用Azure帳戶,即可訪問(wèn)開放數(shù)據(jù)集;可以在含或不含Spark的任意Python環(huán)境中訪問(wèn)它們。

請(qǐng)求獲取或參與數(shù)據(jù)集

如果找不到所需的數(shù)據(jù),請(qǐng)向我們發(fā)送電子郵件,以請(qǐng)求獲取數(shù)據(jù)集或參與數(shù)據(jù)集。

立即登錄,閱讀全文
版權(quán)說(shuō)明:
本文內(nèi)容來(lái)自于Microsoft Azure,本站不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。文章內(nèi)容系作者個(gè)人觀點(diǎn),不代表快出海對(duì)觀點(diǎn)贊同或支持。如有侵權(quán),請(qǐng)聯(lián)系管理員(zzx@kchuhai.com)刪除!
相關(guān)文章
Azure Arc為企業(yè)構(gòu)建安全的云基礎(chǔ)
Azure Arc為企業(yè)構(gòu)建安全的云基礎(chǔ)
隨著人工智能技術(shù)持續(xù)重塑企業(yè)運(yùn)營(yíng)方式,企業(yè)需要能夠處理海量數(shù)據(jù)的系統(tǒng),以支持實(shí)時(shí)洞察,同時(shí)幫助他們應(yīng)對(duì)跨IT和OT環(huán)境(包括云端、邊緣和本地)中運(yùn)營(yíng)、應(yīng)用、數(shù)據(jù)和基礎(chǔ)設(shè)施的協(xié)作難題。
Azure
微軟云
云服務(wù)
2024-12-172024-12-17
釋放.NET 9和Azure的AI技術(shù)與云計(jì)算潛力:更快、更智能、面向未來(lái)
釋放.NET 9和Azure的AI技術(shù)與云計(jì)算潛力:更快、更智能、面向未來(lái)
.NET 9現(xiàn)已正式發(fā)布,它為.NET平臺(tái)的發(fā)展掀開了嶄新的一頁(yè),突破了性能、云原生開發(fā)和AI技術(shù)集成的邊界。
Azure
微軟云
云服務(wù)
2024-12-162024-12-16
Azure網(wǎng)絡(luò)管理現(xiàn)已具備智能Microsoft Copilot副駕駛能力
Azure網(wǎng)絡(luò)管理現(xiàn)已具備智能Microsoft Copilot副駕駛能力
智能Microsoft Copilot副駕駛for Azure網(wǎng)絡(luò)服務(wù)現(xiàn)已推出公共預(yù)覽版。
Azure
微軟云
云服務(wù)
2024-12-102024-12-10
Microsoft Fabric功能更新,借助AI驅(qū)動(dòng)的數(shù)據(jù)平臺(tái)加速應(yīng)用創(chuàng)新
Microsoft Fabric功能更新,借助AI驅(qū)動(dòng)的數(shù)據(jù)平臺(tái)加速應(yīng)用創(chuàng)新
一年前,我們正式推出了一款端到端數(shù)據(jù)平臺(tái),旨在幫助組織推動(dòng)人工智能轉(zhuǎn)型,并重新定義數(shù)據(jù)的連接、管理和分析方式。
Azure
微軟云
云服務(wù)
2024-12-092024-12-09
掃碼登錄
打開掃一掃, 關(guān)注公眾號(hào)后即可登錄/注冊(cè)
加載中
二維碼已失效 請(qǐng)重試
刷新
賬號(hào)登錄/注冊(cè)
個(gè)人VIP
小程序
快出海小程序
公眾號(hào)
快出海公眾號(hào)
商務(wù)合作
商務(wù)合作
投稿采訪
投稿采訪
出海管家
出海管家