甲骨文(Oracle)數據倉庫分析工具MySQL HeatWave更新,除了強化自動機器學習(AutoML)功能,增加支持的機器學習用例,同時也擴展MySQL HeatWave的多云支持。
HeatWave是甲骨文的高性能MySQL查詢工具,使用戶能夠快速地查詢存儲在MySQL數據庫的資料,而HeatWave原本就有提供內置在數據庫中的原生機器學習服務,能夠直接執(zhí)行機器學習訓練、推理和解釋資料,提供自動訓練回歸、分類和單變量時間串行預測模型。
而本次MySQL HeatWave的新功能,甲骨文擴展HeatWave AutoML生命周期自動化,新支持多變量時間串行預測、非監(jiān)督異常偵測和推薦系統(tǒng),資料分析師可以不需要專業(yè)人員協助,就能以互動式控制臺,構建、訓練、執(zhí)行和解釋這些機器學習模型。
多變量時間串行預測是以過去多變量時間串行,預測未來資料變化的一種方法,像是可用于創(chuàng)建模型,預測冬季用電需求等,多變量時間串行有多種可用的預測算法,而挑選適合的算法并非一件簡單的工作,現在MySQL HeatWave所提供的AutoML,能夠預處理資料,并且自動選擇最適合的機器學習模型算法,還能自動調校模型。
官方提到,他們在自動化預測工作管線中,使用由高端時間串行預處理、算法選擇和超參數調校等多階段組成的專利技術,使得用戶可以不需要專業(yè)統(tǒng)計人員,就可以完成多變量時間串行預測。
MySQL HeatWave新支持的無監(jiān)督異常偵測,則可讓用戶能夠簡單地從未標記的資料集中,偵測不同類型的異常,官方解釋,有多種算法都能夠用于偵測資料異常,但是通常只能偵測特定類型的資料,因此當用戶不知道資料集中存在哪些異常資料,算法可能無法正確運行。
而MySQL HeatWave所生成的模型,能夠針對各類型的資料異常,執(zhí)行高精確度預測,而且該過程完全自動化,分析師不需要選擇算法、特征,也不用擔心超參數的數值。另外,MySQL HeatWave中的推薦系統(tǒng)現在也完全自動化,算法、特征和超參數優(yōu)化都不需要用戶決定。
甲骨文改進了在MySQL HeatWave與AWS服務的集成,MySQL HeatWave可在AWS上原生運行,并且提供S3優(yōu)化存儲層,當MySQL資料要加載至HeatWave時,系統(tǒng)會將資料復制到S3擴展資料管理層,好處是當需要資料恢復,重新加載資料到HeatWave時,多個HeatWave節(jié)點可以平行訪問資料,這大幅加速資料恢復速度和服務可用性,使得原本4 TB的HeatWave集群從S3恢復只要3.5分鐘,比從MySQL重新加載資料需時140分鐘要快上許多。
MySQL HeatWave控制臺開始支持MySQL自動形狀預測(Autopilot Auto-shape Prediction),該機器學習功能將會即時監(jiān)控OLTP工作負載,預測應用程序的執(zhí)行狀況和性能需求,根據歷史性能分析趨勢,像是吞吐量、緩沖區(qū)命中率,自動推薦適合的數據庫形狀。數據庫的形狀指得是數據庫執(zhí)行實例的配置,包括CPU、內存和存儲空間等。