LinkedIn開源了Greykite函數(shù)庫,這是LinkedIn為滿足自家時間串行預測需求,而開發(fā)的Python函數(shù)庫,Greykite主要使用一個稱為Silverkite的算法,可以提供快速、準確且主動的預測結果,適合用于大規(guī)模且需要交互的預測應用。
時間串行預測可以用來預測,隨時間變化的指標以及各種數(shù)值,官方提到,雖然專家可以產(chǎn)生精確的預測,但是算法的自動化優(yōu)勢,可以帶來可擴展性和可重復性,而且還能提高準確度,下游算法也可以使用自動化產(chǎn)生的結果進行決策。
LinkedIn所開發(fā)的Greykite,包含了一個簡單的建模界面,可促進資料探索和模型調整,而Silverkite算法有很大的自定義空間,能夠調整參數(shù)以截取各種時間串行特征,輸出的結果也具可解釋性,能夠以可視化的方式反應趨勢、季節(jié)性和其他影響統(tǒng)計的要素。
官方提到,Silverkite對具有時間變化的趨勢、季節(jié)性和重復事件等時間串行預測效果很好,在LinkedIn中,他們已經(jīng)將其應用在每小時、每天和每周等各種時間頻率,以及短期與長期等時間范圍的指標預測上。
由于Greykite具有高度靈活特性,能提供趨勢、季節(jié)性、變化點(Changepoint)以及自動回歸等時間串行回歸功能,用戶可以按需求使用,并應用在選擇的機器學習模型上,而且Greykite有探索性圖表功能、調校模板和可解釋性預測,因此可提供用戶直觀的使用體驗,另外,Greykite高性能的特性,可以支持大規(guī)模快速雛形開發(fā)和部署。
LinkedIn在資源規(guī)劃、績效管理、優(yōu)化和分析生態(tài)系統(tǒng)等各種領域,廣泛地使用時間串行預測,像是預測高峰流量以準備足夠的基礎設施,或是用于設置業(yè)務指標,并且關注運營進度,還可以預測市場的增長,來優(yōu)化預算運用。官方提到,Greykite就很適合用于COVID-19疫情沖擊后,預測各國的恢復速度。
Greykite主要采用高度可自定的算法Silverkite,官方表示,Greykite能夠擴展支持多種算法,并通過單一界面進行基準測試,目前Greykite還支持臉書Prophet算法,LinkedIn預計未來還會支持更多開源算法。Greykite函數(shù)庫現(xiàn)在已于GitHub和PyPI上公開。