當(dāng)數(shù)字經(jīng)濟(jì)成為社會(huì)發(fā)展的主旋律,數(shù)據(jù)可以說是支撐業(yè)務(wù)創(chuàng)新的源動(dòng)力,能否充分發(fā)揮數(shù)據(jù)價(jià)值反映了一家企業(yè)達(dá)成數(shù)字化轉(zhuǎn)型的程度與質(zhì)量,尤其是隨著越來越多的生產(chǎn)系統(tǒng)和業(yè)務(wù)系統(tǒng)走上云端、邁向智能化,如何挖掘數(shù)據(jù)、理解數(shù)據(jù)、管好數(shù)據(jù)就成了重中之重。以數(shù)據(jù)治理為例,從過去的IT為先逐漸向業(yè)務(wù)層面滲透,讓數(shù)據(jù)治理項(xiàng)目能夠?yàn)槠髽I(yè)貢獻(xiàn)可持續(xù)的經(jīng)濟(jì)效益?!皵?shù)據(jù)治理已成為一種剛需,原來出報(bào)表的時(shí)候沒有數(shù)據(jù)治理工具也能做,但是現(xiàn)在有些數(shù)據(jù)是難以理解的,不知道到哪里去找數(shù)據(jù),不清楚數(shù)據(jù)與業(yè)務(wù)有什么關(guān)系。”四川省稅務(wù)局大數(shù)據(jù)風(fēng)險(xiǎn)管理局大數(shù)據(jù)平臺(tái)技術(shù)專家肖斌說。
IBM幫助四川稅務(wù)局實(shí)現(xiàn)“以數(shù)治稅”
去年3月,中共中央辦公廳、國務(wù)院辦公廳印發(fā)了《關(guān)于進(jìn)一步深化稅收征管改革的意見》,指出要加快推進(jìn)智慧稅務(wù)建設(shè),充分運(yùn)用大數(shù)據(jù)、云計(jì)算、人工智能、移動(dòng)互聯(lián)網(wǎng)等現(xiàn)代信息技術(shù),著力推進(jìn)內(nèi)外部涉稅數(shù)據(jù)匯聚聯(lián)通、線上線下有機(jī)貫通,驅(qū)動(dòng)稅務(wù)執(zhí)法、服務(wù)、監(jiān)管制度創(chuàng)新和業(yè)務(wù)變革,進(jìn)一步優(yōu)化組織體系和資源配置。在稅收征管數(shù)字化升級(jí)和智能化改造的過程中,國家稅務(wù)總局四川省稅務(wù)局積極響應(yīng),并推行了一系列舉措。
打破數(shù)據(jù)的煙囪化壁壘
不過,要想全面實(shí)現(xiàn)“以數(shù)治稅”并不容易。傳統(tǒng)的稅務(wù)系統(tǒng)業(yè)務(wù)模式較為固化,分散式、手工式、信息化程度低,缺乏系統(tǒng)性的建設(shè)思路和科學(xué)的服務(wù)工具。此外,還要構(gòu)建起總局、省局兩級(jí)數(shù)據(jù)管理體系,建立系統(tǒng)化的數(shù)據(jù)應(yīng)用體系,打造多層級(jí)的數(shù)據(jù)服務(wù)體系,實(shí)施一體化數(shù)據(jù)調(diào)度和統(tǒng)一的標(biāo)準(zhǔn)規(guī)范體系,用“互聯(lián)網(wǎng)+”大數(shù)據(jù)加強(qiáng)稅收風(fēng)險(xiǎn)管理,建立統(tǒng)一的數(shù)據(jù)應(yīng)用平臺(tái),實(shí)現(xiàn)數(shù)據(jù)高效共享服務(wù)。
肖斌所在的稅收大數(shù)據(jù)風(fēng)險(xiǎn)管理局,是國家稅務(wù)總局主管組織指導(dǎo)全國稅收大數(shù)據(jù)和風(fēng)險(xiǎn)管理相關(guān)工作的機(jī)構(gòu)。過去,四川稅務(wù)局的各單位機(jī)構(gòu)自建系統(tǒng)沒有統(tǒng)一數(shù)據(jù)標(biāo)準(zhǔn),數(shù)據(jù)質(zhì)量參差不齊,盡管用戶擁有海量數(shù)據(jù),但數(shù)據(jù)和業(yè)務(wù)知識(shí)之間的關(guān)聯(lián)還比較弱,沒有把數(shù)據(jù)和業(yè)務(wù)知識(shí)體系關(guān)聯(lián)起來,難以做到數(shù)據(jù)與業(yè)務(wù)知識(shí)之間的快速轉(zhuǎn)換,不能對(duì)數(shù)據(jù)進(jìn)行自主的探索和挖掘,數(shù)據(jù)的深層價(jià)值難以體現(xiàn),沒有形成知識(shí)圖譜。
在國家稅務(wù)總局金稅四期的背景下,四川省稅務(wù)局大數(shù)據(jù)風(fēng)險(xiǎn)管理局對(duì)省級(jí)數(shù)據(jù)進(jìn)行了管理,涉及分散各處、不同時(shí)期的70多個(gè)數(shù)據(jù)庫。起初,大數(shù)據(jù)風(fēng)險(xiǎn)管理局花了兩年時(shí)間把這些數(shù)據(jù)分門別類的匯聚到大數(shù)據(jù)平臺(tái)上,所遇到的問題之一就是一部分歷史數(shù)據(jù)的內(nèi)容和業(yè)務(wù)含義已經(jīng)無從辨別,有些數(shù)據(jù)甚至要追溯到七、八年前。同時(shí),此前合作的數(shù)據(jù)公司并未給出系統(tǒng)的要求和規(guī)范,導(dǎo)致該局的數(shù)據(jù)平臺(tái)缺少必要的邏輯模型、物理模型,難以形成一套完整的數(shù)據(jù)知識(shí)體系。
“我們的職責(zé)除了匯聚數(shù)據(jù),還要為各個(gè)業(yè)務(wù)處室、基層提供一些數(shù)據(jù)服務(wù),當(dāng)對(duì)方提出一個(gè)數(shù)據(jù)需求時(shí),我們就要去找這個(gè)數(shù)據(jù)放在什么地方,如果是在一張表上,那么各個(gè)表之間的關(guān)系是什么,有什么邏輯,字段有什么特殊含義,都要提取出來?!毙け笳劦剑拔覀兊臄?shù)據(jù)治理以前就是‘口口相傳’,大概問一下以前運(yùn)維的公司,看看數(shù)據(jù)在哪個(gè)地方,在系統(tǒng)里面的功能,功能里面有哪個(gè)表等等,主要是通過員工來慢慢積累數(shù)據(jù)。但如果換了一批員工就又不知道了,會(huì)反復(fù)出現(xiàn)這樣的問題?!?/p>
建立數(shù)據(jù)與業(yè)務(wù)知識(shí)的聯(lián)系
據(jù)悉,四川省稅務(wù)局希望實(shí)現(xiàn)元數(shù)據(jù)標(biāo)準(zhǔn)化體系,集成現(xiàn)有的元數(shù)據(jù)管理系統(tǒng),建立統(tǒng)一的數(shù)據(jù)資產(chǎn)目錄,持續(xù)提升數(shù)據(jù)質(zhì)量,對(duì)數(shù)據(jù)消費(fèi)實(shí)現(xiàn)自服務(wù),提升效率。此外,建立完整的數(shù)據(jù)治理體系,掌握資產(chǎn)之間關(guān)系,了解數(shù)據(jù)的來源和去向。借助IBM Watson Knowledge Catalog(IBM WKC),四川省稅務(wù)局構(gòu)建了數(shù)據(jù)知識(shí)體系,把表、證、單、書等數(shù)據(jù)與業(yè)務(wù)進(jìn)行關(guān)聯(lián),在征管規(guī)范之下幫助業(yè)務(wù)人員和IT人員看懂?dāng)?shù)據(jù)的含義,掌握了元數(shù)據(jù)的關(guān)聯(lián)和管理能力。
對(duì)于大量的歷史業(yè)務(wù)系統(tǒng)和持續(xù)增長的生產(chǎn)業(yè)務(wù)系統(tǒng),四川省稅務(wù)局建立了統(tǒng)一的數(shù)字資產(chǎn)目錄,對(duì)每個(gè)系統(tǒng)進(jìn)行統(tǒng)一管理。同時(shí),根據(jù)定義的業(yè)務(wù)規(guī)則提升數(shù)據(jù)質(zhì)量,對(duì)有問題的數(shù)據(jù)進(jìn)行生產(chǎn)評(píng)估或進(jìn)行標(biāo)記。通過數(shù)據(jù)知識(shí)體系指導(dǎo)數(shù)據(jù)消費(fèi),四川省稅務(wù)局對(duì)數(shù)據(jù)安全有了更明確的分級(jí)管理,利用數(shù)據(jù)治理工具對(duì)數(shù)據(jù)進(jìn)行高、中、低的敏感度定義,為其他系統(tǒng)調(diào)用該數(shù)據(jù)時(shí)提供參考和權(quán)限設(shè)置。IBM WKC內(nèi)置了豐富的數(shù)字資產(chǎn)類型,可以快速表達(dá)業(yè)務(wù)數(shù)據(jù)之間的關(guān)系,通過可視化的方式進(jìn)行展現(xiàn)。
“我們使用了Apache Atlas,在Hadoop架構(gòu)中,Atlas在創(chuàng)建復(fù)雜的表時(shí)會(huì)自動(dòng)記錄血緣關(guān)系,IBM WKC則會(huì)讀取這些關(guān)系。在選型的過程中,我們使用了一些產(chǎn)品,發(fā)現(xiàn)IBM WKC自動(dòng)形成的數(shù)據(jù)知識(shí)圖譜,可以把表、證、單、書和征管規(guī)范等信息的關(guān)系進(jìn)行圖形展示,包括物理模型、邏輯模型、血緣關(guān)系等等。”肖斌表示,“現(xiàn)在整個(gè)數(shù)據(jù)治理環(huán)節(jié)已經(jīng)打通了,后續(xù)還會(huì)有進(jìn)一步的規(guī)劃,把更多的系統(tǒng)和平臺(tái)納入管理范圍,由IBM WKC來承載。”
四川省稅務(wù)局使用IBM WKC實(shí)現(xiàn)了企業(yè)級(jí)數(shù)據(jù)治理系統(tǒng)平臺(tái)建設(shè),賦能了稅務(wù)登記、稅務(wù)申報(bào)、發(fā)票類、國際稅收業(yè)務(wù)類,稅務(wù)行政、出口退免稅等業(yè)務(wù)系統(tǒng)。借助IBM WKC解決方案,采用AI技術(shù)提升了自動(dòng)化治理數(shù)據(jù)效率,減低運(yùn)營成本,為用戶數(shù)據(jù)提供可信賴的信息、開展新業(yè)務(wù)。目前,該項(xiàng)目處于建成數(shù)據(jù)知識(shí)體系階段,下一步將是更大規(guī)模的應(yīng)用。
與客戶共建的專業(yè)團(tuán)隊(duì)
可以說,IBM專家團(tuán)隊(duì)與四川省稅務(wù)局的緊密合作確保了項(xiàng)目成功實(shí)施。2021年1月,肖斌所在的四川省稅務(wù)局大數(shù)據(jù)風(fēng)險(xiǎn)管理局開始推進(jìn)數(shù)據(jù)治理工作,與IBM專家多次交流后確定了對(duì)IBM軟件測(cè)試的場(chǎng)景,在春節(jié)前開展了PoC測(cè)試,節(jié)后完成了可行性方案調(diào)研和軟件產(chǎn)品測(cè)試。期間,IBM團(tuán)隊(duì)積極爭取IBM不同部門和渠道的資源,制定了對(duì)四川省稅務(wù)局最有價(jià)值的策略。2021年7月到2022年5月,IBM客戶成功管理團(tuán)隊(duì)和IBM中國開發(fā)中心介入項(xiàng)目,分別負(fù)責(zé)生產(chǎn)系統(tǒng)安裝和系統(tǒng)上線,以及解決生產(chǎn)系統(tǒng)問題。
正是有了IBM客戶成功管理團(tuán)隊(duì)的幫助,才讓四川省稅務(wù)局對(duì)IBM WKC和IBM Cloud Pak for Data的使用更加游刃有余。肖斌稱:“項(xiàng)目落地的過程總會(huì)遇到很多問題,IBM中國開發(fā)中心的專家會(huì)對(duì)IBM WKC做出相應(yīng)的改變來貼近客戶的實(shí)際需求,并且有IBM客戶成功管理團(tuán)隊(duì)這樣可信賴的伙伴來輔助,可以幫助我們梳理業(yè)務(wù),結(jié)合IBM WKC的特點(diǎn)做一些嘗試,合作研究如何與業(yè)務(wù)關(guān)聯(lián)起來?!背薎BM Cloud Pak for Data,四川省稅務(wù)局還在測(cè)試使用IBM Cloud Pak for Business Automation等產(chǎn)品。IBM中國客戶成功架構(gòu)師張敏介紹稱:“Cloud Pak for Data內(nèi)置了很多分析工具,包括SPSS等,還有Cloud Pak for Business Automation的規(guī)則引擎、工作流,近期就會(huì)進(jìn)行測(cè)試。”
據(jù)了解,IBM Cloud Pak for Data是統(tǒng)一和簡化數(shù)據(jù)收集、組織和分析的平臺(tái),構(gòu)建在Red Hat OpenShfit之上,嵌入了IBM企業(yè)級(jí)和產(chǎn)品化的AI技術(shù)(Watson AI)與功能,企業(yè)可以通過集成的云原生架構(gòu)將數(shù)據(jù)轉(zhuǎn)化為洞察力,IBM Watson Knowledge Catalog則是其中用于數(shù)據(jù)治理的重要工具,可以接入客戶的數(shù)倉、Hadoop集群的元數(shù)據(jù)、Apache Atlas的數(shù)據(jù)等,將其變成數(shù)據(jù)資產(chǎn)進(jìn)行分析。
IBM WKC可以提供數(shù)據(jù)可視化,自動(dòng)化數(shù)據(jù)質(zhì)量分析和打分,從多維度評(píng)估數(shù)據(jù),給出全面的質(zhì)量檔案信息、趨勢(shì)分析、遵循業(yè)務(wù)規(guī)則的評(píng)估信息。通過讓數(shù)據(jù)資產(chǎn)與業(yè)務(wù)信息建立映射關(guān)系,實(shí)現(xiàn)端-到-端的數(shù)據(jù)世襲關(guān)系分析,建立跨業(yè)務(wù)類別、跨系統(tǒng)的數(shù)據(jù)治理策略和流程管理,推進(jìn)業(yè)務(wù)部門對(duì)其數(shù)據(jù)歸屬管理。IBM WKC提供了與業(yè)務(wù)集成的數(shù)據(jù)治理流程管理,大量應(yīng)用機(jī)器學(xué)習(xí)能力提高獲取數(shù)據(jù)能力和分析數(shù)據(jù)的準(zhǔn)確率。同時(shí),利用關(guān)鍵字圖形化搜索,快速獲取相關(guān)信息和數(shù)據(jù)圖譜,讓企業(yè)不同角色人員都能掌握業(yè)務(wù)策略、治理規(guī)則和業(yè)務(wù)術(shù)語,了解數(shù)據(jù)資產(chǎn)結(jié)構(gòu)、數(shù)據(jù)治理邏輯表達(dá)式、規(guī)則定義、數(shù)據(jù)治理流程等信息。
結(jié)束語
在Cloud Pak for Data的幫助下,IBM幫助四川省稅務(wù)局邁出了“以數(shù)治稅”的重要一步,隨著雙方合作的持續(xù)深入,相信會(huì)看到更多的稅務(wù)數(shù)字化實(shí)踐,為全面推進(jìn)稅收征管的數(shù)字化升級(jí)和智能化改造貢獻(xiàn)更大的力量。