阿里云陳威:如何讓銀行的核心系統(tǒng)「拎包上云」?

來源: 雷鋒網(wǎng)
作者:雷鋒網(wǎng)
時間:2021-03-12
17398
在雷鋒網(wǎng)《AI金融評論》與阿里云聯(lián)合主辦“銀行系統(tǒng)云化升級”實戰(zhàn)體驗營中,陳威就從阿里云服務(wù)金融機(jī)構(gòu)的過往經(jīng)驗中提取精華,詳盡深入地討論了他們在金融核心系統(tǒng)轉(zhuǎn)型方面的探索和實踐。

Hippopx (21).jpg

很多金融機(jī)構(gòu)在考慮「上云」與否的時候,并不清楚自己能得到什么。

其實他們最在意的,是希望技術(shù)保證核心穩(wěn)定運行,是整體完全自主掌控,是最后達(dá)到每單筆交易/每個賬戶成本下降的目標(biāo),是在業(yè)務(wù)穩(wěn)定性、連續(xù)性不降低的前提下,支撐業(yè)務(wù)敏捷。

抽絲剝繭數(shù)個實踐合作案例后,我們可以看到,金融機(jī)構(gòu)的訴求,或許可以分為三環(huán):

最難解決的是“1環(huán)”問題,分布式事務(wù)怎么實現(xiàn)?各種模式應(yīng)用在哪些場景?有何利弊?異地多活情況下,數(shù)據(jù)庫怎么保證良好的支撐?

到了“2環(huán)”,重點落在領(lǐng)域化建模,機(jī)構(gòu)們要參考最佳實踐,思考底層模型框架如何處理,他們也在關(guān)心集中化架構(gòu)——分布式架構(gòu)——云化架構(gòu),有沒有一些特殊的差異?

上升到“3環(huán)”,訴求就會涵蓋整個云化環(huán)境下的運維保障體系、devOps體系、整體的部署架構(gòu)體系……

2020年被認(rèn)為是云原生核心的元年,更多金融機(jī)構(gòu)逐漸從混沌中醒來,與科技公司聯(lián)手摸索出核心系統(tǒng)的“病灶”所在,對癥下藥。

陳威是阿里云新金融事業(yè)部金融核心部負(fù)責(zé)人,曾從事企業(yè)級信息技術(shù)產(chǎn)業(yè)十余年,具備豐富的應(yīng)用架構(gòu)與設(shè)計,數(shù)據(jù)智能,云平臺,互聯(lián)網(wǎng)等領(lǐng)域的理論與大型復(fù)雜項目實踐,尤其在金融行業(yè)具有多年的交叉實踐經(jīng)驗,服務(wù)于近百家大型機(jī)構(gòu)與客戶。

在雷鋒網(wǎng)《AI金融評論》與阿里云聯(lián)合主辦“銀行系統(tǒng)云化升級”實戰(zhàn)體驗營中,陳威就從阿里云服務(wù)金融機(jī)構(gòu)的過往經(jīng)驗中提取精華,詳盡深入地討論了他們在金融核心系統(tǒng)轉(zhuǎn)型方面的探索和實踐。

欲獲得所有講者視頻,可關(guān)注公眾號“AI金融評論”(ID: aijinrongpinglun),進(jìn)群獲取回放鏈接。

以下為陳威演講內(nèi)容,雷鋒網(wǎng)(公眾號:雷鋒網(wǎng))做了不改變原意的編輯和整理:

今天的主題是《金融核心云原生轉(zhuǎn)型的探索與實踐》。

在整個金融業(yè),尤其在銀行領(lǐng)域,核心系統(tǒng)是IT整體支出占比最大,最為復(fù)雜,對于技術(shù)要求最高的一塊。這也是我們認(rèn)為,整個金融行業(yè)包括銀行,在朝著云化轉(zhuǎn)型的理念里,最后最難的一部分。

今天的內(nèi)容首先會講到銀行核心系統(tǒng)云化轉(zhuǎn)型的訴求,簡單來講就是客戶和我們?yōu)槭裁匆鲞@件事?其次是核心云原生轉(zhuǎn)型的挑戰(zhàn)與應(yīng)對。

銀行核心系統(tǒng)云化轉(zhuǎn)型的訴求

可能在座的聽眾有所了解,金融核心實際上經(jīng)過了好幾代,存在代際的差異。

最早是傳統(tǒng)綜合業(yè)務(wù)系統(tǒng)這部分,然后到第一代基于主機(jī)的單體式核心系統(tǒng)。比如錢存在國有大行那里,都是在主機(jī)系統(tǒng)Mainframe(大型機(jī))上。

大量的農(nóng)商農(nóng)信體系是在AS400上;還有一部分在Power小型機(jī)系列。

第二代就是我們通??吹姐y行會走到瘦核心的階段,從原來的核心系統(tǒng)進(jìn)行拆分,尤其是面向敏態(tài)的部分,通常會建設(shè)一個叫互聯(lián)網(wǎng)核心的系統(tǒng)。

第一代的技術(shù)架構(gòu)的改造或者升級,通常的做法,基于從單體下移到基于ESB的SOA架構(gòu)。近幾年有些開發(fā)商會基于開源Spring Cloud把這部分SOA架構(gòu)升級到微服務(wù)的架構(gòu)。

從技術(shù)架構(gòu)路線來講,這是從ESB向微服務(wù)框架的體系改進(jìn),這就是我們經(jīng)常聽到的分布式核心的實際的現(xiàn)狀。

從應(yīng)用架構(gòu)路線來看,技術(shù)層面雖然有一些升級,但是它底層模型和應(yīng)用架構(gòu),其實沒有太大變化。

第二代核心的典型特征就是以ESB為核心和微服務(wù)架構(gòu),但有個問題沒有解決:底層對業(yè)務(wù)敏捷的支撐是心有余而力不足。支撐一些新的產(chǎn)品,服務(wù)或者功能上線需要大量的人力定制化開發(fā),業(yè)務(wù)并不夠敏捷。

隨著云計算技術(shù)的不斷發(fā)展和成熟,云化的潮流勢不可擋,不論是傳統(tǒng)企業(yè)還是金融系統(tǒng),有意愿和動力升級到云上核心,這就是所謂的第三代,也叫云原生核心,基于容器云原生或者基于PaaS等技術(shù)。

它跟我們通常理解的分布式核心,實際上有較大差異。第三代是完全走向IaaS/PaaS化,但在底層應(yīng)用架構(gòu)方面,其實也有相應(yīng)的變更,類似于大家聽到的中臺化、領(lǐng)域設(shè)計,這些關(guān)鍵字都會在第三代核心中有所體現(xiàn)。

第三代金融核心關(guān)鍵性標(biāo)準(zhǔn)

我們試圖總結(jié)一下第三代核心的一些關(guān)鍵詞,經(jīng)過長時間的調(diào)研與歸納,形成了這么一些標(biāo)簽,云原生,異地多活,中臺化,數(shù)字化。

云原生和異地多活,偏向技術(shù)架構(gòu)和基礎(chǔ)設(shè)施;中臺化和數(shù)字化,偏向于業(yè)務(wù)和應(yīng)用。

云原生:金融核心實際上也是應(yīng)用系統(tǒng),本質(zhì)上和其他業(yè)務(wù)系統(tǒng)沒有特別大的差異,但是它比較復(fù)雜,對業(yè)務(wù)連續(xù)性和一致性的保障會比較高。

同時,它本質(zhì)上是一個應(yīng)用,所以云原生應(yīng)用該具備的特征,它實際上也具備。比如容器化部署模式,PaaS的資源供給應(yīng)用需要的能力,這都屬于云原生范疇。

異地多活:大部分新建的銀行要做的核心,基本上會有異地多活。它不光是同城容災(zāi)或者異地容災(zāi),是能夠做到多地多活的模式,可以做到城市級的容災(zāi)。對于傳統(tǒng)金融機(jī)構(gòu)而言,異地多活也是比較大的挑戰(zhàn)。

中臺化:原來的集中式架構(gòu),就是傳統(tǒng)一個大的單體化應(yīng)用,牽一發(fā)而動全身。

當(dāng)需要定制化或創(chuàng)新金融產(chǎn)品服務(wù),尤其是疫情常態(tài)化之后,未來有很多不見面的流程服務(wù),包括基于互聯(lián)網(wǎng)或者視頻的新渠道形態(tài),原來的架構(gòu)不能復(fù)用。

這時希望打造一個堅實的業(yè)務(wù)中臺能力,能夠支撐未來多變的挑戰(zhàn)。中臺化最終是為了提高面向創(chuàng)新的效率,這也是建中臺的初心,這是支撐業(yè)務(wù)敏捷非常重要的手段。

數(shù)字化:能夠以數(shù)字化模式,展現(xiàn)里面所有運營相關(guān)內(nèi)容,有了數(shù)字化運營的基礎(chǔ)和能力,智能自動化運維才有空間,這是核心未來發(fā)展的重要方向。

其次,因為核心系統(tǒng)的生命周期非常長,可能會要支撐全行的業(yè)務(wù)支撐十年八年的的時間。如果遇上比如數(shù)字貨幣這種國家大力推行的方向,它對于核心有怎樣的挑戰(zhàn)?所以架構(gòu)上的設(shè)計,一定要把這個(時間跨度)也考量進(jìn)去,具備很強(qiáng)的擴(kuò)展能力。

第三代金融核心的重要意義

自主創(chuàng)新:首先它是自主創(chuàng)新的一個標(biāo)桿。但從我們的觀察來看,2020年是云原生核心的元年,諸多傳統(tǒng)金融機(jī)構(gòu)在逐步的進(jìn)行嘗試。

行業(yè)標(biāo)準(zhǔn):在第三代核心,或者全分布式、云原生、多活核心架構(gòu)領(lǐng)域,還沒有公認(rèn)的標(biāo)準(zhǔn)。金融機(jī)構(gòu)非常想去打造行業(yè)的先鋒標(biāo)桿,沉淀的卓越實踐參考。

實施工藝:核心是一個龐大的項目群,周期很長,可能有不同的開發(fā)商,涉及的人員非常多,不可能按照原來的小應(yīng)用開發(fā)模式,必須要有一套統(tǒng)一規(guī)范的框架和實施工藝,支撐長生命周期的大型系統(tǒng)開發(fā),能夠在上面開發(fā)整個核心系統(tǒng)上百個應(yīng)用。

能把這三點做好,是我們認(rèn)為第三代核心在金融機(jī)構(gòu)落地的標(biāo)志。

第三代金融核心的業(yè)務(wù)價值

首先是全棧式的自主可控,滿足相關(guān)的要求。

多活架構(gòu),可以做到RPO=0,甚至是城市級的容災(zāi),RPO=0,有問題的話恢復(fù)時間<1分鐘。如果大家對于基礎(chǔ)設(shè)施比較了解,就會了解要達(dá)到這樣一個指標(biāo)會有多么巨大的挑戰(zhàn),只有達(dá)到城市級別的RPO=0,RTO分鐘級,才能夠真正的保證業(yè)務(wù)的連續(xù)性。

彈性擴(kuò)展,基于分布式架構(gòu)的擴(kuò)展性,一定比集中式架構(gòu)要好,所以它完全能夠滿足業(yè)務(wù)的特殊要求或者線性增長,支撐傳統(tǒng)金融機(jī)構(gòu)做類似于雙十一這樣的大促銷,金融爆款產(chǎn)品的秒殺,或者是一些高并發(fā)的場景金融。

業(yè)務(wù)敏捷,產(chǎn)品團(tuán)隊能很快在該框架的核心上,實現(xiàn)新的金融產(chǎn)品和服務(wù)。在傳統(tǒng)的集中式架構(gòu)下,上線新的大一些的功能就可能需要大量改動核心內(nèi)部、關(guān)聯(lián)系統(tǒng),造成業(yè)務(wù)上架用時較長。基于微服務(wù)或分布式架構(gòu)的,可以通過devops模式縮短業(yè)務(wù)交付時間。

運維成本,云原生架構(gòu)基于相對低廉的x86服務(wù)器構(gòu)建,同等處理能力下,分布式架構(gòu)的單位運行成本大幅降低,分布式架構(gòu)的年均運行維護(hù)成本是大型機(jī)的17%。

金融機(jī)構(gòu)們的訴求是什么?

在一個分布式的云化環(huán)境中,要保證核心穩(wěn)定運行,其實有三個非常關(guān)鍵的標(biāo)志。

整體完全自主掌控。

從財務(wù)的角度看,最后達(dá)到每單筆交易/每個賬戶成本的下降。

業(yè)務(wù)穩(wěn)定性、連續(xù)性不降低的前提下,支撐業(yè)務(wù)敏捷。

這三點衍生出金融機(jī)構(gòu)對供應(yīng)商/合作伙伴的訴求,大體分為4個方向。

咨詢與設(shè)計:架構(gòu)咨詢指導(dǎo),技術(shù),開發(fā)規(guī)范等,配套的組織體系架構(gòu)等。

服務(wù)交付:服務(wù)的長期交付過程,一般來講建設(shè)周期在2——3年,所以整體的人員投入,開發(fā)實施交付規(guī)范等。

運維保障:后續(xù)的長期運維保障,出問題怎么監(jiān)控、解決,怎么更自動化;

產(chǎn)品與方案:最底層的是產(chǎn)品方案的支撐,包括整體規(guī)劃路線圖,產(chǎn)品的延續(xù)性、一致性、無縫升級維護(hù),還有產(chǎn)品計劃的發(fā)布策略、相應(yīng)的生態(tài)豐富度。

客戶的訴求可以分為三環(huán),最難解決的是“1環(huán)”問題:

業(yè)務(wù)一致性,怎么實現(xiàn)分布式事務(wù)?各種各樣的模式,到底用在哪些場景?各種模式的利弊是什么?

數(shù)據(jù)一致性,尤其是異地多活這種情況下,數(shù)據(jù)庫怎么保證良好的支撐,尤其在異地之后的數(shù)據(jù)容災(zāi)等問題,都是基礎(chǔ)架構(gòu)部門非常關(guān)心的“1環(huán)”內(nèi)容,通常很難靠金融機(jī)構(gòu)自己解決,一般需要外部供應(yīng)商來做。

“2環(huán)”重點是怎么領(lǐng)域化建模,有沒有一些最佳實踐?底層模型框架怎么處理?集中化架構(gòu)到分布式架構(gòu),再到云化架構(gòu),有沒有一些特殊的差異?

“3環(huán)” 涵蓋整個云化環(huán)境下的運維保障體系,devOps體系,整體的部署架構(gòu)體系,比如怎么做單元化架構(gòu)等。

云原生轉(zhuǎn)型的挑戰(zhàn)和應(yīng)對

從哪些框架/思路,去解決轉(zhuǎn)型訴求帶來的挑戰(zhàn)?

可能原來大家理解的,主要是在業(yè)務(wù)和數(shù)據(jù)建模,以及底層的技術(shù)軟件支撐。但在大量調(diào)研之后,發(fā)現(xiàn)其實中間還缺兩層,就是架構(gòu)集成、開發(fā)運維部分,這也是要攻克的難點。

之前講到,第一代、第二代(金融核心)里這塊業(yè)務(wù)流程不會有太大調(diào)整,但在第三代,一定要真正讓它敏捷,對業(yè)務(wù)流程清晰梳理,同時要能轉(zhuǎn)化為類似中臺的模式。

上半部分屬于企業(yè)級架構(gòu)建模的范疇,下半部分是建模之后怎樣在云上落地。

我們怎么做敏捷的架構(gòu)設(shè)計?

做敏捷的架構(gòu)設(shè)計,首先要考慮中臺化領(lǐng)域設(shè)計。

相對傳統(tǒng)的服務(wù)集成架構(gòu)是渠道層+整合層+核心系統(tǒng),但中臺化分層就會拆成渠道層、開放層、產(chǎn)品服務(wù)層、中臺能力層、基礎(chǔ)服務(wù)層等。

其中,渠道層,包括各個電子化渠道,開放互聯(lián)網(wǎng)渠道,線下的渠道等。

像產(chǎn)品服務(wù)層,其實不是產(chǎn)品真正執(zhí)行代碼的地方,實際是業(yè)務(wù)能力編排的領(lǐng)域。例如存貸款這些業(yè)務(wù),也是經(jīng)過一個流程編碼,調(diào)用不同的引擎賬戶和中臺能力,去支撐完成業(yè)務(wù)鏈。

其次是思考云原生應(yīng)用框架的搭建。

為什么要考慮框架?我們在客戶項目中經(jīng)常遇到一個客戶的問題,感嘆懂業(yè)務(wù)的不懂云原生分布式;懂云原生分布式的,對業(yè)務(wù)理解可能也沒有那么深。

現(xiàn)在更先進(jìn)的底層技術(shù),比如云原生分布式數(shù)據(jù)庫,學(xué)習(xí)使用和運維的難度可能比原來要高,這樣會極大影響技術(shù)的可獲得性,就是好不好用的問題。

這需要一套框架整合起來,在業(yè)務(wù)組件技術(shù)層面封裝,降低開發(fā)難度,最后讓普通的應(yīng)用開發(fā)人員,能夠像普通單體架構(gòu)一樣開發(fā)業(yè)務(wù)應(yīng)用,而不用關(guān)心這后面到底是在什么樣的環(huán)境里部署的。

再就是底層基礎(chǔ)設(shè)施部分。

因為開發(fā)周期非常長,難免中間有老的核心系統(tǒng),怎么統(tǒng)一完成服務(wù)調(diào)度治理,怎么在盡量不改代碼的情況下,更平滑地接入和交互?

其實我們講的mesh技術(shù),就比較好解決這個問題。我們也發(fā)現(xiàn)很多客戶不由自主地運用mesh來支撐集成的架構(gòu)核心。

使用mesh,下一代的微服務(wù)技術(shù),結(jié)合分布式網(wǎng)關(guān),能夠跟ESB對接,支撐傳統(tǒng)業(yè)務(wù)調(diào)用——這也是服務(wù)網(wǎng)格目標(biāo)。這部分與現(xiàn)在經(jīng)常講到的low code低代碼、低侵入,都具備相近似的模式。

如果想用mesh的模式實現(xiàn)異構(gòu)架構(gòu)集成等?這就尤為需要關(guān)注云化分布式改造方面的新進(jìn)展。

以往來講,spring cloud這套體系,如果你要寫一個比較健壯的核心應(yīng)用,一定要在體系里把所有代碼和編排都放進(jìn)去,實際上每個真正的業(yè)務(wù)代碼量占整體比較少,會有大量業(yè)務(wù)無關(guān)的邏輯。

這部分如果通過mesh技術(shù),直接用sidecar處理,對于原來的業(yè)務(wù)應(yīng)用不會有大量的侵入。因為走的是網(wǎng)絡(luò)層所有監(jiān)控,所以能夠把整個架構(gòu)的鏈路全部清晰表達(dá)出來。這對全方位監(jiān)控也是很重要的內(nèi)容。

如何保證質(zhì)量安全與穩(wěn)定性?

客戶無論是大機(jī)下移還是云化轉(zhuǎn)型,都有一個非常重要的前提:保證自身業(yè)務(wù)連續(xù)性;保證整體業(yè)務(wù)安全情況下,能支撐業(yè)務(wù)敏捷。

在質(zhì)量安全與穩(wěn)定性方面,我們有一整套可回滾可灰度可監(jiān)控的防控體系,分為三層質(zhì)量網(wǎng)。

未來一旦微服務(wù)化、云化,它會有大量的容器應(yīng)用,不大可能靠人力定位最終的問題,一定要靠自動化、智能化的方式解決傳統(tǒng)的巡檢監(jiān)控問題。總的來說,會有配套機(jī)制保障終端客戶不出問題,設(shè)施是不可靠的,要從應(yīng)用、軟件、機(jī)制規(guī)范、工具體系支撐。

另外就是異地多活架構(gòu)。

這部分實際是支付寶能去支持雙十一的底層核心架構(gòu),是三地五中心的多活架構(gòu)。在互聯(lián)網(wǎng)上,我們一般采用客戶ID號尾號分片的方式,最后拆到100個單元,能夠在不同機(jī)房之間精細(xì)調(diào)撥流量。

所以任何一個機(jī)房或城市出現(xiàn)問題,我們都能把流量瞬間調(diào)撥過去,同時業(yè)務(wù)應(yīng)用能承擔(dān)起來,機(jī)房級或城市級容災(zāi)都能做到RPO=0。這里面非常核心的,就是底層分布數(shù)據(jù)庫,真正能夠支持異地容災(zāi)的分布式結(jié)架構(gòu)。

比如在異地機(jī)房,整個單元從端到端升級到一個新的架構(gòu),現(xiàn)在可以做到機(jī)房級的邏輯單元架構(gòu)更新,或者應(yīng)用版本大規(guī)模升級,這些都可以通過單元化方式實現(xiàn)。

無論在哪個級別,RPO都能做到等于0,但由于網(wǎng)絡(luò)或者物理限制,無法做到RTO=0。

陳威在本場演講中,還談到了金融核心轉(zhuǎn)型的實踐路徑和案例分析,并回答了銀行大機(jī)下移、數(shù)字貨幣對金融核心的挑戰(zhàn)等提問。欲獲得本場演講回放,可關(guān)注公眾號“AI金融評論”(ID: aijinrongpinglun),回復(fù)關(guān)鍵詞“參會”,進(jìn)群獲取回放鏈接。

本文轉(zhuǎn)自雷鋒網(wǎng),如需轉(zhuǎn)載請至雷鋒網(wǎng)官網(wǎng)申請授權(quán)。

立即登錄,閱讀全文
版權(quán)說明:
本文內(nèi)容來自于雷鋒網(wǎng),本站不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。文章內(nèi)容系作者個人觀點,不代表快出海對觀點贊同或支持。如有侵權(quán),請聯(lián)系管理員(zzx@kchuhai.com)刪除!
相關(guān)文章
阿里云助力《誅仙世界》端游正式開服!
阿里云助力《誅仙世界》端游正式開服!
近?,完美世界游戲歷時多年打造的新國?仙俠MMORPG端游《誅仙世界》在阿?云上正式開服。
阿里云
云服務(wù)
2024-12-292024-12-29
一文詳解阿里云AI大基建
一文詳解阿里云AI大基建
面向AI時代,阿里云基礎(chǔ)設(shè)施是如何創(chuàng)新與發(fā)展的?計算、網(wǎng)絡(luò)、存儲、服務(wù)器、集群、可觀測等,阿里云全新升級的AI Infra到底有哪些重磅更新?
阿里云
云服務(wù)
2024-11-022024-11-02
AI時代云安全新范式,阿里云安全能力全線升級!
AI時代云安全新范式,阿里云安全能力全線升級!
AI時代,云安全面臨著新的挑戰(zhàn),不僅要持續(xù)面對以往的傳統(tǒng)問題,更需要全新理念落地于產(chǎn)品設(shè)計、技術(shù)演進(jìn)、架構(gòu)設(shè)計,才能實現(xiàn)效果、性能、和成本的最優(yōu)解。
AI
阿里云
云服務(wù)
2024-09-272024-09-27
連續(xù)四年!阿里云領(lǐng)跑中國公有云大數(shù)據(jù)平臺
連續(xù)四年!阿里云領(lǐng)跑中國公有云大數(shù)據(jù)平臺
近日,國際數(shù)據(jù)公司(IDC)發(fā)布《中國大數(shù)據(jù)平臺市場份額,2023:數(shù)智融合時代的真正到來》報告——2023年中國大數(shù)據(jù)平臺公有云服務(wù)市場規(guī)模達(dá)72.2億元人民幣,其中阿里巴巴市場份額保持領(lǐng)先,占比達(dá)40.2%,連續(xù)四年排名第一。
阿里云
云服務(wù)
2024-09-182024-09-18
優(yōu)質(zhì)服務(wù)商推薦
更多
掃碼登錄
打開掃一掃, 關(guān)注公眾號后即可登錄/注冊
加載中
二維碼已失效 請重試
刷新
賬號登錄/注冊
個人VIP
小程序
快出海小程序
公眾號
快出海公眾號
商務(wù)合作
商務(wù)合作
投稿采訪
投稿采訪
出海管家
出海管家