受訪嘉賓:阿里云數(shù)據(jù)庫事業(yè)部 產(chǎn)品與解決方案部總經(jīng)理 王偉民(花名:唯敏)
采訪人:IT168企業(yè)級(jí)&ITPUB執(zhí)行總編 老魚
(本文根據(jù)DTCC 2021大會(huì)現(xiàn)場(chǎng)采訪整理)
記者:請(qǐng)介紹下您目前在阿里云數(shù)據(jù)庫所負(fù)責(zé)的日常工作
王偉民:首先介紹一下自己,我先后經(jīng)歷過Oracle、Microsoft、華為等企業(yè)在這些企業(yè)里面都是從事數(shù)據(jù)庫相關(guān)的工作,擔(dān)任過不同的崗位。
今年加入了阿里云,目前我主要負(fù)責(zé)四個(gè)方面的工作。
第一部分是產(chǎn)品管理,和我以前的工作是完全一樣的,主要是以市場(chǎng)、客戶需求為導(dǎo)向,去看我們需要研發(fā)哪些產(chǎn)品。
第二部分是解決方案,為產(chǎn)品的商業(yè)成功負(fù)責(zé),包括行業(yè)、區(qū)域和國際市場(chǎng)。
第三部分是產(chǎn)品體驗(yàn),包括文檔、體驗(yàn)設(shè)計(jì)等,主要是為了讓用戶有更好的體驗(yàn)并更高效地使用我們的產(chǎn)品和服務(wù)。
第四部分是品牌和生態(tài),品牌方面包括要持續(xù)對(duì)行業(yè)內(nèi)構(gòu)筑產(chǎn)品的影響力。生態(tài)方面,數(shù)據(jù)庫作為基礎(chǔ)類軟件,在PaaS層,不像計(jì)算、網(wǎng)絡(luò)存儲(chǔ)、安全這些通用能力,大家都需要;也不像SaaS應(yīng)用那樣自帶流量入口。所以,單獨(dú)去推廣數(shù)據(jù)庫不是特別高效,我們需要通過生態(tài)的方式去做市場(chǎng)、推廣,和伙伴們一起去更快速地推廣和復(fù)制到各大應(yīng)用場(chǎng)景。
以上是目前我在阿里云的工作。
記者:相當(dāng)于OLAP、OLTP還有NoSQL,研發(fā)針對(duì)各自產(chǎn)品做集成與研發(fā),你這邊就變成產(chǎn)品化的。
王偉民:對(duì),客戶需求都是到我們團(tuán)隊(duì)。我們會(huì)去規(guī)劃產(chǎn)品,研發(fā)來承接需求、投入資源、按產(chǎn)品規(guī)劃的路標(biāo)來推動(dòng)產(chǎn)品上市。另外產(chǎn)品的商業(yè)模式、定價(jià)等GTM工作,也都是在我們團(tuán)隊(duì)負(fù)責(zé)。
記者:您今天的演講主題是“云原生數(shù)據(jù)庫2.0,一站式全鏈路數(shù)據(jù)管理與服務(wù)”。為什么會(huì)選擇這個(gè)主題,這個(gè)主題您覺得對(duì)于參會(huì)的人來說,它能夠獲得哪些收益?
王偉民:我們首先強(qiáng)調(diào)的是“一站式”,這個(gè)“站”是“One Stop”的意思,不是“技術(shù)?!钡摹皸!?,這個(gè)叫“Stack”。我們現(xiàn)在做的是云服務(wù),各類引擎上架后實(shí)現(xiàn)了多樣化的供給;每一款產(chǎn)品或引擎是為特定的用戶場(chǎng)景做定制優(yōu)化的,這也是經(jīng)典的General Purpose(GP)和Special Purpose(SP)之間的trade-off。有很多公司嘗試用General Purpose的方式解決所有的問題,但目前為止,它可能在某些場(chǎng)景里是最優(yōu)解的,但在所有其他場(chǎng)景里都是次優(yōu)解。當(dāng)然General Purpose有個(gè)好處,對(duì)產(chǎn)品研發(fā)團(tuán)隊(duì)來說,它的ROI是最高的,持續(xù)性投入打造一款產(chǎn)品試圖解決所有場(chǎng)景。
但其實(shí)存在一個(gè)問題,我們看到有很多為專用場(chǎng)景設(shè)計(jì)的產(chǎn)品,比如緩存、嵌入式的IoT場(chǎng)景、邊緣場(chǎng)景、多模,都不是GP產(chǎn)品能很好地解決的。到目前為止,千行百業(yè)都在做數(shù)字化轉(zhuǎn)型和上云,想用一款產(chǎn)品解決所有的問題,從哲學(xué)上來講,這是一種過于理想的狀態(tài),是不可能實(shí)現(xiàn)的。我們想用的方式是用產(chǎn)品和產(chǎn)品的組合去滿足各類業(yè)務(wù)場(chǎng)景的需求,相當(dāng)于我們是GP+SP的模式去做。所以這是我們選這個(gè)主題的原因。
其次要強(qiáng)調(diào)“全鏈路”,我們做過調(diào)研,絕大部分企業(yè)里,各類產(chǎn)品和解決方案都是非常紛繁復(fù)雜的,但目前它們之間的拉通和協(xié)調(diào)仍存在很大問題。我們用云的方式可能能解決“煙囪”的問題,但其實(shí)只是解決了資源的“煙囪”,業(yè)務(wù)和數(shù)據(jù)上仍然沒有打通。既然數(shù)據(jù)是新的生產(chǎn)資料,就需要有一個(gè)數(shù)據(jù)的操作系統(tǒng),我們想用DMS來實(shí)現(xiàn)DataOS。這是我們的想法,也是我們一直努力的方向。
到目前為止,豐富的業(yè)務(wù)場(chǎng)景以及里面不同的業(yè)務(wù)負(fù)載特性,使得很難用一款產(chǎn)品最終解決所有問題,這是我們最大的洞察。所以我們希望可以帶來實(shí)際的變化。
記者:您正好提到了這個(gè)觀點(diǎn),和我下面問到的趨勢(shì)是一樣的。專用數(shù)據(jù)庫、多模數(shù)據(jù)庫方面,顯然你們的專用數(shù)據(jù)庫是類似于亞馬遜的,而非像微軟的“一庫包打天下”——一套產(chǎn)品應(yīng)用于所有場(chǎng)景。現(xiàn)在所有的廠商其實(shí)都在聊云原生,你們的云原生架構(gòu)和友商的,在演進(jìn)時(shí)候有什么不一樣嗎?
王偉民:首先,像微軟和Oracle其實(shí)只是品牌比較聚焦和統(tǒng)一,但它其實(shí)也是GP、SP相組合的,Oracle有比較多的品牌,比如面向緩存場(chǎng)景的叫Oracle TimesTen ,面向高可用場(chǎng)景的是Oracle RAC,所以O(shè)racle有一級(jí)品牌和二級(jí)品牌之分。同樣微軟針對(duì)分析、報(bào)表、集成等有SSIS、SSAS、SSRS,面向多模有Azure CosmosDB;
所以我認(rèn)為大家之所以不約而同地選擇了“邁向云原生2.0”這條路,核心原因是大家都看到負(fù)載的多樣性對(duì)底層基礎(chǔ)軟件的設(shè)計(jì)太挑戰(zhàn)了,無法用一個(gè)架構(gòu)、一套code去cover所有。
提到和友商的差異,在云原生1.0那個(gè)既往時(shí)代,大家其實(shí)已經(jīng)把產(chǎn)品化和服務(wù)化做完了,基本都已完成基礎(chǔ)設(shè)施池化了,在管控上做到多租戶、按需使用、按量計(jì)量,而且能夠做不同程度的擴(kuò)縮容。
而云原生2.0時(shí)代,更看重產(chǎn)品與服務(wù)之間的聯(lián)動(dòng)。在我剛才的分享中(第十二屆中國數(shù)據(jù)庫技術(shù)大會(huì))提到七個(gè)客戶案例,其中沒有一個(gè)場(chǎng)景是用單款產(chǎn)品去應(yīng)對(duì)的。為了滿足客戶的轉(zhuǎn)型需求,基本都需要交易型、分析型、數(shù)據(jù)實(shí)時(shí)入倉、庫倉一體等很多需求,都需要實(shí)現(xiàn)數(shù)據(jù)的發(fā)現(xiàn)、洞察和價(jià)值變現(xiàn)。
在我們看來,云原生2.0時(shí)代可能會(huì)朝兩個(gè)方向演進(jìn),第一,持續(xù)不斷夯實(shí)、增強(qiáng)單品的差異化競(jìng)爭(zhēng)力。第二,多種產(chǎn)品之間的高效協(xié)同和體驗(yàn)提升。
記者:?jiǎn)纹贩矫妫^續(xù)強(qiáng)化自己的優(yōu)勢(shì)。整體上,你們也會(huì)強(qiáng)調(diào)整體解決方案的優(yōu)勢(shì),不管是OLTP、OLAP還是NoSQL,所有產(chǎn)品尋求更好地協(xié)同。
王偉民:我們現(xiàn)在有一個(gè)想法,即把解決方案產(chǎn)品化。比如客戶想要一個(gè)在線電商系統(tǒng),我們可以直接提供一個(gè)有緩存和交易,中間帶著鏈路,像一個(gè)小型數(shù)倉一樣已就緒的系統(tǒng)。因?yàn)槠鸩降臅r(shí)候可能沒有那么多數(shù)據(jù),所以這個(gè)數(shù)倉是可擴(kuò)縮容的。
雖然是在云上,但也是垂直的,業(yè)務(wù)是煙囪,資源是水平拉通的,這是我們正在做的嘗試。
解決方案產(chǎn)品化,其實(shí)業(yè)界有很多公司都做過。我們可能也只能在通用方案上去做,想要結(jié)合行業(yè)領(lǐng)域know how去做,可能還是比較困難的。
記者:如果要用一個(gè)比較簡(jiǎn)單的方式、一句話兩句話去描述“云原生數(shù)據(jù)庫2.0”,應(yīng)該怎樣去說呢?讓別人一下就能理解“云原生數(shù)據(jù)庫2.0”的概念。
王偉民:“一站式全鏈路”還是相對(duì)偏技術(shù)術(shù)語,如果用業(yè)務(wù)術(shù)語來講的話,應(yīng)該是多引擎的高效組合,以滿足客戶多樣化的業(yè)務(wù)負(fù)載。另外一種提法是“全場(chǎng)景”、“數(shù)據(jù)全生命周期”,但這些相對(duì)偏Marketing術(shù)語。
記者:對(duì),對(duì)于非技術(shù)人員來說,理解起來還是有點(diǎn)晦澀。下一個(gè)問題,其實(shí)來源于TiDB黃東旭曾提到的一個(gè)觀點(diǎn),他認(rèn)為目前所謂的云原生數(shù)據(jù)庫都不是真正的云原生,凡是能回歸到線下部署的都不叫云原生。您怎么看這個(gè)觀點(diǎn)?
王偉民:這個(gè)觀點(diǎn)挺新穎的,之前確實(shí)沒聽說過。我們遇到過一類上云的客戶會(huì)要求數(shù)據(jù)可回流、隨時(shí)可以下云??蛻粲羞@個(gè)訴求的核心原因是擔(dān)心云是一個(gè)超級(jí)的lock in,擔(dān)心“我上了你的云,除非我掛了,否則今生今世在你這上面”。
在與客戶交流的過程中,會(huì)發(fā)現(xiàn)有些客戶比較抵制差異化特性,擔(dān)心因?yàn)椴町惢匦远鴮?duì)某廠商產(chǎn)生依賴。當(dāng)然,在這方面也有很多不同的技術(shù)流派,有些客戶在寫SQL時(shí)候用的并不用數(shù)據(jù)庫專用語法,它中間有一層抽象層,可以適配底層的MySQL,也可以換成SQL Server或者Oracle,對(duì)他來說不可見。業(yè)界其實(shí)有這樣的產(chǎn)品,比如Source Pro,能夠?qū)ι蠈討?yīng)用屏蔽底層數(shù)據(jù)庫的差異性,所以我不太贊同這個(gè)論斷。
數(shù)據(jù)庫產(chǎn)品化和云化應(yīng)該是兩個(gè)階段,它可以是一個(gè)產(chǎn)品,這個(gè)產(chǎn)品可以provision在on-premise,也可以在云上,但是在云上能夠發(fā)揮資源彈性伸縮等很多云上所特有的能力,但并非只能在云上。
比如,RDS MySQL不能下云嗎?它一定能下云,如果按照剛才的標(biāo)準(zhǔn),它就不是云原生數(shù)據(jù)庫。但如果給它做了解耦,變成AWS Aurora那樣,計(jì)算和存儲(chǔ)解耦了,Aurora是很難下來的。
是否屬于“云原生”,應(yīng)以客戶業(yè)務(wù)場(chǎng)景和需求出發(fā)去考慮,而非從技術(shù)實(shí)現(xiàn)上去判別,畢竟很多客戶的要求是不一樣的。比如拎包入住酒店,今天入住這個(gè)酒店,明天入住那個(gè)酒店,但酒店并不能不讓客戶走。
記者:你覺得他的說法是否是基于國外市場(chǎng)得出的結(jié)論?像您說的這種既能上又能下的,是否是國內(nèi)市場(chǎng)特有的需求?還是說,這是全球市場(chǎng)的需求?其實(shí)最近我看到一篇文章,其觀點(diǎn)是“國外都不用分布式,所以國內(nèi)要用分布式”。
王偉民:關(guān)于您提到的,這是否是國內(nèi)市場(chǎng)的特殊情況?我覺得,未來公有云成為主流,一定會(huì)出現(xiàn)用戶如何考慮平臺(tái)中立、云中立的問題?,F(xiàn)在已經(jīng)看到很多類似需求了,比如客戶的主站在A云,容災(zāi)在B云;另一種是交叉的,一部分業(yè)務(wù)生產(chǎn)在A,備份或Standby在B,另一部分業(yè)務(wù)主站在B,備站在A。客戶的需求在將來可能會(huì)持續(xù)不斷的變化,我們的理念是“客戶第一”,這是我們必須考慮的事情。東旭的觀點(diǎn)目前來說比較新穎,但你說TiDB可不可以線下部署?肯定是可以的。
關(guān)于最近看到這篇文章指的是InfoQ最近才實(shí)現(xiàn)底層數(shù)據(jù)庫的分庫,之前都是單庫。就產(chǎn)品及其架構(gòu)實(shí)現(xiàn)而言,首先云廠商本身是有目標(biāo)市場(chǎng)選擇的,比如說AWS不做線下市場(chǎng),它不做on-premise部署,最多有一個(gè)Outposts邊緣部署,只提供受限的能力,可能是他客戶選擇的問題。
記者:東旭的觀點(diǎn)比較超前,他們好多客戶在國外,國外的市場(chǎng)對(duì)于公有云的擁抱程度很高,但對(duì)國內(nèi)來說,顯然對(duì)線下部署、混合云、私有云等,要比對(duì)公有云的擁抱程度更高,至少在金融、電信等行業(yè)貢獻(xiàn)大戶來說,相對(duì)來說是這樣的。
王偉民:在公有云的大趨勢(shì)方面,我的判斷跟東旭是一樣的。對(duì)于國內(nèi)金融、電信行業(yè)很大業(yè)務(wù)負(fù)載還沒有在公有云上,我認(rèn)為可能有兩個(gè)原因:第一,國內(nèi)在信息安全、行業(yè)監(jiān)管、合規(guī)遵循等方面的政策要求;第二,客戶在系統(tǒng)軟件運(yùn)維管理方面的自主可控需求。
其實(shí)你說在公有云上就不安全嗎?不一定的。美國國防部100億的JEDI項(xiàng)目都是在公有云上,美國第一大銀行CapitalOne是100% 在公有云上的,沒有用私有云。我認(rèn)為,公有云的未來是比較樂觀的。很多行業(yè)都需要一個(gè)過程,上云可能是長達(dá)十幾年的過程,賽道很長。
記者:因?yàn)閲獠挥梅植际?,所以分布式就沒有意義或應(yīng)用價(jià)值嗎?
王偉民:這又是一個(gè)特別值得討論的問題,我認(rèn)為復(fù)雜度是守恒的事情。國外,比如GitHub之前沒有用分布式,但不代表這部分工作就不做了,它的這部分工作可能在應(yīng)用層、中間件層做了;只不過從數(shù)據(jù)庫角度來說,我們希望把復(fù)雜留給數(shù)據(jù)庫,把簡(jiǎn)單留給應(yīng)用。我們希望分布式數(shù)據(jù)庫能像單機(jī)一樣去做應(yīng)用開發(fā)、去做管理運(yùn)維,這樣應(yīng)用就不需要關(guān)注底層數(shù)據(jù)庫容量、事務(wù)、伸縮擴(kuò)容、一致性備份等問題。
其實(shí)國外數(shù)據(jù)庫在并發(fā)用戶量和用戶規(guī)模方面,沒有國內(nèi)這么凸顯,畢竟我們有人口紅利。比如阿里的雙十一“剁手節(jié)”,可不可以把支付系統(tǒng)用Oracle數(shù)據(jù)庫支撐呢?肯定可以,把底下的OceanBase換成Oracle也可以,但這樣TCO太高。
因此,到底是用分布式產(chǎn)品去解決,還是用分布式解決方案去解決,這又是另外一個(gè)思路。比如應(yīng)用接分布式中間件,比如ShardingSphere和底下接單機(jī)數(shù)據(jù)庫,都一樣可以做這個(gè)事情。
我覺得并非說國外沒有用它,它就沒有意義,而是看這些投入是在哪個(gè)層面去做的。比如我認(rèn)為從產(chǎn)品的維度來講,隨著使用量的增加,邊際成本是持續(xù)下降的,所以我認(rèn)為做這件事情是非常有意義的,比如可以讓應(yīng)用不用關(guān)心柔性事務(wù)、業(yè)務(wù)沖正等,這個(gè)復(fù)雜度都在數(shù)據(jù)庫層面處理了,所以我覺得分布式數(shù)據(jù)庫還是非常有意義的。在國外,可能不需要用分布式數(shù)據(jù)庫,但可以把分布式數(shù)據(jù)庫退化成單實(shí)例使用,在Oracle RAC也可以只用一個(gè)節(jié)點(diǎn),這都是沒問題的。
記者:過去我一直覺得國內(nèi)云廠商里,在數(shù)據(jù)庫方面,生態(tài)做的最好的是華為,經(jīng)常會(huì)看到誰又加入了它的生態(tài)伙伴圈。阿里是云方面最早吃螃蟹的,所以阿里云保持了一定的先發(fā)優(yōu)勢(shì),同時(shí)阿里也有一些類似于雙十一的極端場(chǎng)景,使得它會(huì)有技術(shù)方面的積累。當(dāng)然,這只是我個(gè)人的看法。從您的角度來說,阿里云數(shù)據(jù)庫從技術(shù)、產(chǎn)品、商業(yè)、生態(tài)等各個(gè)角度,相對(duì)于其他競(jìng)爭(zhēng)對(duì)手,它的優(yōu)勢(shì)在哪?
王偉民:首先,針對(duì)我們產(chǎn)研團(tuán)隊(duì),我認(rèn)為第一個(gè)優(yōu)勢(shì)是從組織上的高度統(tǒng)一和一致,我們能做到力出一孔。李飛飛既是阿里云數(shù)據(jù)庫事業(yè)部的一號(hào)位,他同時(shí)又是達(dá)摩院數(shù)據(jù)庫與存儲(chǔ)實(shí)驗(yàn)室的一號(hào)位,所以相當(dāng)于他統(tǒng)領(lǐng)了整個(gè)阿里體系所有數(shù)據(jù)庫的產(chǎn)品、研發(fā)和預(yù)研團(tuán)隊(duì),在產(chǎn)品的戰(zhàn)略、溝通、市場(chǎng)等策略方面是高度一致的,這是第一個(gè)優(yōu)勢(shì)。
第二,阿里確實(shí)有先發(fā)優(yōu)勢(shì),我們很多客戶不是才上云,比如基于IDC,剛上云。而是day one就是長在云上,生于云長在云。
第三,在產(chǎn)品方面比較聚焦,我們沒有非常多的產(chǎn)品,我們的產(chǎn)品分成三大類:開源托管類、商業(yè)產(chǎn)品托管類和自研產(chǎn)品類,核心是希望聚焦,而且針對(duì)這三類產(chǎn)品,我們有不同的策略。
比如開源托管類聚焦的是簡(jiǎn)單易用、安全可靠和高性價(jià)比;商業(yè)產(chǎn)品主要利用它的開放生態(tài),在這方面,我們主要是解決業(yè)務(wù)合規(guī)生態(tài)多元的問題,我們和SQL Server、MongoDB是直接商業(yè)合作的,這些是需要阿里云持續(xù)地去合規(guī)的;自研產(chǎn)品,我們聚焦四個(gè)大的品類,PolarDB、AnalyticDB、Lindorm、Tair,并沒有很發(fā)散。
講到生態(tài),其實(shí)各個(gè)廠商做生態(tài)的方式是不一樣的。有些友商雖然在做數(shù)據(jù)庫,但并不是要把數(shù)據(jù)庫作為一個(gè)獨(dú)立產(chǎn)業(yè)來做。通過打造一個(gè)第二平面去解決“卡脖子”的問題,這也非常了不起,我們也需要這樣的技術(shù)。
阿里在做生態(tài)方面,尤其我們更多地是希望以“被集成”的方式來做。生態(tài)要開放繁榮,最主要的就是要能夠和伙伴實(shí)現(xiàn)利益分享,如果做不到這一點(diǎn),我覺得生態(tài)是做不起來的。所以我們一直在探索怎么樣讓生態(tài)的參與者和我們一起,去把餅做大,同時(shí)去看如何更好地兼顧各方。
生態(tài)方面我們也一直在持續(xù)投入,比如分銷的伙伴、SaaS被集成、ISV、交付伙伴、培訓(xùn)認(rèn)證等都在搞,但的確我們這一塊的投入量還需要持續(xù)加強(qiáng)。
記者:上個(gè)月阿里媒體溝通會(huì)上,我采訪李飛飛,他提到你們要去打線下市場(chǎng),因?yàn)樗X得線上格局基本已經(jīng)定了。針對(duì)線下市場(chǎng)的數(shù)據(jù)庫領(lǐng)域高端客戶,比如金融政企等,是不是有些友商也比阿里更有優(yōu)勢(shì)?阿里現(xiàn)在去打線下這塊兒市場(chǎng),準(zhǔn)備怎么做?你們的差異化優(yōu)勢(shì)在哪兒?
王偉民:首先,線下市場(chǎng)的需求是剛性的,這是客觀存在的。目前,我們積累了包括運(yùn)營商、金融行業(yè)、政府等很多客戶。大家都在討論一個(gè)問題,如果重新再做一次,是原封不動(dòng)地?fù)Q平臺(tái)還是在原有基礎(chǔ)上做轉(zhuǎn)型升級(jí)?
目前我們看到,包括運(yùn)營商在內(nèi)的客戶有一個(gè)普遍需求,今天我也分享了一個(gè)運(yùn)營商案例,它的業(yè)務(wù)系統(tǒng)(包括boss系統(tǒng))都直接云化了。在這個(gè)過程中,他們要將包括“云”在內(nèi)的很多理念、對(duì)上層應(yīng)用做“泳道化”切割、微服務(wù)化,以及整個(gè)運(yùn)維開發(fā)都要結(jié)合起來,我認(rèn)為這個(gè)替換不是單純地去拿一個(gè)產(chǎn)品替換,而是用解決方案替換。
第二,在政企市場(chǎng)去和Oracle直接PK,比方說性能,我們認(rèn)為這個(gè)可能是被誤導(dǎo)的。因?yàn)橛脩粼谶x型的時(shí)候,性能不是唯一因素,還有非常多其他的因素。我們希望可以用DBStack敏捷交付,無縫集成,將這樣一個(gè)輕量化、可以部署到客戶本地的云,把用戶可能會(huì)用到的數(shù)據(jù)引擎都放上去?,F(xiàn)在,廣東移動(dòng)、安徽移動(dòng)等客戶,都是用了這些產(chǎn)品。
相比友商,他們可能會(huì)有他們的靈活度,我們也有自己差異化特色。比如友商明確了不做私有云,就會(huì)把很大一塊市場(chǎng)放出來,也勢(shì)必有很多友商去填補(bǔ)這個(gè)市場(chǎng)空白。
關(guān)于李飛飛提到的這一點(diǎn),我理解我們要去做的核心原因有兩個(gè):第一,這是高端市場(chǎng),也是標(biāo)桿,是擺在明面上的市場(chǎng)剛需。第二,這些業(yè)務(wù)場(chǎng)景和業(yè)務(wù)負(fù)載對(duì)牽引產(chǎn)品研發(fā)、檢驗(yàn)和持續(xù)提升產(chǎn)品穩(wěn)定性、可靠性都非常有幫助。我覺得結(jié)合這兩方面因素,我們肯定會(huì)堅(jiān)定不移地去做。
記者:就像您提到“云原生數(shù)據(jù)庫2.0時(shí)代的一站式全鏈路數(shù)據(jù)管理與服務(wù)”,也是我們看到的現(xiàn)實(shí)情況,針對(duì)不同場(chǎng)景,需要不同數(shù)據(jù)庫去解決問題,沒有所謂的“一庫包打天下”。我們看到的這些所謂的趨勢(shì),比如云原生+分布式、軟硬一體化、湖倉一體、HTAP等,它本身都是一種融合,背后是用戶簡(jiǎn)單化需求的推動(dòng)。對(duì)于用戶來說,管理一個(gè)數(shù)據(jù)庫和同時(shí)管理四個(gè)數(shù)據(jù)庫的復(fù)雜度、難度肯定不一樣。趨勢(shì)上,大家希望簡(jiǎn)化,但我們看到大家還是專用的場(chǎng)景用專用的數(shù)據(jù)庫,這個(gè)是不是有點(diǎn)矛盾?
王偉民:我們要解決的很多問題其實(shí)都是多變量的。首先,想要兼顧所有變量,是非常有挑戰(zhàn)性的,以及這些變量之間要如何排優(yōu)先級(jí),比如可靠性、開發(fā)、管理、運(yùn)維等一系列因素,都要綜合考慮。
其次,既然通用產(chǎn)品無法滿足需求,那就用“通用+專用”的組合去搞,又要降低復(fù)雜度,怎么辦?我們用DAS、DMS等技術(shù)手段去解決。我們希望DAS可以把以前傳統(tǒng)DBA的補(bǔ)丁升級(jí)、日常巡檢、參數(shù)配置或調(diào)整、備份告警等日常工作用AI的技術(shù)手段來解決。現(xiàn)在有一個(gè)特別好的趨勢(shì),我們已經(jīng)積累了海量的數(shù)據(jù)庫負(fù)載、水位線、慢SQL治理等最佳實(shí)踐,可供我們?nèi)プ鲞@些工作。和深度學(xué)習(xí)一樣,楊立昆老師90年代剛提出的時(shí)候,它只能在90年代美國郵政里面檢測(cè)郵政編碼,不像今天有非常廣泛的用途,主要是數(shù)據(jù)和算力上來了。
回到剛才講的問題,這個(gè)矛盾可能放在以前的確是難以逾越的。但在今天,我們看到解決的契機(jī)了,我們可以用AI4DB的方式來解決。這樣,人就可以更多的聚焦類似于Application DBA、邏輯設(shè)計(jì)、數(shù)據(jù)的data placement等高價(jià)值的工作,常規(guī)工作讓程序自動(dòng)化來做,將兩者有機(jī)的結(jié)合起來。
記者:咱們之前新聞稿提到,阿里云要全面進(jìn)軍線下市場(chǎng)。線下市場(chǎng)里,大家其實(shí)都盯緊的是金融行業(yè),尤其是銀行,我觀察到銀行去做分布式改造其實(shí)是一個(gè)必然的趨勢(shì)。李飛飛之前也有提到,這次云棲大會(huì)上,你們開源PolarDB-X這樣一個(gè)分布式數(shù)據(jù)庫,我可以理解為,這是你們進(jìn)軍線下市場(chǎng)的組合拳嗎?
王偉民:對(duì),可以理解為這是其中一個(gè)關(guān)鍵的action。國內(nèi)做數(shù)據(jù)庫的各參與方熱情高漲,廠家非常多。但對(duì)很多企業(yè)而言,他們非常擔(dān)心你這家公司有多大規(guī)模?我們是不是會(huì)貢獻(xiàn)你50%-60%的營收?他們其實(shí)非常擔(dān)心數(shù)據(jù)庫公司的可持續(xù)經(jīng)營能力,這其實(shí)還是信任的問題。開源在我看來包括兩個(gè)方面:第一,用開源的方式、開放的心態(tài)去解決開放的問題和挑戰(zhàn),吸引更多人參與,第二,開源相當(dāng)于智力的眾籌;
另外,開源也表示一種自信,是一種可以讓用戶檢視質(zhì)量的方式,這樣能夠把信任建立過程中的挑戰(zhàn)大幅度降低。
最后,當(dāng)然我們也希望通過這種方式做生態(tài),比如應(yīng)用的生態(tài)、人才的生態(tài)。
記者:所以,開源只是一種策略,它并不是決定數(shù)據(jù)庫公司、廠商能否在未來競(jìng)爭(zhēng)中脫穎而出的必要條件?
王偉民:對(duì),它并不是。有很多開源產(chǎn)品,可能叫好,但未必叫座(商業(yè)化成功)。也有很多產(chǎn)品,從不叫好也不叫座,直接就玩不下去了,它就只好Open Source了。我們希望用這種方式持續(xù)去做,不代表這樣做了就一定成功,因?yàn)榈拇_有太多開源項(xiàng)目,最后其實(shí)是商業(yè)化不成功的。不光在數(shù)據(jù)庫領(lǐng)域,其他領(lǐng)域也一樣。比如以前有OpenOffice,Open Solaris。即便我們嚴(yán)肅認(rèn)真地去做Open Source,中間也有很多需要學(xué)習(xí)的地方和規(guī)避的坑,這期間要做的事情非常多。
記者:國產(chǎn)數(shù)據(jù)庫落地應(yīng)用越來越多,但實(shí)際上更多是存在于邊緣業(yè)務(wù)上,核心業(yè)務(wù)相對(duì)來說比較少。很多企業(yè)在部署國產(chǎn)數(shù)據(jù)庫的同時(shí),還在續(xù)費(fèi)Oracle數(shù)據(jù)庫,甚至到現(xiàn)在為止兩條線并著跑。這種現(xiàn)象是由于客戶心里的顧慮——怕國產(chǎn)數(shù)據(jù)庫撐不住,還是目前國產(chǎn)數(shù)據(jù)庫在承擔(dān)高端、核心業(yè)務(wù)上,確實(shí)有一定的問題?
王偉民:這兩方面因素都有,而且還不止這兩方面因素。確實(shí)很多客戶在嘗試用更多的供應(yīng)商,包括國產(chǎn)數(shù)據(jù)庫廠商,同時(shí)持續(xù)不斷地使用商業(yè)數(shù)據(jù)庫的產(chǎn)品,這是目前的現(xiàn)狀。原因有幾方面:
第一,商業(yè)數(shù)據(jù)庫經(jīng)過幾十年的發(fā)展和海量用戶(上百萬)長期真實(shí)業(yè)務(wù)負(fù)載的考驗(yàn),它的企業(yè)級(jí)特性、穩(wěn)定性、商業(yè)模式、服務(wù)等各方面,都是經(jīng)過考驗(yàn)的。不管用什么產(chǎn)品,用戶業(yè)務(wù)系統(tǒng)都能高效的運(yùn)轉(zhuǎn)起來。
而目前國內(nèi)很多廠商,無論是從研發(fā)的投入、產(chǎn)品的成熟度,還是產(chǎn)品資料、生態(tài)、人才等各方面,與商業(yè)數(shù)據(jù)庫相比還是有差距的。這是客觀事實(shí),我們也應(yīng)該正視這個(gè)客觀事實(shí)。人家干了五十年,我們干了十年,投入比人家少很多,不可能就超越人家,這不符合客觀規(guī)律。
第二,的確有很多業(yè)務(wù)場(chǎng)景不需要那么高端的產(chǎn)品。這句話有兩層意思,一是目前很多產(chǎn)品在企業(yè)功能、特性、完備度、性能、穩(wěn)定性等各方面(與商業(yè)數(shù)據(jù)庫)有差距,但不代表這個(gè)差距不可逾越,只是需要時(shí)間去逾越。二是很多業(yè)務(wù)場(chǎng)景里,很多商業(yè)數(shù)據(jù)庫的功能、特性其實(shí)都是沒有被用到的也不需要用到,這個(gè)是有統(tǒng)計(jì)數(shù)據(jù)表明的。
記者:之前我了解到,使用Oracle的絕大部分企業(yè)可能連一半的功能、性能都未必用得上,對(duì)于很多企業(yè)來說,性能問題可以被很多架構(gòu)很好地解決。
王偉民:在很大程度上,我們的產(chǎn)品對(duì)很多核心業(yè)務(wù)場(chǎng)景、業(yè)務(wù)典型負(fù)載來說,都是夠用的,但是我們產(chǎn)品的穩(wěn)定性或其他方面,可能還有較長的路要走,還需要接受海量用戶長時(shí)間、持續(xù)的負(fù)載考驗(yàn)。
記者:我是不是可以這樣理解?目前來說,國產(chǎn)數(shù)據(jù)庫是可用的,但是離好用還有一定距離?之前我看到關(guān)于國產(chǎn)數(shù)據(jù)庫的目標(biāo)分為技術(shù)目標(biāo)和市場(chǎng)目標(biāo)。市場(chǎng)目標(biāo),第一個(gè)是實(shí)現(xiàn)國產(chǎn)化的自主可控,第二個(gè)是走向全球。從技術(shù)目標(biāo)來說,分為四個(gè)目標(biāo):人有我無、人有我有、人無我有、人有我優(yōu)。您覺得,目前整個(gè)國產(chǎn)數(shù)據(jù)庫市場(chǎng)從技術(shù)目標(biāo)、市場(chǎng)目標(biāo)來說,分別是什么階段?
王偉民:我覺得從技術(shù)目標(biāo)、功能特性角度來講,可能有一些特性是人無我有的,但對(duì)于很多普遍需求的特性、共性,我們還處在追趕和補(bǔ)充階段,“人有我有一部分”或“人有我優(yōu)一小部分”,不同廠商在清單的完備程度上不太一樣。
市場(chǎng)方面差的就更遠(yuǎn)了。如果統(tǒng)計(jì)線上、線下市場(chǎng),阿里云在中國做到了第一,超過了Oracle。但如果回到全球視角,根據(jù)2020年Gartner統(tǒng)計(jì)數(shù)據(jù),微軟第一,Oracle第二,阿里云排到全球第七,在To B、云和數(shù)據(jù)庫市場(chǎng),我們和領(lǐng)先企業(yè)還有不小差距。
舉個(gè)例子,Oracle一個(gè)季度的凈利潤差不多100多億美金,就算數(shù)據(jù)庫只占40%,除去它的標(biāo)準(zhǔn)服務(wù),可能也有幾十億美金,這是個(gè)不得了的數(shù)據(jù)。中國的軟件業(yè)百強(qiáng)的凈利潤加起來可能都沒有這么多。
記者:目前,你們幫客戶去O、去MySQL、去Teradata等的時(shí)候,會(huì)面臨哪些挑戰(zhàn)?你們通常是以什么方式幫助客戶?
王偉民:目前最大的挑戰(zhàn)是生態(tài)層面的。沒有哪個(gè)客戶的業(yè)務(wù)系統(tǒng)能做到drop-in replacement,北向可能有應(yīng)用側(cè),縱向可能有數(shù)據(jù)的集成,還有南側(cè)可能有操作系統(tǒng)、硬件等一系列的適配。你要想去替換的時(shí)候,很多客戶會(huì)說“不光要替換這個(gè)產(chǎn)品,還要保留原來的管控、開發(fā)、運(yùn)維、應(yīng)用等一系列流程的對(duì)接。所以,生態(tài)方面是一個(gè)很大的挑戰(zhàn)。
第二是人才方面。很多企業(yè)在人才方面要求有一定的專業(yè)積累,換產(chǎn)品可能需要有一個(gè)學(xué)習(xí)的過程,對(duì)人才來說,要降低學(xué)習(xí)曲線的坡度,學(xué)習(xí)成本不要太高。所以我們?cè)诩嫒菪苑矫?,要做很多工作。關(guān)于兼容性的工作又是動(dòng)態(tài)移動(dòng)靶,今天做到了某個(gè)點(diǎn),被兼容的對(duì)象又往前走了,又要繼續(xù)去做。兼容性工作,做到90分和80分的區(qū)別不大,但是從90分到95分工作量巨大,要從95分到100分幾乎是不可能的任務(wù)。所以我們?cè)谙胧遣皇且S,哪些方面我們要跟隨,哪些方面我們要用別的方式來替代——或者干脆不考慮兼容性了等等,這些都是要思考的問題。當(dāng)然,這中間的取舍是非常難的。
記者:今天的采訪就到這兒,感謝王總接受采訪。