作者:郭華
今年六月距去年六月正好一年。
去年六月,Cloudera發(fā)了FY20Q1財(cái)報(bào),營(yíng)收以微小差值不及分析師預(yù)期,股價(jià)當(dāng)天跌去40%。
今年六月,Cloudera發(fā)了FY21Q1財(cái)報(bào),對(duì)比去年,營(yíng)收增長(zhǎng)12%,利潤(rùn)增長(zhǎng)44%,大客戶和訂閱服務(wù)占比也穩(wěn)定增長(zhǎng),均超分析師預(yù)期,于是股價(jià)一路上漲,疫情中逆勢(shì)重回高地。
從股價(jià)來(lái)看,Cloudera這一年的表現(xiàn)就像坐了一次過(guò)山車,不過(guò)解讀財(cái)報(bào)非我所愿,對(duì)趨勢(shì)做技術(shù)分析更非我所擅長(zhǎng),但對(duì)于這個(gè)現(xiàn)象,我倒有些關(guān)于“基本面”的話想說(shuō)一說(shuō)。
去年六月,在Cloudera股價(jià)暴跌的時(shí)候,大家找到了三個(gè)問(wèn)題:
1) Cloudera所賴以生存的Hadoop氣數(shù)已盡;
2) Cloudera公司合并了Hortonworks,兩者的產(chǎn)品線不同,整合困難;
3) Cloudera在云時(shí)代毫無(wú)作為,已被拋棄;
這三個(gè)問(wèn)題在程度上雖然有夸張的成分,但不完全是空穴來(lái)風(fēng),關(guān)注點(diǎn)也非常準(zhǔn)確。所以所謂的“基本面”,其實(shí)就是看看Cloudera到底把它們解決掉了沒(méi)有。
1. Hadoop已死,Hadoop長(zhǎng)存
很早的時(shí)候,大概比Cloudera股價(jià)暴跌2019年還早那么五六年,很多人便開(kāi)始宣稱Hadoop已死,Spark出來(lái)后Hadoop已死,Elasticsearch出來(lái)后Hadoop已死,甚至MongoDB出來(lái)后Hadoop也已死。
作為一個(gè)2011年開(kāi)始接觸Hadoop,并至今還賴以為生的IT中年,我對(duì)Hadoop已死的論調(diào)十分不感冒。實(shí)際上只需幾個(gè)問(wèn)題便能停止這種毫無(wú)根據(jù)的假想:有幾家公司做大數(shù)據(jù)不用Hadoop?Hadoop是否有替代方案?如果有的話,難度是不是小于Elasticsearch或Spark或Mongo或其他?
我更能接受的一種說(shuō)法是,Hadoop里某些組件已經(jīng)有了的替代品,比如Spark、Flink 之于 MapReduce,云存儲(chǔ)之于HDFS,K8S之于YARN。而且我認(rèn)為比起Hadoop已死的暴力論斷,這種說(shuō)法更為實(shí)際,也更值得Cloudera擔(dān)心。
那Cloudera是怎么解決這個(gè)問(wèn)題的?
他沒(méi)有解決。
真的,他沒(méi)有反駁和抗拒技術(shù)本身的衰落,反而承認(rèn)了這一點(diǎn)。他說(shuō)技術(shù)就是不停的處于打破與被打破的循環(huán)之中,而他們要做的是把Hadoop發(fā)展成一個(gè)生態(tài),讓那些更先進(jìn)的技術(shù),最終成為這個(gè)生態(tài)的一部分,老的如Hive、Hbase,新的像Spark、Flink,現(xiàn)在都是Hadoop生態(tài)的一部分,總體不下40個(gè)。
就像一片森林,局部有枯萎有新生,但整體看斗轉(zhuǎn)星移,生生不息。
借用他們的一張PPT來(lái)看,大概是下邊這樣。
(圖片來(lái)自Cloudera大中華區(qū)總經(jīng)理徐晉在InfoQ的分享)
這是一種擁抱變化的哲學(xué)。
如果這樣看的話,你不得不承認(rèn)Hadoop反而有比其他開(kāi)源軟件更強(qiáng)的生命力。因?yàn)殡m然大家都有意無(wú)意在朝這個(gè)方向努力,比如Elasticsearch上的ELK、Kafka上的KSQL和Kafka Streams,但能做成一個(gè)生態(tài)的,目前看,恐怕只有Hadoop。
而且從另一方面來(lái)看,很多廠商提供的Hadoop部分替換方案也無(wú)一例外會(huì)兼容Hadoop接口,所以哪怕Hadoop自身所有軟件都衰落了,被完全替換了,Hadoop也能作為一種標(biāo)準(zhǔn)繼續(xù)存在。
Hadoop已死,Hadoop長(zhǎng)存。
2. Cloudera產(chǎn)品線合并
全新的Cloudera由老的Cloudera和Hortonworks合并而來(lái)。
在合并之前,兩者的產(chǎn)品雖然都基于Hadoop,但理念和具體組件并不一致。Cloudera的產(chǎn)品叫CDH,采取了Open Core+閉源組件的商業(yè)模式,在開(kāi)源Hadoop上加了一些自研產(chǎn)品,比如管控平臺(tái)。Hortonworks的產(chǎn)品叫HDP,組件和商業(yè)模式都采取了全開(kāi)源的模式。
所以合并后的第一大問(wèn)題就是產(chǎn)品策略的問(wèn)題。
為此,Cloudera做了大刀闊斧的改革。
一方面,Cloudera保持對(duì)原CDH和HDP的支持直到2022年,給這些客戶一個(gè)平滑的過(guò)渡期。另一方面,Cloudera也推出了整合性的新產(chǎn)品,并且孤注一擲的表示2022年以后,全部客戶都會(huì)轉(zhuǎn)移到這個(gè)產(chǎn)品上來(lái)。
這個(gè)新產(chǎn)品便是CDP。
CDP全稱為Cloudera Data Platform。按照Cloudera CPO Arun Murthy的說(shuō)法,CDP會(huì)在CDH6和HDP3的基礎(chǔ)上進(jìn)行整合,把兩條產(chǎn)品線里最好的組件拿出來(lái),在保證兼容性的前提下,給客戶更好的體驗(yàn)。
在這個(gè)基礎(chǔ)上,Cloudera也改變了自己的商業(yè)模式。
2019年7月,Cloudera發(fā)表了一篇文章,題為《我們對(duì)開(kāi)源的承諾》,表示會(huì)把原來(lái)的閉源組件全部開(kāi)源,比如Cloudera Manager,Cloudera Navigator和Cloudera Data Science Workbench(“CDSW”)等,而且這個(gè)決定在所有新發(fā)版本上全部有效,包括老的CDH、HDP和CDP。
該決定的執(zhí)行期為6個(gè)月,現(xiàn)在已完成。
現(xiàn)在Cloudera把所有產(chǎn)品都托管到了Apache基金會(huì),在AGPL 和 Apache 2.0 兩種許可下進(jìn)行開(kāi)源,并以訂閱的形式向客戶收取軟件和服務(wù)費(fèi)用。
這是Cloudera新商業(yè)模式,也是紅帽的商業(yè)模式。早在2013年的時(shí)候,Cloudera的第一任CEO Mike Olson就曾表示,雖然開(kāi)源軟件蓬勃發(fā)展,但其背后的商業(yè)公司卻難以獨(dú)立生存,要么消失要么被收購(gòu),比如IIIustra、Informix、Sleepycat、Mysql、SpringSource、JBoss……實(shí)際成功的只有一家,就是紅帽。
所以并不意外。
那效果怎么樣?
從FY21Q1財(cái)報(bào)來(lái)看,訂閱服務(wù)收入1.871億美元,占總體的89%,同比增長(zhǎng)21%,超過(guò)總體增幅,同時(shí)毛利率也提高到了85%。這意味著訂閱服務(wù)已經(jīng)成了其營(yíng)收的主力,而且在帶動(dòng)整體向上突破。
與此同時(shí),Cloudera的客戶數(shù)也在增加。
FY20Q2的財(cái)報(bào)中, Cloudera的大客戶(年化經(jīng)常性收入大于10萬(wàn)美金)數(shù)增長(zhǎng)了24個(gè),達(dá)到953個(gè)。而到了FY21Q1的財(cái)報(bào),這個(gè)數(shù)字已經(jīng)到了1004。要知道一年前Cloudera的暴跌就和客戶數(shù)有關(guān),在FY20Q1的財(cái)報(bào)電話會(huì)議上前 CEO Tom Reilly曾親口承認(rèn)產(chǎn)品線的分歧影響了客戶拓展,確實(shí)某些客戶因?yàn)榈却a(chǎn)品線的整合而推遲了續(xù)費(fèi)。
所以從這兩點(diǎn)看,Cloudera在產(chǎn)品線上的整合可以說(shuō)是成功了。
3. 與云共生
過(guò)去的一年是Cloudera在云計(jì)算上猛追猛趕的一年。
北宋有位“半部論語(yǔ)治天下”的名相趙普,在宋太宗趙匡義繼位時(shí),他曾上書(shū)說(shuō),“中國(guó)既安,群夷自服。是故夫欲攘外者,必先安內(nèi)。” 自此以后,“攘外必先安內(nèi)”就流傳了下來(lái),成了歷代統(tǒng)治者面臨內(nèi)憂外患時(shí)的首選策略,直到九一八事變后,還在被國(guó)民政府反復(fù)強(qiáng)調(diào)。
這句話用來(lái)形容Cloudera或許也是貼切的。
因?yàn)镠adoop社區(qū)之前一直在內(nèi)戰(zhàn)。Hadoop萌芽自Doug Cutting個(gè)人,但成長(zhǎng)于雅虎。在Hadoop基礎(chǔ)上,有兩家主要開(kāi)源獨(dú)立開(kāi)源商業(yè)公司,就是Cloudera和Hortonworks,兩家在開(kāi)源社區(qū)的貢獻(xiàn)幾乎相當(dāng),雙方不僅在爭(zhēng)奪市場(chǎng),也在爭(zhēng)奪開(kāi)源Hadoop的控制權(quán)。這種分裂牽扯了太多精力,以至于一不注意就讓云廠商直接用開(kāi)源Hadoop收割掉了大部分企業(yè)上云的紅利。
所以有這樣一種魔幻般的現(xiàn)實(shí),一邊是Hadoop已死,一邊是各大云廠商拿Hadoop瘋狂賺錢(qián)。據(jù)分析師測(cè)算,單2018年AWS的EMR就產(chǎn)生了2.5億美金的營(yíng)收,而該產(chǎn)品介紹就是“Hosted Hadoop framework“。而這并不是孤例,除AWS的EMR外,谷歌云有Dataproc,Azure有HDInsight,阿里云有E-MapReduce,云計(jì)算四巨頭,在收割Hadoop開(kāi)源紅利面前,無(wú)一缺席。
所以如果說(shuō)產(chǎn)品線合并是內(nèi)憂的話,那云廠商就是外患了。
不過(guò)云廠商并不是在針對(duì)Hadoop,云只是在崛起,并在崛起之路上順帶吞噬了遇到的東西,不僅包括Hadoop,也包括其他開(kāi)源軟件。
MongoDB 的 CEO這樣描述道:“每當(dāng)一個(gè)新的開(kāi)源項(xiàng)目變得非常流行時(shí),云提供商就會(huì)剝奪我們的技術(shù),將免費(fèi)軟件放在他們的平臺(tái)上,然后從中獲取大部分(如果不是全部)價(jià)值,但幾乎不回饋開(kāi)源社區(qū)”。
只要用戶上了云,那他幾乎只能選擇云廠商提供的開(kāi)源服務(wù),而上云恰恰是過(guò)去十年企業(yè)IT的主旋律。這讓開(kāi)源原廠十分憤怒,Redis CEO 直言:“多年來(lái),我們就像個(gè)傻子一樣,他們拿著我們開(kāi)發(fā)的東西大賺了一筆”。
于是他們紛紛開(kāi)始采取行動(dòng),一方面修改開(kāi)源協(xié)議,禁止云廠商提供托管服務(wù)(只針對(duì)部分組件有效),另一方面也在積極發(fā)展自己的獨(dú)立云服務(wù),比如Confluent的Confluent Cloud、Elastic的Elastic Cloud,以及Cloudera的CDP。
他們怒斥公共云廠商為吸血鬼,而且準(zhǔn)備以反壟斷名義提起訴訟。
不過(guò)好在云廠商也不是鐵板一塊,比如谷歌就從中看到了超越AWS的機(jī)會(huì)。他旗幟鮮明的表示支持開(kāi)源,并在2019年引入了7家開(kāi)源軟件供應(yīng)商,通過(guò)谷歌云售賣他們的商業(yè)服務(wù),準(zhǔn)備打造一個(gè)Open Cloud。
大部分云廠商都有一個(gè)MarketPlace可以售賣其他公司開(kāi)發(fā)的軟件,而谷歌云的特別之處在于,他引入的開(kāi)源廠商都會(huì)有內(nèi)部的團(tuán)隊(duì)來(lái)對(duì)業(yè)績(jī)負(fù)責(zé)。比如引入Confluent(kafka)的就是谷歌自己的Pub/Sub產(chǎn)品團(tuán)隊(duì),兩者功能和場(chǎng)景上類似,只不過(guò)一個(gè)自研,一個(gè)開(kāi)源。按照谷歌的說(shuō)法,在同一個(gè)云平臺(tái)上提供這兩個(gè)產(chǎn)品,旨在“滿足用戶的不同選擇傾向”。
在這種情況下,開(kāi)源原廠的獨(dú)立云服務(wù)變得實(shí)際起來(lái),他們可以和不同的公共云合作,在不同的云上售賣自己的產(chǎn)品,同時(shí)維持獨(dú)立入口,與云共生。
Cloudera的CDP也是如此。
CDP不僅是原CDH和HDP兩條產(chǎn)品線的結(jié)合體,也有支持多云的共有云版本,同時(shí)也有私有云/混合云等多種運(yùn)行環(huán)境。
而且CDP的開(kāi)發(fā)速度也十分快,2019年初公布計(jì)劃,幾個(gè)月后產(chǎn)品發(fā)布,目前已經(jīng)完成了在AWS、Azure上的版本,谷歌云版本下半年面市。實(shí)際上多云不僅是Cloudera應(yīng)對(duì)云廠商威脅的手段,從客戶的需求看,其本身也有不可替代的價(jià)值。隨著云滲透率的提高,被云綁定成了一個(gè)切實(shí)的擔(dān)憂,讓很多客戶在上云的同時(shí)尋找Plan B。比如把應(yīng)用部署在多個(gè)云服務(wù)商,或者自建機(jī)房。CDP就是這種需求下的產(chǎn)物,通過(guò)CDP,客戶可以把自己的大數(shù)據(jù)服務(wù)部署到AWS、Azure或谷歌云上,無(wú)縫切換,消除了被某個(gè)云廠商綁定的問(wèn)題。
而且Cloudera最近還推出了CDP私有云,在K8S基礎(chǔ)上把存儲(chǔ)和計(jì)算做了分離,讓客戶應(yīng)用可以在公有云與公有云,公有云和私有云之間無(wú)縫切換,構(gòu)建一個(gè)“以數(shù)據(jù)為中心,面向多云的私有云平臺(tái)”。
短短一年時(shí)間,Cloudera以驚人的速度完成了一場(chǎng)蛻變,曾被人詬病在云時(shí)代毫無(wú)作為的他,儼然看齊并領(lǐng)先起了潮流。
4. 總結(jié)
這便是Cloudera股價(jià)過(guò)山車背后的基本面,他孤注一擲的CDP不管從計(jì)劃還是執(zhí)行上都表現(xiàn)的足夠亮眼,以一個(gè)產(chǎn)品解答了曾被人詬病的多個(gè)問(wèn)題。從這個(gè)角度來(lái)看,可以說(shuō)他轉(zhuǎn)型成功了,至少也走在了成功的路上。
再?zèng)]有人像去年那樣,用洋槍隊(duì)圍觀神拳義和團(tuán)的姿態(tài),詢問(wèn)他將何去何從。
只是對(duì)他來(lái)說(shuō),過(guò)去的這一年似乎有些漫長(zhǎng)。