以 “數(shù)據(jù)為擎 融合共贏” 為主題的第2屆中國信息通信大數(shù)據(jù)大會于今日隆重召開。在會上,中國聯(lián)通研究院大數(shù)據(jù)研究中心主任魏進(jìn)武做了以“基于電信大數(shù)據(jù)、帶動公共創(chuàng)新的實踐與再思考”為主題的報告。
以下為演講實錄:
各位領(lǐng)導(dǎo)、各位來賓,上午好,這是我第二次參加咱們信息通信的大會,當(dāng)然這個大會也開了兩屆,那么在第一屆大會上我提出來是說唱響的,說大數(shù)據(jù)怎么樣構(gòu)建這個開放的大數(shù)據(jù)?能共享的大數(shù)據(jù)?能夠和業(yè)界來和合作,能不能把大數(shù)據(jù)平臺變成一個公共的基礎(chǔ)設(shè)施?能不能把面向公共去開放,能夠讓更多的大數(shù)據(jù)的有意愿的玩家能夠在基于電信的數(shù)據(jù)做更多的工作,那么秉承著這兩個想法,我們在這一年當(dāng)中,也就是說咱們兩屆大會之間期間,一直都在把我們的平臺像公共化在開放、在推進(jìn),那么在這一塊里面,也遇到了好多技術(shù)上的問題、模式上的問題,因為在一個企業(yè)內(nèi)部,向各個生產(chǎn)主體單元來開放和面向社會公共化的開放,面臨壓力是不一樣的。
所以經(jīng)過這一年的一些做法,我們把我們的一些實踐的情況跟大家做一個匯報,也跟大家做一個分享,同時通過這一年當(dāng)中我們也有一些體會,在今年的4月份,聯(lián)通集團(tuán)整個召開了一個面向六大板塊的一個創(chuàng)新業(yè)務(wù)的研討會,那么其中大數(shù)據(jù)是一個大的板塊,在這個版塊里面我們也把全球的運(yùn)營商,也就是說通信行業(yè)里面大數(shù)據(jù)的發(fā)展情況進(jìn)行了梳理,大概的話運(yùn)營商的大數(shù)據(jù)基本上發(fā)展了這么幾個階段,一個就是數(shù)據(jù)整合階段就練內(nèi)功的階段。
第二個就是通過內(nèi)部的應(yīng)用來做嘗試大數(shù)據(jù)的應(yīng)用階段。第三個階段就是推向外部的行業(yè)應(yīng)用,也就是說賺錢。也就是咱們說的數(shù)據(jù)變現(xiàn),那么現(xiàn)在全球的運(yùn)營商基本上都在處于一個內(nèi)外部應(yīng)用并舉的這么一個發(fā)展階段了。那么其中內(nèi)部應(yīng)用這一塊,重點(diǎn)可能有面向市場營銷、精準(zhǔn)營銷,包括提升客戶體驗后端的網(wǎng)絡(luò)優(yōu)化,然后前端服務(wù)這一塊,大致上有這么幾種模式,一個就是數(shù)據(jù)服務(wù),另外一個就是分析服務(wù),還有一塊就是平臺服務(wù),那么這三個從數(shù)據(jù)分析到平臺,就是他的難度越來越大,但是同樣的價值也越來越大。
這三種模式現(xiàn)在在不同的運(yùn)營商當(dāng)中都在開展,而且在國外的運(yùn)營商和國內(nèi)的運(yùn)營商,橫向來看,認(rèn)為基本上技術(shù)上雷同技術(shù)架構(gòu)大差不差,然后數(shù)據(jù)類型大差不差,服務(wù)模式大差不差,各種應(yīng)用場景你有的我也有,基本上是這么一個情況。所以就是說在這講各種應(yīng)用的案例的沒舉是沒有太大的含義的,但是這個大數(shù)據(jù)的發(fā)展真正的差異在哪?到了現(xiàn)在我們認(rèn)為制約或者說決定每一個企業(yè)大數(shù)據(jù)的發(fā)展的好或賴?在市場上的占用的情況取決于你的規(guī)模化的生產(chǎn)組織、運(yùn)營能力,而不是取決于技術(shù),也不取決于說你的數(shù)據(jù)有多大的量,或者說你的技術(shù)多先進(jìn),那么能不能把這個企業(yè)里面各個單元的生產(chǎn)單元的,一個生產(chǎn)組織和調(diào)動能夠規(guī)模化的組織起來,這可能是制約每一個企業(yè)未來這大數(shù)據(jù)產(chǎn)業(yè)市場上的一個關(guān)鍵。
第二個現(xiàn)在各個大會上都在講大出來的前景,市場非常廣闊。但是經(jīng)過了這么多年以來,這么幾年來大數(shù)據(jù)的熱情,直到現(xiàn)在我們來看的話,基本上實際的市場的投資回報和實際的市場回報和預(yù)期的市場空間之間差異是很大的。那么這個原因可能有很多種,其中之一可能就是整個現(xiàn)在大數(shù)據(jù)還在沉睡,還沒有喚醒,當(dāng)然這個原因可能有好多,但是其中有一個原因可能是最根本的,就是我們的市場真正愿意為做,為了應(yīng)用大數(shù)據(jù)而愿意付費(fèi)的市場空間的剛需并不是那么大。
大家還是處于一個獵奇也好,探索也好,這樣的目前更大。這是我們在應(yīng)用態(tài)勢的一個基本的判斷,當(dāng)然剛才講李總也講了,就是說講大數(shù)據(jù)都愛講生態(tài)圈,基本上包含這么幾塊數(shù)據(jù)產(chǎn)品服務(wù),那么現(xiàn)在就是說為什么運(yùn)營商有責(zé)任或者說有義務(wù)扛起來大數(shù)據(jù)把大數(shù)據(jù)變成一個公共基礎(chǔ)設(shè)施、公共創(chuàng)新環(huán)境的這么一個大旗,因為運(yùn)營商在制約大數(shù)據(jù)的這三個關(guān)鍵要素里面能夠做到全覆蓋,所以的話運(yùn)營商最有希望能把自己的開放生態(tài)做好,能夠變成國家層面上的一個基礎(chǔ)的公共創(chuàng)新平臺,就像我們的網(wǎng)絡(luò)一樣,所以就是說運(yùn)營商在這個大數(shù)據(jù)生態(tài)圈里面,我們期望是說把大數(shù)據(jù)也像固網(wǎng)以往一樣,變成國家級的這么一個公共創(chuàng)新的基礎(chǔ)設(shè)施,而不是應(yīng)用層面上那么一個民主高高在上。
現(xiàn)在在這三個要素里面產(chǎn)品和服務(wù),依然是這個產(chǎn)生價值的一個關(guān)鍵,但是這兩個我剛才講了,就是說實際的市場回報并沒有那么預(yù)期的那么強(qiáng)。為什么?就是因為產(chǎn)品和應(yīng)用還是中需要進(jìn)一步的探索,實際的就是說基于數(shù)據(jù)加剛需的這種市場的需求。直接基于需求的這種驅(qū)動力還遠(yuǎn)遠(yuǎn)低于說由數(shù)據(jù)或者說是加需求的這種共同磨合出來的這種探索出來的刺激,出來的新需求更少。那么在這種情況下就更需要說要把這個大數(shù)據(jù)的能力面向公共來開放,然后給大家一個給整個全社會一個試錯的環(huán)境,一個尋找探索的一個環(huán)境。
在這一方面,中國聯(lián)通在這一塊也充分認(rèn)識到了,就是說只有合作和開放,才能夠?qū)崿F(xiàn)將來大數(shù)據(jù)規(guī)模化應(yīng)用的一個主要的途徑,那么這點(diǎn)上基本上在聯(lián)通內(nèi)部也形成這么兩個開放的格局,一個就是構(gòu)建面向公共開放的創(chuàng)新孵化平臺,另外一個面向我們企業(yè)內(nèi)部各個生產(chǎn)主體,包括我們的分公司、子公司開放的這么一個生產(chǎn)平臺,那么這個生產(chǎn)平臺,主要是開放給我們內(nèi)部的生產(chǎn)單元來對外變現(xiàn),對內(nèi)運(yùn)營。那么這個開放孵化平臺主要是面向全社會來開放,給社會提供一個試錯的平臺探索的平臺,同時也給我們提供一個就是說人才挖掘的環(huán)境,然后創(chuàng)新應(yīng)用的孵化環(huán)境,那么基于這種情況,所以能夠讓這樣的聯(lián)動,也就是說在公共創(chuàng)新孵化平臺上的已有的模型應(yīng)用場景,能夠引流到我們生產(chǎn)平臺上去,變成可以對外運(yùn)營服務(wù)的。
同時因為我們現(xiàn)在就是說實際上大家在做大數(shù)據(jù)應(yīng)用的時候,都可能會遇上一個問題,所以我們在交流的時候說你這樣的數(shù)據(jù),我這樣的數(shù)據(jù),咱們一結(jié)合就能怎么樣?結(jié)果說得很熱鬧,可是事實上落地的時候,兩個都是數(shù)據(jù),根本見不了面,為什么?回去跟老板一匯報,老板說我的數(shù)據(jù)也不能出門,他說它的數(shù)據(jù)也不能出門,結(jié)果說得很熱鬧,結(jié)果數(shù)據(jù)是見不了面的,這是為什么?是因為模糊性的決策是沒法決策的。當(dāng)把一個數(shù)據(jù)開放擺在決策的領(lǐng)導(dǎo)面前的時候,誰都不敢拍這個板,但是當(dāng)我們把這個要出什么場景?需要有你的什么字段的數(shù)據(jù)和我的什么字段的結(jié)合的時候,把具體問題擺出來的時候是可以決策的,所以也就是說在這種情況下,在當(dāng)前數(shù)據(jù)流通的法律邊界很模糊的情況下,我認(rèn)為公共創(chuàng)新孵化平臺是推進(jìn),基于不同行業(yè)數(shù)據(jù)融合出來來產(chǎn)生新的應(yīng)用的一種無奈之舉,也是一種可行的辦法。
基于這種情況下,聯(lián)通去年也是對外勉勉強(qiáng)強(qiáng)實現(xiàn)了合同的收入的四個億,也就是說是在實際的大數(shù)據(jù)的對外變現(xiàn)的運(yùn)營,做了一下試水,那么實際上來說是抵不住我們后端大概將近4000個節(jié)點(diǎn)的服務(wù)器的電費(fèi)的。但是是從這個數(shù)據(jù)的端到應(yīng)用的端,這個流程是跑通了,也就是說嘗試有了結(jié)果,也就是說把我們從大數(shù)據(jù)的核型圈、供給圈到增值圈這一套全流程是走通了,這是就是一個嘗試。
所以在開放的過程當(dāng)中我們就會發(fā)現(xiàn),就是說在這個生態(tài)圈里面不同的主體上有些主體,說我只有一個待業(yè)的行業(yè)數(shù)據(jù),但是我要做我的應(yīng)用的時候可能需要其他行業(yè)的一點(diǎn)數(shù)聚,就剛才講的這個問題,讓不同行業(yè)的具體的字段行的數(shù)據(jù)能夠減免。第二個說我有人才,但是我要啥沒啥,還有一塊說我有需求,我應(yīng)用場景,但是我要數(shù)據(jù)沒數(shù)據(jù)。我要IT資源,沒IT資源,要人才沒人才,然后有些說我有主意,大概這是目前在大數(shù)據(jù)各個生態(tài)圈里面的,有和缺的幾個狀態(tài),所以在這種情況下可能更需要有一個能夠面向公共開放的這么一個環(huán)境,然而有同層面情懷的人來在這個上面的人碰撞和探索,所以這就是我們?nèi)ツ陜蓪么髸陂g做的工作,就推出了一個數(shù)極數(shù)據(jù)空間的這么一個公共的平臺。
就是說我們是提供的是平臺加數(shù)據(jù)加應(yīng)用場景的三種開發(fā)模式,也就是說把我電信運(yùn)營商的全網(wǎng)異構(gòu)的全量樣本數(shù)據(jù)都想社會能開放,當(dāng)然是一定歷史的數(shù)據(jù)一定歷史時期的數(shù)據(jù),讓大家社會上的人能夠看得懂運(yùn)營商全網(wǎng)的不斷分布在終端上的IT系統(tǒng)上的、網(wǎng)絡(luò)上、網(wǎng)元上的數(shù)據(jù)都長什么樣,有什么含義?那么希望通過這種方式能夠提供一種全社會的眾創(chuàng)眾籌的這么一個環(huán)境,讓這個不同層面上的人能夠在應(yīng)用上、模型上,然后知識庫上能夠貢獻(xiàn)和完善,這是一個就是這個平臺的一種能力,大概有八類幾十種能力。
這是這個平臺的特點(diǎn),就是說在這個平臺里面把底層的,然后中間的大數(shù)據(jù)能力的平臺,然后后期面向運(yùn)營的這種一個管理,然后還有這種服務(wù)的容器化調(diào)度都得平臺上做的實現(xiàn)。另外一塊,更重要的是就是這個平臺要面向公共開放和面向企業(yè)內(nèi)開放是不一樣的,企業(yè)內(nèi)開放,我可以通過行政的文件的要求來約束,而面向公共開放,其中之一個難題就是說把一切的數(shù)據(jù)加工,就要引擎化分裝,我不可能說讓他做數(shù)據(jù)加工都要登錄到我的機(jī)器的操作系統(tǒng)上去,再來做這個加工,那這樣的話就等于不是開放了,那是裸奔了。
第二個就是在這個架構(gòu)里面,我們也在暢想,就是說兩級的一個架構(gòu),后端通過提供各種大數(shù)據(jù)的平臺的能力,大概就是幾類的能力,四大類的能力在后端,那么前端也提供這么一個整個面向產(chǎn)品、面向應(yīng)用孵化、面向應(yīng)用場景接入的這么一個輕量級的平臺,能夠訪問到后臺重點(diǎn)的能力上去。那么相對來說我們也和目前幾個公共的大數(shù)據(jù)平臺做了一個比對,那么這幾個平臺從技術(shù)上講那是很豐富的,但是從商業(yè)模式上來說運(yùn)行的并不好,因為他的一個基本的商業(yè)模式說你有數(shù)據(jù)沒地方處或者沒工具來處理,你到我這來處理。
他們這個事情,其實來說,當(dāng)我一個團(tuán)隊,當(dāng)我一個企業(yè)有TB級PB級的出去的時候,那么真正我來說我建一個平臺在平臺的費(fèi)用不止是什么東西,真是看說這樣的數(shù)據(jù)對我這個企業(yè)收益有沒有帶來更高的提高,所以就是說我只提供一個平臺的IT的價值是沒有意義的,開展不起來的,所以我們這個平臺上是基于平臺能力的,也就是說平臺的IT能力和運(yùn)營商的的樣本數(shù)據(jù)以及我們希望或者說我們希望社會力量參與的一些場景來開放出來,大家共同來參與,那么這是這個平臺的一些技術(shù)要素,大概有這么幾個特點(diǎn)。
其中之一就是說包括資源,包括安全的,就是我剛才講的這個就是加工引擎的封裝,另外一塊在安全這一塊也做了一個,就是說結(jié)果數(shù)據(jù)從后臺重載能力平臺輸出,那么這個也是經(jīng)過這一年的嘗試,也大概就是孵化的內(nèi)容也覆蓋了這么多的行業(yè)和內(nèi)容。我在想運(yùn)營商的大數(shù)據(jù)發(fā)展到現(xiàn)在,我們基本上把我們的平臺架構(gòu),把我們的部署環(huán)境看,基本上是以旁路式的這種大數(shù)據(jù)來做的。什么叫旁路式?
然后通過這邊采集,出來在旁邊一個大的數(shù)據(jù)平臺,比如說聯(lián)通是把31個省全網(wǎng)全站的數(shù)據(jù)全部集中在總部了,在旁邊堆了一個大數(shù)據(jù)平臺,3000多個節(jié)點(diǎn),4000個節(jié)點(diǎn),然后來做分析服務(wù),可是這樣的一些旁路式的大數(shù)據(jù)服務(wù),這是當(dāng)年的無奈之舉,因為這種方案是三年以前四年以前定的,因為當(dāng)時的技術(shù)只是分布式技術(shù)帶動的。大數(shù)據(jù)在今天的時候我們再來看,面臨著什么問題,就是說它只適合做群體性的風(fēng)險而處理性的分析,一個很好的應(yīng)用就是管理類的應(yīng)用。也就是說他只是我們過去原來1.0,大數(shù)據(jù)1.0做BI的時候是管理類的,因為給我們企業(yè)老板看,但是現(xiàn)在我這個管理類應(yīng)用可以給政府看了,他一個全國看了可以給交通部看。等等部委看,但是實際上來說,但是就是說這樣的話就是離大數(shù)據(jù)的真正的變現(xiàn),可能還有一定的距離,因為管理類的應(yīng)用是運(yùn)營商應(yīng)該盡一定的責(zé)任。
怎么辦?要讓大數(shù)據(jù)發(fā)揮商業(yè)價值怎么辦?必須要把這個旁路式的大數(shù)據(jù)逐步的平息掉,大數(shù)據(jù)有什么基礎(chǔ),那么要拼砌成什么樣,也就是說要讓數(shù)聚,真正的不管是數(shù)據(jù)的加工還是數(shù)據(jù)的分析結(jié)果,要真正的切入到正向的生產(chǎn)環(huán)節(jié)里面去提供所謂的即時服務(wù),旁路只是說我們的模型訓(xùn)練少量的樣本數(shù)據(jù)的訓(xùn)練要扔在旁路上去,然后旁路和煮肉實現(xiàn)這個有機(jī)的快速的聯(lián)動,那么這就要求要在主路上要再旁路上都要雙加速,那么原來那時候沒有這個條件,但是現(xiàn)在技術(shù)發(fā)展了,尤其是計算歷法量,大家看AlphaGo很熱鬧,AlphaGo真正現(xiàn)在能打敗這個打敗那個不是算法先進(jìn)了,也不是說人工智能怎么發(fā)展,那算法60年以前就有,主要的是計算力提升,所以他能算得過來,那么同樣也是這個基礎(chǔ),也是因為計算力現(xiàn)在提升了。
所以要改這種旁路的大數(shù)據(jù),逐步變成主流的大數(shù)據(jù),要把群體性分析逐步到個體性分析上去,這樣才能讓大數(shù)據(jù)發(fā)揮真正的商業(yè)價值,這是我一個方面。第二個方面大數(shù)據(jù)現(xiàn)在真正市場,因為大數(shù)據(jù)的市場帶來的不過兩個條件,一個面向下游的市場拓展,比如說我挖掘客戶,另外一個面向下游的生產(chǎn)調(diào)度節(jié)約成本,無外乎就是給客戶帶來就這兩方面的事,那么現(xiàn)在就是說我認(rèn)為大數(shù)據(jù)市場方面愿意付錢的剛需還不太多,還處于嘗試階段,那么只有就是說我們的傳統(tǒng)行業(yè),通過互聯(lián)網(wǎng)加這種方式是不斷地升級之后形成這種大數(shù)據(jù)的預(yù)期,需求之后,真正愿意付費(fèi)的這樣的剛需才會上來。
現(xiàn)在也就處于大數(shù)據(jù)2.0時代,主要是以規(guī)模化分布式技術(shù)驅(qū)動的,包括思維的特征,然后技術(shù)上能實現(xiàn)了大量的pb級的、多少pb級的融合處理,然后也實現(xiàn)了面向單個用戶的靜態(tài)級的標(biāo)簽的維護(hù)和周期細(xì)化的更新這樣的能力,但是下一步技術(shù)驅(qū)動的大數(shù)據(jù)會3.0去發(fā)展,我認(rèn)為主要的特征可能是在智能化和自學(xué)習(xí),然后包括剛才講的AI的核心技術(shù),就是這個機(jī)器學(xué)習(xí)深度學(xué)習(xí),那么我們也做了一些嘗試,積極學(xué)習(xí)在我們的存量流量經(jīng)營,比如說我們的客戶流失預(yù)警,然后我們的輿情、語義分析這樣的一些嘗試。
另外一塊可能會實現(xiàn)多元素個體化領(lǐng)域化的一個自學(xué)習(xí)能力,實現(xiàn)這個云大霧的整個的一個整合,那么這時候我們再來看1.0DI,2.0就當(dāng)前真正扛起這個大數(shù)據(jù)的,計算的大旗都是CPU,但是到三點(diǎn)零時代唐企大數(shù)據(jù)的計算的大旗會是GPU,那么這才是真正AlphaGo不斷那么快速學(xué)習(xí)的一個根本的原因,因為那些算法真的60年以前就有不稀奇,那么另外單獨(dú)的大數(shù)據(jù)可能無法規(guī)模化的發(fā)展。
包括剛才也講了,就是說以這個人為主的消費(fèi)要變成以物為主的消費(fèi)或者以產(chǎn)業(yè)互聯(lián)網(wǎng)信息化的這種消費(fèi)為特征了,另外一個就是說是由原來單純的網(wǎng)絡(luò)能力開放變現(xiàn),可能下一步就向多元化云大霧各種能力開放之后再變現(xiàn),各種組合了,所以大家說的說場景都是通過這種能力來組合出來,因為物聯(lián)網(wǎng)整個的產(chǎn)業(yè)鏈從上游的芯片制造、供給到下游的垂直行業(yè)、專屬行業(yè)和通用行業(yè)的用戶,它是鏈條很長,也就說互聯(lián)網(wǎng)的整個產(chǎn)業(yè)鏈上下游就是大數(shù)據(jù)的本身的客戶,同時積累出來也可以像當(dāng)前的向第三方的客戶來服務(wù),這可能就是說云大物整合之后賺錢的點(diǎn),也就是說能形成一個這么一個生態(tài)圈體系內(nèi)嵌套式的這么一個商業(yè)模式,來做這個事情。讓這個圈生態(tài)圈會做的更大。那么通過這一年嘗試,我們享受到了開放合作帶來的紅利,也希望我們在座的各位都能夠共同攜起手來,把這個技術(shù)模型應(yīng)用,能夠共同把它做大做強(qiáng)做好,謝謝各位!