在6月15日舉辦的第二屆中國(guó)信息通信大數(shù)據(jù)大會(huì)上,中國(guó)移動(dòng)業(yè)務(wù)支撐系統(tǒng)部信息管理處副經(jīng)理尚晶分享了《大數(shù)據(jù)的機(jī)會(huì)與挑戰(zhàn)》專題報(bào)告。
中國(guó)移動(dòng)業(yè)務(wù)支撐系統(tǒng)部信息管理處副經(jīng)理 尚晶
以下為演講實(shí)錄:
尊敬的領(lǐng)導(dǎo)專家,然后各位來(lái)賓大家上午好,我是來(lái)自中國(guó)移動(dòng)的尚晶,非常高興有這樣一個(gè)機(jī)會(huì)能夠跟業(yè)內(nèi)的各位同仁一塊去分享,今天我想跟大家分享的是三個(gè)方面。第一個(gè)是中國(guó)中移動(dòng)大數(shù)據(jù)的發(fā)展情況,第二個(gè)是目前我們面臨的一些挑戰(zhàn),最后是對(duì)于大數(shù)據(jù)前未來(lái)演進(jìn)過(guò)程中的一些思考。
首先介紹一下中國(guó)移動(dòng)的大數(shù)據(jù)的發(fā)展歷程。那么在大數(shù)據(jù)時(shí)代來(lái)臨之前,中國(guó)移動(dòng)從2002年就已經(jīng)開(kāi)始啟動(dòng)了經(jīng)營(yíng)分析系統(tǒng)的建設(shè),2009年集團(tuán)就開(kāi)始啟動(dòng)了一系列的新技術(shù)試點(diǎn),在原來(lái)這種系統(tǒng)的基礎(chǔ)上引入了流處理等一系列的這種大數(shù)據(jù)新技術(shù)。當(dāng)然,我們很快就意識(shí)到這并不是一次技術(shù)的顛覆和變革,而是面向數(shù)字化經(jīng)濟(jì)的運(yùn)營(yíng),面向另外一部生態(tài)的一個(gè)顛覆和轉(zhuǎn)型。然后于是2015年的時(shí)候公司就開(kāi)始去明確了大數(shù)據(jù)建設(shè)運(yùn)營(yíng)研發(fā)的一些職能分工,然后我們現(xiàn)在開(kāi)始從把系統(tǒng)從兩個(gè)重點(diǎn)方面進(jìn)行改造,第一個(gè)就是拉通下沉基礎(chǔ)能力,包括數(shù)據(jù)的能力平臺(tái)的能力。第二個(gè)方面就是要把這個(gè)上層的應(yīng)用充分開(kāi)放,剛剛中國(guó)電信的同事也在講說(shuō)上層其實(shí)是一個(gè)非常廣闊的領(lǐng)域,只有充分開(kāi)放它才能夠形成縱深的各個(gè)城市領(lǐng)域的一個(gè)合作。我們提供了這樣的平臺(tái),能夠使我們的創(chuàng)新更加的敏捷,當(dāng)然這個(gè)工作我們還在過(guò)程中,后面也會(huì)展開(kāi)一個(gè)探討。
經(jīng)過(guò)一段時(shí)間的努力,雖然過(guò)程也是很曲折的,但是我們覺(jué)得感覺(jué)還是比較值得的。從橫向看,我們的大部分省公司都已經(jīng)完成了三數(shù)據(jù)的整合,那么從縱向看的話,我們的集中化節(jié)點(diǎn)再進(jìn)一步擴(kuò)容之后,去吸納更多的參與數(shù)據(jù)。從全網(wǎng)來(lái)看,我們大數(shù)據(jù)平臺(tái)的擴(kuò)容是非常的快的。那么相信在17年,我們中國(guó)移動(dòng)在這里面會(huì)有一個(gè)更大的發(fā)展。剛剛說(shuō)的是這個(gè)數(shù)據(jù)層面的積累,另外從平臺(tái)能力的話,一方面是完成了平臺(tái)的技術(shù)的升級(jí)改造,另一方面的話在多租戶的開(kāi)放能力中,我們?cè)趯?shí)際運(yùn)營(yíng)中也趟過(guò)了很多的坑,下午的時(shí)候會(huì)跟大家有個(gè)交流,他們可能談的會(huì)比我更加的具體。
從應(yīng)用方面,我們構(gòu)建了內(nèi)部外部的這種全景視圖,然后對(duì)內(nèi)的還面向企業(yè)運(yùn)營(yíng)管理的方方面面,做統(tǒng)一的應(yīng)用架構(gòu)的規(guī)劃和建設(shè),那么目前對(duì)于對(duì)內(nèi)的支撐上,我們已經(jīng)做的非常駕輕就熟,從識(shí)別用戶的需求匹配我們產(chǎn)品渠道,然后做交叉營(yíng)銷以及做網(wǎng)絡(luò)覆蓋分析和優(yōu)化,客戶感知的評(píng)估方面都已經(jīng)有了一系列的這種能力的儲(chǔ)備。那么對(duì)外的話就是立足中國(guó)移動(dòng)現(xiàn)有的數(shù)據(jù)資產(chǎn),然后基于用戶的行為位置偏好社交,還有信用等數(shù)據(jù),然后面向公共服務(wù)智慧交通市政交通智慧旅游金融征信期待欺詐的治理電信欺詐的治理教育培訓(xùn),還有商業(yè)快消等一系列的這種以及行業(yè)領(lǐng)域開(kāi)展了這種試點(diǎn)合作,形成了位置營(yíng)銷終端征信等一系列的大數(shù)據(jù)產(chǎn)品能力。
既然是在今天的這樣一個(gè)開(kāi)放的會(huì)議上,我覺(jué)得大家可能更感興趣的是我們現(xiàn)在本身大數(shù)據(jù)的這種對(duì)外服務(wù)能力,所以就具體幾個(gè)安利進(jìn)行一些展開(kāi),第一個(gè)是關(guān)于這種大數(shù)據(jù)在零售行業(yè)的應(yīng)用。首先,我們利用大數(shù)據(jù)可以進(jìn)行客流量這種分析,然后找出客流的高峰期和恰當(dāng)?shù)臓I(yíng)銷時(shí)期。其次,我們還可以去找到這個(gè)客戶活動(dòng)區(qū)域和恰當(dāng)?shù)倪@種營(yíng)銷的地點(diǎn),然后了解客戶的行為模式,然后最后對(duì)用戶的潛在用戶的特征還有偏好,通過(guò)統(tǒng)計(jì)可以識(shí)別,然后他就是來(lái)分析是否能夠匹配自己的產(chǎn)品,那么商戶基于這種分析的話就可以去決定說(shuō)要在哪個(gè)地點(diǎn)要在哪個(gè)時(shí)間去營(yíng)銷,哪些自己的產(chǎn)品會(huì)更為適合。
第二個(gè)是關(guān)于大數(shù)據(jù)在交通中的應(yīng)用。智慧交通客戶其實(shí)分兩個(gè)方面,第一個(gè)是關(guān)于城市內(nèi)的,第二個(gè)是關(guān)于高速路網(wǎng)的,那么這個(gè)例子是我們福建公司合作的一個(gè)高速公路網(wǎng)的一個(gè)應(yīng)用,去識(shí)別司機(jī)并且做這種車輛測(cè)速,可以幫助交管實(shí)時(shí)地去獲取高速公路上的一些路況數(shù)據(jù)和分析結(jié)果,同時(shí)能夠?yàn)樯鐣?huì)的公眾提供交通路況的景。當(dāng)然在實(shí)現(xiàn)這個(gè)應(yīng)用的過(guò)程中還是需要很多的這種算法優(yōu)化,比如說(shuō)要去識(shí)別高速公路的客戶,要去排除掉附近的一些非高速上的人員,實(shí)時(shí)處理實(shí)時(shí)計(jì)算,才能夠獲取更加精彩準(zhǔn)的這樣一個(gè)移動(dòng)的速度。
第三個(gè)案例是面向終端,我們可以進(jìn)行分品牌分地域去分析各種各樣的受眾人群的偏好分析,以及不同終端上對(duì)于APP的偏好,這些數(shù)據(jù)一方面可以有助于我們自己為移動(dòng)的客戶提供更好的這種換機(jī)推薦以及套餐,另一方面也有助于終端廠家去改善它們自己的產(chǎn)品。我們事實(shí)上也是面臨著很多的挑戰(zhàn),所以說(shuō)這些挑戰(zhàn)也是很骨感的,雖然說(shuō)骨感也是一種性感,那么挑戰(zhàn)第一就是大數(shù)據(jù)治理的挑戰(zhàn)。目前我們?nèi)匀皇莾蓸O的法人的結(jié)構(gòu),所以31個(gè)省公司IT的生產(chǎn)系統(tǒng)是不同的,產(chǎn)生的數(shù)據(jù)格式也是不一致,所以做統(tǒng)一數(shù)據(jù)建模對(duì)于我們來(lái)說(shuō)是一個(gè)比較帶來(lái)挑戰(zhàn),那么在同樣使用的過(guò)程中,數(shù)據(jù)的多樣性就帶來(lái)了大家在使用的過(guò)程中需要去發(fā)現(xiàn)數(shù)據(jù)中間的這種各種各樣的溯源關(guān)系及關(guān)聯(lián)關(guān)系起,這也是需要進(jìn)一步去提升我們現(xiàn)有的這種管理能力才能夠去解決的。另外的話就是說(shuō)能夠從端到端的對(duì)我們的所有的IT系統(tǒng)進(jìn)行數(shù)據(jù)質(zhì)量管理,這也是對(duì)于大數(shù)據(jù)年代來(lái)說(shuō)是一個(gè)挑戰(zhàn)性的主題,那么以前在這個(gè)數(shù)據(jù)倉(cāng)庫(kù)年代我們經(jīng)?梢阅軙(huì)說(shuō)我們?nèi)ゴ_定我們以某個(gè)數(shù)據(jù)源為準(zhǔn),但實(shí)際上進(jìn)入大數(shù)據(jù)年代的話,我們就會(huì)發(fā)現(xiàn)我們的數(shù)據(jù)來(lái)源其實(shí)非常的多,在這種幾十種或者是上百種的數(shù)據(jù)來(lái)源的過(guò)程中,我們?nèi)プ黾珊驼,已?jīng)不是像原來(lái)那樣更有確定性的內(nèi)容,可能有的時(shí)候就是會(huì)參差不齊的這種現(xiàn)狀。
挑戰(zhàn)二是關(guān)于技術(shù)的挑戰(zhàn),第一個(gè)就是大數(shù)據(jù)技術(shù)主要是來(lái)自于這種開(kāi)源系統(tǒng),那么開(kāi)源系統(tǒng)的現(xiàn)在的特點(diǎn)仍然是還在快速的迭代快速的這種不斷推陳出新的這種過(guò)程中,所以我們?cè)诖髷?shù)據(jù)系統(tǒng)建設(shè)的過(guò)程中需要不斷的去做試驗(yàn),不斷的去做優(yōu)化淘汰。以前我們大概先做研究,然后試點(diǎn),但事實(shí)上現(xiàn)在這種節(jié)奏經(jīng)越來(lái)越不適應(yīng),我們一邊試驗(yàn)一邊上系統(tǒng),然后一邊去優(yōu)化。我們?cè)谶@個(gè)過(guò)程中也在困惑我們?cè)谧汾s這個(gè)技術(shù)的同時(shí),到底是采用追隨開(kāi)源的方式,還是逐漸像bat那樣逐漸走出一個(gè)就是基于開(kāi)源逐漸走出自己的一條技術(shù)路線,這個(gè)過(guò)程中其實(shí)我們也有一些猶豫,但是我們必須去解決這些問(wèn)題,因?yàn)槲覀兊乃幍倪@個(gè)問(wèn)題一點(diǎn)也不比bat少。bat畢竟投入了大量的這種人力物力去解決他們的集群?jiǎn)渭簭囊磺_(tái)到兩千臺(tái)到這個(gè)就現(xiàn)在的這種上萬(wàn)臺(tái)的這種水平,然后還是花了很長(zhǎng)的時(shí)間,這個(gè)過(guò)程其實(shí)我們也得去走過(guò),而且這個(gè)過(guò)程中必須適合我們的合作伙伴,一起去共同去解決這些問(wèn)題。
大家現(xiàn)在講人工智能的時(shí)候往往會(huì)講,我們需要大量的數(shù)據(jù),人工智能才會(huì)變成AlphaGo這種能力去帶各種各樣的這種人力所不能達(dá)到的一些范圍,但是從我們的角度來(lái)來(lái)看,我們覺(jué)得大數(shù)據(jù)的管理這種依法復(fù)雜的這種情況實(shí)際上也是需要引入人工智能去解決,我們當(dāng)可能現(xiàn)在的問(wèn)題,比如說(shuō)在智能運(yùn)維方面安全審計(jì)方面還有剛剛我所提到的數(shù)據(jù)管理的方面都是是這個(gè)人工智能可以輔助我們的人工更多的去解決大數(shù)據(jù)目前的問(wèn)題。
第三個(gè)挑戰(zhàn)是大數(shù)據(jù)能力孵化的挑戰(zhàn),那么剛剛也說(shuō)了我們現(xiàn)在要做各種各樣的這種能力挑戰(zhàn),但是這個(gè)服務(wù)化的過(guò)程中,我們?nèi)绾稳ラ_(kāi)放我們的這種資源,工具的開(kāi)放還有數(shù)據(jù)的開(kāi)放以及如何去做好管理,這種問(wèn)題需要逐漸去克服,比如說(shuō)像儲(chǔ)量資源中的異構(gòu)的平臺(tái)如何去統(tǒng)一管理的互通,如何去實(shí)現(xiàn)合理的為我們的租戶去做資源分配和管理。然后從工序開(kāi)放的層面,我們有各種各樣的開(kāi)源工具,也有各種各樣的商用工具,如何讓他們?nèi)ヌ峁?biāo)準(zhǔn)化的這種接口,然后如何形成供給之間的這種無(wú)縫的集成以及和這種能力的編排。那么從數(shù)據(jù)開(kāi)放的角度來(lái)說(shuō),我們?nèi)绻盐覀兊臄?shù)據(jù)開(kāi)放出去,我們有很多的這種時(shí)空信息,我們需要把時(shí)空信息整個(gè)的整合起來(lái),建立一個(gè)時(shí)空層,那這個(gè)時(shí)空層到底如何去建立,才能讓我們?cè)谏厦媸且粋(gè)開(kāi)放的接口,在上面去構(gòu)建不同的應(yīng)用,這同樣也是目前所面臨的一個(gè)挑戰(zhàn)。開(kāi)放租戶對(duì)于我們來(lái)說(shuō)可能還有多層次的這個(gè)問(wèn)題,所以我們的租戶也將會(huì)是一個(gè)多層次的這種租戶,如何去做?
最后挑戰(zhàn)四就是大數(shù)據(jù)安全和隱私保護(hù)的挑戰(zhàn)。雖然放在最后一個(gè)講,但實(shí)際上這是當(dāng)前需要我們?cè)谥匾曇膊贿`過(guò)的一個(gè)問(wèn)題。今年6月1號(hào),兩高已經(jīng)對(duì)公民個(gè)人信息的保護(hù)又做了更加詳細(xì)的解釋,包括非法提供人公民個(gè)人信息的認(rèn)定標(biāo)準(zhǔn)以及一些問(wèn)題上的定性和數(shù)量的計(jì)算規(guī)則,那么作為一個(gè)國(guó)企來(lái)看,就是我們是更需要去履行我們的社會(huì)職責(zé),在大數(shù)據(jù)發(fā)展過(guò)程中,然后我們必須會(huì)去堅(jiān)持依法合規(guī)。按照規(guī)范數(shù)據(jù)脫敏保護(hù)隱私的這種的基礎(chǔ)上,同時(shí)去做開(kāi)放合作的能力,走集中運(yùn)營(yíng)和安全管控相結(jié)合的道路。
最后再講一下,就是我們對(duì)于大數(shù)據(jù)未來(lái)演進(jìn)的思考。中國(guó)移動(dòng)去年制定了我們大連接的戰(zhàn)略,也就是說(shuō)要成為一個(gè)數(shù)字化創(chuàng)新的全球領(lǐng)先的運(yùn)營(yíng)商。那么在數(shù)字化時(shí)代,基于云管端實(shí)現(xiàn)人和物的普遍連接已經(jīng)成為一個(gè)最重要的特征,那么依托大數(shù)據(jù)還有云計(jì)算去創(chuàng)造一系列的這種智能化軟件化定制化的這樣一個(gè)化服務(wù)就成為一種最主要的這種生產(chǎn)方式。那么對(duì)于大數(shù)據(jù)而言來(lái)說(shuō),我們需要面向大連接戰(zhàn)略去建立一個(gè)良性的內(nèi)外部的協(xié)同,打造面向數(shù)字化管理數(shù)字化運(yùn)營(yíng)數(shù)字化業(yè)務(wù)數(shù)字化服務(wù)的大數(shù)據(jù)引擎,能夠支撐我們做大做優(yōu)做強(qiáng)。那么從中國(guó)移動(dòng)到大數(shù)據(jù)的工作愿景和目標(biāo)上來(lái)看的話,我們希望把大數(shù)據(jù)能夠打造成中國(guó)移動(dòng)優(yōu)秀的基礎(chǔ)能力之一,實(shí)現(xiàn)大數(shù)據(jù)的普遍服務(wù),同時(shí)去支撐內(nèi)部的數(shù)字化企業(yè)和外部的數(shù)字化業(yè)務(wù),同時(shí)去構(gòu)建大數(shù)據(jù)內(nèi)外部的整合良好生態(tài)去解決大數(shù)據(jù)的生產(chǎn)力,具體包括三個(gè)橫向能力的構(gòu)建,具體就是數(shù)據(jù)整合、平臺(tái)整合,還有產(chǎn)品整合,還有兩個(gè)縱向能力的拓展,包括我們數(shù)字化企業(yè)的就是對(duì)于內(nèi)部的支撐能力和數(shù)字化業(yè)務(wù)對(duì)外部的各種垂直行業(yè),包括像娛樂(lè)物聯(lián)網(wǎng)政府交通旅游一系列的這種支撐能力。為了能夠建立這樣的一個(gè)能力,同時(shí)我們需要在公司內(nèi)部結(jié)合我們的各個(gè)省公司各個(gè)專業(yè)公司一起去做一個(gè)矩陣式的合作團(tuán)隊(duì),因?yàn)榇髷?shù)據(jù)本身是貫穿整個(gè)公司的一個(gè)能力,所以也需要去建立這樣一個(gè)矩陣去實(shí)現(xiàn)我們的整個(gè)的目標(biāo)。
這張圖就是我們目前的一個(gè)大數(shù)據(jù)平臺(tái)的總體方案,在總體方案上我們大概有幾個(gè)主要的側(cè)重點(diǎn),第一個(gè)就是要統(tǒng)籌資源,合理布局,然后目前我們各個(gè)運(yùn)營(yíng)商都在這個(gè)云計(jì)算方面去做了各種各樣的這種儲(chǔ)備,我們大數(shù)據(jù)的整個(gè)建設(shè)也需要根據(jù)我們本身私有云的建設(shè)情況,統(tǒng)籌去利用我們的一級(jí)私有云和我們的省級(jí)私有云資源池,然后來(lái)形成一個(gè)多中心的集中化的大數(shù)據(jù)平臺(tái)架構(gòu)。第二個(gè)的話也需要去考慮一個(gè)最優(yōu)進(jìn)入高效加工的原則,因?yàn)楝F(xiàn)在數(shù)據(jù)的這個(gè)數(shù)據(jù)量是非常的大的,然后到底哪些數(shù)據(jù)需要在接入點(diǎn)去處理,然后哪些數(shù)據(jù)需要集中化處理,然后我們需要去最佳的去選擇路徑,然后能夠使我們的數(shù)據(jù)加工更加的高效。第三點(diǎn)就是服務(wù)開(kāi)放,應(yīng)用多元,最后一個(gè)就是要統(tǒng)一管控,保障我們的安全。
最后還要說(shuō)一點(diǎn),要構(gòu)建一個(gè)全覆蓋的大數(shù)據(jù)的安全能力,目前我們?cè)诖髷?shù)據(jù)的應(yīng)用中實(shí)際上是一直在提一個(gè)叫三不原則,第一個(gè)叫做數(shù)據(jù)不涉隱私,第二個(gè)叫做原始數(shù)據(jù)不出數(shù)據(jù)系統(tǒng),第三個(gè)是系統(tǒng)不出移動(dòng)。雖然做了很多這種方案,但實(shí)際上一直沒(méi)有談到一個(gè)問(wèn)題,為什么會(huì)出現(xiàn)這些問(wèn)題,是因?yàn)榇髷?shù)據(jù)就是一個(gè)非常拓展性的領(lǐng)域,它在這個(gè)過(guò)程中是不可能是一個(gè)短鏈條的合作的。目前我們剛剛所說(shuō)的所有的例子都是一對(duì)一、二對(duì)二的合作,就很難去避免用戶的授權(quán)問(wèn)題。
未來(lái)的大數(shù)據(jù)的發(fā)揮過(guò)程中經(jīng)常需要多方的合作,需要很長(zhǎng)的鏈條,有的時(shí)候你往往可能不知道這個(gè)鏈條上到底有誰(shuí),那么如何去取得多方互信的一個(gè)關(guān)系,能夠使大數(shù)據(jù)能夠順暢地去流動(dòng),我們認(rèn)為應(yīng)該去建立這樣的一個(gè)授權(quán)的網(wǎng)絡(luò),用戶能夠自主地決定把我的信息以什么樣的授權(quán)原則授權(quán)給誰(shuí),同時(shí)還可以收回授權(quán),那么授權(quán)的網(wǎng)絡(luò)能夠參與其中,合理合法的去實(shí)現(xiàn)這個(gè)數(shù)據(jù)的合理流動(dòng)。
總之來(lái)說(shuō),然后我們還是希望未來(lái)大數(shù)據(jù)能夠得到很好的發(fā)展,那么大數(shù)據(jù)在使能運(yùn)營(yíng)傷的過(guò)程中,同時(shí)能夠促進(jìn)運(yùn)營(yíng)商能夠更好的去使用社會(huì),那謝謝大家。