到底多大才是“大數(shù)據(jù)”?“大數(shù)據(jù)之‘大’并不在于其表面的‘大容量’,而在于其潛在的‘大價值’!薄洞髷(shù)據(jù):正在到來的數(shù)據(jù)革命》一書的作者、知名信息管理專家涂子沛在第十屆國家信息化專家論壇上指出,數(shù)據(jù)的價值在于計算,未來將興起一個全計算型的社會,特別是以物聯(lián)網(wǎng)為核心的機(jī)器計算和社會計算,開放數(shù)據(jù)的目的是鼓勵創(chuàng)新、推動網(wǎng)絡(luò)經(jīng)濟(jì)的發(fā)展、促進(jìn)中國經(jīng)濟(jì)向精細(xì)化轉(zhuǎn)型。
從全球數(shù)據(jù)技術(shù)投入的資金分布來看,傳統(tǒng)的小數(shù)據(jù)仍然占據(jù)絕對的重頭。據(jù)國際數(shù)據(jù)集團(tuán)(IDG)統(tǒng)計,2012年,全球?qū)π?shù)據(jù)分析工具的投資為349億美元,而對大數(shù)據(jù)分析工具Hadoop的投資僅為1.3億美元,不及前者的1%。IDG的結(jié)論是,傳統(tǒng)的小數(shù)據(jù)軟件滿足了企業(yè)和組織95%的需求。涂子沛認(rèn)為,目前行業(yè)發(fā)展的最新態(tài)勢,是“大”、“小”數(shù)據(jù)分析工具趨于一體化并在向“云”遷徙。
未來的計算機(jī)會越來越小,會無處不在,跟日常環(huán)境聯(lián)系到一起。涂子沛指出,我們的智能手機(jī)就是一臺計算機(jī),有傳感器也有攝像頭,它可以收集數(shù)據(jù),反饋數(shù)據(jù)。美國氣象局用來做氣象檢測的傳感器是隨著汽車不停行進(jìn)的,從紐約到波士頓,每10秒鐘收集一次數(shù)據(jù),一天收集十幾萬次數(shù)據(jù),實時傳輸?shù)綌?shù)據(jù)中心。在1989年,就已經(jīng)出現(xiàn)了數(shù)據(jù)挖掘。摩爾定律解決了一個問題,就是無論有多少信息,我們都可以以很低的成本保存下來。普適計算解決的問題是使得人類收集信息的能力越來越強(qiáng),感應(yīng)器、手機(jī)、無線網(wǎng)絡(luò)、望遠(yuǎn)鏡、仿真計算都在產(chǎn)生數(shù)據(jù),就是說保存數(shù)據(jù)的能力很強(qiáng),收集數(shù)據(jù)的能力很強(qiáng),到1989年數(shù)據(jù)挖掘出現(xiàn)之后,人類分析數(shù)據(jù)的能力也空前增強(qiáng)。
涂子沛指出,通過開放數(shù)據(jù),大數(shù)據(jù)還可以成為啟動透明政府的利器。這對當(dāng)下的中國,現(xiàn)實意義毋庸諱言。數(shù)據(jù)增值的關(guān)鍵在于整合,但自由整合的前提是數(shù)據(jù)的開放。開放數(shù)據(jù)是指將原始的數(shù)據(jù)及其相關(guān)元數(shù)據(jù)以可以下載的電子格式放在互聯(lián)網(wǎng)上,讓其他方自由使用。開放數(shù)據(jù)和公開數(shù)據(jù)是兩個不同的概念,公開是信息層面的,是一條一條的;開放是數(shù)據(jù)庫層面的,是一片一片的。開放也不一定代表免費,企業(yè)的數(shù)據(jù),可以以收費的形式開放。開放也是有層次的,可以對某個群體、某個組織,也可以對整個社會開放。在大數(shù)據(jù)的時代,開放數(shù)據(jù)的意義,不僅僅是滿足公民的知情權(quán),更在于讓大數(shù)據(jù)時代最重要的生產(chǎn)資料數(shù)據(jù)自由地流動起來,以催生創(chuàng)新,推動知識經(jīng)濟(jì)和網(wǎng)絡(luò)經(jīng)濟(jì)的發(fā)展,促進(jìn)中國的經(jīng)濟(jì)增長由粗放型向精細(xì)型轉(zhuǎn)型升級。