揭秘Da 數(shù)據(jù)的出現(xiàn),Da 數(shù)據(jù)是怎么來(lái)的?Da 數(shù)據(jù)是做什么的?換句話說,如果把Da 數(shù)據(jù)比作一個(gè)完整的產(chǎn)業(yè)鏈,那么這個(gè)完整產(chǎn)業(yè)鏈盈利的關(guān)鍵就在于按照“制造”來(lái)提高數(shù)據(jù)的“產(chǎn)量”和數(shù)據(jù)的“附加值”。Da 數(shù)據(jù)的最終目的是能夠?yàn)樗@得的數(shù)據(jù)的實(shí)際應(yīng)用提供服務(wù)并產(chǎn)生價(jià)值。
large 數(shù)據(jù),是大型數(shù)據(jù)文件還是大量數(shù)據(jù)文件?多大,KB,MB,GB,TB,PB,EB?還是大型的數(shù)據(jù),包括文字,圖片,視頻?至少在2014年之前,Da 數(shù)據(jù)的范疇還沒有一個(gè)準(zhǔn)確的定義。這是IEEE關(guān)于Big 數(shù)據(jù)的專題報(bào)告集中的說法。這里的問題是,一個(gè)大詞每天都在發(fā)生變化:更多的設(shè)備被應(yīng)用到日常生活中,每天都有比以往更多的比特在網(wǎng)絡(luò)中產(chǎn)生、流動(dòng)和湮滅。類似地,比以往任何時(shí)候都更多地使用和應(yīng)用這些比特流,并且這種使用和應(yīng)用進(jìn)一步產(chǎn)生了更大數(shù)量的比特流。
是大數(shù)據(jù)是什么?大數(shù)據(jù)是各種IT技術(shù)的匯聚點(diǎn),比如光纖通信、DSL接入、Wifi、LTE等等。隨著帶寬越來(lái)越多,價(jià)格越來(lái)越低,大數(shù)據(jù)網(wǎng)絡(luò)的傳輸成為可能。光學(xué)技術(shù)和半導(dǎo)體集成電路技術(shù)使數(shù)據(jù)的大規(guī)模存儲(chǔ)成為可能。各種傳感器技術(shù)使得獲取數(shù)據(jù)日常越來(lái)越方便。數(shù)據(jù) library技術(shù)的長(zhǎng)期發(fā)展和廣泛應(yīng)用,為數(shù)據(jù)提供了充分和初步的來(lái)源,并提供了新的數(shù)據(jù)處理方法的原始脈絡(luò)。
第一階段,運(yùn)營(yíng)系統(tǒng)階段。上世紀(jì)七八十年代,用戶在購(gòu)物過程中產(chǎn)生的記錄被錄入數(shù)據(jù)數(shù)據(jù)庫(kù),這些數(shù)據(jù)就是當(dāng)時(shí)這些操作系統(tǒng)產(chǎn)生的。第二階段,用戶原創(chuàng)內(nèi)容階段。2002年有博客,后來(lái)發(fā)展成微博和微信。這些都讓每一個(gè)網(wǎng)民成為了自媒體,可以隨意向網(wǎng)絡(luò)發(fā)布相關(guān)信息。此時(shí)數(shù)據(jù)的速度比之前的數(shù)據(jù)快了很多,后者只由操作系統(tǒng)生成。
真正讓“Da 數(shù)據(jù)”從量變到質(zhì)變的時(shí)代,是數(shù)據(jù)在知覺系統(tǒng)的第三階段產(chǎn)生。感知系統(tǒng)階段是物聯(lián)網(wǎng)的大規(guī)模普及,物聯(lián)網(wǎng)的快速發(fā)展最終帶來(lái)了“-0”時(shí)代。大數(shù)據(jù)是互聯(lián)網(wǎng)發(fā)展的必然產(chǎn)物:隨著互聯(lián)網(wǎng)在資源整合方面的能力不斷增強(qiáng),互聯(lián)網(wǎng)本身必然要通過數(shù)據(jù)來(lái)體現(xiàn)自身的價(jià)值,所以從這個(gè)角度來(lái)說,大數(shù)據(jù)正在充當(dāng)互聯(lián)網(wǎng)價(jià)值的體現(xiàn)者。