中國(guó)企業(yè)研究院對(duì)10余家應(yīng)用領(lǐng)先企業(yè)數(shù)據(jù)進(jìn)行了訪(fǎng)談和研究,更多企業(yè)企業(yè)進(jìn)行了書(shū)面數(shù)據(jù)研究。我們發(fā)現(xiàn):■中國(guó)企業(yè)目前的應(yīng)用可以分為:大型數(shù)據(jù)運(yùn)營(yíng)、大型數(shù)據(jù)產(chǎn)品、大型數(shù)據(jù)平臺(tái)三種。
large數(shù)據(jù)(bigdata),或稱(chēng)“巨量數(shù)據(jù)”,是指涉及數(shù)據(jù)量如此之大,以至于不能被當(dāng)前主流的軟件工具捕獲、管理、處理和整理成更積極的目的來(lái)幫助企業(yè)商業(yè)決策的信息。(在維克多·邁耶、勛伯格和肯尼斯·庫(kù)克耶寫(xiě)的《Da 數(shù)據(jù) Time》中,Da 數(shù)據(jù)指的是采用所有的方法數(shù)據(jù)而不是隨機(jī)分析的捷徑(抽樣調(diào)查)?!按蟆睌?shù)據(jù)的基本特征是什么?大數(shù)據(jù)是指在可承受的時(shí)間范圍內(nèi),常規(guī)軟件工具無(wú)法捕捉、管理和處理的“大數(shù)據(jù)”數(shù)據(jù)* *數(shù)據(jù)。1.數(shù)據(jù)金額大,TB,PB,甚至EB等。數(shù)據(jù)數(shù)量數(shù)據(jù)需要分析處理。2.需要快速反應(yīng),市場(chǎng)瞬息萬(wàn)變。什么是大數(shù)據(jù)?大數(shù)據(jù),有什么特點(diǎn)和結(jié)構(gòu)?(大數(shù)據(jù))是指“無(wú)法用現(xiàn)有的軟件工具提取、存儲(chǔ)、搜索、共享和分享。
一個(gè)是數(shù)據(jù)體量巨大。到目前為止,人類(lèi)生產(chǎn)的所有印刷材料的數(shù)據(jù)的量是200PB(1PB210TB),而歷史上人類(lèi)說(shuō)出的所有單詞的數(shù)據(jù)的量大約是5EB(1EB210PB)。目前典型的個(gè)人電腦硬盤(pán)容量在TB量級(jí),而一些大的企業(yè) 數(shù)據(jù)已經(jīng)接近EB量級(jí)。第二,數(shù)據(jù)綜藝。這種類(lèi)型的多樣性也使得數(shù)據(jù) Bei 分為結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)。
“Da數(shù)據(jù)”是指以多種形式從多個(gè)來(lái)源收集的龐大的數(shù)據(jù)群,往往是實(shí)時(shí)的。Big 數(shù)據(jù)(bigdata,megadata),即龐大的數(shù)據(jù),是指海量的、高增長(zhǎng)的、多樣化的信息資產(chǎn),需要新的處理模式來(lái)具備更強(qiáng)的決策、洞察和流程優(yōu)化能力。Da 數(shù)據(jù)的5V特征是:體量(質(zhì)量)、速度(高速)、多樣性(多樣性)、價(jià)值(價(jià)值密度)、真實(shí)性。
從TB級(jí)跳到PB級(jí)。其次是綜藝,數(shù)據(jù)有很多類(lèi)型,比如博客、視頻、圖片、地理信息等等。第三,價(jià)值(價(jià)值密度)低。以視頻為例。在持續(xù)監(jiān)控的過(guò)程中,可能只有一兩秒鐘有用數(shù)據(jù)吧。第四,速度(高速),加工速度快。1第二定律。這最后一點(diǎn)也和傳統(tǒng)的數(shù)據(jù)挖礦技術(shù)有著本質(zhì)的區(qū)別。