有人說,把1PB的數(shù)據(jù)寫到磁盤需要200多天,全人類的總資產(chǎn)加起來還不到1P,TB單位的數(shù)據(jù)相當(dāng)于全世界海灘上所有的沙子,大小永遠是相對的。更多的是利用數(shù)據(jù)去發(fā)現(xiàn)數(shù)據(jù)背后的價值,這將是經(jīng)過仔細分析后開發(fā)出來的。尺度也是用不同的維度來衡量的,從時間序列上積累了大量的數(shù)據(jù),深度上更詳細的數(shù)據(jù)。
5、1b的數(shù)據(jù)集有多大1字節(jié)。根據(jù)與查詢相關(guān)的公開信息,1 bit(比特位)為0.125字節(jié)(比特位),1B為1字節(jié)。Byte,KB,B,MB,GB之間的關(guān)系是:Bit bit,B byte,KB千字節(jié),MB兆字節(jié),GB千兆字節(jié),TB太字節(jié),1B8Bit,1KB1024B,1MB1024KB,1GB1024MB,1TB1024GB,一個比特可以表示的數(shù)據(jù)大小是1bit)0.125。
6、大數(shù)據(jù)時代,我國數(shù)據(jù)量究竟有多大1大數(shù)據(jù)的興起預(yù)示著它將進入信息時代的新階段。1.1用歷史的眼光看待大數(shù)據(jù)。信息時代與農(nóng)業(yè)和工業(yè)時代相比是相當(dāng)長的一段時間。不同時期的生產(chǎn)要素和社會發(fā)展動力有明顯的差異。信息時代標(biāo)志性的技術(shù)發(fā)明是數(shù)字計算機、集成電路、光纖通信和互聯(lián)網(wǎng)(萬維網(wǎng))。雖然媒體上有很多調(diào)侃大數(shù)據(jù)時代的說法,但是大數(shù)據(jù)、云計算等新技術(shù)還沒有取得可以與上述劃時代的技術(shù)發(fā)明相媲美的技術(shù)突破,很難形成超越信息時代的新時代。
通過考察和分析100多年的漫長歷史,可以發(fā)現(xiàn)信息時代和工業(yè)時代的發(fā)展規(guī)律有很多相似之處。電氣化時代提高生產(chǎn)力的過程與信息時代驚人的相似。擴散儲備20~30年后才明顯增加,分界線分別為1915年和1995年。我猜想,21世紀(jì)的前30年,可能是信息技術(shù)在經(jīng)過幾十年的擴散和存儲后,提高生產(chǎn)力的黃金時代。1.2從認(rèn)識信息時代新階段的高度,大數(shù)據(jù)被調(diào)侃的地方中國已經(jīng)開始進入信息時代,但很多人的思想還停留在工業(yè)時代。
7、大數(shù)據(jù)時代中國數(shù)據(jù)量有多大首先,我們只說你擁有的數(shù)據(jù)量。數(shù)據(jù)再多也不算。(1)首先是基本信息:包括人口基本信息、健康信息、信用信息、評價信息、經(jīng)歷信息(如學(xué)籍)、關(guān)系信息(如親屬)等。當(dāng)然這部分信息不是很大,可能會更新,但是更新的頻率不會很大。(2)交易信息:這部分大,比如你的手機交易,旅游信息,都是交易信息。而且,交易信息不僅僅是一條信息,還包括物流變更信息、買家信息、商品信息等。這部分內(nèi)容會經(jīng)常更新。你可以想象你在網(wǎng)上購買。你覺得這部分信息大不大,不涉及財務(wù)信息。
8、“大數(shù)據(jù)”到底有多大大數(shù)據(jù)是一種數(shù)據(jù)集合,其規(guī)模遠遠超出傳統(tǒng)數(shù)據(jù)庫軟件工具在獲取、存儲、管理和分析方面的能力。具有數(shù)據(jù)規(guī)模海量、數(shù)據(jù)流動迅速、數(shù)據(jù)類型多樣、價值密度低四大特點。在很多人眼里,大數(shù)據(jù)可能是一個很模糊的概念,但是在日常生活中,大數(shù)據(jù)離我們很近,我們不再時時刻刻享受著大數(shù)據(jù)帶來的便利、個性化和人性化。要全面理解大數(shù)據(jù),應(yīng)該簡單地從四個方面來理解。
那么到底什么是“大數(shù)據(jù)”呢?麥肯錫全球研究所給出的定義中指出,大數(shù)據(jù)是一種數(shù)據(jù)集合,其規(guī)模之大,大大超過了傳統(tǒng)數(shù)據(jù)庫軟件工具在獲取、存儲、管理和分析方面的能力。簡單地說,大數(shù)據(jù)意味著有如此多的數(shù)據(jù)在圖表之外。大數(shù)據(jù)的單位一般以PB來衡量。那么PB有多大呢?1GB1024MB,1PB1024GB足以稱得上大數(shù)據(jù)。如圖:計量單位列表其次,大數(shù)據(jù)的特點和結(jié)構(gòu)是什么?
9、多大的數(shù)據(jù)是大數(shù)據(jù)其實首先你要區(qū)分大數(shù)據(jù)和大數(shù)據(jù)量的概念。大數(shù)據(jù)量只是一個純粹的數(shù)據(jù)量級問題,現(xiàn)在我們說的大數(shù)據(jù)主要包括搜索、新聞、博客、微博等社交網(wǎng)絡(luò)、手機和短信、熱線和監(jiān)測數(shù)據(jù)、一般測試數(shù)據(jù)等等,這些數(shù)據(jù)大部分都是在我們?nèi)粘5纳缃簧罨蛘哒Z音交流中產(chǎn)生的。通常是TB級別的非結(jié)構(gòu)化數(shù)據(jù),TB級的數(shù)據(jù)很難用excel或其他數(shù)據(jù)分析工具進行展示和處理,因此需要BI工具來處理大數(shù)據(jù)。