其實大數(shù)據(jù)一般的范圍更廣,任何涉及海量數(shù)據(jù)和多個數(shù)據(jù)源的復雜計算都屬于大數(shù)據(jù)的范疇,不限于非結構化數(shù)據(jù)。Hadoop等大數(shù)據(jù)技術等大數(shù)據(jù)工具和設備的出現(xiàn),以及云計算數(shù)據(jù)處理和應用模式的廣泛應用,為企業(yè)處理日益增長的海量非結構化數(shù)據(jù)提供了高效、可擴展的低成本解決方案,彌補了傳統(tǒng)關系數(shù)據(jù)庫或數(shù)據(jù)倉庫在處理非結構化數(shù)據(jù)方面的不足,深化和拓展了企業(yè)的商業(yè)智能和知識服務能力,形成了數(shù)據(jù)驅動的決策機制,提高了決策水平。
大數(shù)據(jù)時代,企業(yè)必須做好信息資源的整合。數(shù)據(jù)被認為是新時代的基本生活資料和市場要素,與物質資產(chǎn)和人力資本同等重要。近年來,企業(yè)產(chǎn)生的數(shù)據(jù)量呈指數(shù)級增長,信息資源呈爆炸式增長,其中非結構化數(shù)據(jù)信息達到85%左右。傳統(tǒng)的信息資源管理技術已經(jīng)無法應對大數(shù)據(jù)時代的挑戰(zhàn)。Hadoop等大數(shù)據(jù)技術等大數(shù)據(jù)工具和設備的出現(xiàn),以及云計算數(shù)據(jù)處理和應用模式的廣泛應用,為企業(yè)處理日益增長的海量非結構化數(shù)據(jù)提供了高效、可擴展的低成本解決方案,彌補了傳統(tǒng)關系數(shù)據(jù)庫或數(shù)據(jù)倉庫在處理非結構化數(shù)據(jù)方面的不足,深化和拓展了企業(yè)的商業(yè)智能和知識服務能力,形成了數(shù)據(jù)驅動的決策機制,提高了決策水平。
1。數(shù)據(jù)核心的原理從“流程”核心變成了“數(shù)據(jù)”核心。大數(shù)據(jù)時代,計算模式也發(fā)生了變化,從“流程”核心變?yōu)椤皵?shù)據(jù)”核心。hadoop系統(tǒng)的分布式計算框架一直是以“數(shù)據(jù)”為核心的范式。非結構化數(shù)據(jù)和分析需求將改變IT系統(tǒng)的升級模式:從簡單的增量到架構的改變。大數(shù)據(jù)下新思維計算模式的轉變。例如,IBM將使用以數(shù)據(jù)為中心的設計來減少超級計算機之間大量數(shù)據(jù)交換的需求。
大數(shù)據(jù)與云計算的關系:云計算為大數(shù)據(jù)提供了強大的工具和途徑,大數(shù)據(jù)為云計算提供了有價值的地方。大數(shù)據(jù)比云計算更接地氣,可以有效利用已經(jīng)大量建立起來的云計算資源,并最終加以利用。科學進步越來越多地由數(shù)據(jù)驅動,海量數(shù)據(jù)給數(shù)據(jù)分析既帶來了機遇,也帶來了新的挑戰(zhàn)。大數(shù)據(jù)往往是利用多種技術和方法綜合多渠道、不同時間的信息而獲得的。
3、大數(shù)據(jù)分析需全面解決方案大數(shù)據(jù)分析需要一個全面的解決方案。目前,越來越多的企業(yè)將大數(shù)據(jù)的分析結果作為判斷自身未來發(fā)展的依據(jù)。與此同時,傳統(tǒng)的商業(yè)預測邏輯正日益被新的大數(shù)據(jù)預測所取代。但是,我們應該謹慎管理每個人對大數(shù)據(jù)的期望,因為只有在有效治理的前提下,海量數(shù)據(jù)才能進一步發(fā)揮其商業(yè)價值。大數(shù)據(jù)最廣為人知的定義是Gartner給出的大數(shù)據(jù)3V特征:龐大的體量、快速的數(shù)據(jù)處理、多變的數(shù)據(jù)結構和種類。
換句話說,大數(shù)據(jù)不僅要處理事務性數(shù)據(jù)的分析,還要整合社交媒體、電子商務、決策支持等信息?,F(xiàn)在,分布式處理技術Hadoop和NoSQL已經(jīng)能夠存儲、處理、分析和挖掘非結構化數(shù)據(jù),但它們未能提供全面的解決方案來滿足客戶的大數(shù)據(jù)需求,其實大數(shù)據(jù)一般的范圍更廣,任何涉及海量數(shù)據(jù)和多個數(shù)據(jù)源的復雜計算都屬于大數(shù)據(jù)的范疇,不限于非結構化數(shù)據(jù)。