數(shù)據(jù)倉庫的開發(fā)策略主要有自上而下、自下而上以及這兩種策略的結(jié)合。自頂向下策略在實際應(yīng)用中比較困難,因為數(shù)據(jù) 倉庫的功能是一個決策支持功能。這一功能在企業(yè)戰(zhàn)略的應(yīng)用范圍中往往難以確定,因為數(shù)據(jù) 倉庫的應(yīng)用機會往往超出了企業(yè)當(dāng)前的實際經(jīng)營范圍,在開發(fā)之前就確定了目標(biāo),達(dá)到預(yù)定目標(biāo)后就不再追求新的應(yīng)用,所以是數(shù)據(jù)。
在使用這種方法時,開發(fā)人員需要具有豐富的自頂向下系統(tǒng)開發(fā)經(jīng)驗,企業(yè)決策者和管理者充分了解數(shù)據(jù) 倉庫的預(yù)定目標(biāo),并知道數(shù)據(jù) 倉庫能夠在那些決策中發(fā)揮作用。自下而上策略一般從數(shù)據(jù) 倉庫的一個原型出發(fā),選取一些企業(yè)管理者熟知的具體管理問題作為數(shù)據(jù) 倉庫的開發(fā)對象,并在此基礎(chǔ)上進行。因此,在開發(fā)a 數(shù)據(jù) bazaar、一個經(jīng)理系統(tǒng)或一個部門-2倉庫時,經(jīng)常使用這種策略。
5、 數(shù)據(jù) 倉庫和大 數(shù)據(jù)一樣嗎,概念好抽像啊不同。數(shù)據(jù) 倉庫是一個戰(zhàn)略集合,為企業(yè)各個層面的決策過程提供各種類型的支持。它是一個單獨的數(shù)據(jù) store,是為分析報告和決策支持目的而創(chuàng)建的。為需要商業(yè)智能的企業(yè)提供業(yè)務(wù)流程改進、監(jiān)控時間、成本、質(zhì)量和控制方面的指導(dǎo)。大數(shù)據(jù)是指在可承受的時間范圍內(nèi),常規(guī)軟件工具無法捕捉、管理和處理的數(shù)據(jù)的集合。Large 數(shù)據(jù)使用all 數(shù)據(jù)進行分析,沒有隨機分析(抽樣調(diào)查)的捷徑。
6、 數(shù)據(jù)湖和 數(shù)據(jù) 倉庫的區(qū)別是什么?01-2倉庫數(shù)據(jù)倉庫(數(shù)據(jù)倉庫),又稱企業(yè)數(shù)據(jù)。它是一個面向主題的、集成的、相對穩(wěn)定的、反映歷史變化的聚合存儲系統(tǒng)。它聚集了來自不同來源的結(jié)構(gòu)化數(shù)據(jù),以便在商業(yè)智能領(lǐng)域進行比較和分析。數(shù)據(jù) -0.數(shù)據(jù) 倉庫系統(tǒng)的功能可以實現(xiàn)跨業(yè)務(wù)條線、跨系統(tǒng)數(shù)據(jù)集成,為管理分析和經(jīng)營決策提供統(tǒng)一數(shù)據(jù)支持。
數(shù)據(jù) 倉庫用于實時數(shù)據(jù)處理和非結(jié)構(gòu)化數(shù)據(jù)處理能力較弱,在預(yù)警預(yù)報業(yè)務(wù)應(yīng)用上有一定限制。02數(shù)據(jù)Lake數(shù)據(jù)data Lake是Pentaho公司的CTOJamesDixon提出的數(shù)據(jù)的存儲概念,即在系統(tǒng)或存儲庫中以自然格式存儲數(shù)據(jù)的方法。數(shù)據(jù)作為一個集中式存儲庫,lake可以存儲任何規(guī)模的結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)。在數(shù)據(jù) Lake中,可以存儲不需要結(jié)構(gòu)化的數(shù)據(jù)
7、什么是 數(shù)據(jù) 倉庫?為什么要建立 數(shù)據(jù) 倉庫? 數(shù)據(jù) 倉庫有什么特點數(shù)據(jù)倉庫,英文名為DataWarehouse,可縮寫為DW或DWH。數(shù)據(jù) 倉庫是一個戰(zhàn)略集合,為企業(yè)各個層面的決策過程提供各種類型的支持。它是一個單獨的數(shù)據(jù) store,是為分析報告和決策支持目的而創(chuàng)建的。為需要商業(yè)智能的企業(yè)提供業(yè)務(wù)流程改進、監(jiān)控時間、成本、質(zhì)量和控制方面的指導(dǎo)。我打個簡單的比方,數(shù)據(jù) 倉庫是用倉庫,數(shù)據(jù)是這個倉庫的商品。數(shù)據(jù) 倉庫的開發(fā)者是這個倉庫的管理員,那么數(shù)據(jù) 倉庫就是如何管理好它。方便數(shù)據(jù)的BI、AI等方面更好的使用倉庫inside數(shù)據(jù)使得數(shù)據(jù)更好的發(fā)揮作用。
8、 數(shù)據(jù) 倉庫和大 數(shù)據(jù)的區(qū)別?的定義與數(shù)據(jù) 倉庫的定義有本質(zhì)區(qū)別:它是一個戰(zhàn)略集合,為企業(yè)各個層面的決策過程提供各種類型的支持。它是一個單獨的數(shù)據(jù) store,是為分析報告和決策支持目的而創(chuàng)建的。大數(shù)據(jù):指在一定時間范圍內(nèi),常規(guī)軟件工具無法捕捉、管理和處理的數(shù)據(jù)的集合。它是一種海量、高增長、多元化的信息資產(chǎn),需要一種新的處理模式來擁有更強的決策力、洞察力和發(fā)現(xiàn)力以及流程優(yōu)化能力。
當(dāng)然,從某種角度來說,企業(yè)的數(shù)據(jù) 倉庫本身就是一個大的數(shù)據(jù),是企業(yè)長期積累的數(shù)據(jù)的集合。從數(shù)據(jù)、數(shù)據(jù) 倉庫的處理方式來看,并不是所有的都可以通過一條sql就能找出自己想要的結(jié)果,如果倉庫medium數(shù)據(jù)的量巨大,
9、 數(shù)據(jù)庫, 數(shù)據(jù) 倉庫和 數(shù)據(jù)挖掘技術(shù)之間的區(qū)別數(shù)據(jù)挖掘是用價值從大量數(shù)據(jù)中提取潛在知識(模型或規(guī)則)的過程。1.數(shù)據(jù)挖掘能做什么?1) 數(shù)據(jù)挖掘可以做以下六種不同的事情(分析方法):分類()估計(預(yù)測)關(guān)聯(lián)分組或關(guān)聯(lián)規(guī)則(聚類)描述與可視化(2)數(shù)據(jù)挖掘的分類以上六種數(shù)據(jù)挖掘的分析方法可以分為兩類:直接數(shù)據(jù)挖掘;間接的數(shù)據(jù)挖掘直接的數(shù)據(jù)挖掘的目標(biāo)是使用可用的數(shù)據(jù)來建立一個模型,該模型用于剩余的數(shù)據(jù)和一個特定的變量(可以理解為-)
10、 數(shù)據(jù) 倉庫跟 數(shù)據(jù)庫有什么異同點相似性:都是-2的集合/差異:倉庫是“常規(guī)”數(shù)據(jù)庫,而數(shù)據(jù)庫只是。數(shù)據(jù) library和-2倉庫的區(qū)別其實就是OLTP和OLAP的區(qū)別。操作處理,稱為在線事務(wù)處理(OLTP),也可以稱為面向事務(wù)的處理系統(tǒng)。針對數(shù)據(jù) library中具體業(yè)務(wù)在線的日常操作,平時查詢修改少量記錄。
傳統(tǒng)的數(shù)據(jù)庫系統(tǒng)作為數(shù)據(jù)管理的主要手段,主要用于操作處理。關(guān)系型數(shù)據(jù)Mysql、Oracle等庫一般屬于OLTP,分析處理,稱為聯(lián)機分析處理OLAP(online analytical processing ),一般通過分析某些主題的歷史來支持管理決策。首先要明白數(shù)據(jù) 倉庫的出現(xiàn)并不是為了取代數(shù)據(jù)庫,數(shù)據(jù)庫是面向事務(wù)的設(shè)計,數(shù)據(jù) 倉庫是面向主題的設(shè)計。