數(shù)據(jù)數(shù)據(jù)庫(kù)(DB)是長(zhǎng)期存儲(chǔ)在計(jì)算機(jī)中的有組織、共享、統(tǒng)一管理的數(shù)據(jù)集合。它是按照結(jié)構(gòu)存儲(chǔ)和管理數(shù)據(jù)的計(jì)算機(jī)軟件系統(tǒng)。數(shù)據(jù) 倉(cāng)庫(kù),英文名為DataWarehouse,可縮寫為DW或DWH。它是一個(gè)用于決策支持系統(tǒng)(dss)和在線分析應(yīng)用程序的結(jié)構(gòu)化環(huán)境。數(shù)據(jù) 倉(cāng)庫(kù)研究解決從數(shù)據(jù)圖書館獲取信息的問題。
數(shù)據(jù)數(shù)據(jù)挖掘是通過(guò)對(duì)每一個(gè)進(jìn)行分析,從大量數(shù)據(jù)中找出其規(guī)則的技術(shù),主要包括三個(gè)步驟:數(shù)據(jù)準(zhǔn)備、規(guī)則發(fā)現(xiàn)和規(guī)則表示。主要是通過(guò)分析大量的數(shù)據(jù),來(lái)發(fā)現(xiàn)一些不容易被人感知的事物之間的規(guī)律??梢曰跀?shù)據(jù)-1/,但是數(shù)據(jù) 倉(cāng)庫(kù)的建立會(huì)消耗大量的人力、物力、財(cái)力和很長(zhǎng)的時(shí)間。僅僅為了數(shù)據(jù)挖掘而構(gòu)建數(shù)據(jù)倉(cāng)庫(kù)是不值得的,但是如果數(shù)據(jù)-1/本身是構(gòu)建的,就應(yīng)該在其基礎(chǔ)上構(gòu)建。
9、 數(shù)據(jù)庫(kù)與 數(shù)據(jù) 倉(cāng)庫(kù)的區(qū)別總之,數(shù)據(jù) Library是面向事務(wù)的設(shè)計(jì),數(shù)據(jù)倉(cāng)庫(kù)Library是面向主題的。數(shù)據(jù)圖書館一般存儲(chǔ)網(wǎng)上交易數(shù)據(jù),數(shù)據(jù) 倉(cāng)庫(kù)存儲(chǔ)歷史數(shù)據(jù)。數(shù)據(jù)庫(kù)的設(shè)計(jì)是盡可能避免冗余,一般采用符合范式的規(guī)則。數(shù)據(jù) 倉(cāng)庫(kù)設(shè)計(jì)中有意引入冗余,采用反范式。數(shù)據(jù) Library是為了捕捉數(shù)據(jù),倉(cāng)庫(kù)是為了分析數(shù)據(jù),它的兩個(gè)基本元素是維度表和事實(shí)表。維度是看問題的視角,比如時(shí)間、部門、維度表,里面包含了這些東西的定義,事實(shí)表包含了要查詢的數(shù)據(jù),維度的ID。
任何技術(shù)都是為應(yīng)用服務(wù)的,結(jié)合應(yīng)用就很容易理解。以銀行業(yè)為例。數(shù)據(jù)庫(kù)是交易系統(tǒng)的數(shù)據(jù)平臺(tái)。客戶在銀行進(jìn)行的每一筆交易都會(huì)被寫入數(shù)據(jù) Library并記錄在案。這里可以簡(jiǎn)單理解為用數(shù)據(jù)庫(kù)記賬。數(shù)據(jù) 倉(cāng)庫(kù)是分析系統(tǒng)的數(shù)據(jù)平臺(tái)。它從交易系統(tǒng)中獲取數(shù)據(jù),并對(duì)其進(jìn)行匯總和處理,為決策者提供依據(jù)。比如某銀行某支行一個(gè)月發(fā)生了多少筆交易,該支行的活期存款余額是多少。
10、 數(shù)據(jù) 倉(cāng)庫(kù)與 數(shù)據(jù)庫(kù)有什么聯(lián)系數(shù)據(jù)倉(cāng)庫(kù)是基于數(shù)據(jù) library技術(shù),就是研究如何利用大型復(fù)雜數(shù)據(jù)更有效的組織來(lái)方便。這是我這么多年后的理解數(shù)據(jù)-1/。數(shù)據(jù)庫(kù)★數(shù)據(jù)庫(kù)開發(fā)階段大致可以分為以下幾個(gè)階段:手工管理階段;文件系統(tǒng)階段;數(shù)據(jù)庫(kù)系統(tǒng)階段;高級(jí)數(shù)據(jù)庫(kù)階段。當(dāng)人們從不同的角度描述這個(gè)概念時(shí),他們有不同的定義(當(dāng)然是描述性的)。比如數(shù)據(jù) library就是一個(gè)“記錄保存系統(tǒng)”(這個(gè)定義強(qiáng)調(diào)數(shù)據(jù) library是幾個(gè)記錄的集合)。
更何況數(shù)據(jù)庫(kù)是“一個(gè)數(shù)據(jù) 倉(cāng)庫(kù)”。當(dāng)然,這種說(shuō)法雖然形象,但并不嚴(yán)謹(jǐn),嚴(yán)格來(lái)說(shuō),數(shù)據(jù) library是“按照數(shù)據(jù) 倉(cāng)庫(kù)”的結(jié)構(gòu)進(jìn)行組織、存儲(chǔ)和管理的。在日常的經(jīng)濟(jì)管理工作中,經(jīng)常需要把一些相關(guān)的數(shù)據(jù)放到這個(gè)“倉(cāng)庫(kù)”中,根據(jù)管理的需要進(jìn)行相應(yīng)的處理,比如企事業(yè)單位的人事部門,往往存儲(chǔ)著員工的基本信息(工號(hào)、姓名、年齡、性別、籍貫、工資、簡(jiǎn)歷等。)在表20.6.3中,而這個(gè)表可以看作是a 數(shù)據(jù)庫(kù)。