數(shù)據(jù)集市(DataMart)簡(jiǎn)介數(shù)據(jù)集市(data market)也稱數(shù)據(jù)市場(chǎng),是一個(gè)從運(yùn)營(yíng)數(shù)據(jù)和其他數(shù)據(jù)源收集數(shù)據(jù)的倉(cāng)庫(kù),服務(wù)于一個(gè)特殊的專業(yè)群體。數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)挖掘技術(shù)-特征與元數(shù)據(jù)數(shù)據(jù)倉(cāng)庫(kù)具有以下特征:數(shù)據(jù)倉(cāng)庫(kù)中的數(shù)據(jù)是面向主題的,它在更高的層次上對(duì)分析對(duì)象的數(shù)據(jù)給出了完整的、一致的描述,能夠有效地刻畫(huà)分析對(duì)象所涉及的數(shù)據(jù)以及數(shù)據(jù)之間的關(guān)系。
作為一種數(shù)據(jù)管理手段,傳統(tǒng)的數(shù)據(jù)庫(kù)系統(tǒng)即OnLineTransactionProcessing(OLTP)主要用于事務(wù)處理,但其對(duì)分析和處理的支持一直不盡如人意。因此,人們逐漸嘗試對(duì)OLTP數(shù)據(jù)庫(kù)的數(shù)據(jù)進(jìn)行再加工,形成一個(gè)全面的、面向分析的環(huán)境,以更好地支持決策分析。數(shù)據(jù)倉(cāng)庫(kù)和聯(lián)機(jī)分析處理系統(tǒng)(OLAP)是決策分析系統(tǒng)的有機(jī)組成部分。數(shù)據(jù)倉(cāng)庫(kù)從分布在整個(gè)公司的OLTP數(shù)據(jù)庫(kù)中提取數(shù)據(jù),并對(duì)提取的數(shù)據(jù)進(jìn)行預(yù)處理,為公司的決策分析提供必要的數(shù)據(jù)。OLAP利用存儲(chǔ)在數(shù)據(jù)倉(cāng)庫(kù)中的數(shù)據(jù)完成各種分析操作,并將分析結(jié)果以直觀易懂的形式返回給決策者。
1。概述多維數(shù)據(jù)模型是數(shù)據(jù)倉(cāng)庫(kù)中最流行的數(shù)據(jù)模型。多維數(shù)據(jù)模型最典型的數(shù)據(jù)模型有星形模式、雪花模式和事實(shí)星座模式。本文通過(guò)實(shí)例展示了它們之間的模式和差異。二、star schema star schema的核心是一個(gè)大的中心表(事實(shí)表)和一組小的附屬表(維度表)。星型模式的例子如下:3 .snowflakeschema雪花模式是星型模式的擴(kuò)展,其中一些維度表被規(guī)范化并進(jìn)一步分解為附加表(維度表)。
supplier_type表進(jìn)一步細(xì)分為供應(yīng)商維度。4.FactConstellation或galaxyschema數(shù)據(jù)倉(cāng)庫(kù)由多個(gè)主題組成,包含多個(gè)事實(shí)表,維度表是公共的,可以共享。這個(gè)模型可以看作是恒星模式的集合,所以被稱為星系圖式或事實(shí)星座圖式。這種模式的一個(gè)例子如下圖所示:如上圖所示,事實(shí)星座模式包含兩個(gè)事實(shí)表:sales和shipping,它們共享維度表。
3、數(shù)據(jù)倉(cāng)庫(kù)的業(yè)務(wù)處理稱作數(shù)據(jù)倉(cāng)庫(kù)的業(yè)務(wù)處理描述如下:數(shù)據(jù)源和數(shù)據(jù)的存儲(chǔ)管理部分可以統(tǒng)稱為數(shù)據(jù)倉(cāng)庫(kù)服務(wù)器。數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)通常采用三層架構(gòu),底層是數(shù)據(jù)倉(cāng)庫(kù)服務(wù)器,中間層是OLAP服務(wù)器,頂層是前端工具。具體如下:1。數(shù)據(jù)源和數(shù)據(jù)存儲(chǔ)與管理可以統(tǒng)稱為數(shù)據(jù)倉(cāng)庫(kù)服務(wù)器。(1)數(shù)據(jù)源:是數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)的基礎(chǔ),是整個(gè)系統(tǒng)的數(shù)據(jù)源。通常包括內(nèi)部信息和外部信息。
外部信息包括各種法律法規(guī)、市場(chǎng)信息和競(jìng)爭(zhēng)對(duì)手信息等等。(2)數(shù)據(jù)存儲(chǔ)和管理:它是整個(gè)數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)的核心。數(shù)據(jù)倉(cāng)庫(kù)的真正關(guān)鍵是數(shù)據(jù)的存儲(chǔ)和管理。數(shù)據(jù)倉(cāng)庫(kù)的組織和管理模式?jīng)Q定了它不同于傳統(tǒng)數(shù)據(jù)庫(kù),也決定了它對(duì)外數(shù)據(jù)的表達(dá)形式。為了決定采用什么產(chǎn)品和技術(shù)來(lái)建立數(shù)據(jù)倉(cāng)庫(kù)的核心,有必要分析數(shù)據(jù)倉(cāng)庫(kù)的技術(shù)特征。對(duì)現(xiàn)有業(yè)務(wù)系統(tǒng)的數(shù)據(jù)進(jìn)行提取、清洗、有效整合,并按照主題進(jìn)行組織。
4、數(shù)據(jù)倉(cāng)庫(kù)是做什么的