數(shù)據(jù)集市(DataMart)簡介數(shù)據(jù)集市(data market)也稱數(shù)據(jù)市場,是一個從運營數(shù)據(jù)和其他數(shù)據(jù)源收集數(shù)據(jù)的倉庫,服務(wù)于一個特殊的專業(yè)群體。數(shù)據(jù)倉庫與數(shù)據(jù)挖掘技術(shù)-特征與元數(shù)據(jù)數(shù)據(jù)倉庫具有以下特征:數(shù)據(jù)倉庫中的數(shù)據(jù)是面向主題的,它在更高的層次上對分析對象的數(shù)據(jù)給出了完整的、一致的描述,能夠有效地刻畫分析對象所涉及的數(shù)據(jù)以及數(shù)據(jù)之間的關(guān)系。
作為一種數(shù)據(jù)管理手段,傳統(tǒng)的數(shù)據(jù)庫系統(tǒng)即OnLineTransactionProcessing(OLTP)主要用于事務(wù)處理,但其對分析和處理的支持一直不盡如人意。因此,人們逐漸嘗試對OLTP數(shù)據(jù)庫的數(shù)據(jù)進行再加工,形成一個全面的、面向分析的環(huán)境,以更好地支持決策分析。數(shù)據(jù)倉庫和聯(lián)機分析處理系統(tǒng)(OLAP)是決策分析系統(tǒng)的有機組成部分。數(shù)據(jù)倉庫從分布在整個公司的OLTP數(shù)據(jù)庫中提取數(shù)據(jù),并對提取的數(shù)據(jù)進行預(yù)處理,為公司的決策分析提供必要的數(shù)據(jù)。OLAP利用存儲在數(shù)據(jù)倉庫中的數(shù)據(jù)完成各種分析操作,并將分析結(jié)果以直觀易懂的形式返回給決策者。
1。概述多維數(shù)據(jù)模型是數(shù)據(jù)倉庫中最流行的數(shù)據(jù)模型。多維數(shù)據(jù)模型最典型的數(shù)據(jù)模型有星形模式、雪花模式和事實星座模式。本文通過實例展示了它們之間的模式和差異。二、star schema star schema的核心是一個大的中心表(事實表)和一組小的附屬表(維度表)。星型模式的例子如下:3 .snowflakeschema雪花模式是星型模式的擴展,其中一些維度表被規(guī)范化并進一步分解為附加表(維度表)。
supplier_type表進一步細分為供應(yīng)商維度。4.FactConstellation或galaxyschema數(shù)據(jù)倉庫由多個主題組成,包含多個事實表,維度表是公共的,可以共享。這個模型可以看作是恒星模式的集合,所以被稱為星系圖式或事實星座圖式。這種模式的一個例子如下圖所示:如上圖所示,事實星座模式包含兩個事實表:sales和shipping,它們共享維度表。
3、數(shù)據(jù)倉庫的業(yè)務(wù)處理稱作數(shù)據(jù)倉庫的業(yè)務(wù)處理描述如下:數(shù)據(jù)源和數(shù)據(jù)的存儲管理部分可以統(tǒng)稱為數(shù)據(jù)倉庫服務(wù)器。數(shù)據(jù)倉庫系統(tǒng)通常采用三層架構(gòu),底層是數(shù)據(jù)倉庫服務(wù)器,中間層是OLAP服務(wù)器,頂層是前端工具。具體如下:1。數(shù)據(jù)源和數(shù)據(jù)存儲與管理可以統(tǒng)稱為數(shù)據(jù)倉庫服務(wù)器。(1)數(shù)據(jù)源:是數(shù)據(jù)倉庫系統(tǒng)的基礎(chǔ),是整個系統(tǒng)的數(shù)據(jù)源。通常包括內(nèi)部信息和外部信息。
外部信息包括各種法律法規(guī)、市場信息和競爭對手信息等等。(2)數(shù)據(jù)存儲和管理:它是整個數(shù)據(jù)倉庫系統(tǒng)的核心。數(shù)據(jù)倉庫的真正關(guān)鍵是數(shù)據(jù)的存儲和管理。數(shù)據(jù)倉庫的組織和管理模式?jīng)Q定了它不同于傳統(tǒng)數(shù)據(jù)庫,也決定了它對外數(shù)據(jù)的表達形式。為了決定采用什么產(chǎn)品和技術(shù)來建立數(shù)據(jù)倉庫的核心,有必要分析數(shù)據(jù)倉庫的技術(shù)特征。對現(xiàn)有業(yè)務(wù)系統(tǒng)的數(shù)據(jù)進行提取、清洗、有效整合,并按照主題進行組織。
4、數(shù)據(jù)倉庫是做什么的