是數(shù)據(jù)倉庫系統(tǒng)的基礎(chǔ),也是整個系統(tǒng)數(shù)據(jù)的來源。通常包括內(nèi)部信息和外部信息。內(nèi)部信息包括存儲在RDBMS 數(shù)據(jù)和各種文檔數(shù)據(jù)中的各種業(yè)務(wù)流程。外部信息包括各種法律法規(guī)、市場信息和競爭對手的信息等。數(shù)據(jù)的存儲和管理是整個數(shù)據(jù)倉庫系統(tǒng)的核心。數(shù)據(jù) warehouse的真正關(guān)鍵是數(shù)據(jù)的存儲和管理。數(shù)據(jù)倉庫的組織管理決定了它不同于傳統(tǒng)的數(shù)據(jù)倉庫,也決定了它的外在數(shù)據(jù)表達(dá)式。
根據(jù)主題對現(xiàn)有業(yè)務(wù)系統(tǒng)進(jìn)行提取、清理、有效整合和組織。數(shù)據(jù)倉庫覆蓋范圍可分為企業(yè)級數(shù)據(jù)倉庫和部門級數(shù)據(jù)倉庫(俗稱-) OLAP服務(wù)器有效整合數(shù)據(jù)進(jìn)行分析所需,并按照多維模型進(jìn)行組織,進(jìn)行多角度多層次分析,發(fā)現(xiàn)趨勢。其具體實現(xiàn)可分為ROLAP(關(guān)系聯(lián)機分析處理)、MOLAP(多維聯(lián)機分析處理)和HOLAP(混合聯(lián)機分析處理)。
4、 數(shù)據(jù)倉庫三層結(jié)構(gòu)中的組成部分是數(shù)據(jù)倉庫3 數(shù)據(jù)結(jié)構(gòu)為:企業(yè)數(shù)據(jù)模型層;數(shù)據(jù)層(操作類型數(shù)據(jù),和諧數(shù)據(jù),導(dǎo)出數(shù)據(jù));元數(shù)據(jù)層(操作類型數(shù)據(jù),和諧數(shù)據(jù)層元素數(shù)據(jù),數(shù)據(jù)。數(shù)據(jù) Warehouse數(shù)據(jù)Repository是整個數(shù)據(jù)Warehouse環(huán)境的核心,在這里存儲數(shù)據(jù)并為數(shù)據(jù) retrieval提供支持。與被操縱的數(shù)據(jù)數(shù)據(jù)庫相比,其突出特點是支持海量數(shù)據(jù)和快速檢索技術(shù)。數(shù)據(jù)抽取工具將數(shù)據(jù)從各種存儲方式中取出,進(jìn)行必要的轉(zhuǎn)換和排序,然后存儲到數(shù)據(jù) warehouse中。
數(shù)據(jù)轉(zhuǎn)換包括刪除對決策應(yīng)用無意義的數(shù)據(jù)段;轉(zhuǎn)換成統(tǒng)一的數(shù)據(jù)名稱和定義;計算統(tǒng)計與求導(dǎo)數(shù)據(jù);將默認(rèn)值數(shù)據(jù)賦予默認(rèn)值;統(tǒng)一數(shù)據(jù)的不同定義。元數(shù)據(jù)元數(shù)據(jù)描述了數(shù)據(jù) in倉數(shù)據(jù)的結(jié)構(gòu)和建立方法。根據(jù)用途不同可分為兩類,即技術(shù)元素數(shù)據(jù)和商業(yè)元素數(shù)據(jù)。技術(shù)元素數(shù)據(jù)是數(shù)據(jù)倉庫的設(shè)計人員和管理人員用于開發(fā)和日常管理數(shù)據(jù)倉庫用于數(shù)據(jù)。
5、蒙特利爾銀行的分析 數(shù)據(jù) 集市建立分析的建議-3集市于1995年底提交給銀行管理層。在項目開始時,銀行和Sybase professional services共同制定了本數(shù)據(jù) 集市的業(yè)務(wù)和技術(shù)要求。該項目的初步計劃只是為信用卡部門提供風(fēng)險分析。由于數(shù)據(jù) 集市只針對信用卡部門服務(wù)開發(fā),因此數(shù)據(jù)的來源僅限于此。同時,銀行還增加了外部數(shù)據(jù)來自第三方,加強對客戶行為的分析能力。1996年,該行首次推出數(shù)據(jù) 集市應(yīng)用。
6、淺析 數(shù)據(jù)倉庫的 構(gòu)建方法Analysis數(shù)據(jù)Warehouse s構(gòu)建方法隨著不同企業(yè)不同管理信息系統(tǒng)(MIS)的大規(guī)模應(yīng)用部門以及企業(yè)對數(shù)據(jù)管理的新要求,不僅要求可以實現(xiàn),而且越來越多的要求是,各種應(yīng)用系統(tǒng)能夠在企業(yè)積累的、從外部企業(yè)獲得的豐富信息資源的基礎(chǔ)上,利用這些分散的、不一致的、雜亂的信息資源,即更多地參與數(shù)據(jù)分析與決策支持,由此出現(xiàn)了一種數(shù)據(jù)分析、處理與決策支持。
7、 數(shù)據(jù) 集市的常見問題-3/倉庫、數(shù)據(jù) 集市建立不同規(guī)格的成本經(jīng)過國外咨詢機構(gòu)的專門評估,在一定程度上可以借鑒。但是這些結(jié)果在國內(nèi)不一定適用,因為國情不同,國內(nèi)構(gòu)建造價需要專門考察。以人作為企業(yè)的客戶主題構(gòu)建數(shù)據(jù)集市為例,一般費用在20-50萬元之間。數(shù)據(jù) 集市的設(shè)計可以采用迭代法。在迭代開發(fā)中,每次迭代都會給最后的結(jié)果增加新的功能。
通俗地說,就是將不完善的中間產(chǎn)品交付給客戶進(jìn)行多次“試用”,然后再正式交付。這些中間產(chǎn)品有些功能還沒有添加,還不穩(wěn)定,但是客戶提出修改意見后,開發(fā)人員更能了解客戶的需求。如此反復(fù),產(chǎn)品質(zhì)量才能逐漸接近客戶的要求。這種開發(fā)方式周期長,成本高,但可以避免整個項目的返工風(fēng)險,更適合大型高風(fēng)險項目。
8、 數(shù)據(jù) 集市的特征1的特性。數(shù)據(jù)集市包含小規(guī)模。2.有具體的應(yīng)用。3.面臨部門。4.由業(yè)務(wù)定義、設(shè)計和開發(fā)部門。5.業(yè)務(wù)部門管理維護(hù)。6.可以很快實現(xiàn)。7.買的比較便宜。8.投資回收快。9.工具集的緊密集成。10.提供數(shù)據(jù) warehouse的更詳細(xì)和預(yù)先存在的匯總子集。11.可以升級到完整的數(shù)據(jù)倉庫。
9、 數(shù)據(jù) 集市的 數(shù)據(jù)結(jié)構(gòu)數(shù)據(jù)集市China數(shù)據(jù)的結(jié)構(gòu)通常被描述為星型結(jié)構(gòu)或雪花型結(jié)構(gòu)。星型結(jié)構(gòu)由兩個基本部分組成,一個事實表和各種支持維度表。事實表描述數(shù)據(jù) 集市最密數(shù)據(jù)。在電話公司中,用于通話的數(shù)據(jù)是典型的最密集的數(shù)據(jù);在銀行中,與對賬和ATM相關(guān)的數(shù)據(jù)是典型的最密集的數(shù)據(jù)。對于零售行業(yè),銷售和庫存數(shù)據(jù)最為密集數(shù)據(jù)以此類推。事實表是預(yù)先連接在一起的各種類型的組合。它包括:反映建立事實表目的的實體的主鍵,如訂單、銷售、電話等。,主鍵信息,連接事實表和維度表的外鍵,外鍵攜帶的非鍵值數(shù)據(jù)。
事實表是高度索引的。事實表中出現(xiàn)30到40個索引是很常見的,有時事實表的每一列都有索引,這使得事實表中的數(shù)據(jù)非常容易閱讀。但是,導(dǎo)入索引所需的資源數(shù)量必須為等式提供一個因子,通常情況下,事實表中的數(shù)據(jù)不可更改,但數(shù)據(jù)可以輸入。一旦記錄輸入正確,該記錄中的任何內(nèi)容都不能更改,維度表是圍繞事實表構(gòu)建的。