是數據倉庫系統(tǒng)的基礎,也是整個系統(tǒng)數據的來源。通常包括內部信息和外部信息。內部信息包括存儲在RDBMS 數據和各種文檔數據中的各種業(yè)務流程。外部信息包括各種法律法規(guī)、市場信息和競爭對手的信息等。數據的存儲和管理是整個數據倉庫系統(tǒng)的核心。數據 warehouse的真正關鍵是數據的存儲和管理。數據倉庫的組織管理決定了它不同于傳統(tǒng)的數據倉庫,也決定了它的外在數據表達式。
根據主題對現有業(yè)務系統(tǒng)進行提取、清理、有效整合和組織。數據倉庫覆蓋范圍可分為企業(yè)級數據倉庫和部門級數據倉庫(俗稱-) OLAP服務器有效整合數據進行分析所需,并按照多維模型進行組織,進行多角度多層次分析,發(fā)現趨勢。其具體實現可分為ROLAP(關系聯機分析處理)、MOLAP(多維聯機分析處理)和HOLAP(混合聯機分析處理)。
4、 數據倉庫三層結構中的組成部分是數據倉庫3 數據結構為:企業(yè)數據模型層;數據層(操作類型數據,和諧數據,導出數據);元數據層(操作類型數據,和諧數據層元素數據,數據。數據 Warehouse數據Repository是整個數據Warehouse環(huán)境的核心,在這里存儲數據并為數據 retrieval提供支持。與被操縱的數據數據庫相比,其突出特點是支持海量數據和快速檢索技術。數據抽取工具將數據從各種存儲方式中取出,進行必要的轉換和排序,然后存儲到數據 warehouse中。
數據轉換包括刪除對決策應用無意義的數據段;轉換成統(tǒng)一的數據名稱和定義;計算統(tǒng)計與求導數據;將默認值數據賦予默認值;統(tǒng)一數據的不同定義。元數據元數據描述了數據 in倉數據的結構和建立方法。根據用途不同可分為兩類,即技術元素數據和商業(yè)元素數據。技術元素數據是數據倉庫的設計人員和管理人員用于開發(fā)和日常管理數據倉庫用于數據。
5、蒙特利爾銀行的分析 數據 集市建立分析的建議-3集市于1995年底提交給銀行管理層。在項目開始時,銀行和Sybase professional services共同制定了本數據 集市的業(yè)務和技術要求。該項目的初步計劃只是為信用卡部門提供風險分析。由于數據 集市只針對信用卡部門服務開發(fā),因此數據的來源僅限于此。同時,銀行還增加了外部數據來自第三方,加強對客戶行為的分析能力。1996年,該行首次推出數據 集市應用。
6、淺析 數據倉庫的 構建方法Analysis數據Warehouse s構建方法隨著不同企業(yè)不同管理信息系統(tǒng)(MIS)的大規(guī)模應用部門以及企業(yè)對數據管理的新要求,不僅要求可以實現,而且越來越多的要求是,各種應用系統(tǒng)能夠在企業(yè)積累的、從外部企業(yè)獲得的豐富信息資源的基礎上,利用這些分散的、不一致的、雜亂的信息資源,即更多地參與數據分析與決策支持,由此出現了一種數據分析、處理與決策支持。
7、 數據 集市的常見問題-3/倉庫、數據 集市建立不同規(guī)格的成本經過國外咨詢機構的專門評估,在一定程度上可以借鑒。但是這些結果在國內不一定適用,因為國情不同,國內構建造價需要專門考察。以人作為企業(yè)的客戶主題構建數據集市為例,一般費用在20-50萬元之間。數據 集市的設計可以采用迭代法。在迭代開發(fā)中,每次迭代都會給最后的結果增加新的功能。
通俗地說,就是將不完善的中間產品交付給客戶進行多次“試用”,然后再正式交付。這些中間產品有些功能還沒有添加,還不穩(wěn)定,但是客戶提出修改意見后,開發(fā)人員更能了解客戶的需求。如此反復,產品質量才能逐漸接近客戶的要求。這種開發(fā)方式周期長,成本高,但可以避免整個項目的返工風險,更適合大型高風險項目。
8、 數據 集市的特征1的特性。數據集市包含小規(guī)模。2.有具體的應用。3.面臨部門。4.由業(yè)務定義、設計和開發(fā)部門。5.業(yè)務部門管理維護。6.可以很快實現。7.買的比較便宜。8.投資回收快。9.工具集的緊密集成。10.提供數據 warehouse的更詳細和預先存在的匯總子集。11.可以升級到完整的數據倉庫。
9、 數據 集市的 數據結構數據集市China數據的結構通常被描述為星型結構或雪花型結構。星型結構由兩個基本部分組成,一個事實表和各種支持維度表。事實表描述數據 集市最密數據。在電話公司中,用于通話的數據是典型的最密集的數據;在銀行中,與對賬和ATM相關的數據是典型的最密集的數據。對于零售行業(yè),銷售和庫存數據最為密集數據以此類推。事實表是預先連接在一起的各種類型的組合。它包括:反映建立事實表目的的實體的主鍵,如訂單、銷售、電話等。,主鍵信息,連接事實表和維度表的外鍵,外鍵攜帶的非鍵值數據。
事實表是高度索引的。事實表中出現30到40個索引是很常見的,有時事實表的每一列都有索引,這使得事實表中的數據非常容易閱讀。但是,導入索引所需的資源數量必須為等式提供一個因子,通常情況下,事實表中的數據不可更改,但數據可以輸入。一旦記錄輸入正確,該記錄中的任何內容都不能更改,維度表是圍繞事實表構建的。