數(shù)據(jù)倉(cāng)庫(kù)的業(yè)務(wù)處理描述如下:數(shù)據(jù) source和數(shù)據(jù)的存儲(chǔ)和管理部分可以統(tǒng)稱為數(shù)據(jù)。數(shù)據(jù) 倉(cāng)庫(kù)系統(tǒng)通常采用三層架構(gòu),底層為數(shù)據(jù)倉(cāng)庫(kù)server,中間層為OLAP服務(wù)器,頂層為前端工具。具體如下:1。數(shù)據(jù) source和數(shù)據(jù)的存儲(chǔ)和管理部分可以統(tǒng)稱為數(shù)據(jù)server。(1) 數(shù)據(jù)來(lái)源:是數(shù)據(jù) 倉(cāng)庫(kù)系統(tǒng)的基礎(chǔ),也是整個(gè)系統(tǒng)的來(lái)源。通常包括內(nèi)部信息和外部信息。
外部信息包括各種法律法規(guī)、市場(chǎng)信息和競(jìng)爭(zhēng)對(duì)手信息等等。(2)對(duì)數(shù)據(jù)的存儲(chǔ)和管理是整個(gè)數(shù)據(jù) 倉(cāng)庫(kù)系統(tǒng)的核心。數(shù)據(jù) 倉(cāng)庫(kù)的真正關(guān)鍵是數(shù)據(jù)的存儲(chǔ)和管理。數(shù)據(jù) 倉(cāng)庫(kù)的組織管理決定了它不同于傳統(tǒng)的數(shù)據(jù)庫(kù),也決定了它對(duì)外的數(shù)據(jù)表達(dá)式。要決定用什么產(chǎn)品和技術(shù)來(lái)構(gòu)建數(shù)據(jù) 倉(cāng)庫(kù)的核心,我們需要從數(shù)據(jù) 倉(cāng)庫(kù)的技術(shù)特點(diǎn)入手。根據(jù)主題對(duì)現(xiàn)有業(yè)務(wù)系統(tǒng)進(jìn)行提取、清理、有效整合和組織。
4、什么是 數(shù)據(jù) 集市?數(shù)據(jù)集市獨(dú)立DB2數(shù)據(jù)Library includes數(shù)據(jù)enterprise。每個(gè)數(shù)據(jù) 集市包括來(lái)自中央政府的歷史數(shù)據(jù) 倉(cāng)庫(kù)的子集,以滿足特定部門、團(tuán)隊(duì)、客戶或應(yīng)用的分析和報(bào)告需求。托管這個(gè)DB2 數(shù)據(jù)庫(kù)的系統(tǒng)稱為數(shù)據(jù)集市server。雖然數(shù)據(jù)-1/可以有很多,但是數(shù)據(jù)-1/服務(wù)器只能有一個(gè)。數(shù)據(jù) 集市該組件需要IBM DB 2 Universal Database Enterprise Edition,在安裝控制服務(wù)器之前必須手動(dòng)安裝。
IbmtivoolimonitoringForransaction Performance通過提供一個(gè)名為數(shù)據(jù) 集市的提取、轉(zhuǎn)換和加載(ETL)進(jìn)程來(lái)實(shí)現(xiàn)此操作,該進(jìn)程是由數(shù)據(jù) 集市創(chuàng)建的,并將來(lái)自中央/您可以修改現(xiàn)有的數(shù)據(jù)集市或創(chuàng)建一個(gè)新的
5、 數(shù)據(jù) 倉(cāng)庫(kù)是做什么的個(gè)人認(rèn)為最簡(jiǎn)單的答案是數(shù)據(jù)對(duì)歷史進(jìn)行分析整理。數(shù)據(jù) 倉(cāng)庫(kù)在根源上,它的出現(xiàn)是因?yàn)楦鞣N應(yīng)用系統(tǒng)無(wú)法高效處理大量歷史數(shù)據(jù)。以銀行為例。我國(guó)幅員遼闊,資源豐富。一般全國(guó)銀行網(wǎng)點(diǎn)至少有4000家。在財(cái)務(wù)系統(tǒng)的一個(gè)總賬里,每個(gè)分行每個(gè)月至少要有1000個(gè)科目和項(xiàng)目/123,456,789-0/要報(bào),還不算各種外幣和海外機(jī)構(gòu)。經(jīng)過10年的積累,集中庫(kù)的總賬中/123,456,789-0/的金額是如此之大:
我們能做的就是減少在應(yīng)用系統(tǒng)中保存數(shù)據(jù)的時(shí)間,只能查看最近2年及以下的記錄。把歷史數(shù)據(jù)的統(tǒng)計(jì)分析留給其他系統(tǒng),就出現(xiàn)了一個(gè)名為數(shù)據(jù)-2/的系統(tǒng)。這個(gè)倉(cāng)庫(kù)中最重要的問題是歷史數(shù)據(jù)的統(tǒng)計(jì),如何高效的存儲(chǔ)歷史數(shù)據(jù)如何處理緯度梯度,如何設(shè)計(jì)更貼近業(yè)務(wù)的主題等等。
6、什么是 數(shù)據(jù) 倉(cāng)庫(kù), 數(shù)據(jù) 倉(cāng)庫(kù)如何分層數(shù)據(jù)倉(cāng)庫(kù)分層的原因1效率是通過數(shù)據(jù)預(yù)處理提高的,所以會(huì)有冗余數(shù)據(jù)2如果業(yè)務(wù)系統(tǒng)的業(yè)務(wù)規(guī)則沒有分層,會(huì)影響整個(gè)/10。工作量巨大。3工作通過分級(jí)管理逐步完成,使每一層的處理邏輯簡(jiǎn)單。標(biāo)準(zhǔn)數(shù)據(jù)-2/Layers:ods(臨時(shí)存儲(chǔ)層)、PDW(數(shù)據(jù)-2/layer)、Mid(數(shù)據(jù)集市l(wèi)ayer)、app(應(yīng)用層)ODS:歷史存儲(chǔ)層,與源系統(tǒng)同構(gòu)數(shù)據(jù)、以及
7、 數(shù)據(jù) 倉(cāng)庫(kù)與 數(shù)據(jù)挖掘技術(shù)—特點(diǎn)及元 數(shù)據(jù)數(shù)據(jù)倉(cāng)庫(kù)具有以下特征數(shù)據(jù) 數(shù)據(jù)其中數(shù)據(jù)是在更高層次上分析對(duì)象的主題式組織。主題通常在更高的層次上進(jìn)行分類數(shù)據(jù),每個(gè)主題對(duì)應(yīng)一個(gè)宏觀分析領(lǐng)域。數(shù)據(jù) 倉(cāng)庫(kù)應(yīng)該重組數(shù)據(jù)完成從業(yè)務(wù)數(shù)據(jù)到主題數(shù)據(jù)的轉(zhuǎn)化。題目的提取要根據(jù)分析的要求來(lái)確定,根據(jù)需要的信息,分門別類、分角度存儲(chǔ)數(shù)據(jù)-0/倉(cāng)庫(kù)數(shù)據(jù)是綜合事務(wù)處理系統(tǒng)中的操作型數(shù)據(jù) in。
8、 數(shù)據(jù)庫(kù)與 數(shù)據(jù) 倉(cāng)庫(kù)的區(qū)別總之,數(shù)據(jù) Library是面向事務(wù)的設(shè)計(jì),數(shù)據(jù)倉(cāng)庫(kù)Library是面向主題的。數(shù)據(jù)圖書館一般存儲(chǔ)網(wǎng)上交易數(shù)據(jù),數(shù)據(jù) 倉(cāng)庫(kù)存儲(chǔ)歷史數(shù)據(jù)。數(shù)據(jù)庫(kù)的設(shè)計(jì)是盡可能避免冗余,一般采用符合范式的規(guī)則。數(shù)據(jù) 倉(cāng)庫(kù)設(shè)計(jì)中有意引入冗余,采用反范式。數(shù)據(jù) Library是為了捕捉數(shù)據(jù),倉(cāng)庫(kù)是為了分析數(shù)據(jù),它的兩個(gè)基本元素是維度表和事實(shí)表。維度是看問題的視角,比如時(shí)間、部門、維度表,里面包含了這些東西的定義,事實(shí)表包含了要查詢的數(shù)據(jù),維度的ID。
任何技術(shù)都是為應(yīng)用服務(wù)的,結(jié)合應(yīng)用就很容易理解。以銀行業(yè)為例,數(shù)據(jù)庫(kù)是交易系統(tǒng)的數(shù)據(jù)平臺(tái)??蛻粼阢y行進(jìn)行的每一筆交易都會(huì)被寫入數(shù)據(jù) Library并記錄在案,這里可以簡(jiǎn)單理解為用數(shù)據(jù)庫(kù)記賬。數(shù)據(jù) 倉(cāng)庫(kù)是分析系統(tǒng)的數(shù)據(jù)平臺(tái),它從交易系統(tǒng)中獲取數(shù)據(jù),并對(duì)其進(jìn)行匯總和處理,為決策者提供依據(jù)。比如某銀行某支行一個(gè)月發(fā)生了多少筆交易,該支行的活期存款余額是多少。