increment抽取Yes數(shù)據(jù)Warehouse ETL(抽取、轉(zhuǎn)換、加載、數(shù)據(jù) 抽取、轉(zhuǎn)換和加載)實現(xiàn)中的關(guān)鍵問題。imformaitca element數(shù)據(jù)Informatica所有元素數(shù)據(jù)信息以數(shù)據(jù) library表的形式存儲在element 數(shù)據(jù) library中,etl和elt 數(shù)據(jù)處理上的區(qū)別對于開發(fā)過BI的朋友來說并不陌生,只要涉及到數(shù)據(jù)source抽取,/,提取抽取,轉(zhuǎn)化轉(zhuǎn)化,加載加載。
對于做過BI開發(fā)的人來說,ETL并不陌生。作為加載,因為它涉及到數(shù)據(jù)-3抽取-3/的來源,它是ETL和ETL。從不同的數(shù)據(jù)source抽取數(shù)據(jù)extraction中,按照一定的數(shù)據(jù)處理規(guī)則,數(shù)據(jù)被處理并格式轉(zhuǎn)換成TRASFORMATION,最后將處理后的輸出輸出到。
菜市場的每個攤位都是數(shù)據(jù)的來源,熟食才是最終的輸出結(jié)果。中間所有的過程,比如摘菜、洗菜、切菜、做飯,都是轉(zhuǎn)換。在開發(fā)的時候,大部分時候會通過ETL工具來實現(xiàn),比如微軟SQLSERVER中的KETTLE、PENTAHO、IBMDATASTAGE、INFORNAICA、SSIS等,整個ETL過程將通過結(jié)合基礎(chǔ)SQL來實現(xiàn)。
ETL是數(shù)據(jù)抽取(extract),Transform,Load的縮寫,是OLTP系統(tǒng)中數(shù)據(jù)after-的縮寫。并將不同的數(shù)據(jù)source數(shù)據(jù)進(jìn)行轉(zhuǎn)換整合得到一致的數(shù)據(jù),然后加載到數(shù)據(jù) warehouse中。簡而言之,ETL就是從OLTP系統(tǒng)到OLAP系統(tǒng)數(shù)據(jù) DataWarehouseDW的過程,是基于OLTP系統(tǒng)數(shù)據(jù) source,以特定的模式存儲數(shù)據(jù)而建立的關(guān)系型,用于多維度分析和多角度呈現(xiàn)。它不同于多維數(shù)據(jù)庫,而數(shù)據(jù)倉庫是細(xì)化的、綜合的。數(shù)據(jù) Warehouse以學(xué)科為導(dǎo)向,以O(shè)LAP系統(tǒng)分析為目標(biāo)。
3、 數(shù)據(jù)治理三個階段是什么?數(shù)據(jù)治理過程是從數(shù)據(jù)規(guī)劃、數(shù)據(jù)收集、數(shù)據(jù)存儲管理到數(shù)據(jù)應(yīng)用的過程。根據(jù)每個過程的特點,我們可以把數(shù)據(jù)治理過程概括為四個字,即“理”、“用”、“存”、“用”。1.合理性:梳理業(yè)務(wù)流程,規(guī)劃數(shù)據(jù)資源。對于企業(yè)來說,日常實時數(shù)據(jù)會超過TB級別。需要收集哪些數(shù)據(jù)的用戶,這么多數(shù)據(jù),放在哪里,怎么放?
4、簡述 etl過程中哪個步驟應(yīng)該出于安全的考慮將 數(shù)據(jù)寫到磁盤上1。數(shù)據(jù)ODS區(qū)采集:主要功能是盡量減少對業(yè)務(wù)系統(tǒng)的影響。表結(jié)構(gòu)可能與DW不一致。根據(jù)具體的業(yè)務(wù)需求和數(shù)據(jù)的數(shù)量,將數(shù)據(jù)從源放入ODS有多種方式,如Oracle的數(shù)據(jù)庫鏈接、表復(fù)制、SQL*LOADER和Fastload Teradata。需要解決的問題包括:當(dāng)A和數(shù)據(jù)is抽取old數(shù)據(jù)的時差時,不同時期數(shù)據(jù)的定義要統(tǒng)一,更早的數(shù)據(jù)要統(tǒng)一。