一直想整理一下這段內(nèi)容。既然是漫談,想到什么就說什么。比如我一直在互聯(lián)網(wǎng)行業(yè)。先簡(jiǎn)單列舉一下互聯(lián)網(wǎng)行業(yè)數(shù)據(jù) 倉(cāng)庫(kù)和數(shù)據(jù)平臺(tái)的目的:整合公司所有業(yè)務(wù)數(shù)據(jù)建立統(tǒng)一的數(shù)據(jù)中心;提供各種報(bào)表,有的給高管,有的給各種業(yè)務(wù);為網(wǎng)站運(yùn)營(yíng)提供運(yùn)營(yíng)支持?jǐn)?shù)據(jù)是指運(yùn)營(yíng)人員可以通過數(shù)據(jù)及時(shí)了解網(wǎng)站和產(chǎn)品的運(yùn)營(yíng)效果;為各類業(yè)務(wù)提供線上或線下數(shù)據(jù)支持,成為公司統(tǒng)一的數(shù)據(jù)交換和提供平臺(tái);分析用戶行為數(shù)據(jù),通過數(shù)據(jù)挖掘降低投入成本,提高投入效果;比如定向精準(zhǔn)廣告,用戶個(gè)性化推薦等。;開發(fā)數(shù)據(jù)產(chǎn)品,直接或間接使公司受益;建工開數(shù)據(jù)平臺(tái),開公司數(shù)據(jù);。
8、詳解 數(shù)據(jù) 倉(cāng)庫(kù)和 數(shù)據(jù)庫(kù)的區(qū)別數(shù)據(jù) 倉(cāng)庫(kù)本身是一個(gè)非常大的數(shù)據(jù)庫(kù),但是數(shù)據(jù)倉(cāng)庫(kù)是由組織存儲(chǔ)的。數(shù)據(jù)庫(kù)是面向事務(wù)的設(shè)計(jì),數(shù)據(jù) 倉(cāng)庫(kù)是面向主題的設(shè)計(jì);數(shù)據(jù)圖書館一般存儲(chǔ)業(yè)務(wù)數(shù)據(jù),數(shù)據(jù) 倉(cāng)庫(kù)一般歷史存儲(chǔ)數(shù)據(jù);數(shù)據(jù)庫(kù)的設(shè)計(jì)是為了盡可能避免冗余。一般是為某個(gè)業(yè)務(wù)應(yīng)用設(shè)計(jì)的,比如簡(jiǎn)單的用戶表,用戶名和密碼記錄簡(jiǎn)單到數(shù)據(jù),符合業(yè)務(wù)應(yīng)用,但不符合分析。數(shù)據(jù)-1.
9、 數(shù)據(jù) 倉(cāng)庫(kù)與 數(shù)據(jù)庫(kù)有什么聯(lián)系數(shù)據(jù)倉(cāng)庫(kù)是基于數(shù)據(jù) library技術(shù),就是研究如何利用大型復(fù)雜數(shù)據(jù)更有效的組織來方便。這是我這么多年后的理解數(shù)據(jù)-1/。數(shù)據(jù)庫(kù)★數(shù)據(jù)庫(kù)開發(fā)階段大致可以分為以下幾個(gè)階段:手工管理階段;文件系統(tǒng)階段;數(shù)據(jù)庫(kù)系統(tǒng)階段;高級(jí)數(shù)據(jù)庫(kù)階段。當(dāng)人們從不同的角度描述這個(gè)概念時(shí),他們有不同的定義(當(dāng)然是描述性的)。比如數(shù)據(jù) library就是一個(gè)“記錄保存系統(tǒng)”(這個(gè)定義強(qiáng)調(diào)數(shù)據(jù) library是幾個(gè)記錄的集合)。
更何況數(shù)據(jù)庫(kù)是“一個(gè)數(shù)據(jù) 倉(cāng)庫(kù)”。當(dāng)然,這種說法雖然形象,但并不嚴(yán)謹(jǐn)。嚴(yán)格來說,數(shù)據(jù) library是“按照數(shù)據(jù) 倉(cāng)庫(kù)”的結(jié)構(gòu)進(jìn)行組織、存儲(chǔ)和管理的。在日常的經(jīng)濟(jì)管理工作中,經(jīng)常需要把一些相關(guān)的數(shù)據(jù)放到這個(gè)“倉(cāng)庫(kù)”中,根據(jù)管理的需要進(jìn)行相應(yīng)的處理。比如企事業(yè)單位的人事部門,往往存儲(chǔ)著員工的基本信息(工號(hào)、姓名、年齡、性別、籍貫、工資、簡(jiǎn)歷等。)在表20.6.3中,而這個(gè)表可以看作是a 數(shù)據(jù)庫(kù)。
10、簡(jiǎn)述 數(shù)據(jù)庫(kù) 數(shù)據(jù) 倉(cāng)庫(kù)和 數(shù)據(jù)挖掘三者之間的關(guān)系數(shù)據(jù)數(shù)據(jù)庫(kù)(DB)是長(zhǎng)期存儲(chǔ)在計(jì)算機(jī)中的有組織、共享、統(tǒng)一管理的數(shù)據(jù)集合。它是按照結(jié)構(gòu)存儲(chǔ)和管理數(shù)據(jù)的計(jì)算機(jī)軟件系統(tǒng)。數(shù)據(jù) 倉(cāng)庫(kù),英文名為DataWarehouse,可縮寫為DW或DWH。它是一個(gè)用于決策支持系統(tǒng)(dss)和在線分析應(yīng)用程序的結(jié)構(gòu)化環(huán)境。數(shù)據(jù) 倉(cāng)庫(kù)研究解決從數(shù)據(jù)圖書館獲取信息的問題。
數(shù)據(jù)數(shù)據(jù)挖掘是通過對(duì)每一個(gè)進(jìn)行分析,從大量的數(shù)據(jù)中發(fā)現(xiàn)其規(guī)則的技術(shù),主要包括三個(gè)步驟:數(shù)據(jù)準(zhǔn)備、規(guī)則發(fā)現(xiàn)和規(guī)則表示。主要是通過分析大量的數(shù)據(jù),來發(fā)現(xiàn)一些不容易被人感知的事物之間的規(guī)律,可以基于數(shù)據(jù)-1/,但是數(shù)據(jù) 倉(cāng)庫(kù)的建立會(huì)消耗大量的人力、物力、財(cái)力和很長(zhǎng)的時(shí)間。僅僅為了數(shù)據(jù)挖掘而構(gòu)建數(shù)據(jù)倉(cāng)庫(kù)是不值得的,但是如果數(shù)據(jù)-1/本身是構(gòu)建的,就應(yīng)該在其基礎(chǔ)上構(gòu)建。