這時候你只需要隨時記錄下你的想法,列出你的顧慮和解決方法。當(dāng)然,這個系統(tǒng)雖然龐大,但還是有很多線索讓你掌握它們的構(gòu)造。首先,這個系統(tǒng)需要有一個業(yè)務(wù)目標(biāo)分析,你的系統(tǒng)要達(dá)到的業(yè)務(wù)目標(biāo)要系統(tǒng)地分析,結(jié)合具體的企業(yè)環(huán)境。這份文件的讀者基本上屬于最高層的決策者。還有一個技術(shù)目標(biāo)分析,就是你的項目要解決哪些具體的技術(shù)問題。這部分也很復(fù)雜,基本需要行業(yè)專家認(rèn)真分析。本文件的讀者屬于管理人員。
5、如何做好 數(shù)據(jù) 分析?Step 1: 數(shù)據(jù)準(zhǔn)備:(70%的時間)采集數(shù)據(jù)(爬蟲,數(shù)據(jù)倉庫)驗證數(shù)據(jù)-2/清理(缺失值、離群值、垃圾郵件、規(guī)范化、重復(fù)記錄、特殊值、合并數(shù)據(jù)集)使用python。關(guān)鍵是隨機(jī)性)。存儲與歸檔第二步:數(shù)據(jù)觀察(發(fā)現(xiàn)規(guī)律和隱藏關(guān)聯(lián))。單變量:點圖和抖動圖;直方圖和核密度估計;累積分布函數(shù)兩個變量:散點圖、黃土平滑、殘差分析、對數(shù)圖、傾斜、多個變量:假彩色圖、鑲嵌圖、平行左手圖第三步:數(shù)據(jù)建模、計算和估計(平衡可行性和成本消耗)標(biāo)度參數(shù)模型(標(biāo)度維數(shù))泊松分布與已知模型比較)第四步:數(shù)據(jù)采選擇合適的機(jī)器學(xué)習(xí)算法(蒙特卡羅模擬,相似度計算,主成分分析)Large數(shù)據(jù)考慮用Map/Reduce得出結(jié)論,畫出最終圖表循環(huán)到第二個。
6、 需求 分析--- 數(shù)據(jù)流圖Structured分析,常用于數(shù)據(jù)模型為實體關(guān)系圖,功能模型為數(shù)據(jù)流程圖DFD。可以認(rèn)為一個基于計算機(jī)的信息處理系統(tǒng)是由數(shù)據(jù) Flow和一系列。數(shù)據(jù)流程圖是用于描述數(shù)據(jù)流程和轉(zhuǎn)換的信息系統(tǒng)建模技術(shù)。它用簡單的圖形符號分別表示數(shù)據(jù)流、轉(zhuǎn)換、數(shù)據(jù)源和外部實體。數(shù)據(jù)對象由其屬性來表征。實體關(guān)系圖是表達(dá)數(shù)據(jù)對象及其關(guān)系數(shù)據(jù)對象之間相互聯(lián)系的方式稱為關(guān)系,也稱為連接。
數(shù)據(jù)流程圖的作用主要是(1)描述數(shù)據(jù)系統(tǒng)中邏輯功能模塊之間的流程和處理過程,是一個功能模型。(2)主要描述“函數(shù)數(shù)據(jù)”和“”的輸入輸出。它與數(shù)據(jù) dictionary一起構(gòu)成系統(tǒng)的邏輯模型。數(shù)據(jù)流程圖中每個對象的表示一般指源點和終點:通常指外部對象,用長方形或長方體表示。
7、如何做 需求 分析需求分析(1)用戶分析通過用戶生活方式分組的方法,將用戶按照其價值觀和生活方式特征進(jìn)行分組,形成典型的細(xì)分群體,并對該群體中用戶的一般特征進(jìn)行歸納和提煉。主要解決目標(biāo)用戶是誰,預(yù)期市場容量有多大的問題,(2) 需求挖掘根據(jù)前一階段選定的目標(biāo)用戶群,進(jìn)行抽樣調(diào)研,通過記錄某一類用戶的生活場景或業(yè)務(wù)體驗,了解用戶的典型行為或習(xí)慣,了解其在特定場景下的需求結(jié)合企業(yè)自身能力,拓展業(yè)務(wù)創(chuàng)新的空間。