收集后數(shù)據(jù),很多肯定是重復(fù)的或者沒用的數(shù)據(jù)。此時數(shù)據(jù)需要進行簡單的清洗和預(yù)處理,使不同來源的數(shù)據(jù)融為一體,適用于,如數(shù)據(jù)重復(fù)數(shù)據(jù)刪除、異常處理和數(shù)據(jù)規(guī)范化,然后將這些數(shù)據(jù)存儲在大型分布式數(shù)據(jù)庫或分布式存儲集群中,大數(shù)據(jù)的集合采用ETL工具收集分布式、異構(gòu)數(shù)據(jù)source數(shù)據(jù)relationship數(shù)據(jù)plane數(shù)據(jù)等非結(jié)構(gòu)化/12。
數(shù)據(jù)采集,數(shù)據(jù)導(dǎo)入和清洗預(yù)處理,數(shù)據(jù)統(tǒng)計分析和挖掘,結(jié)果可視化。1.第一,數(shù)據(jù)收購。大數(shù)據(jù)的集合采用ETL工具收集分布式、異構(gòu)數(shù)據(jù)source數(shù)據(jù)relationship數(shù)據(jù)plane數(shù)據(jù)等非結(jié)構(gòu)化/12。2.其次,數(shù)據(jù)導(dǎo)入和清洗預(yù)處理。收集后數(shù)據(jù),很多肯定是重復(fù)的或者沒用的數(shù)據(jù)。此時數(shù)據(jù)需要進行簡單的清洗和預(yù)處理,使不同來源的數(shù)據(jù)融為一體,適用于。如數(shù)據(jù)重復(fù)數(shù)據(jù)刪除、異常處理和數(shù)據(jù)規(guī)范化,然后將這些數(shù)據(jù)存儲在大型分布式數(shù)據(jù)庫或分布式存儲集群中。
統(tǒng)計分析需要工具,如SPSS工具和一些結(jié)構(gòu)化算法模型,進行分類匯總,以滿足各種數(shù)據(jù)分析需求。4.最后,對結(jié)果進行可視化。big 數(shù)據(jù)分析的用戶包括big 數(shù)據(jù)分析專家和普通用戶,但是big 數(shù)據(jù)分析最基本的要求是可視化分析,因為可視化分析可以直觀地呈現(xiàn)big 數(shù)據(jù)的特征,同時也可以非常容易。
在這里分享一個4S店的大數(shù)據(jù)營銷案例。1.在針對客戶需求采用big 數(shù)據(jù) marketing之前,4S店一個月參加兩次車展,成交效果并不理想,投入成本高,售后客戶流失嚴重??蛻粝Mㄟ^大數(shù)據(jù) marketing增加客戶的店鋪訪問量,提高營業(yè)額,降低推廣和營銷投入的成本。2.投放方案①通過線下獲客設(shè)備投放核心區(qū)域(尤其是車展),24小時不間斷采集區(qū)域內(nèi)用戶設(shè)備信息。
②將客戶設(shè)備數(shù)據(jù)信息打包成大數(shù)據(jù)智能分析初級處理:去重、人群屬性分析、時間段分析、區(qū)域劃分、人群標簽分析、人群行為分析等。目的:獲取更準確的客戶設(shè)置信息數(shù)據(jù)。③根據(jù)定期獲取的精準客戶設(shè)備數(shù)據(jù)信息的分析結(jié)果,開發(fā)更具吸引力和體驗感的網(wǎng)絡(luò)廣告展示風(fēng)格,通過DSP廣告平臺選擇最佳投放渠道投放廣告。