最近一直在研究數(shù)據(jù)分析的相關(guān)知識,我將一點(diǎn)一滴的分享我所學(xué)到的,從百度統(tǒng)計(jì)開始。百度統(tǒng)計(jì)是網(wǎng)站數(shù)據(jù)統(tǒng)計(jì)和分析的有力工具。它從六個維度進(jìn)行趨勢分析、來源分析、頁面分析、訪客分析、定制分析、優(yōu)化分析,幫助網(wǎng)站優(yōu)化、用戶定位、營銷推廣,打通網(wǎng)站與用戶的完美結(jié)合。趨勢分析,可以知道網(wǎng)站的基本狀態(tài)和用戶活躍度;訪客分析和用戶自定義變量可以幫助我們了解網(wǎng)站訪客的構(gòu)成和各種屬性,幫助我們明確用戶的定位;頁面分析、轉(zhuǎn)化路徑和事件跟蹤可以幫助我們了解用戶的操作行為,幫助我們合理安排頁面布局和層次,優(yōu)化網(wǎng)站設(shè)計(jì),提高轉(zhuǎn)化;來源分析,優(yōu)化分析,指定廣告跟蹤,可以幫助我們了解網(wǎng)站的營銷推廣狀況,監(jiān)控各種網(wǎng)絡(luò)媒體的推廣效果,優(yōu)化SEO。
7、數(shù)據(jù)指標(biāo)|移動應(yīng)用 數(shù)據(jù)分析體系考核關(guān)鍵指標(biāo):參與度分析主要分析用戶的活躍度;渠道分析主要分析渠道推廣的效果;功能分析主要分析功能活躍度、頁面訪問路徑、轉(zhuǎn)化率;用戶屬性分析主要分析用戶特征。用戶規(guī)模和質(zhì)量的分析包括五個常用指標(biāo):活躍用戶、新增用戶、用戶構(gòu)成、用戶留存率和每個用戶的總活躍天數(shù)?;钴S用戶是指在一定統(tǒng)計(jì)周期內(nèi)啟動了某個應(yīng)用(APP)的用戶。根據(jù)統(tǒng)計(jì)周期的不同,活躍用戶數(shù)可分為日活躍數(shù)(DAU)、周活躍數(shù)(WAU)和月活躍數(shù)(MAU)。
根據(jù)統(tǒng)計(jì)時間跨度的不同,分為日新增用戶、周新增用戶和月新增用戶。新用戶的指標(biāo)主要是衡量營銷推廣渠道效果的最基本指標(biāo);另一方面,新用戶占活躍用戶的比例也可以用來衡量產(chǎn)品的健康程度。如果一個產(chǎn)品的新用戶比例過高,說明產(chǎn)品的活躍度來自推廣,這是非常值得關(guān)注的,尤其是用戶的留存率。以周活躍用戶為例。周活躍用戶包括以下幾類用戶,包括本周回歸用戶,N周連續(xù)活躍用戶,忠實(shí)用戶,持續(xù)活躍用戶。
8、 數(shù)據(jù)分析系列-零售數(shù)據(jù)指標(biāo)9、 數(shù)據(jù)分析-評估指標(biāo)(F1score和ROC曲線
這里我介紹數(shù)據(jù)分析的兩個評價指標(biāo),f1評分和ROC曲線。在介紹F1score和ROC曲線之前,我們首先要了解以下幾個概念:什么是混淆矩陣?我們來看下圖:注意上圖中,藍(lán)點(diǎn)為正,紅點(diǎn)為負(fù)。一般來說,從醫(yī)學(xué)的角度來說,陽性代表有病或者病毒,陰性代表正常。上述模型中有多少真陽性、真陰性、假陽性和假陰性?
我們來學(xué)習(xí)一個衡量模型性能的方法,精度。準(zhǔn)確度如何?我們繼續(xù)引用上圖,準(zhǔn)確率是圖表所有數(shù)據(jù)中正確分類的點(diǎn)數(shù),是正確分類的點(diǎn)數(shù)占總點(diǎn)數(shù)的比率。數(shù)學(xué)公式是正確分類精度的點(diǎn)數(shù)/總點(diǎn)數(shù),上圖中,正確的分類是真正(6) 真負(fù)(5)11;總點(diǎn)數(shù)為14,上圖準(zhǔn)確率為11/140.7857。在知道準(zhǔn)確率之前,我們先來看看下面這張醫(yī)學(xué)預(yù)測圖:準(zhǔn)確率的定義是所有預(yù)測的陽性點(diǎn)有多少是真陽性。