數(shù)字生活讓人多疑。就在你跟微信上的朋友說(shuō)要去日本玩的時(shí)候,看到朋友圈里的機(jī)票廣告。就在你老婆打電話給你買奶粉后,你在淘寶上看到了奶粉推薦。這些廣告是怎么來(lái)的?為什么這些app知道你想買什么?淘寶當(dāng)然不會(huì)偷聽(tīng)你的電話。是你的行為數(shù)據(jù)讓淘寶意識(shí)到你需要嬰兒奶粉。注冊(cè)賬戶需要輸入姓名、手機(jī)號(hào)碼,有時(shí)還需要添加性別和所在地。
更重要的是,你的消費(fèi)記錄,打車頻率,你關(guān)注的微信官方賬號(hào),你玩過(guò)的游戲,理財(cái)習(xí)慣,你有沒(méi)有車貸或房貸,你有沒(méi)有買保險(xiǎn),你發(fā)過(guò)的紅包,最終都會(huì)成為成千上萬(wàn)的事實(shí)標(biāo)簽,成為你行為數(shù)據(jù)的一部分。收集事實(shí)標(biāo)簽不難,難的是建立模型,從雜亂的標(biāo)簽中找到自己真正的興趣,進(jìn)而建立用戶畫像。比如你打開(kāi)一篇內(nèi)容標(biāo)簽為美女的文章,并不代表你真的愛(ài)看美女,可能只是不小心點(diǎn)了一下。
7、數(shù)據(jù)分析和 數(shù)據(jù)處理那個(gè)在前?數(shù)據(jù)處理數(shù)據(jù)分析第一。一般來(lái)說(shuō),計(jì)算機(jī)獲取數(shù)據(jù)后,首先要對(duì)數(shù)據(jù)進(jìn)行處理,去掉臟數(shù)據(jù),然后再對(duì)數(shù)據(jù)進(jìn)行分析。這種數(shù)據(jù)分析曾經(jīng)有過(guò)權(quán)威的信。數(shù)據(jù)處理在前面,數(shù)據(jù)分析在后面。數(shù)據(jù)處理是對(duì)數(shù)據(jù)(數(shù)值型和非數(shù)值型)進(jìn)行分析和處理的技術(shù)過(guò)程。包括對(duì)各種原始數(shù)據(jù)的分析、整理、計(jì)算、編輯等加工處理。數(shù)據(jù)處理的基本目的是從大量的數(shù)據(jù)中心中提取并推導(dǎo)出對(duì)某些特定人群有價(jià)值、有意義的數(shù)據(jù),這些數(shù)據(jù)可能是混亂的、難以理解的。
8、前端處理數(shù)據(jù)還是后端處理數(shù)據(jù)?我們知道,一個(gè)互聯(lián)網(wǎng)應(yīng)用按照分工可以分為前端和后端。前端主要負(fù)責(zé)數(shù)據(jù)調(diào)用和頁(yè)面顯示渲染,后端主要負(fù)責(zé)數(shù)據(jù)處理。這里可能有很多人認(rèn)為做前端比做后端容易,但事實(shí)并非如此。說(shuō)到前端,以前只負(fù)責(zé)界面渲染(通俗點(diǎn)說(shuō)就是“Cutter”)和一些JS驗(yàn)證和效果實(shí)現(xiàn),但是隨著這幾年技術(shù)的發(fā)展,前端也有了翻天覆地的變化。
什么是“大前端”?大前端是在傳統(tǒng)前端的基礎(chǔ)上,針對(duì)后端的。大前端可以理解為前端領(lǐng)域的升級(jí)和拓展。以前前端排好頁(yè)面后,還要交給后端進(jìn)行模板填充。當(dāng)時(shí)的“前端與后端分離”并不徹底。在“大前端”模式下,前后端的分離比較徹底。大前端的特點(diǎn)主要包括:終端多樣式:除了傳統(tǒng)的WEB、WAP終端,還有iOS、Android、H5、小程序、微信官方賬號(hào)等新型終端。
9、 推薦 系統(tǒng)的理解推薦系統(tǒng)就是把“正確的”內(nèi)容推送給“正確的”人。具體是指推送“信息”(包括圖片、視頻等。)根據(jù)“人的興趣”(興趣可以通過(guò)用戶在頁(yè)面上的點(diǎn)擊習(xí)慣、頁(yè)面瀏覽時(shí)間、喜歡和收藏等行為數(shù)據(jù)來(lái)表達(dá))來(lái)給人。把人找信息的想法變成信息找人的想法。推薦是基于用戶行為數(shù)據(jù)進(jìn)行數(shù)據(jù)挖掘的結(jié)果。
數(shù)據(jù)包括:足夠多的用戶,足夠多的行為數(shù)據(jù),足夠多的內(nèi)容。推薦的目標(biāo)是提高正反饋,減少負(fù)反饋,延長(zhǎng)使用時(shí)間,增加用戶粘性,算法核心:給用戶推薦和這個(gè)用戶相似的用戶喜歡的內(nèi)容。如下圖所示,用戶A和用戶B都喜歡視頻A、視頻B和視頻D,所以認(rèn)為用戶A和用戶B是相似用戶,會(huì)把用戶B喜歡的視頻c 推薦給用戶A,算法核心:給用戶推薦那些與自己喜歡的內(nèi)容相似的內(nèi)容。