數(shù)字生活讓人多疑。就在你跟微信上的朋友說要去日本玩的時候,看到朋友圈里的機票廣告。就在你老婆打電話給你買奶粉后,你在淘寶上看到了奶粉推薦。這些廣告是怎么來的?為什么這些app知道你想買什么?淘寶當(dāng)然不會偷聽你的電話。是你的行為數(shù)據(jù)讓淘寶意識到你需要嬰兒奶粉。注冊賬戶需要輸入姓名、手機號碼,有時還需要添加性別和所在地。
更重要的是,你的消費記錄,打車頻率,你關(guān)注的微信官方賬號,你玩過的游戲,理財習(xí)慣,你有沒有車貸或房貸,你有沒有買保險,你發(fā)過的紅包,最終都會成為成千上萬的事實標簽,成為你行為數(shù)據(jù)的一部分。收集事實標簽不難,難的是建立模型,從雜亂的標簽中找到自己真正的興趣,進而建立用戶畫像。比如你打開一篇內(nèi)容標簽為美女的文章,并不代表你真的愛看美女,可能只是不小心點了一下。
7、數(shù)據(jù)分析和 數(shù)據(jù)處理那個在前?數(shù)據(jù)處理數(shù)據(jù)分析第一。一般來說,計算機獲取數(shù)據(jù)后,首先要對數(shù)據(jù)進行處理,去掉臟數(shù)據(jù),然后再對數(shù)據(jù)進行分析。這種數(shù)據(jù)分析曾經(jīng)有過權(quán)威的信。數(shù)據(jù)處理在前面,數(shù)據(jù)分析在后面。數(shù)據(jù)處理是對數(shù)據(jù)(數(shù)值型和非數(shù)值型)進行分析和處理的技術(shù)過程。包括對各種原始數(shù)據(jù)的分析、整理、計算、編輯等加工處理。數(shù)據(jù)處理的基本目的是從大量的數(shù)據(jù)中心中提取并推導(dǎo)出對某些特定人群有價值、有意義的數(shù)據(jù),這些數(shù)據(jù)可能是混亂的、難以理解的。
8、前端處理數(shù)據(jù)還是后端處理數(shù)據(jù)?我們知道,一個互聯(lián)網(wǎng)應(yīng)用按照分工可以分為前端和后端。前端主要負責(zé)數(shù)據(jù)調(diào)用和頁面顯示渲染,后端主要負責(zé)數(shù)據(jù)處理。這里可能有很多人認為做前端比做后端容易,但事實并非如此。說到前端,以前只負責(zé)界面渲染(通俗點說就是“Cutter”)和一些JS驗證和效果實現(xiàn),但是隨著這幾年技術(shù)的發(fā)展,前端也有了翻天覆地的變化。
什么是“大前端”?大前端是在傳統(tǒng)前端的基礎(chǔ)上,針對后端的。大前端可以理解為前端領(lǐng)域的升級和拓展。以前前端排好頁面后,還要交給后端進行模板填充。當(dāng)時的“前端與后端分離”并不徹底。在“大前端”模式下,前后端的分離比較徹底。大前端的特點主要包括:終端多樣式:除了傳統(tǒng)的WEB、WAP終端,還有iOS、Android、H5、小程序、微信官方賬號等新型終端。
9、 推薦 系統(tǒng)的理解推薦系統(tǒng)就是把“正確的”內(nèi)容推送給“正確的”人。具體是指推送“信息”(包括圖片、視頻等。)根據(jù)“人的興趣”(興趣可以通過用戶在頁面上的點擊習(xí)慣、頁面瀏覽時間、喜歡和收藏等行為數(shù)據(jù)來表達)來給人。把人找信息的想法變成信息找人的想法。推薦是基于用戶行為數(shù)據(jù)進行數(shù)據(jù)挖掘的結(jié)果。
數(shù)據(jù)包括:足夠多的用戶,足夠多的行為數(shù)據(jù),足夠多的內(nèi)容。推薦的目標是提高正反饋,減少負反饋,延長使用時間,增加用戶粘性,算法核心:給用戶推薦和這個用戶相似的用戶喜歡的內(nèi)容。如下圖所示,用戶A和用戶B都喜歡視頻A、視頻B和視頻D,所以認為用戶A和用戶B是相似用戶,會把用戶B喜歡的視頻c 推薦給用戶A,算法核心:給用戶推薦那些與自己喜歡的內(nèi)容相似的內(nèi)容。