4.相關(guān)關(guān)系總和因果大部分關(guān)系是混淆的數(shù)據(jù)分析師在處理大數(shù)據(jù)/關(guān)系直接影響相關(guān)。Da 數(shù)據(jù)的倡導(dǎo)者維克托·邁爾·舍恩伯格明確指出,Da 數(shù)據(jù)時(shí)代最大的變化就是放棄了對(duì)因果的渴望,轉(zhuǎn)而關(guān)注相關(guān)了,在Da 數(shù)據(jù)的時(shí)代,基于相關(guān)關(guān)系分析的預(yù)測(cè)是Da 數(shù)據(jù)的核心。
1,分析目標(biāo)不明確。是“海量數(shù)據(jù)其實(shí)不能產(chǎn)生海量財(cái)富”。很多分析師經(jīng)常在海量的數(shù)據(jù)中迷茫,是因?yàn)闆]有明確的分析目標(biāo),或者是收集錯(cuò)了。2.收集錯(cuò)誤數(shù)據(jù)當(dāng)數(shù)據(jù)的軟件或硬件出錯(cuò)時(shí),會(huì)出現(xiàn)一些錯(cuò)誤。例如,如果使用日志不與服務(wù)器同步,則移動(dòng)應(yīng)用上的用戶行為信息可能會(huì)丟失。
3.樣本不具有代表性。在分析數(shù)據(jù)時(shí),必須有一個(gè)可信的數(shù)據(jù)樣本,這是保證數(shù)據(jù)的分析結(jié)果不可靠的關(guān)鍵。如果數(shù)據(jù) sample不具有代表性,也將得到最終的分析結(jié)果。所以還要求樣本數(shù)據(jù)完整全面,用單一的、不具有代表性的數(shù)據(jù)代替全部數(shù)據(jù)進(jìn)行分析。這種片面的數(shù)據(jù)分析結(jié)果可能是完全錯(cuò)誤的。4.相關(guān)關(guān)系總和因果大部分關(guān)系是混淆的數(shù)據(jù)分析師在處理大數(shù)據(jù)/關(guān)系直接影響相關(guān)。
Da 數(shù)據(jù)經(jīng)濟(jì)學(xué)方法論再辯數(shù)據(jù)時(shí)代帶來的信息風(fēng)暴不僅改變了我們的生活、工作和思維,也影響了人類的認(rèn)知視角,沖擊了科學(xué)研究的基本方法。經(jīng)濟(jì)學(xué)被譽(yù)為社會(huì)科學(xué)“皇冠上的明珠”,主要原因是強(qiáng)調(diào)經(jīng)驗(yàn)數(shù)據(jù)驗(yàn)證的實(shí)證主義在經(jīng)濟(jì)學(xué)研究中的應(yīng)用較早。對(duì)于經(jīng)濟(jì)學(xué)來說,“大數(shù)據(jù)”是主流范式的革命還是新噱頭?帶著這樣的問題,筆者于2015年6月下旬參加了中國(guó)社會(huì)科學(xué)院“電子社會(huì)科學(xué)”代表團(tuán),赴英國(guó)了解當(dāng)代信息與數(shù)據(jù)技術(shù)對(duì)社會(huì)科學(xué)研究的影響。
目前關(guān)于Da 數(shù)據(jù)的一個(gè)重要分歧是相關(guān) Sex和因果 Sex之爭(zhēng)。Da 數(shù)據(jù)的倡導(dǎo)者維克托·邁爾·舍恩伯格明確指出,Da 數(shù)據(jù)時(shí)代最大的變化就是放棄了對(duì)因果的渴望,轉(zhuǎn)而關(guān)注相關(guān)了。在諾森比亞大學(xué)培訓(xùn)第一天的班級(jí)討論中,代表團(tuán)就這個(gè)問題進(jìn)行了激烈的辯論。實(shí)際上“因果性和相關(guān)性”的問題一直是認(rèn)知哲學(xué)、統(tǒng)計(jì)學(xué)、經(jīng)濟(jì)學(xué)等領(lǐng)域的老問題。