2012年的時(shí)候,我們說(shuō)R是學(xué)術(shù)界的主流,但是現(xiàn)在Python正在慢慢取代學(xué)術(shù)界的R。不知道是不是因?yàn)榇髷?shù)據(jù)時(shí)代的到來(lái)。Python比r快,Python可以直接處理G的數(shù)據(jù);r不能。在分析數(shù)據(jù)時(shí),R需要通過(guò)數(shù)據(jù)庫(kù)(通過(guò)groupby)將大數(shù)據(jù)轉(zhuǎn)化為小數(shù)據(jù),然后再交給R進(jìn)行分析,所以R不能直接分析行為列表,只能分析統(tǒng)計(jì)結(jié)果。
Python最明顯的一個(gè)優(yōu)勢(shì)就在于它的glue語(yǔ)言,這一點(diǎn)在很多書(shū)里也有提及。有些用C寫的算法封裝到Python包里后效率非常高(Python的數(shù)據(jù)挖掘包Orangecanve里的決策樹(shù),分析50萬(wàn)用戶10秒,R里幾個(gè)小時(shí)都出不出來(lái),8G內(nèi)存都滿了)。然而,一切都不是絕對(duì)的。如果R向量化編程做得好(有點(diǎn)難),R的速度和程序的長(zhǎng)度都會(huì)有明顯的提高。
5、供給側(cè)改革需要大數(shù)據(jù)推薦引擎驅(qū)動(dòng)產(chǎn)業(yè)發(fā)展推薦引擎系統(tǒng)和中國(guó)產(chǎn)業(yè)信息平臺(tái)的供需相對(duì)平衡是國(guó)民經(jīng)濟(jì)穩(wěn)定的決定性因素。為了實(shí)現(xiàn)這種平衡,國(guó)家提出了供給側(cè)改革。我看過(guò)很多關(guān)于供給側(cè)改革的文章,大部分都是宏觀層面的,但是筆者認(rèn)為供給側(cè)改革的精細(xì)化推進(jìn)需要產(chǎn)業(yè)發(fā)展推薦引擎系統(tǒng)和中國(guó)產(chǎn)業(yè)信息平臺(tái),需要大數(shù)據(jù)驅(qū)動(dòng),需要像大數(shù)據(jù)推薦引擎技術(shù)系統(tǒng)一樣形成有效的正反饋機(jī)制,以精細(xì)化的方式解決這個(gè)問(wèn)題。簡(jiǎn)而言之:1)全面了解需求方(改革中的人)的需求;2)全面了解供應(yīng)商擁有哪些行業(yè)來(lái)滿足這些需求。
6、如何利用大數(shù)據(jù)進(jìn)行精細(xì)化管理項(xiàng)目精細(xì)化管理的“精細(xì)”是指細(xì)分對(duì)象、功能、具體工作和實(shí)施。首先是細(xì)分對(duì)象,其實(shí)是包羅萬(wàn)象的。工作中需要細(xì)分吊裝、電焊、鋼筋等不同的施工環(huán)節(jié),不能混淆。其實(shí)和掌握一個(gè)道理是一樣的。只有細(xì)化了這些,才能進(jìn)行有針對(duì)性的管理;人的管理要細(xì)分為所有者、監(jiān)督者、員工、合作單位、競(jìng)爭(zhēng)單位等。,尤其是在以人為本、合作共贏的今天,項(xiàng)目管理日趨復(fù)雜,每一個(gè)關(guān)系中的疏忽都可能給管理帶來(lái)不利因素。
7、如何用大數(shù)據(jù)指導(dǎo)市場(chǎng)營(yíng)銷?這是互聯(lián)網(wǎng)營(yíng)銷過(guò)程中典型的用戶點(diǎn)擊流。你可以回憶一下接觸、了解、購(gòu)買一個(gè)新產(chǎn)品的過(guò)程。從一個(gè)廣告或者朋友圈看到了一個(gè)特別有意思、有趣的產(chǎn)品,最后點(diǎn)擊推廣鏈接打開(kāi)了一個(gè)登陸頁(yè)面。在瀏覽了登陸頁(yè)面的內(nèi)容后,我終于完成了廣告主所期望的行為。至于廣告客戶期望什么,這與營(yíng)銷目的密切相關(guān)。同時(shí)也要考慮產(chǎn)品的推廣階段,因?yàn)椴煌a(chǎn)品階段的營(yíng)銷目的是不一樣的。
8、大數(shù)據(jù)需去其糟粕取精華大數(shù)據(jù)需要去其糟粕取其精華_數(shù)據(jù)分析師考試互聯(lián)網(wǎng)的出現(xiàn)拉近了人與人之間的距離,吐槽成為互聯(lián)網(wǎng)上一道獨(dú)特的風(fēng)景。每次春節(jié)都會(huì)把吐槽推向高潮,無(wú)論是吐槽春晚還是吐槽12306等等??傊?,人是百看不厭的吐槽。在網(wǎng)上吐槽會(huì)產(chǎn)生各種數(shù)據(jù),這些數(shù)據(jù)匯集到一起,就是人們常說(shuō)的大數(shù)據(jù)。今天,我們就來(lái)聊聊這個(gè)當(dāng)下的IT熱點(diǎn)。
大數(shù)據(jù)和我們每個(gè)人有什么關(guān)系?簡(jiǎn)單來(lái)說(shuō),大數(shù)據(jù)就是各種數(shù)據(jù)的集合?!拔?、你、他”可能是這些數(shù)據(jù)的創(chuàng)造者,當(dāng)然我們也可能是這些數(shù)據(jù)的受益者。比如“百度遷徙”,就是利用大數(shù)據(jù)技術(shù),對(duì)其LBS(基于位置的服務(wù))大數(shù)據(jù)進(jìn)行計(jì)算分析,動(dòng)態(tài)、實(shí)時(shí)、直觀地展現(xiàn)春節(jié)前后中國(guó)人口遷徙的軌跡和特征?,F(xiàn)在人們對(duì)春晚節(jié)目的熱情超過(guò)了看春晚。但是蘿卜白菜可以說(shuō)各有所愛(ài),很難有一個(gè)評(píng)價(jià)每個(gè)節(jié)目如何能得到大家的認(rèn)可。
9、大數(shù)據(jù)時(shí)代,為什么要使用大數(shù)據(jù)什么是大數(shù)據(jù)?是運(yùn)營(yíng)模式,是能力,是技術(shù),還是數(shù)據(jù)收集?我們今天所說(shuō)的“大數(shù)據(jù)”和過(guò)去傳統(tǒng)意義上的“數(shù)據(jù)”有什么區(qū)別?大數(shù)據(jù)的來(lái)源有哪些?等一下。當(dāng)然,我不是專家學(xué)者,也無(wú)法給出一個(gè)讓大家信服的權(quán)威定義,下面我說(shuō)的只是基于自己理解的總結(jié),只是表達(dá)個(gè)人理解,不求全面權(quán)威。