如何學(xué)好數(shù)據(jù)挖掘?初學(xué)者如何學(xué)習(xí)數(shù)據(jù)倉(cāng)庫(kù)和數(shù)據(jù) 挖掘技術(shù)說(shuō)實(shí)話,短時(shí)間內(nèi)很難完全掌握這些知識(shí)。最好買(mǎi)一本關(guān)于-2挖掘的書(shū),大致了解一下數(shù)據(jù) 挖掘包含的內(nèi)容,也可以得到一些介紹數(shù)據(jù),如何系統(tǒng)學(xué)習(xí)數(shù)據(jù) 挖掘磨刀不誤砍柴工,而學(xué)習(xí)數(shù)據(jù)分析需要學(xué)習(xí)-2挖掘,其中學(xué)習(xí)數(shù)據(jù) 挖掘需要大量的知識(shí)。
嗯,基本方法有很多,比如決策樹(shù)、支持向量機(jī)、貝葉斯方法、神經(jīng)網(wǎng)絡(luò)方法等。有相關(guān)的數(shù)據(jù) 挖掘書(shū)籍,里面有很多詳細(xì)的算法。我手里有一本剛借的。有需要的話可以推薦給你。個(gè)人建議如下:第一階段是掌握數(shù)據(jù) 挖掘的基本概念和方法。先對(duì)數(shù)據(jù) 挖掘有個(gè)概念并掌握基本算法,比如分類(lèi)算法,聚類(lèi)算法,協(xié)同過(guò)濾算法。
第二階段:掌握數(shù)據(jù)挖掘/時(shí)代的分布式處理算法?,F(xiàn)在已經(jīng)進(jìn)入大數(shù)據(jù)的時(shí)代,傳統(tǒng)的數(shù)據(jù) 挖掘的算法已經(jīng)不再適用于參考書(shū):大數(shù)據(jù):互聯(lián)網(wǎng)海量數(shù)據(jù)。第三階段:利用Hadoop進(jìn)行大數(shù)據(jù) 挖掘。Hadoop有一個(gè)Mahout組件,包含了幾乎所有的數(shù)據(jù) 挖掘算法,包括分類(lèi)、聚類(lèi)和關(guān)聯(lián)規(guī)則。參考書(shū):Hadoop在行動(dòng)(第二版)。作者:陸家恒。
向師弟師妹學(xué)習(xí)的幾點(diǎn)建議數(shù)據(jù) 挖掘看著剛進(jìn)實(shí)驗(yàn)室的師弟師妹們的迷茫,雖然和他們有過(guò)一些零散的對(duì)話,但是不夠系統(tǒng)。所以根據(jù)自己的經(jīng)驗(yàn)給出一些學(xué)習(xí)上的建議-2挖掘。可以根據(jù)自身情況具體問(wèn)題具體分析,供參考。希望在上一屆的基礎(chǔ)上更深更遠(yuǎn)。一、研究生院及數(shù)據(jù) 挖掘基礎(chǔ)首先介紹一下大家關(guān)心的一些問(wèn)題,包括我們組的研究方向是什么,論文相關(guān)的問(wèn)題,工作相關(guān)的問(wèn)題,上海戶(hù)口等。
3、學(xué)習(xí) 數(shù)據(jù) 挖掘需要哪方面的基礎(chǔ)知識(shí)啊?數(shù)據(jù) 挖掘概念與技術(shù),數(shù)據(jù)挖掘原理與應(yīng)用,SQL server 2005數(shù)據(jù)library中的書(shū)籍和算法等。你可以用你的知識(shí)來(lái)改進(jìn)或切入其他應(yīng)用。導(dǎo)讀:推薦大家看機(jī)器學(xué)習(xí)實(shí)戰(zhàn)。不需要去學(xué)算法和數(shù)據(jù)結(jié)構(gòu),也不需要去分析幾何知識(shí)。但是你必須有期望、方差和幾種常用的概率分布作為數(shù)理統(tǒng)計(jì)的基礎(chǔ),還要特別注意條件概率,因?yàn)槟惚仨毩私鈽闼刎惾~斯模型。對(duì)于線性代數(shù),至少你要懂矩陣乘法,行列式計(jì)算,然后是微積分知識(shí)。否則,你無(wú)法閱讀所有基于梯度下降法的文獻(xiàn)。業(yè)內(nèi)廣泛使用c 、java、python。推薦你用python。很多模型不需要你造輪子。python有相關(guān)的第三方模塊,非常方便。