數(shù)據(jù)挖掘,數(shù)據(jù)挖掘什么事?現(xiàn)在已經進入了“大數(shù)據(jù)”的時代,傳統(tǒng)的挖掘的算法已經不適用于工具書“大數(shù)據(jù):互聯(lián)網海量數(shù)據(jù)/12344”。如何自學-1挖掘老師?我個人的建議如下:第一階段:掌握-1挖掘的基本概念和方法,第二階段:掌握數(shù)據(jù)挖掘和數(shù)據(jù)時代的分布式處理算法。
嗯,基本方法有很多,比如決策樹、支持向量機、貝葉斯方法、神經網絡方法等。有相關的-1挖掘書籍,里面有很多詳細的算法。我手里有一本剛借的。有需要的話可以推薦給你。我個人的建議如下:第一階段:掌握-1挖掘的基本概念和方法。先對數(shù)據(jù) 挖掘有個概念并掌握基本算法,比如分類算法,聚類算法,協(xié)同過濾算法。
第二階段:掌握數(shù)據(jù)挖掘和數(shù)據(jù)時代的分布式處理算法。現(xiàn)在已經進入了“大數(shù)據(jù)”的時代,傳統(tǒng)的挖掘的算法已經不適用于工具書“大數(shù)據(jù):互聯(lián)網海量數(shù)據(jù)/12344”。第三階段:利用Hadoop進行大數(shù)據(jù) 挖掘。Hadoop有一個Mahout組件,包含了幾乎所有的數(shù)據(jù) 挖掘算法,包括分類、聚類和關聯(lián)規(guī)則。參考書:Hadoop在行動(第二版)。作者:陸家恒。
(新疆烏魯木齊市新疆財經大學圖書館)摘要:介紹了數(shù)據(jù) 挖掘的含義及其與傳統(tǒng)的數(shù)據(jù)分析的區(qū)別,探討了其在情報研究領域的應用。關鍵詞:數(shù)據(jù)挖掘;信息科學;信息檢索;圖書館信息服務分類編號。:G350.7文件識別碼:A貨號:10076921 (2009) 07030302 1信息科學領域面臨的問題1.1資源全球化可以說,互聯(lián)網是世界上最大的信息資源庫,資源類型多樣,包括教育網站、虛擬圖書館、虛擬軟件庫等。,為收集所需信息提供了便利和可能。
另外,海量網絡數(shù)據(jù)的出現(xiàn),使得提取有用信息變得困難。1.2 數(shù)據(jù)呈現(xiàn)非結構化就大量的視頻、音頻、動畫等非結構化數(shù)據(jù)而言,現(xiàn)有的搜索方式對這類數(shù)據(jù)并不有效。只有數(shù)據(jù)挖掘technology能夠高效地檢索、處理和分析海量結構化或非結構化數(shù)據(jù)。1.3信息需求的個性化需求的個性化使得傳統(tǒng)的一對多的信息服務模式越來越不適應時代的要求。