hadoop非關(guān)系型數(shù)據(jù)庫?請問數(shù)據(jù)庫的類型有哪些?Hadoop,mongodb卡珊德拉;redishbaseneo4j其中mongodb是非常著名的NoSQL 數(shù)據(jù) library,它是一個面向開源文檔的數(shù)據(jù) library。來自數(shù)據(jù) warehouse數(shù)據(jù)的客戶可以放入Hadoop應(yīng)用進(jìn)行分析,分析結(jié)果返回到數(shù)據(jù)warehouse。
首先要了解Java語言和Linux操作系統(tǒng),這是學(xué)習(xí)Da 數(shù)據(jù)的基礎(chǔ),學(xué)習(xí)順序不分先后。樓主JAVA畢業(yè),無疑是一個極好的開端和基石。可以說他贏在了起跑線上,接收和吸收數(shù)據(jù)領(lǐng)域的知識會比普通人更方便。Java:只要懂一些基礎(chǔ),不需要很深的Java技術(shù)就可以大數(shù)據(jù)。學(xué)習(xí)javaSE相當(dāng)于學(xué)習(xí)big 數(shù)據(jù)?;A(chǔ)Linux:因?yàn)橄嚓P(guān)的軟件都運(yùn)行在Linux上,所以要更扎實(shí)的學(xué)習(xí)Linux。學(xué)好Linux對你快速掌握相關(guān)技術(shù)會有很大的幫助。可以讓你更好的了解hadoop、hive、hbase、spark等大型數(shù)據(jù)軟件的運(yùn)行環(huán)境和網(wǎng)絡(luò)環(huán)境配置??梢陨俨瓤樱瑢W(xué)習(xí)shell理解腳本,這樣更容易理解和配置大型數(shù)據(jù)集群。
首先要了解Java語言和Linux操作系統(tǒng),這是學(xué)習(xí)Da 數(shù)據(jù)的基礎(chǔ),學(xué)習(xí)順序不分先后。Java:只要懂一些基礎(chǔ),不需要很深的Java技術(shù)就可以大數(shù)據(jù)。學(xué)習(xí)javaSE相當(dāng)于學(xué)習(xí)big 數(shù)據(jù)。Linux:因?yàn)橄嚓P(guān)的軟件都運(yùn)行在Linux上,所以你要把Linux學(xué)得更扎實(shí)。學(xué)好Linux對你快速掌握相關(guān)技術(shù)會有很大的幫助??梢宰屇愀玫牧私鈎adoop、hive、hbase、spark等大型數(shù)據(jù)軟件的運(yùn)行環(huán)境和網(wǎng)絡(luò)環(huán)境配置??梢陨俨瓤?,學(xué)習(xí)shell理解腳本,這樣更容易理解和配置大型數(shù)據(jù)集群。
Da 數(shù)據(jù)工具不應(yīng)破壞現(xiàn)有的數(shù)據(jù)倉庫環(huán)境。雖然大量低成本甚至零成本的工具降低了進(jìn)入門檻,但它們構(gòu)成了Hadoop的生態(tài)系統(tǒng),支撐了其存儲和管理大量數(shù)據(jù)set的能力。許多企業(yè)數(shù)據(jù)倉庫,這些曾經(jīng)是商業(yè)智能和分析系統(tǒng)的中心,受到了沖擊。然而,企業(yè)在數(shù)據(jù) warehouse中投入了大量的資金、資源和時間來建立和完善數(shù)據(jù) warehouse的查詢、報表和分析功能。企業(yè)不希望這一切付之東流。
通常這種轉(zhuǎn)型是以犧牲服務(wù)質(zhì)量甚至業(yè)務(wù)中斷為代價的。因此,大多數(shù)企業(yè)會選擇一種集成的方式,使新舊系統(tǒng)技術(shù)協(xié)同工作。比如將基于Hadoop的客戶分析應(yīng)用與現(xiàn)有的客戶數(shù)據(jù) warehouse結(jié)合起來。來自數(shù)據(jù) warehouse數(shù)據(jù)的客戶可以放入Hadoop應(yīng)用進(jìn)行分析,分析結(jié)果返回到數(shù)據(jù)warehouse。Da 數(shù)據(jù)關(guān)聯(lián)集成的第一步是建立數(shù)據(jù)倉庫和Da 數(shù)據(jù)平臺之間的關(guān)聯(lián)。