我是技術(shù)員數(shù)據(jù)而且我可以和題主分享一些經(jīng)驗:其實題主需要明確以下幾個問題,問題的答案其實是有的:1。我想從個人學習成長的角度來構(gòu)建平臺自學?還是現(xiàn)在的公司需要big 數(shù)據(jù)技術(shù)進行分析?從個人學習成長的角度,建議根據(jù)Hadoop或者Spark的官網(wǎng)教程直接安裝,建議看官網(wǎng)(英文)。在“Big-2”這個技術(shù)領域,掌握英語是非常重要的,因為它涉及到組件選型、未來的安裝、部署和運維,所有的任務操作信息和錯誤信息都是英文的,包括遇到問題的回答,所以還是非常重要的。
要解決什么業(yè)務問題?需要什么樣的分析?數(shù)據(jù)數(shù)量是多少?是否需要實時分析?對BI報告有需求嗎?下面是一個典型的場景:公司用Oracle或者MySQL搭建了業(yè)務數(shù)據(jù)庫,有簡單的數(shù)據(jù)分析,也可能是購買了BI系統(tǒng),業(yè)務系統(tǒng)數(shù)據(jù)庫直接支持,現(xiàn)在用-
5、什么是基礎 數(shù)據(jù)信息 平臺數(shù)據(jù) Center是業(yè)務系統(tǒng)和數(shù)據(jù)資源的有機結(jié)合,用于集中、集成、共享和分析。從應用層面來說,包括基于數(shù)據(jù) warehouse的業(yè)務系統(tǒng)和分析系統(tǒng);從數(shù)據(jù)的角度來看,包括操作性數(shù)據(jù)和分析性數(shù)據(jù)和數(shù)據(jù)整合過程;從基礎設施來看,包括服務器、網(wǎng)絡、存儲和整體IT運維服務。數(shù)據(jù)中心建設目標數(shù)據(jù)中心的建設目標是:1。全面建設公司總部和省公司兩級數(shù)據(jù)中心,逐步實現(xiàn)數(shù)據(jù)和業(yè)務系統(tǒng)的集中化;2.建立企業(yè)數(shù)據(jù)倉庫,提供豐富的數(shù)據(jù)分析和展現(xiàn)功能;3.實現(xiàn)數(shù)據(jù)的唯一性和共享性;4.建立統(tǒng)一的安全體系,確保數(shù)據(jù)和業(yè)務系統(tǒng)的接入安全;5.結(jié)合數(shù)據(jù)中心的建設,完善數(shù)據(jù)交換系統(tǒng),實現(xiàn)兩級數(shù)據(jù)中心之間的級聯(lián);6.實現(xiàn)網(wǎng)絡、硬件、存儲設備、數(shù)據(jù)、業(yè)務系統(tǒng)和管理流程、IT采購流程和數(shù)據(jù)交換流程的統(tǒng)一;7.統(tǒng)一的信息管理模式和統(tǒng)一的技術(shù)架構(gòu)可以快速實施和部署各種IT系統(tǒng),提高管理能力。
6、 數(shù)據(jù)云 平臺有哪些?7、大 數(shù)據(jù) 平臺是什么?什么時候需要大 數(shù)據(jù) 平臺?如何建立大 數(shù)據(jù) 平臺?
首先要了解Java語言和Linux操作系統(tǒng),這是學習的基礎數(shù)據(jù),學習順序不分先后。Java:只要懂一些基礎,不需要很深的Java技術(shù)就可以大數(shù)據(jù)。學習javaSE相當于學習big 數(shù)據(jù)。Linux:因為相關(guān)的軟件都運行在Linux上,所以你要把Linux學得更扎實。學好Linux對你快速掌握相關(guān)技術(shù)會有很大的幫助??梢宰屇愀玫牧私鈎adoop、hive、hbase、spark等大型數(shù)據(jù)軟件的運行環(huán)境和網(wǎng)絡環(huán)境配置,可以少踩很多坑,學習shell理解腳本,更容易理解和配置大型數(shù)據(jù)集群。
8、大 數(shù)據(jù)分析 平臺Da 數(shù)據(jù)一站式分析平臺:ETHINK是唯一端到端的hadoop,spark平臺Da數(shù)據(jù)Analysis Foundation-。我們的目標是簡化數(shù)據(jù)分析的過程,讓每個人都能快速從數(shù)據(jù)中獲得決策智慧。不需要用很多數(shù)據(jù)整合、數(shù)據(jù)清洗、數(shù)據(jù)預處理、數(shù)據(jù)分析、數(shù)據(jù)挖掘、。ETHINK是一個集成的平臺,可以把你的數(shù)據(jù)全部加載到hadoop中。
連接與整合:結(jié)構(gòu)化與非結(jié)構(gòu)化數(shù)據(jù),它們以不同的關(guān)系數(shù)據(jù)庫和不同的存儲方式存在,你無力處理。ETHINK嵌入了各種大數(shù)據(jù)甚至關(guān)系數(shù)據(jù)的接入連接器,通過非常簡單的步驟,這些數(shù)據(jù)就可以裝入大的平臺。數(shù)據(jù)它可以導入到嵌入式HADOOP和SPARK存儲庫中,數(shù)據(jù)礦業(yè):行業(yè)第一大公司數(shù)據(jù)礦業(yè)產(chǎn)品,通過ETHINK。