1。Da 數(shù)據(jù)架構(gòu)的工具和組件數(shù)據(jù) 工程師更注重分析基礎(chǔ)架構(gòu),所以所需技能大多以架構(gòu)為中心。2.對(duì)SQL和其他數(shù)據(jù)library solutions數(shù)據(jù)工程師需要對(duì)數(shù)據(jù)library management system有比較熟悉的了解,對(duì)SQL的深入了解非常重要。同樣,其他的數(shù)據(jù) library解決方案,比如Cassandra或者BigTable,也一定很熟悉,因?yàn)椴⒉皇敲總€(gè)數(shù)據(jù) library都是按照可識(shí)別的標(biāo)準(zhǔn)構(gòu)建的。
數(shù)據(jù)倉(cāng)庫(kù)解決方案如Redshift或Panoply,ETL工具如StitchData或Segment都非常有用。另外,數(shù)據(jù)存儲(chǔ)和數(shù)據(jù)檢索經(jīng)驗(yàn)同樣重要,因?yàn)閿?shù)據(jù)處理的量是天文數(shù)字。4.基于Hadoop的分析(HBase、Hive、MapReduce等。)對(duì)基于ApacheHadoop的分析有深入的了解是這個(gè)領(lǐng)域非常必要的要求??偟膩?lái)說(shuō),HBase,Hive,MapReduce的知識(shí)存儲(chǔ)是必要的。
5、大 數(shù)據(jù)培訓(xùn)課程都學(xué)什么?對(duì)Da 數(shù)據(jù)肯定有了解的人和想要學(xué) Xida 數(shù)據(jù)的童鞋有所了解,對(duì)da 數(shù)據(jù)相關(guān)的一些學(xué)習(xí)內(nèi)容有個(gè)大概的了解。但是Da 數(shù)據(jù)的培訓(xùn)學(xué)習(xí)內(nèi)容的一些細(xì)節(jié)內(nèi)容還是有差距的。學(xué)習(xí)Da 數(shù)據(jù)的主要目的是為了以后去大企業(yè)做相關(guān)工作,獲得客觀薪資。然后我們需要了解企業(yè)對(duì)技術(shù)的需求,課程內(nèi)容是否包含這些內(nèi)容。
第一階段是Java語(yǔ)言的基礎(chǔ),也就是剛剛開(kāi)始的“Da-2”階段,主要是學(xué)習(xí)Java語(yǔ)言的一些概念、字符和進(jìn)程控制。第二階段,Javaee core了解并熟悉HTML和CSS的一些基礎(chǔ)知識(shí),JavaWeb和數(shù)據(jù) library,Linux基礎(chǔ),Linux操作系統(tǒng)基本原理,虛擬機(jī)使用和Linux構(gòu)建,Shell腳本,Linux權(quán)限管理等Linux使用的基礎(chǔ)知識(shí),通過(guò)實(shí)際操作學(xué)會(huì)使用。
6、大 數(shù)據(jù)專業(yè)主 要學(xué)什么?什么是大數(shù)據(jù)?英文叫bigdata,或者巨量數(shù)據(jù),是當(dāng)代海量數(shù)據(jù),包括我們?cè)诨ヂ?lián)網(wǎng)上的所有信息的集合。大數(shù)據(jù)我能做什么?通過(guò)對(duì)Da 數(shù)據(jù)的提取、管理、加工、整理,幫助我們進(jìn)行決策。列舉如下:應(yīng)用于犯罪預(yù)測(cè)、流感趨勢(shì)預(yù)測(cè)、選舉預(yù)測(cè)、商品推薦預(yù)測(cè)等。數(shù)據(jù)職業(yè)需求要學(xué)什么?因?yàn)樯婕暗胶A康姆治鰯?shù)據(jù),離不開(kāi)數(shù)學(xué),很多數(shù)學(xué)。
7、大 數(shù)據(jù)開(kāi)發(fā) 工程師 要學(xué)習(xí)哪些課程?編程沒(méi)有捷徑。也許天賦有一些作用,但是沒(méi)有長(zhǎng)期的練習(xí)和大腦的開(kāi)發(fā)是不可能成為大師的。其次,編程語(yǔ)言基本上有幾百種,可以在庫(kù)中看到,很多軟件都有一種開(kāi)發(fā)語(yǔ)言,一定不能貪多。然后當(dāng)然主流語(yǔ)言是C系列,從C到C 再到C#或者Java,這是一條基本路線。至于匯編語(yǔ)言,除了計(jì)算機(jī)專業(yè)人士,一般不接觸。