在此之前,他在NASA空間科學(xué)項(xiàng)目中度過了近20年,支持?jǐn)?shù)據(jù) system的各種活動(dòng)。包括擔(dān)任NASA哈勃太空望遠(yuǎn)鏡數(shù)據(jù)檔案項(xiàng)目科學(xué)家、NASA天文學(xué)數(shù)據(jù)中心與空間科學(xué)數(shù)據(jù)運(yùn)營辦公室的合同經(jīng)理??驴恕げ6骷扔杏绊懥τ趾軐?shí)際。筆者整理了Kirk Born最近做的數(shù)據(jù) science相關(guān)的講座和訪談資料,以讀書的形式分享給大家。
4、大 數(shù)據(jù)專業(yè)能進(jìn)哪些公司?Da 數(shù)據(jù)專業(yè)就業(yè)方向1。數(shù)據(jù)挖掘/算法工程師算法工程師是通過算法搜索大量數(shù)據(jù)中隱藏的特定內(nèi)容的專業(yè)人士。這項(xiàng)工作有助于企業(yè)做出明智的決策,提高工作效率,降低出錯(cuò)率。數(shù)據(jù)挖礦已經(jīng)成為很多IT戰(zhàn)略的重要組成部分,對專業(yè)人才的需求很大。2.數(shù)據(jù)分析師數(shù)據(jù)分析師是指從事行業(yè)的專業(yè)人士數(shù)據(jù)收集、整理、分析、評估、預(yù)測。他們主要側(cè)重于從過去和現(xiàn)在去理解數(shù)據(jù)。
3.數(shù)據(jù)Engineer數(shù)據(jù)Engineer主要從事數(shù)據(jù)的收集、分析、整理和維護(hù),重點(diǎn)是清理數(shù)據(jù),方便。4.數(shù)據(jù)產(chǎn)品經(jīng)理以數(shù)字化運(yùn)營的理念深入人心,數(shù)據(jù)產(chǎn)品也進(jìn)入了人們的視線。數(shù)據(jù)產(chǎn)品是一種可以利用數(shù)據(jù)的價(jià)值來幫助用戶做出更好決策的產(chǎn)品形態(tài),而數(shù)據(jù)產(chǎn)品經(jīng)理利用這些產(chǎn)品來滿足特定的數(shù)據(jù)使用需求。
5、 數(shù)據(jù) 科學(xué)家要具備哪些能力?數(shù)學(xué)技能:微積分是嚴(yán)格要掌握的。不一定要掌握多元微積分,但一定要熟練掌握和運(yùn)用一元微積分。另外線性代數(shù)一定要精通,尤其是矩陣運(yùn)算,向量空間,秩等概念。目前機(jī)器學(xué)習(xí)框架中的很多計(jì)算都需要用到矩陣乘法、轉(zhuǎn)置或求逆。雖然很多框架直接提供了這樣的工具,但我們至少要了解內(nèi)部原型原理,比如如何有效判斷一個(gè)矩陣是否有逆矩陣,如何計(jì)算。
6、如何成為一名 數(shù)據(jù) 科學(xué)家保持開放的心態(tài)。如果你是新手,你其實(shí)并不知道數(shù)據(jù)理科是什么,那么完全有可能不是你想要的工作領(lǐng)域。成為數(shù)據(jù) 科學(xué)家,需要花費(fèi)大量的時(shí)間和精力。請充分理解數(shù)據(jù)理科不好的方面,比如數(shù)據(jù)分揀與建筑數(shù)據(jù)生產(chǎn)線。首先要做的是學(xué)習(xí)Python。盡早在MOOC上選擇相關(guān)課程。當(dāng)你熟悉Python的基本用法后,請學(xué)習(xí)如何使用Jupyter工具,并參加一些數(shù)據(jù)科學(xué)領(lǐng)域的在線開放課程。
7、 數(shù)據(jù) 科學(xué)家是干什么的數(shù)據(jù)科學(xué)家大部分要求有編程和計(jì)算機(jī)相關(guān)的專業(yè)背景。簡單來說就是Hadoop、Mahout等大規(guī)模并行處理技術(shù)的機(jī)器學(xué)習(xí)相關(guān)的技能,是處理大數(shù)據(jù)所必須的。除了數(shù)學(xué)和統(tǒng)計(jì)學(xué)方面的素養(yǎng),還需要具備使用SPSS、SAS等主流統(tǒng)計(jì)分析軟件的技能。其中,用于統(tǒng)計(jì)分析的開源編程語言及其運(yùn)行環(huán)境“R”最近備受關(guān)注。r的優(yōu)勢不僅在于其豐富的統(tǒng)計(jì)分析庫,還在于其可視化結(jié)果的高質(zhì)量圖表生成功能,可以通過簡單的命令運(yùn)行。
8、什么是 數(shù)據(jù) 科學(xué)家歸根結(jié)底,沒有數(shù)據(jù)分析師,數(shù)據(jù) 科學(xué)家成功是不可能的,反之亦然。進(jìn)入數(shù)據(jù)理科需要更多的前期投入,但是在薪資方面,回報(bào)會(huì)更高。另外,數(shù)據(jù)科學(xué)就業(yè)市場的增長速度似乎比數(shù)據(jù) analyst要快,這意味著未來可能會(huì)有更多的機(jī)會(huì)。數(shù)據(jù) 科學(xué)家指運(yùn)用科學(xué)方法和挖掘工具,對數(shù)字、符號、字符、網(wǎng)站、音頻或視頻等復(fù)雜海量信息進(jìn)行數(shù)字化再現(xiàn)和理解,并從中發(fā)現(xiàn)新見解的能力數(shù)據(jù)。
9、 數(shù)據(jù) 科學(xué)家與統(tǒng)計(jì)學(xué)家很多統(tǒng)計(jì)學(xué)家認(rèn)為數(shù)據(jù)科學(xué)是關(guān)于分析的數(shù)據(jù),其實(shí)不止于此。數(shù)據(jù) Science還包括自動(dòng)處理的實(shí)現(xiàn)算法提供自動(dòng)預(yù)測和操作,如:自動(dòng)競價(jià)系統(tǒng)估算(實(shí)時(shí))美國(Zillow.com)所有房屋的價(jià)值高頻交易將Google廣告與用戶和網(wǎng)頁匹配,最大化轉(zhuǎn)化率,Amazon.com或臉書的書籍和朋友與任何谷歌搜索都高度相關(guān)。推薦稅務(wù)欺詐調(diào)查和恐怖主義調(diào)查分?jǐn)?shù),計(jì)算所有信用卡交易。癌癥治療中新分子的化學(xué)模擬,分析流行病的早期檢測。美國宇航局的照片被分析,以尋找新的行星或小行星,天氣預(yù)報(bào)是自動(dòng)駕駛的(飛機(jī)和汽車)。所有酒店客房的客戶定制價(jià)格系統(tǒng)(實(shí)時(shí)),問題涵蓋天文學(xué)、欺詐檢測、社交網(wǎng)絡(luò)分析、搜索引擎、金融(交易目標(biāo))、環(huán)境、藥物研發(fā)、貿(mào)易、工程、定價(jià)優(yōu)化(零售)能源(智能電網(wǎng))、投標(biāo)和套利系統(tǒng)。