動詞 (verb的縮寫)你如何描述你的個性?你方便告訴我你現(xiàn)在的工資是多少嗎?7.背景調(diào)查你介意我們通過你原來的單位進(jìn)行一些調(diào)查嗎?面試的95%基本都離不開這些問題。當(dāng)然也有可能問一些專業(yè)的問題。我覺得如果你做過,應(yīng)該不難。一般,面試官員不會問太多專業(yè)問題。
4、大 數(shù)據(jù)和空間限制網(wǎng)頁黑名單系統(tǒng),垃圾郵件過濾系統(tǒng),爬蟲網(wǎng)站重復(fù)判斷系統(tǒng),系統(tǒng)容忍一定程度的錯誤率,但空間要求嚴(yán)格。針對這個問題,一般考慮Bloom filter。布隆過濾器不可能完全正確。它的優(yōu)點是可以用很少的空間達(dá)到很高的精度。哈希函數(shù)(Hash function):輸入域可以是很大的范圍,但輸出域是固定的范圍。性質(zhì)如下:1 .無限輸入字段;2.當(dāng)傳入相同的輸入值時,返回值是相同的;3.當(dāng)傳入不同的輸入值時,返回值可能相同也可能不同。
Bloom filter:長度為m的位數(shù)組,每個位置只占一位。假設(shè)有k個哈希函數(shù),這些函數(shù)的輸出域都大于等于m..對于一個輸入對象,通過k個哈希函數(shù)計算結(jié)果,每個結(jié)果都是m的余數(shù),然后在bitarray上涂黑對應(yīng)的位置。檢查一個對象是否是以前輸入的對象,并檢查相應(yīng)的位置是否為黑色。如果一個不是黑色的,則輸入一定不在集合中。
5、 面試大 數(shù)據(jù)工程師,這些技巧你知道嗎?測試算法,就像很多人說的,知道一個算法能做什么?你可能永遠(yuǎn)不會在工作中用到它。就算可以,很多算法都有庫和包,用就好。確實如此,所以算法考試不是為了考,而是為了學(xué),而是為了考察和驗證一個人是否聰明,基本功是否扎實,溝通是否順暢,在討論算法的過程中是否能快速反應(yīng)和學(xué)習(xí)。在討論和交流的過程中,我們發(fā)現(xiàn)了亮點。
看寫代碼,更多的是考察和驗證生活能力。很多情況下,并不要求用什么語言寫。這樣可以考察基本功,沒有基本功是不可能快速工作的。第二,可以考察平時的培訓(xùn)積累和經(jīng)驗,包括工作方法、編程風(fēng)格、思維方式等等。三是主動接受和完成任務(wù),是否愿意接受任何團(tuán)隊需要完成的任務(wù)。第四是完成任務(wù)的速度和質(zhì)量,也就是活著的速度和質(zhì)量。
6、大 數(shù)據(jù)開發(fā)工程師 面試主要 面試哪些內(nèi)容?只要數(shù)據(jù)在量級上很大(或者數(shù)據(jù)復(fù)雜,或者其他方面很大),其實都可以算大數(shù)據(jù)開發(fā),但一般都是大。有以下幾個方向:1) 數(shù)據(jù)挖掘是處理的一個方向,其中數(shù)據(jù)挖掘需要一些統(tǒng)計學(xué)基礎(chǔ),目前數(shù)據(jù)挖掘方向其實不是很明確,還有人工智能?;A(chǔ)數(shù)據(jù)將由數(shù)據(jù)平臺部或數(shù)據(jù)運維部2) 數(shù)據(jù)平臺開發(fā)(這里的平臺開發(fā)內(nèi)容在不同的公司是不一樣的,小公司可能會根據(jù)公司業(yè)務(wù)做一套完整的。大公司的崗位可能是一些開源組件的二次開發(fā))3) Big 數(shù)據(jù)運維方向:比如hadoop、spark集群的運維涉及ha等內(nèi)容4) Big 數(shù)據(jù)分析方向:有些公司會細(xì)化職責(zé),招聘一些專業(yè)的分析師。寫hql或者其他sql來分析數(shù)據(jù)。最后,其實大數(shù)據(jù)平臺相關(guān)的工作分工并不明確,行業(yè)內(nèi)也沒有統(tǒng)一的標(biāo)準(zhǔn),大公司和小公司的情況也不一樣。
7、 面試題:處理一千條 數(shù)據(jù)與處理一千萬條 數(shù)據(jù)的區(qū)別可能有人會說,量太大就需要用別的方法,但我想說的重點是,除了量沒有區(qū)別,需要認(rèn)真去做。但是,我們更傾向于處理1000項,因為一定要穩(wěn),無論做什么都不能大喜過望。穩(wěn)中求勝才是上策。在處理這個問題之前,我們應(yīng)該考慮自己的能力,權(quán)衡利弊。從目前的計算機發(fā)展來看,這沒有什么區(qū)別,因為一個高性能的服務(wù)器可以處理1000萬個簡單的數(shù)據(jù)(個人實踐經(jīng)驗)而不需要優(yōu)化,但是如果你的數(shù)據(jù)很復(fù)雜,需要的不僅僅是重新排序,你就需要解決問題了。
8、大 數(shù)據(jù)技術(shù)Hadoop 面試題9、大 數(shù)據(jù) 面試要準(zhǔn)備哪些
Da數(shù)據(jù)面試,面試對官員的考察一般包括:1。技術(shù)能力是硬指標(biāo),但基本上可以一票否決?;A(chǔ)能力,比如HBase讀寫過程,底層原理,比如為什么spark即使不在內(nèi)存中運行速度也比mr快,是否讀過源代碼,架構(gòu)設(shè)計能力要考慮哪些因素,比如技術(shù)選擇等。2.如何解決hbase集群高cpu的問題;如何優(yōu)化星火任務(wù)等等。3.方案設(shè)計能力,如數(shù)據(jù)倉庫設(shè)計建模流程等。
一、大數(shù)據(jù) 面試準(zhǔn)備一些考試須知:1。讓面試官員記住你的名字,很多人在介紹名字的時候只會說“我叫XXX”。直到你的自我介紹完畢,面試官方才記起你的名字,如果在后續(xù)的自我介紹中沒有突出的表現(xiàn),那么這樣的自我介紹注定是失敗的。2.Tell 面試該官員與申請職位相關(guān)的工作經(jīng)歷,在介紹自己的工作經(jīng)歷時,一定要注意哪些經(jīng)歷與應(yīng)聘的職位相關(guān)。