從2015年8月到2015年10月,花了3個月時間找工作,先后通過內推參加了美團、阿里螞蟻金服、京東、騰訊、今日頭條、Growing IO、微軟這7個公司的面試,同時參加了網易游戲、LinkedI In中國這2個公司的筆試,拿到比較優質的offer是京東Star和阿里星2個Offer。應聘的崗位要么是算法工程師,要么是機器學習與數據挖掘崗,企業叫法不同,工作實質都是利用機器學習與特征工程去解決業務問題。整個求職過程是一個和互聯網企業雙向了解,接收面試反饋后不斷思考、調整職業規劃與重復完善知識體系的過程,本文通過介紹我個人的求職過程,向后來者揭示國內互聯網企業對算法&機器學習崗的要求、面試過程、薪資狀況,也分享一些個人在這個過程中積累起來的見聞、經驗。
本文分為三個部分,筆試&面試、經驗心得、題目匯總。筆試&面試部分介紹各個公司的內推時間點、內推形式、我個人的筆試&面試情況,對了,還有不涉及保密協議的一些薪資情況;經驗心得部分簡單介紹簡歷、內推、面試的一些體會,對了,還有一些捷徑;題目匯總部分包括我個人3個月求職過程中遇到的題目,分為筆試題、編程題、機器學習&數據挖掘問題、解決方案類題目。
筆試&面試
美團公司-貓眼電影部門。美團在2015年8月初開始接收內推。貓眼電影今年剛單獨拆分出來,部門內缺少算法工程師負責機器學習類的工作,所以面試不難,你懂模型、能搞業務就沒問題,編程題簡單。薪資為15薪,月薪分為13K、15K、16.5K三檔,后2檔為special offer,16.5檔可以談薪水,沒期權股票,沒北京戶口。
阿里螞蟻金服-安全&服務與數據事業群-數據智能部。阿里集團2014年上市,將包括支付寶在內的金融業務剝離單獨成立為螞蟻金服。數據智能部剛成立,戰略定位頗似螞蟻的數據中樞,用于為各個部門產出數據智能。我因為參加阿里的移動推薦競賽獲得亞軍,有專場面試的機會。在專場面試中表現神勇,連面4面+CTO面+HR總監面,獲得阿里星。阿里的面試等級為B+,A-,A,A+,A+可以被面試官推到CTO處進行交叉面,面過了就是阿里星。今年阿里的薪資分為AB檔,B檔薪資有8K、10K兩檔,A檔我知道的有16K一檔,定級都是P5。阿里星年薪(此處馬賽克)。
京東-數字營銷業務部。京東8月底開始內推。數字營銷業務部2014年成立,一年實現100多億的營收,賺了大錢,公司因此開始重視技術。在NLP Job上看到相關內推,順手發了封郵件,第2周的周一就被安排面試,面完2輪面試官給了special offer面試機會。最終的面試流程是2輪技術面+1輪HR面+1輪交叉面+1輪VP面,按照校招宣講的說法這個是京東Star的流程。京東今年的年薪有19.5W、21.5W、26.5W三檔,26.5W檔的薪資可以談,最高可談到40W左右。數字營銷部門有5個左右的戶口,需要按照簡歷情況、面試反饋排隊。
騰訊-TEG。7月底到阿根廷參加IJCAI會議時,碰到TEG的部門老大,在微信上把簡歷給了他。但部門老大自然不把這種校招內推的事放心上,到了9月初才被安排面試。面了2輪,算法題比較簡單,但要求bug free,其他時間都在聊模型、數據挖掘比賽、實習項目。第二輪面試聊了很久,比較有意思,面試官給我分析了我拿到和可能拿到的offer。騰訊月薪我知道的有13K,15K,18K三檔,18K是騰訊大咖檔。騰訊加班多的部門年終在4個月以上,LOL部門幾十個月年終。北京戶口概率比較大。
今日頭條-推薦組。今日頭條算是一家國內少有的技術驅動的公司,目前是C輪。頭條的筆試出的比較有水平,所以會比較看重筆試。我在面頭條時心態不好,先是拒絕參加筆試,而后以比較高的姿態和HR、面試官溝通。所以頭條的面試在第三輪時就中斷了。頭條面試的編程題不難,但對模型、推薦系統、項目線上經驗等考察得比較深入。了解到的offer是月薪23K,加2000股票,沒有戶口。
Growing IO-機器學習組。Growing IO是原Linked In商務分析部門總監張溪夢先生回國創立以提供數據分析為主,一鍵埋點為技術壁壘的Start up公司,目前仍在天使輪,進去的話工號排在十幾。面了5面,部門leader2面+交叉面1面+co-founder面+CEO面。面試是按照社招的標準走的,leader面對機器學習考察得比較全面、深入,其他面就是聊聊天,畫畫餅。底薪一般,期權較多,無北京戶口。團隊里都是比較資深的工程師,但機器學習業務不多。
微軟-Ads。2015年7月開始在微軟小冰組實習,9月中旬開始轉正面試,轉到Ads部門。微軟的轉正面試是2輪技術面+1輪AA面,2輪技術面1輪positive就可以AA面。如果非實習生則需要2輪技術面都positive。另外,微軟有預科生計劃,轉正只需要presentation,無需面試。轉正面試的編程題相對較難,對模型、項目的考察較為深入。微軟今年大幅擴招,還漲薪。21萬左右Base,10%~20% Bonus,一些股票,28萬左右的Package。MSRA的Base是28萬,40萬左右的Package。
網易游戲、LinkedIn中國。在9月中和10月初參加了這2個公司的筆試,2個公司的筆試都比較切合業務,與SQL語句相關。網易的筆試做了340分,但沒被通知面試LinkedIn中國的筆試接近滿分,但已經10月多,已經開始參加數據挖掘競賽,沒什么面試狀態就沒去面試。LinkedIn中國的Package在30萬+,網易游戲看學校給錢。
經驗心得
國內互聯網公司和國外FLAGS的面試有很大不同,前者重視項目、實習經驗、專業積累,后者看重的是你聰不聰明與編程題刷得多不多。在求職開始的時候心里得有個譜,合理分配時間、精力,并理性看待自己掛了筆試或面試。
簡歷講究簡單粗暴有逼格,簡歷包含聯系方式、教育背景、實習經歷、項目介紹、牛逼的榮譽、崗位相關的技能就好,謂之簡單粗暴,有逼格則指的是實習、項目多用數字量化描述,省去敘事的過程,結果導向。還有一點經驗,可以適當裝逼,但不能裝逼得超過可掌控范圍。
投簡歷的時候,多走內推渠道,省去大部分筆試或者電話面試,不吃力又討好。內推渠道有以下幾種,我按照靠譜程度排個序:1) 總監以下的內部技術員工 2) HR 3)總監以上的高管 4)北郵人論壇 5)Linked In 6)知乎 7)NLP job 8)微信公眾號。1)和2)是比較靠譜的,3)~7)只能作為備胎。還有一個非主流但很有效的捷徑是參加企業舉辦的比賽并取得好名次。
面試時要抓住提問環節問一些實質性的問題,比如具體的技術問題、部門組織架構、部門戰略地位、以后的工作團隊、對個人的定位、KPI怎樣給出等,尤以部門組織架構、戰略地位、團隊這類大又可說的問題最佳。京東面試官給我講了百度架構部門的痛點,在之后的面試中我就經常和面試官聊關于架構部門和業務部門的話題,學到很多,大局觀也慢慢改善。
在精力允許的情況下多面,多拿offer,一方面漲見識、談資,一方面在談理想公司的offer時能爭取到更好的薪資待遇。
題目匯總
筆試題
在互聯網分析中,通常會關注用戶的【第N日激活率】來衡量用戶質量。用戶的第N日激活指的是用戶在注冊的第N天登錄網站或App,即算為該用戶的第N日激活。第N日激活率指的是某日注冊用戶在第N天激活的數量除以該日所有注冊用戶數量
“赤兔”是領英中國針對中國職場人士推出的一款本土化的社交應用。如果你是領英中國的數據分析師,你會從哪些方面和維度來設計各項指標,給產品的設計和運營提供數據上的支持?請給出具體的維度和指標,并說明原因。
網易游戲的一道筆試題是給定一條包含3個join的SQL語句,要求寫代碼模擬實現SQL的功能。
編程題
最少時間復雜度求數組中第k大的數,寫code
去除字符串S1中的字符使得最終的字符串S2不包含’ab’和’c’,寫code
長度為N的序列Sequence=abc….Z,問有多少不同的二叉樹形態中序遍歷是這個,寫遞推公式
給定整數n和m,問能不能找出整數x,使得x以后的所有整數都可以由整數n和m組合而成
中序遍歷二叉樹,利用O(1)空間統計遍歷的每個節點的層次,寫bug free的code
排序二叉樹轉雙向鏈表
一個運算序列只有+、*、數字,計算運算序列的結果
機器學習&數據挖掘問題
L1和L2正則項 》》 它們間的比較
各個模型的Loss function,牛頓學習法、SGD如何訓練
介紹LR、RF、GBDT ,分析它們的優缺點,是否寫過它們的分布式代碼
介紹SVD、SVD++
是否了解線性加權、bagging、boosting、cascade等模型融合方式
推薦系統的冷啟動問題如何解決
是否了解A/B Test以及A/B Test結果的置信度
特征工程經驗
是否了解mutual infomation、chi-square、LR前后向、樹模型等特征選擇方式
解決方案類題目
為今日頭條設計一個熱門評論系統,支持實時更新
給定淘寶上同類目同價格范圍的兩個商品A和B,如何利用淘寶已有的用戶、商品數據、搜索數據、評論數據、用戶行為數據等所有能拿到的數據進行建模,判斷A和B統計平均性價比高低。統計平均性價比的衡量標準是大量曝光,購買者多則高。
有n個elements和1個Compare(A, B)函數,用Compare函數作為排序算法中的比較算子給elements排序。Compare函數有p的可能比較錯。排序完取Top m個元素,本來就在Top m并被正確分在Top m的元素個數是x。問x的數學期望。
讀到最后,希望能對你有所幫助。
-
工程師
+關注
關注
59文章
1571瀏覽量
68595 -
算法
+關注
關注
23文章
4629瀏覽量
93193
發布評論請先 登錄
相關推薦
評論