曠視宣布成立上海研究院,由前MSRA資深研究員危夷晨擔(dān)任負(fù)責(zé)人。從西雅圖、南京、成都到如今的上海,曠視人才招攬計劃全面鋪開。是什么吸引危夷晨離開供職12年的微軟?他將如何帶領(lǐng)曠視上海研究院?
今年7月,曠視宣布成立上海研究院,由前微軟亞洲研究院(MSRA)資深研究員危夷晨擔(dān)任負(fù)責(zé)人。
他在MSRA待了12年,也終于加入轟轟烈烈的計算機視覺創(chuàng)業(yè)大軍。
近年來,計算機視覺賽道上的競爭已進入白熱化,獨角獸們的每一個動作都引人注目。去年10月,曠視獲得4.6億美元C輪融資;11月,云從獲得5億人民幣B輪融資;今年4月,商湯獲6億美元C輪融資,5月底,又再獲6.2億美元C+輪融資;6月中旬,依圖完成2億美元C+輪融資,7月再獲得1億美元融資。
隨著融資規(guī)模和公司業(yè)務(wù)的快速進展,這幾家頭部公司的發(fā)展方向也逐漸成型和清晰。過去一提起曠視,往往等同于“刷臉”。然而,近些年曠視的業(yè)務(wù)逐漸多元化,進入安防、智慧城市、新零售等領(lǐng)域,全資收購艾瑞斯機器人進軍倉儲物流,進入手機領(lǐng)域與OPPO、vivo等廠商合作打造智能終端。
曾經(jīng),危夷晨并不認(rèn)為單靠計算機視覺技術(shù)就能在市場存活下來,他認(rèn)為技術(shù)只是起點,從技術(shù)到產(chǎn)品還有漫長的過程,中間任何環(huán)節(jié)的失效都可能導(dǎo)致失敗。做產(chǎn)品難,做能持續(xù)賺錢的產(chǎn)品更難。
然而,人工智能是大勢所趨。面對曠視的邀請,危夷晨選擇相信自己的感覺。他告訴新智元:“這樣一個可能改變職業(yè)生涯和行業(yè)發(fā)展的機會我不能錯過。這次的轉(zhuǎn)變應(yīng)該說是水到渠成吧。”
雖然計算機視覺行業(yè)存在一定的炒作和泡沫,但是真實需求是切實存在的。危夷晨認(rèn)為這是一個前所未有的黃金時代,充滿了不確定性和機會,也將造就一大批成功者。
“未來的技術(shù)人員也許應(yīng)該是算法工程師和研究員的混合體,”危夷晨說,“無論個人還是公司,都應(yīng)該堅持長期投入,樂觀并保持謹(jǐn)慎。”
近日,新智元對危夷晨進行了專訪,揭秘他和曠視上海研究院背后的故事。
危夷晨是計算機視覺領(lǐng)域的資深專家,發(fā)表頂會和期刊論文40余篇。Google scholar論文引用5000余次, h-index 為28。擁有10余項美國專利。科研成果被轉(zhuǎn)化到多個微軟產(chǎn)品,包括Xbox Kinect,Windows Hello,Bing, Office, Hololens,Microsoft Cognitive Service,微軟小冰等。
微軟十二年,科研與產(chǎn)品并重
十二年又稱為“一紀(jì)”或者“一輪”,對于中國人來說似乎蘊含著某種特別的含義。
回到十二年前的2006年,危夷晨在香港科技大學(xué)計算機系讀博士,師從權(quán)龍教授。畢業(yè)后,他加入了如今號稱“中國互聯(lián)網(wǎng)黃埔軍校”的微軟亞洲研究院,一待就是十二年。
研究院寬松的氛圍,豐富的產(chǎn)品應(yīng)用場景給他帶來了全方位的機會:從人臉、手勢、人體、車到萬物;從識別、檢測、跟蹤、屬性到檢索;從圖像、視頻到3D;從寫代碼、寫論文、寫專利、到標(biāo)數(shù)據(jù);從陽春白雪的純科研、高大上的黑科技產(chǎn)品,到跨公司的合作項目;從單打獨斗完成整個項目,到帶領(lǐng)團隊放手培養(yǎng)年輕人。
他說,“我覺得我比大部分科研人員干過的都雜。這有助于全面發(fā)展,挺好的。”新智元記者能感到,他確實樂在其中。
危夷晨十余年的科研工作涉及到多個方向,產(chǎn)生了不少代表性成果,進入到多個微軟產(chǎn)品。博士期間,他基于圖像的三維頭發(fā)建模工作發(fā)表于圖形學(xué)頂會SIGGRAPH。他在人臉識別、檢測和關(guān)鍵點識別方向的一系列工作,是微軟多個人臉應(yīng)用產(chǎn)品的基礎(chǔ),包括Kinect,Windows Hello等。其中,發(fā)表于CVPR 2014的每秒3000幀人臉關(guān)鍵點檢測技術(shù),首次能夠在手機實時運行,大幅提高了性能和精度,在業(yè)界影響巨大。
他在手勢識別和跟蹤方向耕耘數(shù)年,發(fā)表于CVPR 2014的工作是第一個能夠在PC CPU上實時運行的全自由度手勢跟蹤系統(tǒng),啟發(fā)了該領(lǐng)域后續(xù)一系列的工作。
在深度學(xué)習(xí)時代,危夷晨帶領(lǐng)團隊發(fā)表了多篇高質(zhì)量論文,包括可變形卷積網(wǎng)絡(luò),用于物體檢測的關(guān)系網(wǎng)絡(luò),以及高性能的視頻物體檢測等,并在COCO 2016和2017中分別獲得物體分割任務(wù)第一和物體檢測任務(wù)第三的好成績。他最近發(fā)表于ECCV 2018的人體關(guān)鍵點檢測工作在各評測集上均得到最優(yōu)性能,進一步推動了該方向的發(fā)展。
對于技術(shù)轉(zhuǎn)化到產(chǎn)品,危夷晨有著超出大部分科研人員的熱情。那始于2009年的夏天,他回憶道,“當(dāng)時,孫劍(注:曠視首席科學(xué)家,研究院院長)找到我說,‘Kinect要做人的識別,我們上吧’。那時,Kinect還是內(nèi)部的秘密項目,叫‘Project Natal’,人臉識別技術(shù)還很不成熟,我也沒有產(chǎn)品經(jīng)驗。現(xiàn)在想想,可能是無知者無畏吧,我接下了這個前途未卜的任務(wù)。”
“沒有現(xiàn)成的數(shù)據(jù)和經(jīng)驗可參考,我們自己拍數(shù)據(jù),寫算法,每周和西雅圖的產(chǎn)品團隊開會討論,共同開發(fā)。這段經(jīng)歷和之前的科研完全不同,珍貴而又難忘。8個月后,我們的技術(shù)成功進入Xbox,叫做Kinect Identity,傳遞給了千家萬戶。這是當(dāng)年研究院在產(chǎn)品轉(zhuǎn)化上很有影響力的成果,在全院大會上被評為年度最佳項目。讓我尤其自豪的是,其中的核心算法代碼幾乎全是我寫的。那種成就感是無以倫比的。從此我意識到,我喜歡干這個。”
此后,危夷晨參與了很多項目,包括一些核心產(chǎn)品的開發(fā),如早期的HoloLens。然而,不少項目卻以失敗告終。他逐漸意識到,一個好的產(chǎn)品遠不止于技術(shù)本身。技術(shù)只是起點,由此到產(chǎn)品的成功是一條漫漫長路,中間任何環(huán)節(jié)的失效都可能導(dǎo)致失敗。走完這條路要求科研人員拓展自己的思維方式和升級各種技能。在微軟的這些年,他在這條路上一直進行著思考和實踐。
從市值突破8000億美元的微軟,到加入AI獨角獸曠視,接受新的挑戰(zhàn)
2014年起,深度學(xué)習(xí)的大火從學(xué)術(shù)界燒到了工業(yè)界。似乎在一夜之間,計算機視覺的科研人員們變成了香餑餑,在市場上被瘋狂爭搶。同行們頂著光環(huán)紛紛進入新興市場開疆辟地,這讓人無法不動心。
然而,踩過不少坑的危夷晨深知這條道路的艱難和繁榮背后的風(fēng)險。“在很長一段時間內(nèi),我不太相信純粹靠視覺技術(shù)的公司能活下來。做產(chǎn)品難,做能持續(xù)賺錢的產(chǎn)品更難。”他對新智元記者這樣說道。
然而,這是大勢所趨。隨著各行業(yè)的需求被技術(shù)的進步激發(fā),人工智能進入國家戰(zhàn)略,燎原之勢已成。曠視無疑是這波浪潮中的佼佼者。從最初的云服務(wù),到在金融和安防領(lǐng)域站穩(wěn)腳跟,再到如今在手機、物流和零售等領(lǐng)域開拓新天地,如今的曠視已經(jīng)牢牢站在了AI產(chǎn)業(yè)的前沿,不僅在技術(shù)上領(lǐng)先,在商業(yè)模式上也在不斷探索,團隊也從去年的600人增加到如今過千的規(guī)模。
曠視的產(chǎn)品線與商業(yè)模式日益豐富
團隊越來越大,對于技術(shù)和管理人才也是求賢若渴。2018年初,危夷晨接到了曠視科技的邀請,負(fù)責(zé)新成立的上海研究院。相比大公司的按部就班,充滿活力、挑戰(zhàn)和機會的曠視,對已有十余年工作經(jīng)歷,渴望突破的他,充滿了吸引力。
這次,他選擇了相信自己的感覺。
“微軟其實是一個少見的優(yōu)秀公司,最近市值已經(jīng)突破了8000億美元。然而,曠視對于視覺領(lǐng)域從業(yè)者的吸引力也讓人難以抗拒。”危夷晨說:“它有一流的技術(shù),長遠的愿景和一大群優(yōu)秀的人才。這樣一個可能改變職業(yè)生涯和行業(yè)發(fā)展的機會我不能錯過。這次的轉(zhuǎn)變應(yīng)該說是水到渠成吧。”他對新智元記者說。
今年七月,危夷晨正式加入曠視,擔(dān)任曠視上海研究院負(fù)責(zé)人。
“從大公司高級研究員到創(chuàng)業(yè)公司研究院負(fù)責(zé)人,你會有角色轉(zhuǎn)換的不適嗎?”面對新智元的問題,危夷晨回答說,其實這個新角色的不少職能之前在微軟的工作中已有體驗。他和許多產(chǎn)品組有過合作,也帶領(lǐng)團隊做出過高質(zhì)量的科研工作,對于技術(shù)產(chǎn)品轉(zhuǎn)化和團隊管理有一定經(jīng)驗。
然而,和更加象牙塔的大公司相比,創(chuàng)業(yè)公司的研發(fā)團隊要直面產(chǎn)品的壓力,挑戰(zhàn)要大得多。
危夷晨說:“我一直致力于解決實際技術(shù)問題,創(chuàng)造價值。在新的崗位上,招聘人才,幫助年輕人成長,學(xué)習(xí)新的產(chǎn)品和商業(yè)知識,提高團隊溝通和協(xié)作能力。這些既是新的挑戰(zhàn),也是鍛煉和成長。”
“我做好心理準(zhǔn)備了。”
我們處在技術(shù)輪回的頂端,需要樂觀、謹(jǐn)慎和開放
“當(dāng)年做3D問題的時候,真想不到能和如今的AI浪潮產(chǎn)生交集。很是奇妙。”這是危夷晨對曠視的3D人臉技術(shù)實際落地的新聞在朋友圈的評論。
剛開始讀博時,導(dǎo)師告訴他,“計算機視覺就是研究如何從2D到3D”。于是,危夷晨埋頭研究了五年的3D問題。然而,工作后他卻發(fā)現(xiàn),3D技術(shù)的用武之地有限,機器學(xué)習(xí)技術(shù)反而更受青睞。
隨著機器學(xué)習(xí)尤其是深度學(xué)習(xí)近些年來的發(fā)展,現(xiàn)在已經(jīng)少有研究3D方向的年輕學(xué)者了。然而,如今大火的領(lǐng)域,如虛擬/增強現(xiàn)實,無人駕駛,包括最近曠視正在突飛猛進的手機方向,都有對于3D技術(shù)的強烈需求,卻又面臨人才匱乏的窘境。
原來,技術(shù)是有輪回的。
在人工智能的大視角下,又何嘗不是如此?過去的半個多世紀(jì),人工智能的發(fā)展經(jīng)歷了三起兩落。前兩次的過度炒作和泡沫曾將這個行業(yè)打入低谷,而這一次不同以往。對于工業(yè)界的現(xiàn)狀,危夷晨認(rèn)為,“僅僅依靠技術(shù)和人才就能獲得追捧的紅利期早已結(jié)束。大家都意識到,只有堅持打磨產(chǎn)品,深耕行業(yè),重視落地的公司,才能獲得市場的認(rèn)可。
危夷晨說:“雖然這個行業(yè)依然存在著泡沫和炒作,但是大量的需求是真實存在的,技術(shù)、計算力和數(shù)據(jù)這三大核心驅(qū)動力也在持續(xù)進步。這是一個前所未有的黃金時代,充滿了不確定性和機會,也將造就一大批成功者。無論個人還是公司,都應(yīng)該堅持長期投入,樂觀并保持謹(jǐn)慎。”
回到視覺技術(shù)本身,危夷晨認(rèn)為,目前這個領(lǐng)域幾乎所有的問題都已被深度學(xué)習(xí)統(tǒng)治,包括和機器學(xué)習(xí)幾無交集的傳統(tǒng)三維幾何問題,近年來也呈融合之勢。深度學(xué)習(xí)工具越來越好用,效果也往往不錯。這大幅降低了研發(fā)人員進入門檻,促進了工業(yè)界和學(xué)術(shù)界的繁榮,卻也容易造成研發(fā)人員視野的狹隘和能力的局限,尤其容易誤導(dǎo)剛剛進入這個方向的年輕人。
他評論道,“不少同學(xué)能夠熟練的做實驗,卻缺少分析問題的能力,對于視覺的基礎(chǔ)知識如幾何,圖像處理,傳統(tǒng)機器學(xué)習(xí)等都了解不多,基礎(chǔ)不夠扎實。遇到問題就是兩板斧:調(diào)參數(shù)和堆數(shù)據(jù)。這并不利于長期發(fā)展。”
在危夷晨看來,未來的技術(shù)人員也許應(yīng)該是算法工程師和研究員的混合體。算法工程師需要能高效運用現(xiàn)有工具和算法滿足業(yè)務(wù)需求,而研究員需要有扎實的底層知識,開放的思維方式和創(chuàng)造新知識的能力。
“切忌把深度學(xué)習(xí)工具當(dāng)黑盒子使用,而要去探尋問題的本質(zhì)”,這是危夷晨對有志于從事計算機視覺科研的年輕人的建議。
曠視布局上海,招聘人才不設(shè)上限
新智元記者最后的問題聚焦在了曠視上海研究院的定位和人才需求上。
對此,危夷晨介紹,曠視立志做世界一流的人工智能公司,上海研究院的成立是其布局中的重要一環(huán)。上海是全球大都市,具有優(yōu)質(zhì)的教育資源,既是長期的人才基地,也有著豐富的產(chǎn)業(yè)需求。例如,曠視最近的OPPO手機項目就是在上海完成的。“北京的同事來到上海干活,很辛苦。有個基地的話會好很多。”他笑道。
曠視移動端 AI 解決方案
那么,上海研究院和之前成立的西雅圖、南京和成都研究院有何不同呢?“沒有本質(zhì)的不同,”危夷晨說:“它們都出自于招募人才和擴展業(yè)務(wù)的需要,同時重視基礎(chǔ)科研和公司業(yè)務(wù)支持,并互相配合。”
“當(dāng)然,具體做的事情會根據(jù)人員情況和業(yè)務(wù)需求各有側(cè)重,靈活調(diào)整。”危夷晨說:“目前,在產(chǎn)品層面,上海研究院側(cè)重于人臉和物體識別的核心技術(shù)研究和產(chǎn)品支持,并與北京研究院緊密協(xié)作。在科研層面,則沒有什么限制。”
關(guān)于對人才的期望,危夷晨回答:“在這個年代,技術(shù)和產(chǎn)業(yè)需求都在迅速發(fā)展和變化,很多時候沒有經(jīng)驗可循。對于研發(fā)人員,我想最重要的素質(zhì)應(yīng)該是開放的思維方式,強大的自學(xué)能力和追求極致的精神。”
據(jù)介紹,曠視上海研究院位于漕河涇開發(fā)區(qū),剛剛起步就已經(jīng)吸引了來自上海交通大學(xué),復(fù)旦大學(xué)等高校的員工和實習(xí)生近10名。對于未來的招人計劃,危夷晨表示,“對于有志于投身視覺方向的優(yōu)秀人才,我們隨時歡迎。既需要研究員也需要工程師,不設(shè)硬性的門檻。招聘通道長期開放,人數(shù)不設(shè)上限。”
曠視首席科學(xué)家、研究院院長孫劍表示:“目前曠視科技已經(jīng)有很多來自上海或南方的同學(xué)。我們也了解有更多的人才希望在不同風(fēng)格的城市發(fā)展。我們成立上海研究院,希望吸引人才一起來加入人工智能這波技術(shù)革命。上海研究院將會是曠視重要的研發(fā)力量。我們會在基礎(chǔ)科研和產(chǎn)品方面重點和長期的投入。”
-
人臉識別
+關(guān)注
關(guān)注
76文章
4015瀏覽量
82154 -
計算機視覺
+關(guān)注
關(guān)注
8文章
1700瀏覽量
46074
原文標(biāo)題:微軟12年視覺專家危夷晨出山,掛帥曠視上海研究院
文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論