“微軟亞洲研究院創研論壇——CVPR 2018中國論文分享會”在微軟大廈成功舉行。來自國內外計算機視覺領域學術界、工業界的杰出代表們攜各自在CVPR 2018上發表的最新文章出席,與現場觀眾進行了深入的分享與交流。
在此次分享活動上由劉偲(中國科學院信息工程研究所副研究員)主持的圓桌討論環節中,陳光(北京郵電大學模式識別實驗室副教授)、何旭明(上海科技大學信息科學與技術學院副教授)、凌海濱(美國天普大學Temple University計算機系副教授)、童欣(微軟亞洲研究院首席研究員)、王井東(微軟亞洲研究院資深研究員)、王曉剛(商湯科技聯合創始人、研究院院長)等六位計算機視覺領域的資深專家就當前計算機視覺領域中的熱門問題做出了精彩解答。
下面我們就和大家分享一下本次精彩的會談內容!
從左至右:童欣、陳光、何旭明、王曉剛、王井東
▌問題一:很多學生都對計算機視覺領域特別感興趣,各位老師平時比較看重學生哪方面的能力?又是以什么目標來培養人才的?
王曉剛:我認為學習計算機視覺的學生,發展還是可以比較多元化的。以前的學生大部分走學術路線,但是現在隨著工業應用的發展,計算機視覺有了很大的應用前景,學生可以走的路非常多,對學生的要求也不一樣。有的人可以走理論、創新性的道路,有一些學生是更適合解決實際問題。這部分學生,在以前走學術路線可能會困難一些,但現在隨著工業界應用的發展,他們也有很好的前途,我覺得更要因材施教。最重要的是學生能夠經過訓練擁有一個良好的思維能力,將來能獨立地解決問題,并且對整個視覺領域具備良好的知識體系,打下一個堅實的基礎。
陳光:從學生培養的角度來講,同學最重要的是要聽話,尤其是零基礎、冷啟動的同學,如果他一開始不聽話,會走很多的彎路。另外還有兩點,一個是要有悟性,當然這個是可遇不可求的,還有一個是能堅持。我們經常對同學說的一點是,只要你堅持做,再小的一個東西你也能做得很有成果、很有心得,將來不管是工作還是研究,都能有很好的前途。
還有一點就更可遇不可求了,是要在后續的培養里才能看得出來的,就是他能不能從問題里“跳出來”,這一點特別關鍵。有些同學善于鉆研,但是可能鉆進去就出不來了,這部分同學看技術就是技術,但是他“出不來”。“出不來”的問題在哪?他們可能看不到大的方向、大的趨勢或者大的前景,這個時候研究就可能越做越窄,而且也很難找到對于長期發展很有價值的一些點。
▌問題二:現在隨著深度學習的火爆,有很多非視覺領域的人才進入到了視覺領域,各位老師對這個現象怎么看?
何旭明:視覺本來就是個多學科的領域,不同領域同學的進入對這個領域的發展有非常正面的促進作用。如果你有不同的背景,希望你能夠發揮你的長處,從不同的角度對計算機視覺進行有自己特色的研究,我覺得這是非常獨特一個視角。
陳光:對于從其它領域轉專業到視覺領域的同學來說,最重要的一點是你要有好奇心。這個好奇心不是說你對這個圖像技術好不好奇,而是建立在你有一定了解的基礎上,是不是對它的前景和技術有足夠的熱愛、足夠的好奇。我覺得這一點是你是否要跨入圖像領域一個非常重要的點。我本身主要是搞文本的,我見證了很多同學從文本跨越到圖像,我覺得只要想清楚了,只要是學術研究,只要是有前途的方向,都是可以的。
▌問題三:各位老師怎么看待很多高校的學術大牛進入到了工業界?
童欣:這個我覺得是件好事,這說明大家學術做得成功,在工業界能有應用,多好的一件事。越來越多的學術界的人進入到工業界,說明這個領域有了應用。反過來講,工業界也可以給學術界提供很多反饋,提出很多實際的問題,我覺得這是一種很好的、很正向的交流,長期來看一定會帶來兩邊的繁榮和發展。
王曉剛:以前我的學生畢業后都去做投行了,現在他們可以在工業界繼續做研究,并且讓技術落地,這其實是非常好的事情,而且很重要的事情,很多好的問題,實際上是從工業界里發現的,以前我們研究的很多學術問題都是學者拍腦袋想出來的,現在我們希望能夠從工業界得到更多的反饋。
但是從另一方面來說,工業界把很多學者招過來的時候,不一定能夠想得很清楚——怎么能夠用好他們,他們的價值在什么地方?不是所有的學者到了工業界以后就能夠發揮他的作用,每個人還是不太一樣的。
同時,還有一個很重要的問題。這些教授、老師離開了學校,后面的人才誰來培養?整個工業界對視覺和機器學習的人才需求量是非常大的,需要思考怎么樣解決“造血”的問題。
陳光:其實我覺得這個問題要兩邊看,有積極的因素,也有消極的因素。短期來看是消極的,學校肯定是損失了很多培養人才的人才。但是長期來講,將來這些人有可能還會回到學校,回來的時候,他會帶著實踐的經驗和實際的問題,那時候他一定比現在更有價值。而且現在很多學校都在建立人工智能研究院,將來一定能和企業不斷地有更緊密的結合,不管是以人才回流的方式,還是以問題和數據合作的方式,我覺得長期來看還是一件好事。
▌問題四:網上說高二的學生就可以用深度學習去開發人臉識別的系統,請問在座各位專家,你們覺得深度學習讓計算機視覺的門檻變低了嗎?
王井東:我覺得這是個好事情,說明我們很多學生通過網上的資源可以很容易獲取最先進的深度學習技術,看上去是門檻降低了,但這句話的角度是站在一個本來不是做計算機視覺、或者不是做深度學習、或者做這方面時間不是很長的人那里,門檻的確是降低了。但是我們換個角度想一想,對長期在這個領域工作的人來說,不見得是門檻降低了。為什么這樣講?大家都知道,2012年以來深度學習非常火爆,取得了很大的成功,以至于幾乎所有計算機視覺都集中在深度學習的方向,但是,大家還是覺得深度學習還沒有被真正理解透,無法從理論的角度去解釋。從這個角度來講,門檻其實并沒有降低。門檻高和低,實際上是站在不同的位置上講的。
何旭明:因為深度學習對數據的要求很高,某種程度上實際上是把門檻抬高了,尤其是對于一些特殊領域,例如醫療。
▌問題五:每年都有很多CVPR的論文發表,各位老師覺得有多少論文可以解決應用當中的痛點問題?
王曉剛:其中一部分論文對應用是有推動作用的,我們在工業界感覺到,如果有一年時間你不了解這些最新論文就會落后。從另外的角度來說,把論文上面的一些方法拿過來用到實際當中是不是就能解決問題?其實還不是這樣的。現在應用發展得非常快,但是在學術領域,對問題的探索很多時候并沒有跟上應用的發展。而且,學術論文追求的目標和實際應用的導向還是有差別的。但是,大家通過發表論文、寫論文,對整個領域有了全面的理解,等再進入到工業當中,處理各種問題就會游刃有余。
何旭明:CVPR我覺得更多的是培養學生如何去做研究,如何去探索一個新的問題,更多的是為研究生或者博士生創造一個環境,大家可以相互交流,嘗試各種不同的想法,這是一個培養人才的途徑。
陳光:其實我們希望培養出的人才具有兩種特性,我們希望搞工程、搞應用的人具有學術思維和學術視野,他知道算法能實現什么、不能實現什么,這個時候他根據自己所擅長的專業領域拿著問題去找技術,這樣有助于技術可以快速落地。另外我們希望搞研究的人有應用思維,他需要以合理的、正確的方式看待他所掌握的技術和方法,而不是像咱們經常說的拿著錘子找釘子,要從一個需求和應用的視野去看待這些技術和方法。
▌問題六:計算機視覺領域通常會在一個benchmark上刷榜。比如最開始的VOC到ImageNet、COCO或者今年Google Open Images,想請問一下各位老師怎樣看待競賽對學術研究的推動作用?
陳光:我覺得從兩個方面來看,一個是積極的角度,一個消極的角度。積極的方面是顯而易見的,它提供了一個統一的任務,一個大批量的數據,這在以前看是不可想象的,在別的地方可能根本獲取不了這么多數據。這個時候,所有的科研單位和所有做研究的人可以站在同一個起跑線上,用同一個任務去PK,這是一件好事。但是反過來看,它也帶來了一些消極的因素,這些任務有時候定義得過于狹窄。當任務和評價已經確定的情況下,大家的想象力就會受到限制。現在這種評測大家在刷榜的時候可能更多的是做工程性的優化。當大家在用更多工程上的工作去擬合這樣一些確定任務的時候,其實已經限制了我們在更廣泛的、更大的領域里面做更有通用性的工作的想象力。所以我在這里呼吁,設計這些任務和題目的人能夠更多地去考慮模型可解釋性等、效率、實用和通用泛化等問題。
王曉剛:我補充一點對于審論文的影響。有benchmark和datasets可能讓評審工作變得比較容易。對于一些好的、有創新性的想法,或者是一些新的問題,如果沒有benchmark可以衡量,這些論文不容易被注意到。有了benchmark,這個領域會迅速產生大量的論文。并不是說這個領域的問題一定很重要,或者這個領域已經取得了很大進展,是因為有了benchmark,大家比較容易發論文,比較容易做評審。當然,這也是后面需要去糾正的一個問題。
王井東:Benchmark對計算機視覺近幾年的發展起了很大的作用。為什么深度學習今天有這么多人關注?很大程度上是由于當年的ImageNet數據集以及深度學習和GPU的發展,促進了這個領域的發展,帶動了很多計算機視覺初創公司的發展。從這個意義上來講,benchmark對計算機視覺的積極意義是非常大的。但是從另外一個角度來講,你必須要在benchmark,例如ImageNet等數據集上做出一些結果出來,你的研究才有可能會被認可。從這種意義上來說對計算機視覺還是有一點負作用,這個其實可能影響了整個領域的大的發展,埋沒了一些好的東西。因此,不能完全依靠benchmark來評價一個方法或者算法的好壞。
▌問題七:很多高校的計算能力可能無法跟大公司相比,很難在ImageNet或者是其它數據集上做出一個好的結果。面對相對有限的計算能力,高校應該怎么辦?
王曉剛:現在有一種趨勢,學校和工業界的結合越來越緊密,企業會開放更多的資源給到老師們。
另外,學校不應該單純地以拼計算資源來取勝,或者說整個社區不應該以計算資源為導向。如果只是關注在benchmark上的排名,我們還需不需要reviewer了?將來是不是機器來評判就可以了呢?
陳光:我覺得這個問題是一個挺有意義的問題,關系到我們怎么思考未來技術的發展的。從算力的角度來說,學校肯定是拼不過公司的。那怎么樣做突破呢?其實在遷移學習,包括強化學習的方向,學校是可以做更多思考的。我想將來一定會有一些相對通用的模型或者泛化能力比較好的模型能夠通過遷移解決一個跨領域的問題,通過遷移學習會減少很多算力和成本的消耗,所以我期待在高校里面能夠把遷移學習發揚光大。
童欣:我覺得做研究其實解決的是兩個問題:第一個問題是how,就是到底怎么解決這個問題?另一個問題是why,我覺得這是最根本的問題。很多時候學生會跟我說,“老師,我們的模型又提高了2個點,咱們快點寫文章吧。”不是說提高了2個點就要寫文章,我們要解決的是why——這個模型為什么提高了2個點?我用別的方法行不行?短期內大家還在關注how,能夠靠算力提高了2點,大家就會覺得很了不起。但是我覺得很快大家就會到飽和的程度,最后大家做研究還是要回到why的問題,這個東西不僅僅是靠大量的算力能解決的問題,還得靠智力。我覺得這個可能是學校可以更多地發力和好好研究的地方。
▌問題八:下一個階段計算機視覺的研究熱點是什么?
凌海濱:從特定角度來講,計算機視覺現在就是兩個方向——深度學習和非深度學習。深度學習方向我有一點擔心,我的擔心倒不是這個方向做不好,而是如果這個方向繼續走下去,到底計算機視覺這個領域是深度學習的一個應用,還是一個單獨的領域?當然這個并不一定是壞事。
目前我感覺深度學習在計算機視覺這邊發力還不太夠的地方就是偏幾何理解的這分,比如說三維重建這方面,好像目前并沒有產生特別好的結果。純計算機視覺的研究熱點,我覺得還是在幾何這方面的研究。大的算法框架最近幾年沒有看到很大的進展。我覺得這個是視覺比較基礎的問題,是比較值得研究的。
跟深度學習有關的研究,我個人比較關心的一個問題是時序上的建模。大家可以看到現在深度學習在視頻上做得還沒有那么強。目前我沒有看到類似于RNN網絡的架構來很好地對視頻自然地end-to-end建模的,網絡模型更多的是對中間的特征進行一些建模(即特征提取)。
另外一個我關心的是多模態融合的問題。因為隨著計算機視覺越來越成熟之后,有一些計算機視覺解決不了的問題慢慢就會更多地依賴于多個傳感器之間的相互保護和融合,比如說拿手機做三維重建,以前視覺做視覺的,IMU的做IMU的,但是現在大家說這兩個各有優缺點,怎么樣把它們深度的融合起來會比較好。這方面已經有不少很好的工作。我覺得這個可能也是計算機視覺后面需要更多研究的方向。
-
計算機視覺
+關注
關注
8文章
1700瀏覽量
46085 -
深度學習
+關注
關注
73文章
5512瀏覽量
121431
原文標題:CVPR 2018中國論文分享會 | 計算機視覺產業界和學術界的對話
文章出處:【微信號:AI_Thinker,微信公眾號:人工智能頭條】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論