6月 18日上午,CVPR 2019會(huì)議開幕式暨頒獎(jiǎng)儀式在美國(guó)洛杉磯舉行,經(jīng)過 CVPR 2019 專門的最佳論文獎(jiǎng)評(píng)選委員會(huì)(Best Paper Award Committee)評(píng)審,評(píng)委們從50 篇最佳論文候選名單中評(píng)選出 4 篇獲獎(jiǎng)?wù)撐模謩e是 2 篇最佳論文榮譽(yù)提名、1 篇最佳學(xué)生論文和 1 篇最佳論文。
結(jié)果顯示,華人幾乎包攬了最佳論文、最佳學(xué)生論文和最具影響力論文獎(jiǎng),分別由來自CMU的辛?xí)岬热恕⒓又荽髮W(xué)圣巴巴拉分校的王鑫等人和李飛飛團(tuán)隊(duì)等人摘得!
華人包攬三大獎(jiǎng)項(xiàng)第一作者
此次 CVPR 獲獎(jiǎng)?wù)撐闹杏腥螵?jiǎng)項(xiàng)的第一作者均有華人在列,包括最佳論文、最佳學(xué)生論文和最具影響力論文獎(jiǎng),辛?xí)帷⑼貊巍⒗铒w飛等眾多華人的名字出現(xiàn)在獲獎(jiǎng)?wù)呙麊沃凶屓诵老灿钟∠笊羁獭?/p>
▌最佳論文:非視線內(nèi)的物體形狀重建
題目:A Theory of Fermat Paths for Non-Line-of-Sight Shape Reconstruction
非視線形狀重建的費(fèi)馬路徑理論
作者:辛?xí)? Sotiris Nousias, Kiriakos N. Kutulakos, Aswin C. Sankaranarayanan, Srinivasa G. Narasimhan and Ioannis Gkioulekas
我們?cè)谶@篇論文的第一作者辛?xí)岬膫€(gè)人主頁(yè)上發(fā)現(xiàn),原來這是一位卡內(nèi)基梅隆大學(xué)機(jī)器人研究所的二年級(jí)的博士生,研究興趣主要在于計(jì)算機(jī)視覺和計(jì)算攝影領(lǐng)域,師從 Srinivasa Narasimhan 和 Ioannis Gkioulekas 教授。2016年12月,辛?xí)嵩贑MU獲得電氣和計(jì)算機(jī)工程碩士學(xué)位,在去美國(guó)之前獲得了西安交通大學(xué)電氣工程學(xué)士學(xué)位。
作者機(jī)構(gòu):卡內(nèi)基梅隆大學(xué)、多倫多大學(xué)、倫敦大學(xué)學(xué)院
論文地址:
https://www.ri.cmu.edu/publications/a-theory-of-fermat-paths-for-non-line-of-sight-shape-reconstruction/
摘要:
我們提出了一個(gè)新的理論,即在一個(gè)已知的可見場(chǎng)景和一個(gè)不在瞬態(tài)相機(jī)視線范圍內(nèi)的未知物體之間的費(fèi)馬路徑(fermat path)。這些光路或者遵守鏡面反射,或者被物體的邊界反射,從而編碼隱藏物體的形狀。
(注:費(fèi)馬原理(Fermat's principle)最早由法國(guó)科學(xué)家皮埃爾·德·費(fèi)馬在1662年提出:光傳播的路徑是光程取極值的路徑。這個(gè)極值可能是最大值、最小值,甚至是函數(shù)的拐點(diǎn)。 最初提出時(shí),又名“最短時(shí)間原理”:光線傳播的路徑是需時(shí)最少的路徑。)
我們證明費(fèi)馬路徑對(duì)應(yīng)于瞬態(tài)測(cè)量中的不連續(xù)性。基于此,我們推導(dǎo)出一種新的約束,它將這些不連續(xù)處的路徑長(zhǎng)度的空間導(dǎo)數(shù)與表面法線相關(guān)聯(lián)。
基于這一理論,我們提出了一種名為Fermat Flow的算法來估計(jì)非視距物體的形狀。我們的方法第一次實(shí)現(xiàn)復(fù)雜對(duì)象的精確形狀恢復(fù),范圍從隱藏在拐角處以及隱藏在漫射器后面的漫反射到鏡面反射。
最后,我們的方法與用于瞬態(tài)成像的特定技術(shù)無關(guān)。因此,我們展示了使用SPAD和超快激光從皮秒級(jí)瞬態(tài)恢復(fù)的毫米級(jí)形狀,以及使用干涉測(cè)量法從飛秒級(jí)瞬態(tài)微米級(jí)重建。我們相信,這項(xiàng)工作是非視距成像技術(shù)的重大進(jìn)步。
獲獎(jiǎng)理由:這篇論文作出重大進(jìn)步的問題是非視線內(nèi)的物體形狀重建,換句話說就是能看到墻角后面的東西。這篇論文的理論部分非常優(yōu)美,而且同樣非常給人帶來激勵(lì)。它把計(jì)算機(jī)視覺所能解決的問題的邊界繼續(xù)向前推進(jìn)了一步。
▌最佳學(xué)生論文:有效地提高強(qiáng)化學(xué)習(xí)的表現(xiàn)
這篇論文是 UC Santa Barbara 大學(xué)(加州大學(xué)圣巴巴拉分校)與微軟研究院、Duke 大學(xué)合作完成,第一作者系 UC Santa Barbara 大學(xué)的王鑫。
據(jù) UC Santa Barbara 計(jì)算機(jī)科學(xué)系助理教授王威廉在其個(gè)人微博上發(fā)表的喜訊,這篇論文的一作是其組內(nèi)的成員,獲得了 3 個(gè) Strong Accept,在 5165 篇投稿文章中審稿得分排名第一,并且這篇論文已經(jīng)確定將在 6 月的 CVPR 會(huì)議上進(jìn)行報(bào)告。
這篇論文解決的任務(wù) vision-language navigation(VLN),針對(duì)跨模態(tài)的基標(biāo)對(duì)準(zhǔn)(cross-modal grounding)、不適定反饋(ill-posed feedback)這兩個(gè)難點(diǎn),論文提出了一種全新的強(qiáng)化型跨模態(tài)匹配(RCM)方法,用強(qiáng)化學(xué)習(xí)方法將局部和全局的場(chǎng)景聯(lián)系起來,針對(duì)第三個(gè)難點(diǎn)泛化能力問題提出了一種自監(jiān)督模仿學(xué)習(xí)(Self-supervised Imitation Learning, SIL),其目的是讓智能體能夠自主的探索未知的環(huán)境。
題目:Reinforced Cross-Modal Matching and Self-Supervised Imitation Learning for Vision-Language Navigation
面向語(yǔ)言視覺導(dǎo)航(VLN)的強(qiáng)化交叉模型匹配和半監(jiān)督模仿學(xué)習(xí)
作者:王鑫,Qiuyuan Huang,AsliCelikyilmaz,Jianfeng Gao,Dinghan Shen,Yuan-Fang Wang,王威廉,Lei Zhang
作者機(jī)構(gòu):王鑫,Yuan-FangWang,William Yang Wang 加州大學(xué)圣芭芭拉分校
Qiuyuan Huang,Asli Celikyilmaz,Jianfeng Gao,Lei Zhang 微軟研究院
Dinghan Shen 杜克大學(xué)
摘要:
視覺語(yǔ)言導(dǎo)航(VLN)是對(duì)真實(shí)智能體在真實(shí) 3D 環(huán)境內(nèi)執(zhí)行自然語(yǔ)言指令的任務(wù)。本文研究了如何解決這項(xiàng)任務(wù)的三個(gè)關(guān)鍵挑戰(zhàn):跨模態(tài)基礎(chǔ)、不適定反饋和泛化問題。
首先,我們提出了一種基于強(qiáng)化學(xué)習(xí)的新的強(qiáng)化交叉模型匹配(RCM)方法。我們將匹配的批評(píng)內(nèi)容作為內(nèi)在獎(jiǎng)勵(lì),以促進(jìn)指令和智能體運(yùn)動(dòng)軌跡之間的全局性匹配,并利用推理導(dǎo)航器在本地視覺場(chǎng)景中執(zhí)行跨模態(tài) grounding。對(duì) VLN 基準(zhǔn)數(shù)據(jù)集的評(píng)估表明,我們的 RCM 模型在 SPL 上顯著優(yōu)于以前的方法,性能提升 10%,并達(dá)到了最先進(jìn)的性能。
為了提高學(xué)習(xí)政策的可泛化性,文章進(jìn)一步引入了自我監(jiān)督模仿學(xué)習(xí)(SIL)方法,通過模仿自己過去的高質(zhì)量決策來探索未見過的環(huán)境。結(jié)果表明,SIL 方法可以近似地獲得更好、更有效的策略,極大地降低了已見過和未見過的環(huán)境之間的成功率上的性能差距(由 30.7%降低至 11.7%)。
亮點(diǎn):據(jù)加州大學(xué)圣芭芭拉分校計(jì)算機(jī)科學(xué)系助理教授William Yang Wang在微博的介紹,這篇文章的亮點(diǎn)在于該論文提出的自監(jiān)督獎(jiǎng)勵(lì)函數(shù)很大程度上影響了有效獎(jiǎng)勵(lì)的密度,從而有效地提高了強(qiáng)化學(xué)習(xí)的表現(xiàn)。另外,自監(jiān)督模仿學(xué)習(xí)也能很好地提高視覺語(yǔ)言導(dǎo)航系統(tǒng)的泛化能力。
▌經(jīng)典論文獎(jiǎng):李飛飛團(tuán)隊(duì)計(jì)算機(jī)視覺奠基之作——ImageNet
Longuet-Higgins 獎(jiǎng)是 IEEE 計(jì)算機(jī)協(xié)會(huì)模式分析與機(jī)器智能(PAMI)技術(shù)委員會(huì)在每年的 CVPR 頒發(fā)的 “計(jì)算機(jī)視覺基礎(chǔ)貢獻(xiàn)獎(jiǎng)”,表彰十年前對(duì)計(jì)算機(jī)視覺研究產(chǎn)生了重大影響的 CVPR 論文。該獎(jiǎng)項(xiàng)以理論化學(xué)家和認(rèn)知科學(xué)家 H. Christopher Longuet-Higgins 命名。
今年的 Longuet-Higgins 獎(jiǎng)由 Jia Deng、Wei Dong、Richard Socher、李佳、Kai Li 和李飛飛于 2009 年發(fā)表在 CVPR 大會(huì)的論文《ImageNet: A Large-Scale Hierarchical Image Database》摘得。
ImageNet 在計(jì)算機(jī)視覺領(lǐng)域大名鼎鼎,推動(dòng)了計(jì)算機(jī)視覺領(lǐng)域的賽事 ImageNet 挑戰(zhàn)賽成為領(lǐng)域標(biāo)桿,可謂促進(jìn)了計(jì)算機(jī)視覺領(lǐng)域的突破性進(jìn)展。這篇論文發(fā)表于2009 年 CVPR,目前引用量高達(dá) 11508 次,獲獎(jiǎng)實(shí)至名歸。
▌最佳論文榮譽(yù)提名
此次獲得榮譽(yù)論文提名的有兩篇,分別是:
1. A Style-Based Generator Architecture for Generative Adversarial Networks
作者:Tero Karras、Samuli Laine、Timo Aila,來自英偉達(dá)
論文鏈接:https://arxiv.org/abs/1812.04948
2. Learning the Depths of Moving People by Watching Frozen People
作者:Zhengqi Li、Tali Dekel、Forrester Cole、Richard Tucker、Ce Liu、Bill Freeman、Noah Snavely,來自Google Research
論文鏈接:https://arxiv.org/abs/1904.11111
▌?dòng)?jì)算機(jī)先驅(qū)獎(jiǎng)
最后,大會(huì)還頒發(fā)了計(jì)算機(jī)先驅(qū)獎(jiǎng)(Computer Pioneer Award),獲獎(jiǎng)的是加州大學(xué)伯克利分校電氣工程和計(jì)算機(jī)科學(xué)專業(yè)、生物工程專業(yè)教授 Jitendra Malik。他的主要研究領(lǐng)域是計(jì)算機(jī)視覺,特別是在人類視覺、計(jì)算機(jī)圖形學(xué)和生物圖像分析方面有很多突出成果,一些知名的理論和算法就出自 Malik 教授和他領(lǐng)導(dǎo)團(tuán)隊(duì)的研究,包括各向異性擴(kuò)散(anisotropic diffusion)、歸一化分割(normalzied cut)、高動(dòng)態(tài)范圍成像(high dynamic range imaging)等。
計(jì)算機(jī)先驅(qū)獎(jiǎng)于 1981 年由 IEEE 計(jì)算機(jī)協(xié)會(huì)設(shè)立,用于表彰至少在十五年以前對(duì)計(jì)算機(jī)領(lǐng)域發(fā)展做出突出貢獻(xiàn)的個(gè)人。
▌萬(wàn)人參加,中國(guó)影響力顯露
據(jù)官方統(tǒng)計(jì),注冊(cè)的參會(huì)者數(shù)量也是達(dá)到了空前的 9227 人,來自全球世界各地。其中來自美國(guó)的參會(huì)者仍然最多,達(dá) 4743人,有 1044人來自中國(guó)大陸。
據(jù)程序主席之一的 UIUC教授Derek Hoiem介紹道,CVPR 2019共收到了 5165 篇有效提交論文,比去年 CVPR 2018 增加了 56%,增速提高了 26%。有趣的是,這些提交的論文大多數(shù)來自亞洲,且有39%的論文來自中國(guó)。
據(jù)官網(wǎng)統(tǒng)計(jì),今年CVPR一共收到創(chuàng)紀(jì)錄的5165篇有效投稿,比去年的3309篇多出近2000篇。在 5165 篇投稿中,共有 1294 篇被接收,接收論文數(shù)量也首次超過了一千篇,接收率達(dá)到了接近 25.5%。
值得一提的是,今年的 CVPR 特意設(shè)立了 Ethic Chair倫理主席和監(jiān)察員,旨在維護(hù)并改善會(huì)議期間的氣氛、減少歧視以及其它各種不良行為的發(fā)生。但是由于白宮的政策,許多希望參會(huì)的學(xué)者被拒簽,注冊(cè)申請(qǐng)也未獲通過,CVPR 2019組委會(huì)也為此專門發(fā)送了郵件表明學(xué)術(shù)自由的立場(chǎng),并表示明年將考慮換一家不受影響的供應(yīng)商。
作為計(jì)算機(jī)視覺的頂級(jí)會(huì)議,CVPR 2019 盛況依然,中國(guó)學(xué)者斬獲頗豐也代表了中國(guó)學(xué)術(shù)影響力的不斷提高,計(jì)算機(jī)視覺還是研究的一大熱門領(lǐng)域,但同時(shí)我們也注意到,CVPR 2019 的論文接收率仍比去年的 29% 有所下降,可以看出,近年來人工智能頂級(jí)會(huì)議的錄取困難程度在不斷提升。期待來年中國(guó)學(xué)者在頂級(jí)賽事上繼續(xù)高歌前進(jìn)!
-
計(jì)算機(jī)視覺
+關(guān)注
關(guān)注
8文章
1700瀏覽量
46074 -
論文
+關(guān)注
關(guān)注
1文章
103瀏覽量
14972 -
李飛飛
+關(guān)注
關(guān)注
0文章
20瀏覽量
3643
原文標(biāo)題:西交出身,辛?xí)岖@CVPR 2019最佳論文,李飛飛團(tuán)隊(duì)獲經(jīng)典論文獎(jiǎng)
文章出處:【微信號(hào):rgznai100,微信公眾號(hào):rgznai100】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論