9月8日-14日,備受矚目的2018歐洲計(jì)算機(jī)視覺大會(huì)(ECCV 2018)在德國慕尼黑召開, ECCV兩年舉辦一次,與CVPR、ICCV共稱為計(jì)算機(jī)視覺領(lǐng)域三大頂級(jí)學(xué)術(shù)會(huì)議,今年錄用論文700多篇。
商湯科技及聯(lián)合實(shí)驗(yàn)室37篇論文入選ECCV 2018
根據(jù)ECCV 2018宣布的最終結(jié)果,商湯科技及聯(lián)合實(shí)驗(yàn)室共有37篇論文入選,超過微軟、谷歌、Facebook等科技巨頭。
商湯科技ECCV 2018錄取論文在以下領(lǐng)域?qū)崿F(xiàn)突破:大規(guī)模人臉與人體識(shí)別、物體檢測與跟蹤、自動(dòng)駕駛場景理解與分析、視頻分析、3D視覺、底層視覺算法、視覺與自然語言的綜合理解等。這些新穎的計(jì)算機(jī)視覺算法不僅有著豐富的應(yīng)用場景,使得更多的智能視覺算法能應(yīng)用于日常生活之中,還為后續(xù)研究提供了可貴的經(jīng)驗(yàn)和方向。
例如,商湯入選ECCV 2018論文《人臉識(shí)別的瓶頸在于數(shù)據(jù)集噪聲(The Devil of Face Recognition is in the Noise)》中,對于現(xiàn)有人臉數(shù)據(jù)集中的標(biāo)簽噪聲問題進(jìn)行了深入研究,對MegaFace和MS-Celeb-1M數(shù)據(jù)集中的噪聲特性和來源做了全面的分析,發(fā)現(xiàn)干凈子集對于提高人臉識(shí)別精度效果顯著
再如入選論文《量化模仿-訓(xùn)練面向物體檢測的極小CNN模型(Quantization Mimic: Towards Very Tiny CNN for Object Detection)》,本文提出一種簡單而通用的框架—量化模仿,來訓(xùn)練面向物體檢測任務(wù)的極小CNN模型。作者提出聯(lián)合模仿與量化的方法來減小物體檢測CNN模型的參數(shù)量實(shí)現(xiàn)加速。在有限計(jì)算量的限制下,該框架在Pascal VOC和WIDER Face數(shù)據(jù)集的物體檢測性能均超越了當(dāng)前物體檢測的先進(jìn)水平。
而在幾個(gè)月前舉行的CVPR 2018會(huì)議上,商湯科技、香港中文大學(xué)-商湯科技聯(lián)合實(shí)驗(yàn)室以及其他商湯科技聯(lián)合實(shí)驗(yàn)室共有44篇論文中稿,商湯科技今年累計(jì)入選計(jì)算機(jī)視覺頂會(huì)論文數(shù)量達(dá)到81篇!
商湯科技聯(lián)合創(chuàng)始人、商湯研究院院長王曉剛表示:商湯始終堅(jiān)持對原創(chuàng)技術(shù)的極致追求,正是這種精益求精的精神讓商湯在諸多計(jì)算機(jī)視覺前沿技術(shù)領(lǐng)域上不斷取得新突破,也在行業(yè)應(yīng)用方面全面落地。本次會(huì)議,華人入選ECCV 2018 的論文數(shù)量非常搶眼,近年來華人學(xué)者們對原創(chuàng)研究孜孜不倦的堅(jiān)守,鑄就CV技術(shù)領(lǐng)域的一股新力量。
參加COCO 2018和VOT 2018均奪冠
商湯原創(chuàng)技術(shù)的不斷進(jìn)步也在重要的比賽中得到驗(yàn)證。在2018年的COCO比賽中,商湯科技研究員和香港中文大學(xué)-商湯聯(lián)合實(shí)驗(yàn)室同學(xué)組成的團(tuán)隊(duì),在最核心的物體檢測(Detection)項(xiàng)目中奪得冠軍。
香港中文大學(xué)-商湯聯(lián)合實(shí)驗(yàn)室團(tuán)隊(duì)MMDet
在COCO 2018的Detection項(xiàng)目奪冠
在此次競賽中,商湯團(tuán)隊(duì)創(chuàng)造性地開發(fā)了三項(xiàng)全新的技術(shù),獲得了大幅度的性能提升:
(1)新的多任務(wù)混合級(jí)聯(lián)架構(gòu)(hybrid cascade)。通過把不同子任務(wù)進(jìn)行逐級(jí)混合,這種新架構(gòu)有效地改善了整個(gè)檢測過程中的信息流動(dòng)。
(2)通過特征導(dǎo)引產(chǎn)生稀疏錨點(diǎn),而不是使用傳統(tǒng)的規(guī)則分布的密集錨點(diǎn)。這種特征導(dǎo)引的方案使得錨點(diǎn)的投放更為精準(zhǔn),平均召回率提升了超過10個(gè)百分點(diǎn)。
(3)采用一種新型的FishNet網(wǎng)絡(luò)結(jié)構(gòu),它有效地保留和修正多個(gè)尺度的信息,能更有效地用于圖像級(jí),區(qū)域級(jí),以及像素級(jí)預(yù)測任務(wù)。
在test-dev上,商湯團(tuán)隊(duì)對上述框架進(jìn)行了全面測試,其中單模型和多模型(最終提交的結(jié)果來自于五個(gè)模型混合的框架)的mask AP分別達(dá)到了47.4% 和49.0%,比去年冠軍(也是商湯團(tuán)隊(duì)獲得)的結(jié)果,44.0% 和 46.3%,有約3個(gè)百分點(diǎn)的明顯提高。 在傳統(tǒng)的基于檢測框的指標(biāo)bbox AP上,這個(gè)新的框架也分別達(dá)到了單模型54.1%和多模型的56.0%的性能,比去年冠軍的結(jié)果,50.5%和52.6%,也有較大的提升。
值得一提的是,為了推動(dòng)視覺檢測技術(shù)的進(jìn)一步發(fā)展,在ECCV期間,香港中文大學(xué)-商湯聯(lián)合實(shí)驗(yàn)室還開源了檢測庫mm-detection(https://github.com/open-mmlab/mmdetection)。這個(gè)開源庫提供了已公開發(fā)表的多種視覺檢測核心模塊。通過這些模塊的組合,可以迅速搭建出各種著名的檢測框架,比如Faster RCNN,Mask RCNN,和R-FCN等,以及各種新型框架,從而大大加快檢測技術(shù)研究的效率。
此外,商湯科技團(tuán)隊(duì)還參加了視覺目標(biāo)跟蹤大賽VOT Challenge,并在實(shí)時(shí)跟蹤項(xiàng)目獲得第一名,這一成績體現(xiàn)了商湯在視覺目標(biāo)跟蹤技術(shù)的新突破。
VOT Challenge是視覺目標(biāo)跟蹤領(lǐng)域一年一度的國際權(quán)威比賽,其為跟蹤領(lǐng)域提供了精細(xì)的數(shù)據(jù)標(biāo)注和評(píng)測方式,并在2017年引入了實(shí)時(shí)比賽:被評(píng)測算法在跟蹤物體的同時(shí)必須保持至少60fps跟蹤速率,來模擬現(xiàn)實(shí)場景中的跟蹤情況。
今年的VOT 2018在ECCV 2018期間舉辦,共有72只隊(duì)伍參賽,包括微軟亞洲研究院、牛津大學(xué)等知名企業(yè)與高校。商湯科技的參賽算法能夠在60FPS的速率下獲得精確的跟蹤結(jié)果,并且在其他兩項(xiàng)項(xiàng)目(普通跟蹤和長時(shí)跟蹤)也獲得了驕人的成績。
舉辦新型大賽 推動(dòng)人工智能行業(yè)發(fā)展
商湯不止于在頂級(jí)計(jì)算機(jī)視覺大賽上獲得好成績,還致力舉辦行業(yè)大賽,制定行業(yè)標(biāo)準(zhǔn),推動(dòng)人工智能行業(yè)發(fā)展。
今年8月,商湯科技攜手香港中文大學(xué)、亞馬遜、南洋理工大學(xué)、悉尼大學(xué)聯(lián)合舉辦的首屆WIDER Face and Pedestrian Challenge 2018(簡稱:WIDER Challenge)挑戰(zhàn)賽獲得圓滿成功。作為一項(xiàng)全新的全球頂級(jí)計(jì)算機(jī)視覺競賽,共吸引來自世界各國超過400支隊(duì)伍報(bào)名。
商湯作為主辦方制定了全新標(biāo)準(zhǔn)數(shù)據(jù)集——WIDER Face人臉檢測數(shù)據(jù)集、WIDER Pedestrian專門用于行人檢測的大規(guī)模數(shù)據(jù)集和WIDER Person Search人物檢索數(shù)據(jù)集,促進(jìn)高性能算法涌現(xiàn)。
WIDER Workshop現(xiàn)場
參賽隊(duì)伍既有中科院計(jì)算所、微軟亞洲研究院、北京大學(xué)、上海交通大學(xué)、中國科學(xué)院大學(xué)、中國科學(xué)技術(shù)大學(xué)、NtechLab、卡耐基梅隆大學(xué)、香港大學(xué)、香港理工大學(xué)全球頂尖學(xué)府和研究機(jī)構(gòu),也有雅虎、京東、曠視、科大訊飛、滴滴等科技公司。
未來,商湯將繼續(xù)賦能AI創(chuàng)新大賽,加速推進(jìn)以人工智能為核心的創(chuàng)新技術(shù),帶動(dòng)行業(yè)應(yīng)用和產(chǎn)業(yè)融合的持續(xù)深入。
-
數(shù)據(jù)集
+關(guān)注
關(guān)注
4文章
1208瀏覽量
24743 -
3D視覺
+關(guān)注
關(guān)注
4文章
434瀏覽量
27557 -
商湯科技
+關(guān)注
關(guān)注
8文章
514瀏覽量
36111
原文標(biāo)題:商湯及聯(lián)合實(shí)驗(yàn)室37篇論文入選ECCV 2018,識(shí)別、檢測與場景分析等技術(shù)獲關(guān)鍵突破
文章出處:【微信號(hào):SenseTime2017,微信公眾號(hào):商湯科技SenseTime】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評(píng)論請先 登錄
相關(guān)推薦
評(píng)論