色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

一種新型分割圖像中人物的方法,基于人物動作辨認

zhKF_jqr_AI ? 來源:未知 ? 作者:李倩 ? 2018-04-10 15:02 ? 次閱讀

想要進行圖像分割,傳統(tǒng)方法是先檢測圖中物體,在進行分離。在本文中,來自清華大學、騰訊AI研究室和英國卡迪夫大學的研究者們提出了一種新型分割圖像中人物的方法,基于人物動作辨認。以下是論智對原文的編譯。

圖像分割的一般方法是先對物體進行檢測,然后用邊界框?qū)Ξ嬛形矬w進行分割。最近,例如Mask R-CNN的深度學習方法也被用于圖像分割任務,但是大多數(shù)研究都沒有注意到人類的特殊性:可以通過身體姿勢進行辨認。在這篇論文中,我們提出了一種新方法,可以通過人作出的不同動作進行圖像分割。

多人姿態(tài)辨認的目的是分辨圖像中每個人物的動作,這些需要通過身體部位判斷,比如頭部、肩膀、手部、腳等等。而一般的對象分割實例旨在預測圖像中每個對象的像素級標簽。要想解決這兩個問題,都需要檢測目標物體并將它們分離,這一過程通常被稱為目標檢測。但是由于二維圖像所含信息較少,導致想分離兩個重疊的同類圖像非常困難。對于目標檢測,有許多強有力的基準系統(tǒng),例如Fast/Faster R-CNN、YOLO,它們都遵循著一個基本規(guī)則:先生成大量proposal regions,然后用非極大抑制刪除重復區(qū)域。但是,當兩個相同類別的物體重疊時,NMS總是將其中一個視為重復的proposal region,然后刪除它。這表明幾乎所有的目標檢測都不能處理大面積重合的問題。

盡管在許多多人姿態(tài)識別任務中都選用了這種框架,一些不依賴于目標檢測的bottom-up方法也取得了良好性能。Bottom-up方法的主要思想是首先在所有人身體上找?guī)讉€關鍵點。如圖1所示:

圖1

這種方法有幾個優(yōu)點,首先,運行成本不會隨著圖像中人數(shù)的增加而增加;其次,兩個重疊在一起的人物可以在連接身體部位時分開,如圖2所示,使用人體姿勢可以改善目標檢測中物體重疊的問題。

圖2

新方法Pose2Seg

基于人體姿勢識別,我們提出了一種端到端的物體分割框架,整體框架如圖3所示,它將圖片和姿勢識別結果一同作為輸入:

圖3

然后我們使用一個對準模塊,基于人體姿勢檢測結果(稱為Affine Align),將感興趣區(qū)域(ROI)對齊為統(tǒng)一大小(64×64)。同時,我們?yōu)閳D中的每個人物生成骨架特征,并將它們連接到ROI。最終實驗表明,將骨骼信息明確地添加到網(wǎng)絡中可以在圖像分割中提供更好的信息。

AffineAlign

人類的動作種類多且復雜,想要進行圖像分割是很困難的。基于Faster R-CNN和Mask R-CNN中的ROIAlign,我們提出了AffineAlign操作。但是與它們不同的是,我們是基于人物的動作對齊,而不是邊界框。通過人類動作蘊涵的信息,AffineAlign操作可以把奇怪的人類動作拉直,然后將重疊的人分開,具體過程可看圖4:

圖4

同時,我們還研究了人類骨骼的特征,我們用部分親和字段(PAF)重現(xiàn)某個動作的骨骼結構,PAF是一個有兩通道的向量字段映射,如果COCO數(shù)據(jù)集中有11個骨骼標記,PAF就是一個有22個通道的特征映射。

實驗過程

我們選用了COCO數(shù)據(jù)集,它是人類圖像數(shù)量最多的公開數(shù)據(jù)及,其中我們將其分成了COCOHUMAN和COCOHUMAN-OC兩個數(shù)據(jù)集,前者是有中等和大型目標物體的人類數(shù)據(jù)集,并對其中的動作進行了標注;后者是有較多重疊對象的圖像,共有44張圖。COCOHUMAN-OC中的一些樣例如圖所示:

首先是在COCOHUMAN上,本文提出的方法與Mask R-CNN進行對比:

其他AffineAlign操作,a代表輸入的圖像,b代表在原圖上鎖定目標,c代表AffineAlign操作的結果,d代表分割結果

然后是在COCOHUMAN-OC上的實驗對比:

我們的方法與Mask R-CNN在處理重疊圖像上的表現(xiàn)。我們方法中的邊界框使用預測掩碼生成的,能更好地進行可視化和對比

上表顯示,我們提出的基于動作姿勢的框架比基于圖像檢測的框架表現(xiàn)得好。由于非極大抑制,一些基于檢測的框架,如Mask R-CNN無法處理大面積重疊的現(xiàn)象。即使目標物體能被分離,仍然有一部分無法算入其中。但是在這種新框架下,我們做到了讓整個身體都被分離的結果。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 圖像分割
    +關注

    關注

    4

    文章

    182

    瀏覽量

    18019
  • 深度學習
    +關注

    關注

    73

    文章

    5507

    瀏覽量

    121272

原文標題:清華大學與騰訊AI合作推出Pose2Seg:無需目標檢測即對人像進行分割

文章出處:【微信號:jqr_AI,微信公眾號:論智】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    一種新的粘連字符圖像分割方法

    一種新的粘連字符圖像分割方法針對監(jiān)控畫面采樣圖像中數(shù)字的自動識別問題,提出一種新的粘連字符
    發(fā)表于 09-19 09:19

    基于改進遺傳算法的圖像分割方法

    基于改進遺傳算法的圖像分割方法提出一種應用于圖像分割的改進遺傳算法,算法中引入了優(yōu)生算子、改進的
    發(fā)表于 09-19 09:36

    人物

    人物看似大人物的心,卻走不出小人物的路。
    發(fā)表于 05-28 15:07

    Unity 3D和Vuforia制作AR人物互動

    還沒開始談的時候就已經(jīng)通過某種渠道獲得了人物模型和動畫,花了差不多4天時間從零開始完成了AR識別到人物展示以及人物動作這幾個過程,而經(jīng)過
    發(fā)表于 09-21 10:30

    分享一種CameraCube新型圖像傳感技術

    分享一種CameraCube新型圖像傳感技術
    發(fā)表于 06-08 09:29

    一種名片圖像的文字區(qū)塊分割方法

    針對以手機攝像頭作為圖像采集器獲得的名片圖像,該文介紹一種文字區(qū)塊的分割方法。對用手機攝像頭獲取的彩色名片
    發(fā)表于 04-15 09:00 ?24次下載

    一種改進的圖像分割算法分析

    針對傳統(tǒng)閾值分割算法的些缺點,通過將數(shù)字形態(tài)學與閾值分割算法相互結合提出了一種改進的閾值分割算法來進行脊椎
    發(fā)表于 11-03 09:47 ?3次下載
    <b class='flag-5'>一種</b>改進的<b class='flag-5'>圖像</b><b class='flag-5'>分割</b>算法分析

    一種新的彩色圖像分割算法

    本文提出一種新的結合分水嶺與種子區(qū)域生成、區(qū)域合并的彩色圖像分割算法。首先將RGB顏色空間轉換成HSI間,應用分水嶺算法對圖像進行初始化分割
    發(fā)表于 12-14 14:41 ?1次下載
    <b class='flag-5'>一種</b>新的彩色<b class='flag-5'>圖像</b><b class='flag-5'>分割</b>算法

    圖像分割的基本方法解析

    本文詳細介紹了圖像分割的基本方法有:基于邊緣的圖像分割方法、閾值
    發(fā)表于 12-20 11:06 ?10.9w次閱讀
    <b class='flag-5'>圖像</b><b class='flag-5'>分割</b>的基本<b class='flag-5'>方法</b>解析

    基于內(nèi)容的圖像分割方法綜述

    方法、基于像素聚類的方法和語義分割方法這3類型并分別加以介紹對每類方法所包含的典型算法,尤其
    發(fā)表于 01-02 16:52 ?2次下載
    基于內(nèi)容的<b class='flag-5'>圖像</b><b class='flag-5'>分割</b><b class='flag-5'>方法</b>綜述

    一種視頻流特定人物檢測方法

    為實現(xiàn)視頻流特定人物檢測,提出了一種兩階段檢測方法,即基于穩(wěn)健哈希簽名的流級檢測和基于子圖局部特征的文件級檢測。第階段利用簽名快速發(fā)現(xiàn)與查詢圖像
    發(fā)表于 03-05 16:38 ?1次下載

    基于視頻深度學習的時空雙流人物動作識別模型

    深度學習被運用于圖片分類、人物臉部識別和人物位置預測等識別領域。視頻人物動作識別可看作隨時間變化圖片的分類問題,所以圖片識別的深度學習方法
    發(fā)表于 04-17 10:46 ?0次下載
    基于視頻深度學習的時空雙流<b class='flag-5'>人物</b><b class='flag-5'>動作</b>識別模型

    一種開源的機器學習模型,可在瀏覽器中使用TensorFlow.js對人物及身體部位進行分割

    人物分割有何用途?這項技術可廣泛應用于多個多領域,包括增強現(xiàn)實、攝影編輯以及圖像或視頻的藝術效果等。具體應用由您決定!去年,當我們推出 PoseNet(首個能夠在瀏覽器中使用簡易網(wǎng)絡攝像頭估測身體
    的頭像 發(fā)表于 02-26 16:33 ?5849次閱讀

    基于TensorFlow的開源JS庫的網(wǎng)頁前端人物動作捕捉的實現(xiàn)

    。開發(fā)者可以根據(jù)項目需求,對獲得到的人體各keypoint數(shù)據(jù)進行分析處理,實現(xiàn)程序功能。*在基本的原理中并不是必須的組成部分,但在下文中會簡單介紹一種通過的圖像繪制功能,提升人物捕捉精度的
    的頭像 發(fā)表于 08-13 20:07 ?1463次閱讀
    基于TensorFlow的開源JS庫的網(wǎng)頁前端<b class='flag-5'>人物</b><b class='flag-5'>動作</b>捕捉的實現(xiàn)

    一種可用于生成動漫人物頭像的改進模型

    針對已有的動漫人物頭像生成方法中生成結果的多樣性較差,且難以準確地按照用戶想法按類生成或按局部細節(jié)生成的問題,基于含輔助分類器的對抗生成網(wǎng)絡( ACGAN),結合互信息理論、多尺度判別等提出了一種
    發(fā)表于 04-20 11:19 ?3次下載
    <b class='flag-5'>一種</b>可用于生成動漫<b class='flag-5'>人物</b>頭像的改進模型
    主站蜘蛛池模板: 99精品国产福利在线观看| 清冷受被CAO的合不拢| 真人女人无遮挡内谢免费视频%| 蜜桃臀无码内射一区二区三区| 国产成人精品男人的天堂网站 | 草莓视频在线播放视频| 又亲又揉摸下面视频免费看| 色戒西瓜视频| 女bbbbxxx孕妇| 精品蜜臀AV在线天堂| 国产高清超清在线播放| adc免费观看| 最新国产亚洲亚洲精品视频| 亚洲精品一二三| 天天操狠狠操夜夜操| 欧美动物交ideos| 辣文肉高h粗暴| 黑丝袜论坛| 国产精品自产拍在线观看网站| J午夜精品久久久久久毛片| 影音先锋av电影| 亚洲国产精品久久精品成人网站| 色多多涩涩屋下载软件| 漂亮的保姆3中文版完整版| 美女大本营| 久久永久影院免费| 精品亚洲欧美中文字幕在线看| 国产啪视频在线播放观看| 俄罗斯美女破处| 白洁在线观看| xxxxhd17欧美老师| jj插入bb| www.欧美与曽交性video| AV午夜午夜快憣免费观看| 嘴巴舔着她的私处插| 亚洲高清免费在线观看| 亚洲阿v天堂在线2017| 鸭子玩富婆流白浆视频| 午夜亚洲精品不卡在线| 忘忧草在线| 亚洲AV无码专区国产乱码网站 |