色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

基于統計頻率的 baseline 方法

深度學習自然語言處理 ? 來源:深度學習自然語言處理 ? 2023-05-22 10:35 ? 次閱讀

1引言

場景圖是一種結構表示,它將圖片中的對象表示為節點,并將它們的關系表示為邊。最近,場景圖已成功應用于不同的視覺任務,例如圖像檢索[3]、目標檢測、語義分割、圖像合成[4]和高級視覺-語言任務(如圖像字幕[1]或視覺問答[2]等)。它是一種具有豐富信息量的整體場景理解方法,可以連接視覺和自然語言領域之間巨大差距的橋梁。

雖然從單個圖像生成場景圖(靜態場景圖生成)取得了很大進展,但從視頻生成場景圖(動態場景圖生成)的任務是新的且更具挑戰性。最流行的靜態場景圖生成方法是建立在對象檢測器之上的,然后推斷它們的關系類型以及它們的對象類。然而,物體在視頻序列的每一幀中不一定是一致的,任意兩個物體之間的關系可能會因為它們的運動而變化,具有動態的特點。在這種情況下,時間依賴性發揮了作用,因此,靜態場景圖生成方法不能直接應用于動態場景圖生成,這在[5]中進行了充分討論。

65cbd49c-f7da-11ed-90ce-dac502259ad0.png

圖1. 場景圖分類

2 靜態場景圖

2.1 任務定義

靜態場景圖生成任務(Staticscene graph generation)目標是讓計算機自動生成一種語義化的圖結構(稱為 scenegraph,場景圖),作為圖像的表示。圖像中的目標對應 graph node,目標間的關系對應 graph edge(目標的各種屬性,如顏色,有時會在圖中表示)。 這種結構化表示方法相對于向量表示更加直觀,可以看作是小型知識圖譜,因此可以廣泛應用于知識管理、推理、檢索、推薦等。此外,該表示方法是模態無關的,自然語言、視頻、語音等數據同樣可以表示成類似結構,因此對于融合多模態信息很有潛力。

65ec1644-f7da-11ed-90ce-dac502259ad0.png

圖2.靜態場景圖生成任務圖例

2.2 數據集

Visual Genome(VG)[6]于2016年提出,是這個領域最常用的數據集,包含對超過 10W 張圖片的目標、屬性、關系、自然語言描述、視覺問答等的標注。與此任務相關的數據總結如下:

物體:表示為場景圖中節點,使用bounding box標注物體的坐標信息,包含對應的類別信息。VG包含約17000種目標。

關系:表示為場景圖中邊,包含動作關系,空間關系,從屬關系和動詞等。VG中包含約13000種關系。

屬性:可以是顏色,狀態等。Visual Genome 包含約 155000 種屬性。

2.3 方法分類

方法分類如下:

P(O,B,R | I) = P(O,B | I) * P(R| I,O,B),即先目標檢測,再進行關系預測(有一個專門研究該子任務的領域,稱為研究視覺關系識別,visual relationship detection)。最簡單的方法是下文中基于統計頻率的 baseline 方法,另外做視覺關系檢測任務的大多數工作都可以應用到這里。

P(O,B,R | I) = P(B | I) * P(R,O| I,O,B),即先定位目標,然后將一張圖片中所有的目標和關系看作一個未標記的圖結構,再分別對節點和邊進行類別預測。這種做法考慮到了一張圖片中的各元素互為上下文,為彼此分類提供輔助信息。事實上,自此類方法提出之后[7],才正式有了 scenegraph generation 這個新任務名稱(之前基本都稱為visual relationship detection)。

2.4 評價指標

最常用的評價指標是 recall@topk, 即主謂賓關系三元組 在選取前 k 個最可信預測結果的召回率。三元組的confidence score一般采用 score(subject) * score(object) * score(predicate) 。如果在排序時,一對目標只選取最可信的那組關系來排序,則稱之為 constrained scene graph generation;如果一對目標所有的關系三元組都參與排序,即一組目標可能預測多個關系,則稱之為 unconstrained scene graph generation。這兩種方式分別對應兩種 recall 指標。

3 動態場景圖

3.1 任務定義

動態場景圖與靜態場景圖不同,動態場景圖以視頻作為輸入,輸出分為兩種情況:輸出每一幀對應的場景圖(幀級別場景圖);輸出每一段視頻對應的場景圖(片段級別場景圖)。這種結構化的表示可以表征實體之間隨時間變化的動作及狀態。

663a7640-f7da-11ed-90ce-dac502259ad0.png

圖3.靜態/動態場景圖區別示例

3.2 幀級別

3.2.1數據集

Action Genome該數據集是Visual Genome表示的帶時間版本,然而,Visual Genome的目的是詳盡的捕捉圖中每一個區域的物體和關系,而Action Genome的目標是將動作分解,專注于對那些動作發生的視頻片段進行標注,并且只標注動作涉及的對象。Action Genome基于Charades進行標注,該數據集包含157類別動作,144個是人類-物體活動。在Charades中,有很多動作可以同時發生。共有234253個frame,476229個bounding box,35個對象類別,1715568個關系,25個關系類別。

3.2.2 方法

Spatial-temporalTransformer(STTran)[8]:一種由兩個核心模塊組成的神經網絡:一個空間編碼器,它采用輸入幀來提取空間上下文并推斷幀內的視覺關系,以及一個時間解碼器它將空間編碼器的輸出作為輸入,以捕獲幀之間的時間依賴性并推斷動態關系。此外,STTran 可以靈活地將不同長度的視頻作為輸入而無需剪輯,這對于長視頻尤為重要。

665745d6-f7da-11ed-90ce-dac502259ad0.png

圖4.STTrans模型結構

3.2.3 主實驗結果

668744de-f7da-11ed-90ce-dac502259ad0.png

圖5.STTrans模型實驗結果

3.2.4 樣例測試

66a8af0c-f7da-11ed-90ce-dac502259ad0.png

圖6. 樣例

3.3 片段級別

3.3.1 數據集

VidVRD提出了一個新穎的VidVRD任務,旨在探索視頻中物體之間的各種關系,它提供了一個比ImgVRD更可行的VRD任務,通過目標軌跡建議、關系預測和貪婪關系關聯來檢測視頻中的視覺關系,包含1000個帶有手動標記的視覺關系的視頻,被分解為30幀的片段,其中由15幀重疊,再進行謂詞標記。30類+(人、球、沙發、滑板、飛盤)=35類(獨立,沒有對象之間的包含關系),14個及物動詞、3個比較詞、11個空間謂詞,11個不及物動詞,能夠衍生160類謂詞。

3.3.2 方法

VidSGG提出了一個新的框架,在此框架下,將視頻場景圖重新表述為時間二分圖,其中實體和謂詞是兩類具有時隙的節點,邊表示這些節點之間的不同語義角色。

66c7eaa2-f7da-11ed-90ce-dac502259ad0.png

圖7.VidVRD任務示例

66fdec92-f7da-11ed-90ce-dac502259ad0.png

圖8.BIG-C模型結構

3.3.3 主實驗結果

6716a82c-f7da-11ed-90ce-dac502259ad0.png

圖9.BIG-C模型實驗結果

3.3.4 樣例測試

672a226c-f7da-11ed-90ce-dac502259ad0.png

圖10.對話情緒識別示例

審核編輯:彭靜
聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 檢測器
    +關注

    關注

    1

    文章

    865

    瀏覽量

    47718
  • Baseline
    +關注

    關注

    0

    文章

    3

    瀏覽量

    6853
  • 數據集
    +關注

    關注

    4

    文章

    1208

    瀏覽量

    24727

原文標題:哈工大SCIR | 場景圖生成簡述

文章出處:【微信號:zenRRan,微信公眾號:深度學習自然語言處理】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    看門狗喚醒導致baseline降低的原因?

    如圖所示,休眠前baseline是2716,看門狗喚醒后baseline的值變成了2299,導致信號觸發。請幫忙分析有哪些可能導致baseline降低,謝謝。
    發表于 02-04 06:59

    6678功耗計算工具中baseline功耗問題

    如題,我在評估板相關文檔中看到了一個計算芯片功耗的工具。在使用時發現一個比較令我疑惑的地方:無論如何調整各個部件的參數,最終計算芯片總功耗的時候總會加上一個相對較大的(大約8W)baseline功耗。我想請問,這一部分功耗來自哪里,有沒有可能進行削減?
    發表于 06-21 03:24

    8168編碼的問題,如何編出baseline profile 3.1的H264碼流

    目前對于720p的數據 編譯出來baseline 4.1格式 ?能否編出baseline 3.1格式的720p的H264碼流
    發表于 06-21 04:25

    統計學習方法數據挖掘

    統計學習方法C1概論
    發表于 10-29 09:12

    統計的學習方法

    統計學習方法感知機
    發表于 07-15 10:33

    愛立信話務統計概述

    愛立信話務統計概述:統計的目的和用途 關心的指標 網優需要獲取的統計數據 OBJTYPE 和COUNTER的意義 常用OBJTYPE和COUNTER 數據的獲取方法AT、FILE、OS
    發表于 05-21 22:58 ?26次下載

    頻率測量方法的改進

    頻率測量方法的改進
    發表于 10-14 16:41 ?20次下載
    <b class='flag-5'>頻率</b>測量<b class='flag-5'>方法</b>的改進

    數字頻率表設計方法

    數字頻率表設計方法 設計要求1.設計一個能測量方波信號頻率頻率計,測量結果用十進制數顯示。2.測量的頻率范圍是1
    發表于 04-29 16:15 ?2540次閱讀
    數字<b class='flag-5'>頻率</b>表設計<b class='flag-5'>方法</b>

    支持Baseline和Extended Sequential

    支持Baseline和Extended Sequential的JPEG編碼IP核 CAST公司宣布提供獨有的同時支持Baseline(8位)和Extended Sequential(12位)
    發表于 05-18 09:22 ?743次閱讀

    無線電騷擾的統計測量方法研究

    本內容提供了無線電騷擾的統計測量方法研究,通過實驗數據說明了干擾的統計測量特性與數字通信系統性能之間的關系
    發表于 04-13 17:37 ?68次下載
    無線電騷擾的<b class='flag-5'>統計</b>測量<b class='flag-5'>方法</b>研究

    基于相關度統計的同步擾碼盲識別方法

    基于相關度統計的同步擾碼盲識別方法_呂全通
    發表于 01-07 16:24 ?0次下載

    基于統計和理解的自動摘要方法

    針對微博內容駁雜、信息稀疏的問題,深入研究傳統自動摘要技術,結合微博數據特點,在微博事件提取的基礎上提出一種基于統計和理解的混合摘要方法。首先根據詞頻、句子位置等文本特征得到基于統計的初始摘要;然后
    發表于 11-29 14:51 ?0次下載
    基于<b class='flag-5'>統計</b>和理解的自動摘要<b class='flag-5'>方法</b>

    基于步數步幅統計的測距方法

    結構構建是室內地圖構建的基礎,而室內測距是結構構建中的核心問題。為克服現有測距方法中成本高或精度低的不足,在融合了多種智能手機傳感器數據的基礎上,重新設計了基于步數步幅統計的測距方法。在步數
    發表于 11-30 17:33 ?1次下載
    基于步數步幅<b class='flag-5'>統計</b>的測距<b class='flag-5'>方法</b>

    python統計詞頻的三種方法

    python統計詞頻的三種方法方法
    發表于 05-25 14:33 ?2次下載

    人工智能baseline是什么意思?

    人工智能baseline是什么意思? 人工智能(AI)是當今技術領域中最受關注的領域之一。AI的應用范圍非常廣泛,從自動駕駛汽車到語音識別等方面。對于AI的研究,沒有一個明確的終極目標,而是一步一步
    的頭像 發表于 08-22 15:59 ?4312次閱讀
    主站蜘蛛池模板: 亚洲涩福利高清在线| 欧美另类极品videosbest| 久久噜国产精品拍拍拍拍| 日日射日日操| 把腿张开再深点好爽宝贝动态图| 久久精品亚洲牛牛影视| 亚洲日韩乱码人人爽人人澡人| 国产美女视频一区二区二三区 | brazzers情欲狂欢| 老司机福利在视频在ae8| 伊人久久国产免费观看视频| 久久 这里只精品 免费| 中国xxxxxz| 久久热在线视频精品| 诱人的女邻居9中文观看| 久久精品国产久精国产果冻传媒| 夜色福利院在线观看免费| 精品一品国产午夜福利视频| 伊人久久国产免费观看视频| 久久亚洲AV成人无码国产漫画| 在线亚洲中文字幕36页| 快播电影频道| 99久久麻豆AV色婷婷综合| 女人张开腿让男人添| 成人在线免费观看| 爽爽窝窝午夜精品一区二区| 国产色精品VR一区二区| 杨幂视频在线观看1分30秒| 老师扒开尿口男生摸尿口| 99久久久免费精品免费| 三级黄色片免费观看| 国产综合无码一区二区色蜜蜜| 一区二区视频在线观看高清视频在线| 久久永久影院免费| YELLOW视频直播在线观看| 十八禁啪啦啪漫画| 国精产品999一区二区三区有限| 伊人国产在线播放| 强姧伦久久久久久久久| 国产一级特黄a大片99| 最新毛片网|