午夜久久久久久网站,亚洲国产视频网,亚洲色图 p

ST-GCN: Spatial Temporal Graph Convolutional Networks時空圖卷積網絡，這個網絡結構來源于2018年發表的一篇文章《Spatial Temporal Graph Convolutional Networks for Skeleton-Based Action Recognition》，也就是基于時空圖卷積網絡來做人體動作識別。今天，我們就來了解下，如何基于ST-GCN來實現人體動作的識別與生成。

Why：為什么要使用ST-GCN？

ST-GCN網絡訓練好之后要達到的效果就是：用戶提供一段視頻，網絡會輸出視頻中人的動作分類。

類似于上圖中的視頻，如何來識別視頻中的人在做什么動作呢? 視頻其實就是一幀一幀的圖片拼接而成的，而傳統處理圖像識別的網絡最常用的就是CNN（卷積神經網絡），那ST-GCN是否跟CNN有關系呢？為什么要使用這個網絡呢？

可以從以下三點來理解：

(1) 輸入數據有量級的差別。舉個例子，數據為一段10秒左右的視頻，大概300幀，像素1920*1080，分別輸入兩個網絡中。傳統CNN是將所有視頻拆分為一幀一幀的圖片輸入網絡，而ST-GCN則直接輸入人體的骨架關節數據，CNN的輸入數據量約為ST-GCN的83000倍。

(2) 輸入數據純凈度高，噪聲少。CNN是將視頻數據直接輸入網絡，包括了視頻的背景以及圖片中的各種噪音，而ST-GCN是僅僅將人體骨架關節點的信息輸入網絡，只保留了主要的有效信息，噪聲低。

(3) 考慮了空間和時間上的相鄰關節，效果更好。ST-GCN不僅考慮了空間上的相鄰節點，也考慮了時間上的相鄰節點，將鄰域的概念擴展到了時間上，實驗效果表明精度也更高。

What：ST-GCN到底是什么？

ST-GCN是TCN與GCN的結合。TCN，對時間維度的數據進行卷積操作；GCN，則對空間維度的數據進行卷積操作。GCN屬于GNN，而GNN的基礎是圖論。神經網絡處理的傳統數據都是歐式距離結構的數據，比如二維的圖像、一維的聲音等等。而對于非歐式距離結構的數據，比如社交網絡、交通運輸網等等，傳統的網絡結構無法直接處理，而GNN就是用來處理這類型數據的。所以要了解ST-GCN，就要先從圖論的一些基本理論入手，然后再延伸到GNN、GCN、ST-GCN。

2.1 圖論

這里的圖并不是指我們日常所見的圖片，圖的廣泛概念包含具體的事物，以及事物之間的聯系。圖論中的圖由兩部分構成，即點和邊。

點：圖上具體的節點。

邊：連接圖上點和點之間的東西，邊分為有向邊和無向邊。

圖：節點V(G)和邊E(G)構成的集合就是圖，可以表示為：G = {V(G), E(G)}。圖可以簡單分為有向圖和無向圖（如下圖所示）。

2.2 GNN

GNN: Group Neural Network 圖神經網絡，即結合圖論與深度學習的網絡結構。目前主要包含：Graph Convolutional Networks (GCN)、Graph Attention Networks、Graph Auto-encoder、Graph Generative Networks、Graph Spatial-Temporal Networks。最初的GNN網絡，就是將點和邊的特征一起傳入網絡中學習。

2.3 GCN

GCN：Graph Convolutional Networks 圖卷積神經網絡，顧名思義，是將圖與卷積結合起來。根據卷積核的不同，主要分為spectral method（頻譜方法）和spatial method（空間方法）。二者的區別在于：頻譜方法基于拉普拉斯矩陣，與圖的關系緊密聯系，可泛化能力弱；空間方法則直接在圖上定義卷積，對有緊密關系的節點進行操作，分為點分類和圖分類。ST-GCN中的GCN屬于圖分類，且采用的是空間方法。

2.4 ST-GCN

ST-GCN：Spatial Temporal Graph Convolutional Networks時空圖卷積網絡，是在GCN的基礎上提出的。核心觀點是將TCN與GCN相結合，用來處理有時序關系的圖結構數據。網絡分為2個部分：GCN_Net與TCN_Net。

GCN_Net對輸入數據進行空間卷積，即不考慮時間的因素，卷積作用于同一時序的不同點的數據。TCN_Net對數據進行時序卷積，考慮不同時序同一特征點的關系，卷積作用于不同時序同一點的數據。

How：ST-GCN具體如何使用？

前部分講了ST-GCN是什么，那我們回歸到ST-GCN的具體應用上，首次提出ST-GCN是用來做人體動作識別，即通過一段視頻來判斷其中人的動作，也就是人體動作識別。

數據集：論文中使用的數據集為NTU-RGB+D，包含60種動作，共56880個樣本，其中有40類為日常行為動作，9類為與健康相關的動作，11類為雙人相互動作。數據集已經將視頻中的人體動作轉換為了骨架關節的數據，其中人體的骨架標注了25個節點，就是一種圖結構的數據。

NTU-RGB+D數據集的分類

亮點：

(1) 鄰接矩陣不采用傳統的方式，采用一種新的方式，將鄰接矩陣分為3個子集：根節點本身、向心力群，離心群。這一策略的靈感來自于身體部位的運動可以被廣泛地歸類為同心運動和偏心運動，通常距離重心越近，運動幅度越小，同時能更好地區分向心運動和離心運動。即下圖中的（d）。

(2) 網絡中加入可學習的邊的權重，即加入attention機制。每層網絡中鄰接矩陣A都與可學習的權重相乘，這些權重在反向傳播中更新。添加的原因是考慮到人體做不同的動作所側重的關節點不同，而且添加了注意力機制更有利于提高網絡的泛化能力。

整體效果：

使用ST-GCN的網絡結構進行人體動作識別，論文中在NTU-RGB+D數據集的x_sub模式下識別精度達到81.5%，NTU-RGB+D數據集的x-view模式下識別精度達到88.3%，優于傳統的人體動作識別網絡。

團隊工作亮點

ST-GCN的技術延展-動作生成

基于對ST-GCN在人體動作識別上的效果，我們將ST-GCN網絡與VAE網絡結合。目的在于獲取人體動作的語義，進而生成人體的動作，最終可以應用于機器人動作模仿或者其他強化學習項目中。

目前項目已在進行中，下圖展示的是真實的人體骨架節點3D圖與網絡生成的人體骨架節點3D圖。具體的研究結果，之后再跟大家分享，敬請期待。

責任編輯：lq

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

神經網絡

神經網絡

+關注

關注
42

文章
4774

瀏覽量
100890
圖像識別

圖像識別

+關注

關注
9

文章
520

瀏覽量
38290
網絡結構

網絡結構

+關注

關注
0

文章
48

瀏覽量
11129

原文標題：探究 | 一文了解基于ST-GCN的人體動作識別與生成

文章出處：【微信號：kmdian，微信公眾號：深蘭科技】歡迎添加關注！文章轉載請注明出處。

矽典微新品XenD101H人體生命存在感應參考設計

靜止人體生命存在毫米波傳感器采用FMCW調頻連續波技術，對空間內的靜止、微動、運動的人體目標進行探測，通過精確的生命存在感應和測距算法，即可獨立配置區間感應靈敏度，也可以自動化生成傳感器配置參數

發表于 12-30 15:29 ?95次閱讀

矽典微新品XenD101H<b class='flag-5'>人體</b>生命存在感應參考設計

ElfBoard開源項目|百度智能云平臺的人臉識別項目

百度智能云平臺的人臉識別項目，旨在利用其強大的人臉識別服務實現自動人臉識別。選擇百度智能云的原因是其高效的API接口和穩定的服務質量，能夠幫

發表于 12-24 10:54 ?375次閱讀

ElfBoard開源項目|百度智能云平臺<b class='flag-5'>的人</b>臉<b class='flag-5'>識別</b>項目

ADS1293獲取的人體心電信號，如何實現隔直？

1. ADS1293獲取的人體心電信號，如何實現隔直？ECG信號沒有隔直處理的話，基線會偏離0電壓位置，并且不同的人在不同的時間，偏置的電壓不盡相同。 2. ADS1293評估板手冊上，波形十分

發表于 12-10 08:25

使用ADS1298測出的人體心電信號基準線不在Y=0軸,如何解決呢？

這是我采用加壓單極左下肢導聯實測出的人體心電信號，但是基準線不在Y=0軸上，而且每次飄忽不定，總需要重新調整坐標軸，大家有沒有什么解決的辦法呢？謝謝啦。

發表于 12-03 08:05

24G雷達模塊LD2450 支持人體移動軌跡跟蹤與手勢識別

24G人體移動軌跡跟蹤雷達模塊TARGETTRAJECTORYTRACKINGRADARMODULE24GHz雷達傳感器HLK-LD2450主要用來檢測6米目標范圍內的人體移動軌跡，支持檢測區域內

發表于 10-27 08:03 ?340次閱讀

24G雷達模塊LD2450 支持<b class='flag-5'>人體</b>移動軌跡跟蹤與手勢<b class='flag-5'>識別</b>

可穿戴設備的人體成分測量 (BCM)申請簡介

電子發燒友網站提供《可穿戴設備的人體成分測量 (BCM)申請簡介.pdf》資料免費下載

發表于 09-10 09:22 ?0次下載

可穿戴設備<b class='flag-5'>的人體</b>成分測量 (BCM)申請簡介

基于FPGA的人臉識別技術

基于FPGA（現場可編程邏輯門陣列）的人臉識別技術，是一種結合了高效并行處理能力和靈活可編程性的先進圖像處理解決方案。這種技術在安全監控、身份認證、人機交互等領域具有廣泛應用前景。以下將詳細介紹基于FPGA的人臉

發表于 07-17 11:42 ?1506次閱讀

基于OpenCV的人臉識別系統設計

基于OpenCV的人臉識別系統是一個復雜但功能強大的系統，廣泛應用于安全監控、人機交互、智能家居等多個領域。下面將詳細介紹基于OpenCV的人臉識別系統的基本原理、實現步驟，并附上具體

發表于 07-11 15:37 ?1.2w次閱讀

Transformer模型在語音識別和語音生成中的應用優勢

隨著人工智能技術的飛速發展，語音識別和語音生成作為人機交互的重要組成部分，正逐漸滲透到我們生活的各個方面。而Transformer模型，自其誕生以來，憑借其獨特的自注意力機制和并行計算能力，在

發表于 07-03 18:24 ?1183次閱讀

基于毫米波的人體跟蹤和識別算法

準確的人類活動識別（HAR）是實現新興的上下文感知應用程序的關鍵，這些應用程序需要了解和識別人類行為，例如監測獨居的殘疾人或老年人。傳統上，HAR是通過環境傳感器（例如，相機）或通過可穿戴設備（例如

發表于 05-14 18:40

毫米波雷達模塊在高精度人體姿態識別的應用

的優勢。本文將探討毫米波雷達模塊在高精度人體姿態識別中的應用場景、原理和技術挑戰，旨在為推動人體姿態識別技術的發展提供技術支持和理論指導。人體

發表于 04-24 15:20 ?733次閱讀

英碼科技EA500I基于昇騰Mind SDK實現實時人體關鍵點檢測

在教育、體育、安防、交通、醫療等領域中，實時人體關鍵點檢測應用發揮著至關重要的作用，比如在體育訓練時，實時人體關鍵點檢測可以精確、實時地捕捉運動員的動作，從而進行動作分析和優化；在安防

發表于 04-21 17:44 ?1015次閱讀

ST Motor Control Workbench不能生成代碼怎么解決？

ST Motor Control Workbench不能生成代碼

發表于 04-15 06:09

用ST MC Workbench生成代碼時報錯怎么解決？

用 ST MC Workbench生成代碼時報錯

發表于 04-11 07:08

巍泰技術人體存在感知雷達：精準捕捉移動、微動與靜止狀態信息

存在感知雷達WTR-860基于24GHz的人體存在感知檢測方案靈敏度高，最遠可在4.5米范圍內感測到微動作和大動作，最遠3米以內的靜止人體信息（呼吸率等生命體征信號）探測。相較于傳統

發表于 03-11 15:57 ?1382次閱讀

色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

搜索歷史

基于ST-GCN的人體動作識別與生成

評論