色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
电子发烧友
开通电子发烧友VIP会员 尊享10大特权
海量资料免费下载
精品直播免费看
优质内容免费畅学
课程9折专享价
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

深度學習模型在傳感器數據處理中的應用(二):LSTM

MATLAB ? 來源:MATLAB ? 2025-02-20 10:48 ? 次閱讀

長短期記憶網絡(Long Short-Term Memory,LSTM)是遞歸神經網絡(Recurrent Neural Network,RNN)的一個變種,專門設計用來解決標準 RNN 在處理長序列數據時遇到的梯度消失或梯度爆炸問題。標準 RNN 在反向傳播過程中,由于鏈式法則的應用,梯度可能會在多層傳播中指數級地減小(梯度消失)或增大(梯度爆炸),這使得網絡難以學習和記住長時間步的依賴關系。

1.遞歸神經網絡(RNN)

RNN 的核心是其循環結構。在每個時間步,RNN 不僅接收當前輸入數據,還接收前一時間步的隱藏狀態,正是隱藏狀態的設計,使得網絡能夠記住和利用之前的信息。

e896fa42-eea9-11ef-9310-92fbcf53809c.png

圖 1 RNN 單元結構

圖1顯示了標準 RNN 的單元結構,其中輸入向量xt,輸出向量ot,隱藏狀態向量ht-1。當前隱藏狀態向量ht的計算如下,其輸入當前時間步向量xt和前一時間段步的隱藏狀態向量ht-1:

e89f0246-eea9-11ef-9310-92fbcf53809c.png

其中 σ 表示激活函數,Wh 和 Wx 是隱藏狀態變換參數和輸入變換參數,隱藏狀態負責記憶之前時間步上的信息。RNN 的輸出向量ot是對隱藏狀態做線性變換:

e8b103e2-eea9-11ef-9310-92fbcf53809c.png 其中 σ 表示激活函數,Wo?輸出變換。Wh 、Wx 和 Wo 是 RNN 要學習的參數。標準的 RNN 結構存在兩個主要問題:梯度消失(或增大);長期信息丟失。

梯度消失(或增大)在長時間序列中,梯度是消失還是增大,與選擇的激活函數有關,這里我們解釋梯度消失問題。假設損失函數為 L,在反向傳播過程中,針對參數 Wh的梯度計算為:

e8c27ffa-eea9-11ef-9310-92fbcf53809c.png

而?h1/?wh是通過激活函數做梯度計算,激活函數的取值范圍是[-1,1](tanh函數)或[0,1](sigmod函數),因此,連續相乘會產生梯度消失,

長期信息丟失對當前隱藏狀態向量產生影響的是當前時間步的輸入向量和前一個時間步的隱藏狀態向量。當前輸入數據往往是會攜帶大量信息,而隱藏狀態變量是遞歸生成的,隨著遞歸次數的增加其變化量也會較少,因此 Wx × xt 的值會大于 Wh × ht-1。

2.長短期記憶(LSTM)

LSTM 是一種新的 RNN 結構,能夠有效地保留長期信息并緩解梯度消失問題。LSTM 引入了一個記憶單元(也是單元狀態向量),用于存儲長期信息。記憶單元通過直接的線性連接在時間步之間傳遞信息,避免了梯度消失問題。LSTM 通過三個門(遺忘門、輸入門和輸出門)來控制信息在時間步間的流動量。

遺忘門: 決定記憶單元中哪些信息需要丟棄。

輸入門: 決定哪些新的信息會被加入記憶單元。

輸出門: 控制記憶單元的輸出部分如何影響最終的輸出。

LSTM 的單元結構如圖2所示。其中,f、i、o分別是遺忘門、輸入門和輸出門,g表示候選進入單元狀態的信息;σg 和σc表示激活函數,e8cf5fa4-eea9-11ef-9310-92fbcf53809c.png?表示向量對應元素相乘。

e8d6a7be-eea9-11ef-9310-92fbcf53809c.png

圖 2 LSTM 單元結構 每個門對輸入數據和前一時刻的隱藏狀態向量的轉換過程可以表示為:

遺忘門:

e8ecb1c6-eea9-11ef-9310-92fbcf53809c.png

輸入門:

e8ff8594-eea9-11ef-9310-92fbcf53809c.png

輸出門:

e90bb6de-eea9-11ef-9310-92fbcf53809c.png

候選狀態單元:

e912d8ce-eea9-11ef-9310-92fbcf53809c.png

進一步,單元狀態(cellstate)表示為:

e9235578-eea9-11ef-9310-92fbcf53809c.png

隱藏狀態(hidden state)表示為:

e9345fd0-eea9-11ef-9310-92fbcf53809c.png

一般情況下,激活函數σg 和σc分別采用tanh函數和sigmod函數。正如公式(5)所示,t時刻的單元狀態ct,是對前一時刻的單元狀態做部分遺忘,遺忘的比例由遺忘門ft 決定;并增加部分輸入數據,增加的比例由輸入門決定it。而公式(6)表明,每個時間步的隱藏狀態是部分單元狀態,比例部分由輸出門ot 決定。

正是由于單元狀態的引入,可以通過一條直接的路徑記住每個時間步的輸入數據,也就是長期依賴關系;而輸入數據通過加法(類似于殘差)引入單元狀態中,使得反向傳播過程的梯度消失得到緩解。 ▼

3.MATLAB 對 LSTM的支持

在 MATLAB 中,lstmLayer 層實現了 LSTM,其提供了多個屬性用于設置和初始化 LSTM 的相關參數。

e9415596-eea9-11ef-9310-92fbcf53809c.png

MATLAB 中的 lstmLayer 及其屬性

例如NumHiddenUnits用于設置隱藏狀態向量的維度,隱藏狀態包含來自所有先前時間步的信息,其大小也決定了 LSTM 要學習的參數的規模;stateActivateFunction設置單元狀態和隱藏狀態的激活函數;gateActivateFunction用于設置門操作的激活函數;還有一個很重要的屬性outputMode,其有兩個值:sequence和last。LSTM 單元按時間步順序處理輸入數據,輸出是當前時間步的隱藏狀態,如圖 3 所示。如果outputMode的屬性值為 sequence,每個時間步的隱藏狀態向量都會輸出,最終 lstmLayer 輸出一個隱藏狀態序列,序列長度等于輸入序列的長度;如果outputMode的屬性值為 last,那么 lstmLayer 只輸出最后一個時間步的隱藏狀態向量。由于 LSTM 是對輸入序列遞歸處理,所以最后一個時間的輸出隱藏狀態向量已經包含其與之前所有時間步的依賴關系。

e94be542-eea9-11ef-9310-92fbcf53809c.png

圖3(a)LSTM單元的每個時間步的輸入數據和輸出數據;

e95dd270-eea9-11ef-9310-92fbcf53809c.png

圖3(b) LSTM遞歸處理輸入序列,并生成相應的輸出序列

MATLAB 還同時支持 BiLSTM(BiderectionalLong Short-Term Memory),也就是雙向 LSTM。BiLSTM 是對 LSTM 的擴展,通過引入雙向信息流來增強模型的上下文捕獲能力。在 BiLSTM 中,輸入序列不僅從前向后處理(正向 LSTM),還從后向前處理(反向 LSTM)。這種雙向處理方式允許模型在每個時間步上同時考慮前后文信息,從而提高預測的準確性。

類似于 lstmLayer,MATLAB 中的 bilstmLayer 實現了 BiLSTM。屬性NumHiddenUnits用于設置隱藏狀態向量的維度,其包含先前時間步和后續時間步的信息,而實際輸出的隱藏狀態向量維度為 2*NumHiddenUnits,即將前向和后向兩個處理過程的隱藏狀態進行連接。 ▼

4.LSTM 在基于信號數據的故障診斷中的應用

基于 LSTM,可以構建分類網絡對設備或器件做故障診斷。LSTM 可以捕獲傳感器數據在時間上的依賴關系,進而可以識別設備的動態特性實現診斷或預測。使用 Deep Network Designer App 構建分類網絡,如圖 4 所示。

e97003a0-eea9-11ef-9310-92fbcf53809c.png

圖4 LSTM分類網絡

lstmLayer 的隱藏單元向量維度設置為 128,outputMode設置為sequence,因此,lstmLayer 層的輸出是一個隱藏狀態向量序列,并且序列中的每個向量的維度為 128。在 lstmLayer 之后使用 globalMaxPooling1dLayer 層對輸出結果在時間方向上做最大值池化(這類似在傳感器數據的深度學習模型應用(一) – Transformer中使用的方法),進而其輸出結果為一個128維的向量,最后我們使用兩個全連接層做線性變化,最終輸出為 3 維的向量對應于故障種類。

使用在傳感器數據的深度學習模型應用(一) – Transformer提到的數據集,該數據集是對原始信號數據做了時域、頻域、以及時頻域的特征提取,進而將具有 146484 采樣點一維數據,轉換為 1464×30 的二維矩陣(因此,在 LSTM 分類網絡中輸入層的維度為 30)。數據集進步劃分為訓練集和測試集,如下所示:

e9835f90-eea9-11ef-9310-92fbcf53809c.png

訓練集(上)

e98e4cde-eea9-11ef-9310-92fbcf53809c.png

測試集(下)

模型訓練過程,MATLAB 提供了超參數選項實現模型的進一步調優,而超參數選項是通過 trainingOptions 函數設置的,包括初始學習速率、學習速率衰減策略、minibatch 大小、訓練執行環境(GPUCPU)、訓練周期等等。經過 100 個 Epoch 訓練,模型在測試集上的測試結果如圖 5 所示:

e9a2f5f8-eea9-11ef-9310-92fbcf53809c.png

圖 5 模型訓練過程(上)

e9b7ae1c-eea9-11ef-9310-92fbcf53809c.png

圖 5測試集精度(heatmap)(下)

5. 總結

本文的目的主要是介紹 Long-shortterm memory(LSTM),以及 MATLAB 對 LSTM 支持和如何在 MATLAB 中構建基于 LSTM 的分類網絡。當然基于 LSTM 還可以構建回歸網絡,實現序列到一個值和序列到序列的預測。本文目的是給讀者在序列數據分析提供一種思路,文中的模型設計和訓練還有可以優化地方,僅為讀者提供參考,也歡迎大家做進一步模型結構調整和精度提升。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 傳感器
    +關注

    關注

    2560

    文章

    52118

    瀏覽量

    761243
  • matlab
    +關注

    關注

    187

    文章

    2989

    瀏覽量

    232712
  • LSTM
    +關注

    關注

    0

    文章

    60

    瀏覽量

    3934

原文標題:傳感器數據的深度學習模型應用(二)—— LSTM

文章出處:【微信號:MATLAB,微信公眾號:MATLAB】歡迎添加關注!文章轉載請注明出處。

收藏 0人收藏

    評論

    相關推薦

    RNN與LSTM模型的比較分析

    RNN(循環神經網絡)與LSTM(長短期記憶網絡)模型深度學習領域都具有處理序列
    的頭像 發表于 11-15 10:05 ?1680次閱讀

    NPU深度學習的應用

    設計的硬件加速,它在深度學習的應用日益廣泛。 1. NPU的基本概念 NPU是一種專門針對深度學習
    的頭像 發表于 11-14 15:17 ?1510次閱讀

    深度學習框架LSTM神經網絡實現

    長短期記憶(LSTM)網絡是一種特殊的循環神經網絡(RNN),能夠學習長期依賴信息。與傳統的RNN相比,LSTM通過引入門控機制來解決梯度消失和梯度爆炸問題,使其
    的頭像 發表于 11-13 10:16 ?766次閱讀

    LSTM神經網絡圖像處理的應用

    長短期記憶(LSTM)神經網絡是一種特殊的循環神經網絡(RNN),它能夠學習長期依賴關系。雖然LSTM最初是為處理序列數據設計的,但近年來,
    的頭像 發表于 11-13 10:12 ?1183次閱讀

    如何使用Python構建LSTM神經網絡模型

    : NumPy:用于數學運算。 TensorFlow:一個開源機器學習庫,Keras是其高級API。 Keras:用于構建和訓練深度學習模型。 你可以使用pip來安裝這些庫: pip
    的頭像 發表于 11-13 10:10 ?1158次閱讀

    如何優化LSTM神經網絡的性能

    LSTM是一種特殊的循環神經網絡(RNN),它能夠學習長期依賴關系,因此序列數據處理中非常有效。然而,LSTM網絡的訓練可能面臨梯度消失或
    的頭像 發表于 11-13 10:09 ?1988次閱讀

    LSTM神經網絡語音識別的應用實例

    語音識別技術是人工智能領域的一個重要分支,它使計算機能夠理解和處理人類語言。隨著深度學習技術的發展,特別是長短期記憶(LSTM)神經網絡的引入,語音識別的準確性和效率得到了顯著提升。
    的頭像 發表于 11-13 10:03 ?1375次閱讀

    使用LSTM神經網絡處理自然語言處理任務

    自然語言處理(NLP)是人工智能領域的一個重要分支,它旨在使計算機能夠理解、解釋和生成人類語言。隨著深度學習技術的發展,特別是循環神經網絡(RNN)及其變體——長短期記憶(LSTM)網
    的頭像 發表于 11-13 09:56 ?867次閱讀

    LSTM神經網絡時間序列預測的應用

    時間序列預測是數據分析的一個重要領域,它涉及到基于歷史數據預測未來值。隨著深度學習技術的發展,長短期記憶(
    的頭像 發表于 11-13 09:54 ?1586次閱讀

    維力傳感器測量扭力原理,扭力測量的優勢應用

    維力傳感器是一種能夠同時測量物體兩個獨立方向上所承受的力的設備。它采用了先進的應變計技術和微電子機械系統(MEMS)技術,將傳感器的敏感元件與
    的頭像 發表于 09-27 16:47 ?527次閱讀
    <b class='flag-5'>二</b>維力<b class='flag-5'>傳感器</b>測量扭力原理,<b class='flag-5'>在</b>扭力測量<b class='flag-5'>中</b>的優勢應用

    深度學習模型權重

    深度學習這一充滿無限可能性的領域中,模型權重(Weights)作為其核心組成部分,扮演著至關重要的角色。它們不僅是模型
    的頭像 發表于 07-04 11:49 ?3389次閱讀

    深度學習模型訓練過程詳解

    詳細介紹深度學習模型訓練的全過程,包括數據處理模型構建、損失函數定義、優化算法選擇、訓練過程
    的頭像 發表于 07-01 16:13 ?2091次閱讀

    深度學習模型優化與調試方法

    深度學習模型訓練過程,往往會遇到各種問題和挑戰,如過擬合、欠擬合、梯度消失或爆炸等。因此,對深度
    的頭像 發表于 07-01 11:41 ?1351次閱讀

    振弦采集儀巖土工程監測數據處理與結果展示

    的穩定性。 振弦采集儀巖土工程監測數據處理與結果展示 振弦采集儀通過安裝在土體的振弦傳感器,可以對土體的振動信號進行實時采集。采集到
    的頭像 發表于 05-14 16:41 ?406次閱讀
    振弦采集儀<b class='flag-5'>在</b>巖土工程監測<b class='flag-5'>中</b>的<b class='flag-5'>數據處理</b>與結果展示

    助聽器降噪神經網絡模型

    層有 256 個過濾器。訓練期間, LSTM 層之間應用 25% 的 dropout。使用 Adam 優化學習率為 10e-3,梯
    發表于 05-11 17:15
    主站蜘蛛池模板: 日本阿v在线资源无码免费 日本阿v片在线播放免费 | 综合久久久久久久综合网 | 日日啪无需播放器 | 色视频色露露永久免费观看 | 2022国产麻豆剧传媒剧情 | 国产欧美另类久久久精品免费 | 成人免费肉动漫无遮网站 | 性色香蕉AV久久久天天网 | 成人在免费视频手机观看网站 | 中文免费视频 | 久久精品99热超碰 | 免费人成网站在线观看10分钟 | 亚洲色综合中文字幕在线 | 男男被强bl高h文 | 野花日本韩国视频免费高清观看 | 国产精品看高国产精品不卡 | 空姐内射出白浆10p 空姐厕所啪啪啪 | 就去色电影 | 越南美女内射BBWXZ | 久久婷婷五月综合色情 | 久久人妻少妇嫩草AV蜜桃99 | 办公室日本肉丝OL在线 | 亚洲AV香蕉一区区二区三区蜜桃 | 在线免费观看国产精品 | 一抽一出BGM免费50分动漫 | 亚洲七七久久桃花综合 | 俄罗斯bbbbbbbbb大片 | 香蕉精品国产高清自在自线 | 毛片手机在线观看 | 狠狠色综合久久丁香婷婷 | 暖暖直播免费观看韩国 | 成年人在线视频免费观看 | 亚洲精品国产高清不卡在线 | 最近韩国日本免费观看mv免费版 | 日本在线免费播放 | 国产91无毒不卡在线观看 | 51精品国产AV无码久久久 | hd性欧美俱乐部中文 | 国产av在线播放 | 欧美内射AAAAAAXXXXX| 国精品产露脸偷拍视频 |

    電子發燒友

    中國電子工程師最喜歡的網站

    • 2931785位工程師會員交流學習
    • 獲取您個性化的科技前沿技術信息
    • 參加活動獲取豐厚的禮品