一区二区三区午夜,中文字幕一宅男撸撸666,在线亚洲精品国产波多野结衣

長短期記憶網絡（Long Short-Term Memory，LSTM）是遞歸神經網絡（Recurrent Neural Network，RNN）的一個變種，專門設計用來解決標準 RNN 在處理長序列數據時遇到的梯度消失或梯度爆炸問題。標準 RNN 在反向傳播過程中，由于鏈式法則的應用，梯度可能會在多層傳播中指數級地減小（梯度消失）或增大（梯度爆炸），這使得網絡難以學習和記住長時間步的依賴關系。

1.遞歸神經網絡（RNN）

RNN 的核心是其循環結構。在每個時間步，RNN 不僅接收當前輸入數據，還接收前一時間步的隱藏狀態，正是隱藏狀態的設計，使得網絡能夠記住和利用之前的信息。

圖 1 RNN 單元結構

圖1顯示了標準 RNN 的單元結構，其中輸入向量xt，輸出向量ot，隱藏狀態向量ht-1。當前隱藏狀態向量ht的計算如下，其輸入當前時間步向量xt和前一時間段步的隱藏狀態向量ht-1：

其中 σ 表示激活函數，Wh 和 Wx 是隱藏狀態變換參數和輸入變換參數，隱藏狀態負責記憶之前時間步上的信息。RNN 的輸出向量ot是對隱藏狀態做線性變換：

其中 σ 表示激活函數，Wo?輸出變換。Wh 、Wx 和 Wo 是 RNN 要學習的參數。標準的 RNN 結構存在兩個主要問題：梯度消失（或增大）；長期信息丟失。

梯度消失（或增大）在長時間序列中，梯度是消失還是增大，與選擇的激活函數有關，這里我們解釋梯度消失問題。假設損失函數為 L，在反向傳播過程中，針對參數 Wh的梯度計算為：

而?h1/?wh是通過激活函數做梯度計算，激活函數的取值范圍是[-1,1]（tanh函數）或[0,1]（sigmod函數），因此，連續相乘會產生梯度消失，

長期信息丟失對當前隱藏狀態向量產生影響的是當前時間步的輸入向量和前一個時間步的隱藏狀態向量。當前輸入數據往往是會攜帶大量信息，而隱藏狀態變量是遞歸生成的，隨著遞歸次數的增加其變化量也會較少，因此 Wx × xt 的值會大于 Wh × ht-1。

▼

2.長短期記憶（LSTM）

LSTM 是一種新的 RNN 結構，能夠有效地保留長期信息并緩解梯度消失問題。LSTM 引入了一個記憶單元（也是單元狀態向量），用于存儲長期信息。記憶單元通過直接的線性連接在時間步之間傳遞信息，避免了梯度消失問題。LSTM 通過三個門（遺忘門、輸入門和輸出門）來控制信息在時間步間的流動量。

遺忘門: 決定記憶單元中哪些信息需要丟棄。

輸入門: 決定哪些新的信息會被加入記憶單元。

輸出門: 控制記憶單元的輸出部分如何影響最終的輸出。

LSTM 的單元結構如圖2所示。其中，f、i、o分別是遺忘門、輸入門和輸出門，g表示候選進入單元狀態的信息；σg 和σc表示激活函數，?表示向量對應元素相乘。

圖 2 LSTM 單元結構每個門對輸入數據和前一時刻的隱藏狀態向量的轉換過程可以表示為：

遺忘門：

輸入門：

輸出門：

候選狀態單元：

進一步，單元狀態（cellstate）表示為：

隱藏狀態（hidden state）表示為：

一般情況下，激活函數σg 和σc分別采用tanh函數和sigmod函數。正如公式（5）所示，t時刻的單元狀態ct，是對前一時刻的單元狀態做部分遺忘，遺忘的比例由遺忘門ft 決定；并增加部分輸入數據，增加的比例由輸入門決定it。而公式（6）表明，每個時間步的隱藏狀態是部分單元狀態，比例部分由輸出門ot 決定。

正是由于單元狀態的引入，可以通過一條直接的路徑記住每個時間步的輸入數據，也就是長期依賴關系；而輸入數據通過加法（類似于殘差）引入單元狀態中，使得反向傳播過程的梯度消失得到緩解。 ▼

3.MATLAB 對 LSTM的支持

在 MATLAB 中，lstmLayer 層實現了 LSTM，其提供了多個屬性用于設置和初始化 LSTM 的相關參數。

MATLAB 中的 lstmLayer 及其屬性

例如NumHiddenUnits用于設置隱藏狀態向量的維度，隱藏狀態包含來自所有先前時間步的信息，其大小也決定了 LSTM 要學習的參數的規模；stateAc tivateFunction設置單元狀態和隱藏狀態的激活函數；gateActivateFunction用于設置門操作的激活函數；還有一個很重要的屬性outputMode，其有兩個值：sequence和last。LSTM 單元按時間步順序處理輸入數據，輸出是當前時間步的隱藏狀態，如圖 3 所示。如果outputMode的屬性值為 sequence，每個時間步的隱藏狀態向量都會輸出，最終 lstmLayer 輸出一個隱藏狀態序列，序列長度等于輸入序列的長度；如果outputMode的屬性值為 last，那么 lstmLayer 只輸出最后一個時間步的隱藏狀態向量。由于 LSTM 是對輸入序列遞歸處理，所以最后一個時間的輸出隱藏狀態向量已經包含其與之前所有時間步的依賴關系。

圖3（a）LSTM單元的每個時間步的輸入數據和輸出數據；

圖3(b) LSTM遞歸處理輸入序列，并生成相應的輸出序列

MATLAB 還同時支持 BiLSTM（BiderectionalLong Short-Term Memory），也就是雙向 LSTM。BiLSTM 是對 LSTM 的擴展，通過引入雙向信息流來增強模型的上下文捕獲能力。在 BiLSTM 中，輸入序列不僅從前向后處理（正向 LSTM），還從后向前處理（反向 LSTM）。這種雙向處理方式允許模型在每個時間步上同時考慮前后文信息，從而提高預測的準確性。

類似于 lstmLayer，MATLAB 中的 bilstmLayer 實現了 BiLSTM。屬性NumHiddenUnits用于設置隱藏狀態向量的維度，其包含先前時間步和后續時間步的信息，而實際輸出的隱藏狀態向量維度為 2*NumHiddenUnits，即將前向和后向兩個處理過程的隱藏狀態進行連接。 ▼

4.LSTM 在基于信號數據的故障診斷中的應用

基于 LSTM，可以構建分類網絡對設備或器件做故障診斷。LSTM 可以捕獲傳感器數據在時間上的依賴關系，進而可以識別設備的動態特性實現診斷或預測。使用 Deep Network Designer App 構建分類網絡，如圖 4 所示。

圖4 LSTM分類網絡

lstmLayer 的隱藏單元向量維度設置為 128，outputMode設置為sequence，因此，lstmLayer 層的輸出是一個隱藏狀態向量序列，并且序列中的每個向量的維度為 128。在 lstmLayer 之后使用 globalMaxPooling1dLayer 層對輸出結果在時間方向上做最大值池化（這類似在傳感器數據的深度學習模型應用（一） – Transformer中使用的方法），進而其輸出結果為一個128維的向量，最后我們使用兩個全連接層做線性變化，最終輸出為 3 維的向量對應于故障種類。

使用在傳感器數據的深度學習模型應用（一） – Transformer提到的數據集，該數據集是對原始信號數據做了時域、頻域、以及時頻域的特征提取，進而將具有 146484 采樣點一維數據，轉換為 1464×30 的二維矩陣（因此，在 LSTM 分類網絡中輸入層的維度為 30）。數據集進步劃分為訓練集和測試集，如下所示：

訓練集(上)

測試集(下)

模型訓練過程，MATLAB 提供了超參數選項實現模型的進一步調優，而超參數選項是通過 trainingOptions 函數設置的，包括初始學習速率、學習速率衰減策略、minibatch 大小、訓練執行環境（GPU、CPU）、訓練周期等等。經過 100 個 Epoch 訓練，模型在測試集上的測試結果如圖 5 所示：

圖 5 模型訓練過程（上）

圖 5測試集精度（heatmap）(下)

▼

5. 總結

本文的目的主要是介紹 Long-shortterm memory(LSTM)，以及 MATLAB 對 LSTM 支持和如何在 MATLAB 中構建基于 LSTM 的分類網絡。當然基于 LSTM 還可以構建回歸網絡，實現序列到一個值和序列到序列的預測。本文目的是給讀者在序列數據分析提供一種思路，文中的模型設計和訓練還有可以優化地方，僅為讀者提供參考，也歡迎大家做進一步模型結構調整和精度提升。

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

傳感器

傳感器

+關注

關注
2560

文章
52118

瀏覽量
761243
matlab

matlab

+關注

關注
187

文章
2989

瀏覽量
232712
LSTM

LSTM

+關注

關注
0

文章
60

瀏覽量
3934

原文標題：傳感器數據的深度學習模型應用（二）—— LSTM

文章出處：【微信號：MATLAB，微信公眾號：MATLAB】歡迎添加關注！文章轉載請注明出處。

RNN與LSTM模型的比較分析

RNN（循環神經網絡）與LSTM（長短期記憶網絡）模型在深度學習領域都具有處理序列

發表于 11-15 10:05 ?1680次閱讀

NPU在深度學習中的應用

設計的硬件加速器，它在深度學習中的應用日益廣泛。 1. NPU的基本概念 NPU是一種專門針對深度學習

發表于 11-14 15:17 ?1510次閱讀

深度學習框架中的LSTM神經網絡實現

長短期記憶（LSTM）網絡是一種特殊的循環神經網絡（RNN），能夠學習長期依賴信息。與傳統的RNN相比，LSTM通過引入門控機制來解決梯度消失和梯度爆炸問題，使其在

發表于 11-13 10:16 ?766次閱讀

LSTM神經網絡在圖像處理中的應用

長短期記憶（LSTM）神經網絡是一種特殊的循環神經網絡（RNN），它能夠學習長期依賴關系。雖然LSTM最初是為處理序列數據設計的，但近年來，

發表于 11-13 10:12 ?1183次閱讀

如何使用Python構建LSTM神經網絡模型

： NumPy：用于數學運算。 TensorFlow：一個開源機器學習庫，Keras是其高級API。 Keras：用于構建和訓練深度學習模型。你可以使用pip來安裝這些庫： pip

發表于 11-13 10:10 ?1158次閱讀

如何優化LSTM神經網絡的性能

LSTM是一種特殊的循環神經網絡（RNN），它能夠學習長期依賴關系，因此在序列數據處理中非常有效。然而，LSTM網絡的訓練可能面臨梯度消失或

發表于 11-13 10:09 ?1988次閱讀

LSTM神經網絡在語音識別中的應用實例

語音識別技術是人工智能領域的一個重要分支，它使計算機能夠理解和處理人類語言。隨著深度學習技術的發展，特別是長短期記憶（LSTM）神經網絡的引入，語音識別的準確性和效率得到了顯著提升。

發表于 11-13 10:03 ?1375次閱讀

使用LSTM神經網絡處理自然語言處理任務

自然語言處理（NLP）是人工智能領域的一個重要分支，它旨在使計算機能夠理解、解釋和生成人類語言。隨著深度學習技術的發展，特別是循環神經網絡（RNN）及其變體——長短期記憶（LSTM）網

發表于 11-13 09:56 ?867次閱讀

LSTM神經網絡在時間序列預測中的應用

時間序列預測是數據分析中的一個重要領域，它涉及到基于歷史數據預測未來值。隨著深度學習技術的發展，長短期記憶（

發表于 11-13 09:54 ?1586次閱讀

二維力傳感器測量扭力原理，在扭力測量中的優勢應用

二維力傳感器是一種能夠同時測量物體在兩個獨立方向上所承受的力的設備。它采用了先進的應變計技術和微電子機械系統（MEMS）技術，將傳感器的敏感元件與數

發表于 09-27 16:47 ?527次閱讀

深度學習中的模型權重

在深度學習這一充滿無限可能性的領域中，模型權重（Weights）作為其核心組成部分，扮演著至關重要的角色。它們不僅是模型

發表于 07-04 11:49 ?3389次閱讀

深度學習模型訓練過程詳解

詳細介紹深度學習模型訓練的全過程，包括數據預處理、模型構建、損失函數定義、優化算法選擇、訓練過程

發表于 07-01 16:13 ?2091次閱讀

深度學習的模型優化與調試方法

深度學習模型在訓練過程中，往往會遇到各種問題和挑戰，如過擬合、欠擬合、梯度消失或爆炸等。因此，對深度

發表于 07-01 11:41 ?1351次閱讀

振弦采集儀在巖土工程監測中的數據處理與結果展示

的穩定性。振弦采集儀在巖土工程監測中的數據處理與結果展示振弦采集儀通過安裝在土體中的振弦傳感器，可以對土體的振動信號進行實時采集。采集到

發表于 05-14 16:41 ?406次閱讀

助聽器降噪神經網絡模型

層有 256 個過濾器。在訓練期間，在 LSTM 層之間應用 25% 的 dropout。使用 Adam 優化器，學習率為 10e-3，梯

發表于 05-11 17:15

色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

搜索歷史

深度學習模型在傳感器數據處理中的應用(二):LSTM

評論

RNN與LSTM模型的比較分析

NPU在深度學習中的應用

深度學習框架中的LSTM神經網絡實現

LSTM神經網絡在圖像處理中的應用

如何使用Python構建LSTM神經網絡模型

如何優化LSTM神經網絡的性能

LSTM神經網絡在語音識別中的應用實例

使用LSTM神經網絡處理自然語言處理任務

LSTM神經網絡在時間序列預測中的應用

二維力傳感器測量扭力原理，在扭力測量中的優勢應用

深度學習中的模型權重

深度學習模型訓練過程詳解

深度學習的模型優化與調試方法

振弦采集儀在巖土工程監測中的數據處理與結果展示

助聽器降噪神經網絡模型

電子發燒友