五月最新女厕所高跟嘘嘘,一个人看的免费视频www中国,一个人看的免费高清www在线观看一个人看的免费高清www视频

一、隨機失活（Dropout)

具體做法：在訓練的時候，隨機失活的實現方法是讓神經元以超參數的概率被激活或者被設置為 0。如下圖所示：

Dropout 可以看作是 Bagging 的極限形式，每個模型都在當一種情況中訓練，同時模型的每個參數都經過與其他模型共享參數，從而高度正則化。在訓練過程中，隨機失活也可以被認為是對完整的神經網絡抽樣出一些子集，每次基于輸入數據只更新子網絡的參數（然而，數量巨大的子網絡們并不是相互獨立的，因為它們都共享參數）。在測試過程中不使用隨機失活，可以理解為是對數量巨大的子網絡們做了模型集成（model ensemble），以此來計算出一個平均的預測。

關于 Dropout 的 Motivation：一個是類似于性別在生物進化中的角色：物種為了生存往往會傾向于適應這種環境，環境突變則會導致物種難以做出及時反應，性別的出現可以繁衍出適應新環境的變種，有效的阻止過擬合，即避免環境改變時物種可能面臨的滅絕。還有一個就是正則化的思想，減少神經元之間復雜的共適應關系，減少權重使得網絡對丟失特定神經元連接的魯棒性提高。

這里強烈推薦看下論文原文。雖然是英文的，但是對于更深刻的理解還是有很大幫助的！

二、圖像數據的預處理

為什么要預處理：簡單的從二維來理解，首先，圖像數據是高度相關的，假設其分布如下圖 a 所示(簡化為 2 維)。由于初始化的時候，我們的參數一般都是 0 均值的，因此開始的擬合，基本過原點附近(因為 b 接近于零)，如圖 b 紅色虛線。因此，網絡需要經過多次學習才能逐步達到如紫色實線的擬合，即收斂的比較慢。如果我們對輸入數據先作減均值操作，如圖 c，顯然可以加快學習。更進一步的，我們對數據再進行去相關操作，使得數據更加容易區分，這樣又會加快訓練，如圖 d。

下面介紹下一些基礎預處理方法：

歸一化處理

均值減法（Mean subtraction）:它對數據中每個獨立特征減去平均值，從幾何上可以理解為在每個維度上都將數據云的中心都遷移到原點。（就是每個特征數據減去其相應特征的平均值）

歸一化（Normalization）;先對數據做零中心化（zero-centered）處理，然后每個維度都除以其標準差。

（中間零中心化，右邊歸一化）

PCA 和白化（Whitening）

白化（Whitening）:白化操作的輸入是特征基準上的數據，然后對每個維度除以其特征值來對數值范圍進行歸一化。該變換的幾何解釋是：如果數據服從多變量的高斯分布，那么經過白化后，數據的分布將會是一個均值為零，且協方差相等的矩陣

特征向量是按照特征值的大小排列的。我們可以利用這個性質來對數據降維，只要使用前面的小部分特征向量，丟棄掉那些包含的數據沒有方差的維度。這個操作也被稱為主成分分析（ Principal Component Analysis）簡稱 PCA）降維

(中間是經過 PCA 操作的數據，右邊是白化)

需要注意的是:

對比與上面的中心化，與 pca 有點類似，但是不同的是，pca 把數據變換到了數據協方差矩陣的基準軸上（協方差矩陣變成對角陣），也就是說他是軸對稱的，但簡單的零中心化，它不是軸對稱的；還有 PCA 是一種降維的預處理，而零中心化并不是。

常見錯誤:任何預處理策略（比如數據均值）都只能在訓練集數據上進行計算，算法訓練完畢后再應用到驗證集或者測試集上。例如，如果先計算整個數據集圖像的平均值然后每張圖片都減去平均值，最后將整個數據集分成訓練 / 驗證 / 測試集，那么這個做法是錯誤的。應該怎么做呢？應該先分成訓練 / 驗證 / 測試集，只是從訓練集中求圖片平均值，然后各個集（訓練 / 驗證 / 測試集）中的圖像再減去這個平均值。

三、Batch Normalization

原論文中，作者為了計算的穩定性，加了兩個參數將數據又還原回去了，這兩個參數也是需要訓練的。說白了，就是對每一層的數據都預處理一次。方便直觀感受，上張圖：

這個方法可以進一步加速收斂，因此學習率可以適當增大，加快訓練速度；過擬合現象可以得倒一定程度的緩解，所以可以不用 Dropout 或用較低的 Dropout，而且可以減小 L2 正則化系數，訓練速度又再一次得到了提升。即 Batch Normalization 可以降低我們對正則化的依賴程度。

還有要注意的是，Batch Normalization 和 pca 加白化有點類似，結果都是可以零均值加上單位方差，可以使得數據弱相關，但是在深度神經網絡中，我們一般不要 pca 加白化，原因就是白化需要計算整個訓練集的協方差矩陣、求逆等操作，計算量很大，此外，反向傳播時，白化操作不一定可導。最后，再次強烈直接看 BN 的相關論文，有很多細節值得一看！

編輯：hfy

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

神經網絡

神經網絡

+關注

關注
42

文章
4774

瀏覽量
100904

機器學習為什么需要數據預處理

數據預處理是準備原始數據并使其適合機器學習模型的過程。這是創建機器學習模型的第一步也是關鍵的一步。創建機器學習項目時，我們并不總是遇到干凈且格式化的數據。在對

發表于 08-24 09:20 ?1940次閱讀

機器學習為什么需要<b class='flag-5'>數據</b><b class='flag-5'>預處理</b>

請教大家一下關于數據預處理

一般將獲得的加速度數據得進行數據預處理，常見的預處理方法有去掉趨勢相、還得將離散的數值積分獲得振幅。請問有做過的沒，請教一下。

發表于 06-07 11:16

振動信號的預處理具體是什么意思？

振動信號的處理和預處理之間有什么區別？我用labview對振動信號進行預處理算處理嗎？

發表于 10-08 15:33

Python數據預處理方法

機器學習-Python實踐Day3（特征工程--數據預處理2）

發表于 06-03 15:55

數據探索與數據預處理

目錄1數據探索與數據預處理21.1 賽題回顧21.2 數據探索性分析與異常值處理21.3 相關性分析52特征工程82.1 光伏發電領域特征8

發表于 07-12 08:37

工業蒸汽量預測的數據預處理知識有哪些

工業蒸汽量預測的數據預處理知識有哪些？工業蒸汽量預測的特征工程有哪些？

發表于 10-22 06:32

C預處理與C語言基本數據類型

嵌入式系統設計師學習筆記二十九：嵌入式程序設計④——C預處理預處理指令表：（編碼規范：GB/T 28169-2011）關于宏定義 #denfine 詳解可點擊連接查看博主的另一篇文章預定義宏

發表于 12-21 08:29

C語言的編譯預處理

在將一個C源程序轉換為可執行程序的過程中, 編譯預處理是最初的步驟. 這一步驟是由預處理器(preprocessor)來完成的. 在源流程序被編譯器處理之前, 預處理器首先對源程序中的

發表于 09-20 18:17 ?47次下載

Python數據清洗和預處理入門完整指南

凡事預則立，不預則廢，訓練機器學習模型也是如此。數據清洗和預處理是模型訓練之前的必要過程，否則模型可能就「廢」了。本文是一個初學者指南，將帶你領略如何在任意的數據集上，針對任意一個機器學習模型，完成

發表于 12-21 13:50 ?894次閱讀

什么是大數據采集和預處理

一般情況下，大數據處理的流程為：數據采集和預處理、數據存儲、數據分析和數據可視化。

發表于 02-15 14:22 ?4181次閱讀

PyTorch教程之數據預處理

電子發燒友網站提供《PyTorch教程之數據預處理.pdf》資料免費下載

發表于 06-02 14:11 ?0次下載

圖像預處理方法研究

圖像預處理的主要目的是消除圖像中無關的信息，恢復有用的真實信息，增強有關信息的可檢測性、最大限度地簡化數據，從而改進特征提取、圖像分割、匹配和識別的可靠性。一般的預處理流程為：1灰度化->2幾何變換->3圖像增強

發表于 09-20 09:35 ?585次閱讀

數據預處理和特征工程的常用功能

機器學習最基礎的5個流程，分別是數據獲取，數據預處理，特征工程，建模、測試和預測，上線與部署。

發表于 01-25 11:26 ?775次閱讀

機器學習中的數據預處理與特征工程

在機器學習的整個流程中，數據預處理與特征工程是兩個至關重要的步驟。它們直接決定了模型的輸入質量，進而影響模型的訓練效果和泛化能力。本文將從數據預處理和特征工程的基本概念出發，詳細探討這

發表于 07-09 15:57 ?488次閱讀

Minitab 數據清理與預處理技巧

Minitab是一款功能強大的統計分析和質量管理軟件，在數據分析過程中，數據清理與預處理是至關重要的環節。以下是一些在Minitab中進行數據清理與

發表于 12-02 16:06 ?416次閱讀

色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

搜索歷史

關于Dropout、BN及數據預處理方案

評論

機器學習為什么需要數據預處理

請教大家一下關于數據預處理

振動信號的預處理具體是什么意思？

Python數據預處理方法

數據探索與數據預處理

工業蒸汽量預測的數據預處理知識有哪些

C預處理與C語言基本數據類型

C語言的編譯預處理

Python數據清洗和預處理入門完整指南

什么是大數據采集和預處理

PyTorch教程之數據預處理

圖像預處理方法研究

數據預處理和特征工程的常用功能

機器學習中的數據預處理與特征工程

Minitab 數據清理與預處理技巧