色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

關于Dropout、BN及數據預處理方案

電子設計 ? 來源:程序員大本營 ? 作者:datayx ? 2021-05-31 17:37 ? 次閱讀

一、隨機失活(Dropout)

具體做法:在訓練的時候,隨機失活的實現方法是讓神經元以超參數o4YBAF-cdnmAWpDBAAACU_DoSa0457.png的概率被激活或者被設置為 0。如下圖所示:

pIYBAF-cdnuAKYslAABDQ5yQB94073.jpg

Dropout 可以看作是 Bagging 的極限形式,每個模型都在當一種情況中訓練,同時模型的每個參數都經過與其他模型共享參數,從而高度正則化。在訓練過程中,隨機失活也可以被認為是對完整的神經網絡抽樣出一些子集,每次基于輸入數據只更新子網絡的參數(然而,數量巨大的子網絡們并不是相互獨立的,因為它們都共享參數)。在測試過程中不使用隨機失活,可以理解為是對數量巨大的子網絡們做了模型集成(model ensemble),以此來計算出一個平均的預測。

關于 Dropout 的 Motivation:一個是類似于性別在生物進化中的角色:物種為了生存往往會傾向于適應這種環境,環境突變則會導致物種難以做出及時反應,性別的出現可以繁衍出適應新環境的變種,有效的阻止過擬合,即避免環境改變時物種可能面臨的滅絕。還有一個就是正則化的思想,減少神經元之間復雜的共適應關系,減少權重使得網絡對丟失特定神經元連接的魯棒性提高。

這里強烈推薦看下論文原文。雖然是英文的,但是對于更深刻的理解還是有很大幫助的!

二、圖像數據的預處理

為什么要預處理:簡單的從二維來理解,首先,圖像數據是高度相關的,假設其分布如下圖 a 所示(簡化為 2 維)。由于初始化的時候,我們的參數一般都是 0 均值的,因此開始的擬合 o4YBAF-cdn2AUm5PAAAISG9lNi8513.png,基本過原點附近(因為 b 接近于零),如圖 b 紅色虛線。因此,網絡需要經過多次學習才能逐步達到如紫色實線的擬合,即收斂的比較慢。如果我們對輸入數據先作減均值操作,如圖 c,顯然可以加快學習。更進一步的,我們對數據再進行去相關操作,使得數據更加容易區分,這樣又會加快訓練,如圖 d。

pIYBAF-cdoCAGQkwAAAU0Fjltps385.jpg

下面介紹下一些基礎預處理方法:

歸一化處理

均值減法(Mean subtraction):它對數據中每個獨立特征減去平均值,從幾何上可以理解為在每個維度上都將數據云的中心都遷移到原點。(就是每個特征數據減去其相應特征的平均值)

歸一化(Normalization);先對數據做零中心化(zero-centered)處理,然后每個維度都除以其標準差。

pIYBAF-cdoKAHx1cAAAs6MzWcJQ190.jpg

(中間零中心化,右邊歸一化)

PCA 和白化(Whitening)

白化(Whitening):白化操作的輸入是特征基準上的數據,然后對每個維度除以其特征值來對數值范圍進行歸一化。該變換的幾何解釋是:如果數據服從多變量的高斯分布,那么經過白化后,數據的分布將會是一個均值為零,且協方差相等的矩陣

特征向量是按照特征值的大小排列的。我們可以利用這個性質來對數據降維,只要使用前面的小部分特征向量,丟棄掉那些包含的數據沒有方差的維度。這個操作也被稱為主成分分析( Principal Component Analysis)簡稱 PCA)降維

o4YBAF-cdoSAM91NAAAqrWV9zyE177.jpg

(中間是經過 PCA 操作的數據,右邊是白化)

需要注意的是:

對比與上面的中心化,與 pca 有點類似,但是不同的是,pca 把數據變換到了數據協方差矩陣的基準軸上(協方差矩陣變成對角陣),也就是說他是軸對稱的,但簡單的零中心化,它不是軸對稱的;還有 PCA 是一種降維的預處理,而零中心化并不是。

常見錯誤:任何預處理策略(比如數據均值)都只能在訓練集數據上進行計算,算法訓練完畢后再應用到驗證集或者測試集上。例如,如果先計算整個數據集圖像的平均值然后每張圖片都減去平均值,最后將整個數據集分成訓練 / 驗證 / 測試集,那么這個做法是錯誤的。應該怎么做呢?應該先分成訓練 / 驗證 / 測試集,只是從訓練集中求圖片平均值,然后各個集(訓練 / 驗證 / 測試集)中的圖像再減去這個平均值。

三、Batch Normalization

pIYBAF-cdoeAaDEsAACN5x16PK0221.png

原論文中,作者為了計算的穩定性,加了兩個參數將數據又還原回去了,這兩個參數也是需要訓練的。說白了,就是對每一層的數據都預處理一次。方便直觀感受,上張圖:

o4YBAF-cdomALAtFAABipDQJan0158.jpg

這個方法可以進一步加速收斂,因此學習率可以適當增大,加快訓練速度;過擬合現象可以得倒一定程度的緩解,所以可以不用 Dropout 或用較低的 Dropout,而且可以減小 L2 正則化系數,訓練速度又再一次得到了提升。即 Batch Normalization 可以降低我們對正則化的依賴程度。

還有要注意的是,Batch Normalization 和 pca 加白化有點類似,結果都是可以零均值加上單位方差,可以使得數據弱相關,但是在深度神經網絡中,我們一般不要 pca 加白化,原因就是白化需要計算整個訓練集的協方差矩陣、求逆等操作,計算量很大,此外,反向傳播時,白化操作不一定可導。最后,再次強烈直接看 BN 的相關論文,有很多細節值得一看!

編輯:hfy

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 神經網絡
    +關注

    關注

    42

    文章

    4774

    瀏覽量

    100904
收藏 人收藏

    評論

    相關推薦

    機器學習為什么需要數據預處理

    數據預處理是準備原始數據并使其適合機器學習模型的過程。這是創建機器學習模型的第一步也是關鍵的一步。 創建機器學習項目時,我們并不總是遇到干凈且格式化的數據。在對
    的頭像 發表于 08-24 09:20 ?1940次閱讀
    機器學習為什么需要<b class='flag-5'>數據</b><b class='flag-5'>預處理</b>

    請教大家一下關于數據預處理

    一般將獲得的加速度數據得進行數據預處理,常見的預處理方法有去掉趨勢相、還得將離散的數值積分獲得振幅。請問有做過的沒,請教一下。
    發表于 06-07 11:16

    振動信號的預處理具體是什么意思?

    振動信號的處理預處理之間有什么區別?我用labview對振動信號進行預處理處理嗎?
    發表于 10-08 15:33

    Python數據預處理方法

    機器學習-Python實踐Day3(特征工程--數據預處理2)
    發表于 06-03 15:55

    數據探索與數據預處理

    目錄1數據探索與數據預處理21.1 賽題回顧21.2 數據探索性分析與異常值處理21.3 相關性分析52特征工程82.1 光伏發電領域特征8
    發表于 07-12 08:37

    工業蒸汽量預測的數據預處理知識有哪些

    工業蒸汽量預測的數據預處理知識有哪些?工業蒸汽量預測的特征工程有哪些?
    發表于 10-22 06:32

    C預處理與C語言基本數據類型

    嵌入式系統設計師學習筆記二十九:嵌入式程序設計④——C預處理預處理指令表:(編碼規范:GB/T 28169-2011)關于宏定義 #denfine 詳解可點擊連接查看博主的另一篇文章 預定義宏
    發表于 12-21 08:29

    C語言的編譯預處理

    在將一個C源程序轉換為可執行程序的過程中, 編譯預處理是最初的步驟. 這一步驟是由預處理器(preprocessor)來完成的. 在源流程序被編譯器處理之前, 預處理器首先對源程序中的
    發表于 09-20 18:17 ?47次下載

    Python數據清洗和預處理入門完整指南

    凡事預則立,不預則廢,訓練機器學習模型也是如此。數據清洗和預處理是模型訓練之前的必要過程,否則模型可能就「廢」了。本文是一個初學者指南,將帶你領略如何在任意的數據集上,針對任意一個機器學習模型,完成
    的頭像 發表于 12-21 13:50 ?894次閱讀

    什么是大數據采集和預處理

    一般情況下,大數據處理的流程為:數據采集和預處理數據存儲、數據分析和數據可視化。
    的頭像 發表于 02-15 14:22 ?4181次閱讀

    PyTorch教程之數據預處理

    電子發燒友網站提供《PyTorch教程之數據預處理.pdf》資料免費下載
    發表于 06-02 14:11 ?0次下載
    PyTorch教程之<b class='flag-5'>數據</b><b class='flag-5'>預處理</b>

    圖像預處理方法研究

    圖像預處理的主要目的是消除圖像中無關的信息,恢復有用的真實信息,增強有關信息的可檢測性、最大限度地簡化數據,從而改進特征提取、圖像分割、匹配和識別的可靠性。一般的預處理流程為:1灰度化->2幾何變換->3圖像增強
    發表于 09-20 09:35 ?585次閱讀

    數據預處理和特征工程的常用功能

    機器學習最基礎的5個流程,分別是數據獲取,數據預處理,特征工程,建模、測試和預測,上線與部署。
    的頭像 發表于 01-25 11:26 ?775次閱讀

    機器學習中的數據預處理與特征工程

    在機器學習的整個流程中,數據預處理與特征工程是兩個至關重要的步驟。它們直接決定了模型的輸入質量,進而影響模型的訓練效果和泛化能力。本文將從數據預處理和特征工程的基本概念出發,詳細探討這
    的頭像 發表于 07-09 15:57 ?488次閱讀

    Minitab 數據清理與預處理技巧

    Minitab是一款功能強大的統計分析和質量管理軟件,在數據分析過程中,數據清理與預處理是至關重要的環節。以下是一些在Minitab中進行數據清理與
    的頭像 發表于 12-02 16:06 ?416次閱讀
    主站蜘蛛池模板: 攻把受做得合不拢腿play| 亚洲一区综合图区| 小雪奶水涨翁工帮吸的推荐语录| 私人玩物黑丝| 受被攻做到腿发颤高h文| [高清无码] 波多野结衣| 日本妈妈在线观看中文字幕| 99C视频色欲在线| 成人免费视频网站www| 免费成年人在线视频| 伊人久久亚洲精品一区| 97色伦图区97色伦综合图区| 久久AAAA片一区二区| 亲胸吻胸添奶头GIF动态图免费| 最近2019中文字幕免费| 顶级欧美不卡一区二区三区| 皮皮色狼网| 永久adc视频年龄确认| 久久国产36精品色熟妇| 中文字幕在线播放| 男人插女人动态| 亚洲乱妇88网| 电影日本妻子| 视频一区二区三区蜜桃麻豆| 岛国片免费看| 小s现场抛胸挤奶| 精品三级在线观看| 中国拍三a级的明星女| 男人和女人全黄一级毛片| 扒开老师粉嫩的泬10P| 撕烂衣服扒开胸罩揉爆胸| 国产专区_爽死777| 在线播放免费人成毛片视频| 女人高潮久久久叫人喷水| 边做边爱播放3免费观看| 九九热免费在线观看| 中文字幕福利视频在线一区| 欧美日韩另类在线观看视频| 丰满的女友1在线观看| 欧美日韩另类在线专区| 国产精品久久国产三级国不卡顿|