色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

首個關于深度神經網絡訓練相關的理論證明

倩倩 ? 來源:新智元 ? 2020-04-17 11:15 ? 次閱讀

谷歌AI最新發布的一篇論文給出了首個關于深度神經網絡訓練相關的理論證明,實驗觀察結果也為初步解釋梯度下降強于貝葉斯優化奠定了基礎。神經網絡的理論面紗,正逐步被揭開。

原來,神經網絡實際上跟線性模型并沒那么大不同!

谷歌AI的研究人員日前在arxiv貼出一篇文章,給出了首個神經網絡訓練相關的理論證明。

實驗中,他們將一個實際的神經網絡訓練過程與線性模型的訓練過程相比,發現兩者高度一致。這里用到的神經網絡是一個wide ResNet,包括ReLU層、卷積層、pooling層和batch normalization;線性模型是用ResNet關于其初始(隨機)參數的泰勒級數建立的網絡。

將神經網絡的訓練過程與線性模型的相比,兩者高度一致

在多個不同模型上試驗并排除量化誤差后,觀察結果依舊保持一致。由此,谷歌AI研究人員得出結論,當學習率比較小且網絡足夠寬(不必無限寬)的時候,神經網絡就是線性模型。

由此得出的一個推論是,使用梯度下降訓練的大型網絡集成能夠用一個高斯過程描述,而且在梯度下降的任意時間都能用完備形式化描述這個高斯過程。

這些觀察結果也構成了一個理論框架基礎,可以用來初步解釋長期以來困擾深度學習研究界的一個難題:梯度下降究竟在哪些情況下,具體是如何優于貝葉斯優化?

在訓練深度神經網絡被戲謔為“調參煉丹”的當下,這一發現猶如一道希望的強光,射進還被排除在“科學”之外的深度學習領域,激動人心。

相關論文:使用梯度下降訓練的任意深度的Wide神經網絡與線性模型的一致性

終于,調參不再是煉丹:首個關于神經網絡訓練的理論證明

基于深度神經網絡的機器學習模型在許多任務中取得了前所未有的性能。通常,這些模型被認為是復雜系統,其中許多類型的理論分析是很棘手的。此外,由于控制優化的通常是高維的非凸損失平面(non-convex loss surfaces),因此要描述這些模型的基于梯度的訓練動態機制具有挑戰性。

就像在物理科學中常見的那樣,研究這些系統的極限通常可以解釋這些難題。對于神經網絡來說,其中一個極限就是它的“無限寬度”(infinite width),指的是完全連接層中的隱藏單元數量,或卷積層中的通道數量。

在此限制下,網絡初始化時的輸出取自高斯過程(GP);此外,在使用平方損失進行精確貝葉斯訓練后,網絡輸出仍然由GP控制。除了理論上的簡單性,nfinite-width這一限制也具有實際意義,因為許多研究已經證明,更寬的網絡可以更好地進行泛化。

在這項工作中,我們探索了梯度下降下寬的神經網絡的學習動態機制(learning dynamics),并發現動態的權重空間描述變得非常簡單:隨著寬度變大,神經網絡可以有效地被關于其初始化參數的一階泰勒展開式(first-order Taylor expansion)取代。

對于這種誘導的線性模型,梯度下降的動態機制變得易于分析了。雖然線性化只在無限寬度限制下是精確的,但我們發現,即使是有限寬度的情況下,原始網絡的預測與線性化版本的預測仍然非常一致。這種一致性在不同的架構、優化方法和損失函數之間都存在。

對于平方損失(squared loss),精確的學習動態機制允許封閉形式的解決方案,這允許我們用GP來描述預測分布的演化。這一結果可以看作是“先采樣再優化”(sample-then-optimize)后驗采樣對深度神經網絡訓練的延伸。我們的經驗模擬證實,該結果準確地模擬了具有不同隨機初始化的有限寬度模型集合中預測的變化。

谷歌AI的研究人員表示,這篇論文的幾大主要貢獻包括:

首先,我們以 Jacot et al. (2018) 最近的研究成果為基礎,該成果描述了在infinite width 限制下,整個梯度下降訓練過程中網絡輸出的精確動態。他們的結果證明了參數空間的梯度下降對應于函數空間中關于新核的核梯度下降(kernel gradient descent),即Neural Tangent Kernel (NTK)。

我們工作的一個關鍵貢獻是證明了參數空間中的動態等價于所有網絡參數、權重和偏差集合中的仿射模型的訓練動態。無論損失函數的選擇如何,這個結果都成立。在平方損失的情況下, dynamics允許一個封閉形式的解作為時間函數。

無限寬(infinitely wide)神經網絡初始化時的輸出是高斯的,并且如Jacot et al.(2018)中所述,平方損失在整個訓練過程中始終是高斯的。我們推導了該GP的均值和協方差函數的顯式時間依賴表達式,并為結果提供了新的解釋。

具體來說,該解釋對梯度下降與參數的貝葉斯后驗采樣的不同機制提供了一種定量理解:雖然這兩種方法都取自GP,但梯度下降不會從任何概率模型的后驗生成樣本。

這一觀察結果與(Matthews et al.,2017)的“先采樣后優化”(sample-then-optimize)框架形成了對比,在該框架中,只訓練頂層權重,梯度下降從貝葉斯后驗采樣。

這些觀察構成了一個框架,用來分析長期存在的問題,如梯度下降是否、如何以及在何種情況下提供了相對于貝葉斯推理的具體好處。

正如Chizat & Bach (2018b)中論述的,這些理論結果可能過于簡單,無法適用于現實的神經網絡。但是,我們通過實證研究證明了該理論在finite-width設置中的適用性,發現它準確地描述了各種條件下的學習動態機制和后驗函數分布,包括一些實際的網絡架構,如Wide Residual Network(Zagoruyko & Komodakis, 2016)。

具體實驗:無限寬的神經網絡就是線性模型

線性化網絡(linearized network)

此處,我們將考慮線性化網絡的訓練動態,具體地說,就是用一階泰勒展開代替神經網絡的輸出:

值得注意的是,flint是兩項之和:第一項是網絡的初始輸出,在訓練過程中保持不變;第二項是在訓練過程中捕捉對初始值的變化。

使用這個線性化函數的梯度流的動態受到如下約束:

無限寬度限制產生高斯過程

當隱藏層的寬度接近無窮大時,中心極限定理(CLT)意味著初始化{f0(x)}x∈X時的輸出在分布上收斂于多元高斯分布。這一點可以用歸納法非正式的進行證明。

因此,隨機初始化的神經網絡對應于一類高斯過程(以下簡稱NNGP),將有利于神經網絡的完全貝葉斯處理。

梯度下降訓練中的高斯過程

如果我們在初始化之后凍結變量θ≤L,并且只優化θ≤L+1,那么原始網絡及其線性化是相同的。讓寬度趨于無窮,這個特殊的tangent kernel的概率將收斂于K。這是用于評估高斯過程后驗的“先采樣后優化”方法的實現。

我們對比了NNGP、NTK-GP和NN集合的預測分布,如下圖所示:

訓練神經網絡輸出的均值和方差的動態遵循線性化的分析動態機制

黑線表示來自100個訓練神經網絡集合的預測輸出分布的時間演變; 藍色區域表示整個訓練中輸出分布的分析預測;最后,紅色區域表示僅訓練頂層的預測,對應于NNGP。

受過訓練的網絡有3個隱藏層,寬度為8192。陰影區域和虛線表示平均值的2個標準偏差。

無限寬度網絡是線性化網絡

原始網絡的常微分方程(ODE)在一般情況下是不可解的。在積分函數梯度范數保持隨機有界為n1,n2,…,nL→∞的技術假設下:

值得注意的是,上面公式中的上界只是理論性的,是根據經驗觀察得到的:

訓練過程中Relative Frobenius范數的改變

在MSE設置中,我們可以對原始網絡的輸出與其線性化輸出之間的差異進行上限:

對于非常寬的網絡,我們可以用線性化動態機制來近似訓練動態機制。

而從網絡線性化中獲得的另一個見解是,動態機制等效于隨機特征法,其中,特征是模型相對于其權重的梯度。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 神經網絡
    +關注

    關注

    42

    文章

    4776

    瀏覽量

    100945
  • 梯度
    +關注

    關注

    0

    文章

    30

    瀏覽量

    10333
  • 機器學習
    +關注

    關注

    66

    文章

    8428

    瀏覽量

    132834
收藏 人收藏

    評論

    相關推薦

    LSTM神經網絡訓練數據準備方法

    LSTM(Long Short-Term Memory,長短期記憶)神經網絡訓練數據準備方法是一個關鍵步驟,它直接影響到模型的性能和效果。以下是一些關于LSTM神經網絡
    的頭像 發表于 11-13 10:08 ?746次閱讀

    FPGA在深度神經網絡中的應用

    隨著人工智能技術的飛速發展,深度神經網絡(Deep Neural Network, DNN)作為其核心算法之一,在圖像識別、語音識別、自然語言處理等領域取得了顯著成果。然而,傳統的深度神經網絡
    的頭像 發表于 07-24 10:42 ?746次閱讀

    脈沖神經網絡怎么訓練

    脈沖神經網絡(SNN, Spiking Neural Network)的訓練是一個復雜但充滿挑戰的過程,它模擬了生物神經元通過脈沖(或稱為尖峰)進行信息傳遞的方式。以下是對脈沖神經網絡
    的頭像 發表于 07-12 10:13 ?662次閱讀

    殘差網絡深度神經網絡

    殘差網絡(Residual Network,通常簡稱為ResNet) 是深度神經網絡的一種 ,其獨特的結構設計在解決深層網絡訓練中的梯度消失
    的頭像 發表于 07-11 18:13 ?1142次閱讀

    怎么對神經網絡重新訓練

    重新訓練神經網絡是一個復雜的過程,涉及到多個步驟和考慮因素。 引言 神經網絡是一種強大的機器學習模型,廣泛應用于圖像識別、自然語言處理、語音識別等領域。然而,隨著時間的推移,數據分布可能會
    的頭像 發表于 07-11 10:25 ?488次閱讀

    如何利用Matlab進行神經網絡訓練

    ,使得神經網絡的創建、訓練和仿真變得更加便捷。本文將詳細介紹如何利用Matlab進行神經網絡訓練,包括網絡創建、數據預處理、
    的頭像 發表于 07-08 18:26 ?1954次閱讀

    人工神經網絡模型訓練的基本原理

    人工神經網絡(Artificial Neural Networks,簡稱ANNs)是一種受生物神經網絡啟發而構建的數學模型,用于模擬人腦處理信息的方式。它在機器學習和深度學習領域具有廣泛的應用,包括
    的頭像 發表于 07-05 09:16 ?744次閱讀

    深度神經網絡與基本神經網絡的區別

    在探討深度神經網絡(Deep Neural Networks, DNNs)與基本神經網絡(通常指傳統神經網絡或前向神經網絡)的區別時,我們需
    的頭像 發表于 07-04 13:20 ?999次閱讀

    bp神經網絡深度神經網絡

    BP神經網絡(Backpropagation Neural Network)是一種常見的前饋神經網絡,它使用反向傳播算法來訓練網絡。雖然BP神經網絡
    的頭像 發表于 07-03 10:14 ?896次閱讀

    卷積神經網絡訓練的是什么

    訓練過程以及應用場景。 1. 卷積神經網絡的基本概念 1.1 卷積神經網絡的定義 卷積神經網絡是一種前饋深度學習模型,其核心思想是利用卷積
    的頭像 發表于 07-03 09:15 ?457次閱讀

    卷積神經網絡的原理是什么

    卷積神經網絡(Convolutional Neural Network,簡稱CNN)是一種深度學習模型,廣泛應用于圖像識別、語音識別、自然語言處理等領域。本文將詳細介紹卷積神經網絡的原理,包括其
    的頭像 發表于 07-02 14:44 ?717次閱讀

    卷積神經網絡的基本原理、結構及訓練過程

    卷積神經網絡(Convolutional Neural Network,簡稱CNN)是一種深度學習算法,廣泛應用于圖像識別、視頻分析、自然語言處理等領域。本文將詳細介紹卷積神經網絡的基本原理、結構
    的頭像 發表于 07-02 14:21 ?2806次閱讀

    深度神經網絡模型有哪些

    深度神經網絡(Deep Neural Networks,DNNs)是一類具有多個隱藏層的神經網絡,它們在許多領域取得了顯著的成功,如計算機視覺、自然語言處理、語音識別等。以下是一些常見的深度
    的頭像 發表于 07-02 10:00 ?1562次閱讀

    如何訓練和優化神經網絡

    神經網絡是人工智能領域的重要分支,廣泛應用于圖像識別、自然語言處理、語音識別等多個領域。然而,要使神經網絡在實際應用中取得良好效果,必須進行有效的訓練和優化。本文將從神經網絡
    的頭像 發表于 07-01 14:14 ?507次閱讀

    利用深度循環神經網絡對心電圖降噪

    進行訓練。我們還研究了使用合成數據 集如何影響網絡性能。 我們建議使用深度循環去噪神經網絡(DRDNN) 對心電圖信號進行去噪。它們是一種深度
    發表于 05-15 14:42
    主站蜘蛛池模板: 国产AV精品久久久毛片| 色AV色婷婷97人妻久久久| 青娱乐国产精品视频| 91精品国产免费入口| 毛片免费观看视频| 777ZYZ玖玖资源站最稳定网址| 极品网红液液酱粉嫩福利照子凌酱| 少妇系列之白嫩人妻| 失禁 调教 刺激 哭喊男男| 手机国产视频福利| 99视频免费在线| 含羞草传媒在线观看| 日本色呦呦| 99在线观看免费| 久久精品黄AA片一区二区三区| 无限资源在线观看播放| GOGOGO高清在线播放韩国| 久久亚洲精品AV无码四区| 亚洲精品成人a| 国产传媒18精品免费1区| 日本2021免费一二三四区| 5g在线视讯年龄确认海外禁止进入| 国产在线观看www| 午夜特级毛片| 国产精品久久久久久影院| 三级网址在线观看| 成人在线观看视频免费| 欧美激情精品久久久久| 在线国产三级| 久久精品国产清白在天天线| 亚洲欧美高清在线| 黄色网址在线看| 亚洲日韩中文字幕日本有码| 国产人妻人伦精品1国产| 无套暴躁白丝秘书| 国产精品自在拍在线播放| 小小水蜜桃免费影院| 国产一区二区三区乱码在线观看 | 日本孕妇大胆孕交| 99久久国产露脸精品国产麻豆 | 国产精品自在在线午夜蜜芽tv在线|