色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
电子发烧友
开通电子发烧友VIP会员 尊享10大特权
海量资料免费下载
精品直播免费看
优质内容免费畅学
课程9折专享价
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

深度學習的雙下降現象解答

汽車玩家 ? 來源: AI公園 ? 作者:ronghuaiyang ? 2020-01-29 17:16 ? 次閱讀

作者:Preetum Nakkiran,Gal Kaplun,Yamini Bansal,Tristan Yang,Boaz Barak,Ilya Sutskever

編譯:ronghuaiyang

導讀

深度學習中的雙下降現象,可能大家也遇到過,但是沒有深究,OpenAI這里給出了他們的解答。

我們展示了 CNN,ResNet 以及 transformers 中的雙下降現象,隨著模型的尺寸,數據集的大小以及訓練時間的增加,performance 先提升,然后變差,然后再次提升。這種效果通常可以通過仔細的正則化來避免。雖然這種行為似乎是相當普遍的,但我們還沒有完全理解它為什么會發生,并把對這種現象的進一步研究作為一個重要的研究方向。

深度學習的雙下降現象解答

論文:https://arxiv.org/abs/1912.02292

包括 CNNs、ResNets、transformer 在內的許多現代深度學習模型,在不使用 early stopping 或正則化時,都表現出之前觀察到的雙下降現象。峰值發生在一個可以預見的“特殊的時刻”,此時模型剛好可以去擬合訓練集。當我們增加神經網絡參數的數量,剛開始的時候,測試誤差減少,然后會增加,而且,模型開始能夠擬合訓練集,進行了第二次下降。

傳統統計學家認為“模型越大越糟”的傳統觀點,以及“模型越大越好”的現代機器學習范式,都沒有得到支持。我們發現雙下降也發生在訓練過程中。令人驚訝的是,我們發現這些現象會導致數據越多效果越差,此時在更大的訓練集上訓練一個深層網絡的效果實際上更差。

模型的雙下降

1. 在一段時間內,模型越大效果越差。

深度學習的雙下降現象解答

模型的雙下降現象會導致對更多數據的訓練效果越差。在上面的圖中,測試誤差的峰值出現在插值閾值附近,此時模型剛好足夠大到能擬合訓練集。

在我們觀察到的所有情況下,影響插值閾值的變化(如改變優化算法、訓練樣本數量或標簽噪聲量)也會相應地影響測試誤差峰值的位置。在添加標簽噪聲的情況下,雙下降現象最為突出,如果沒有它,峰值會更小,很容易被忽略。添加標簽噪聲會放大這種普遍的行為,讓我們可以很容易地進行研究。

樣本的非單調性

2. 在一段時間內,樣本越多效果越差。

深度學習的雙下降現象解答

上面的圖顯示了在沒有添加標簽噪聲的情況下,在語言翻譯任務訓練的 transformers。正如預期的那樣,增加樣本數量會使曲線向下移動,從而降低測試誤差。然而,由于更多的樣本需要更大的模型來擬合,增加樣本的數量也會使插值閾值(以及測試誤差的峰值)向右移動。對于中等大小的模型(紅色箭頭),這兩個效果結合在一起,我們可以看到在 4.5 倍的樣本上進行訓練實際上會影響測試性能。

訓練 epoch 的雙下降

3. 在一段時間內,訓練時間越長,過擬合情況就越嚴重。

深度學習的雙下降現象解答

上面的圖顯示了測試和訓練誤差與模型大小和優化步驟數量的關系。對于給定數量的優化步驟(固定 y 坐標),測試和訓練誤差表現為隨著模型的大小出現了雙下降。對于給定的模型尺寸(固定的 x 坐標),隨著訓練的進行,測試和訓練誤差不斷地減小、增大、再減小,我們把這種現象稱為 epoch-wise 的雙下降。

一般情況下,當模型剛好能夠擬合訓練集時,會出現測試誤差的峰值

我們的直覺是,對于插值閾值處的模型,實際上只有一個模型正好擬合了數據集,而強迫它擬合即使是稍微有一點噪聲或錯誤的標簽也會破壞它的全局結構。也就是說,沒有既能在插值閾值處擬合訓練集又能在測試集上表現良好的“好模型”。然而,在參數化的情況下,有許多模型可以擬合訓練集,并且存在這樣的好模型。此外,隨機梯度下降法(SGD)的隱式偏差導致了這樣好模型出現,其原因我們還不清楚。

我們把對深層神經網絡的雙下降機制仍的充分認識作為一個重要的開放性問題。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 深度學習
    +關注

    關注

    73

    文章

    5546

    瀏覽量

    122280
  • cnn
    cnn
    +關注

    關注

    3

    文章

    354

    瀏覽量

    22563
收藏 0人收藏

    評論

    相關推薦

    Nanopi深度學習之路(1)深度學習框架分析

    學習,也就是現在最流行的深度學習領域,關注論壇的朋友應該看到了,開發板試用活動中有【NanoPi K1 Plus試用】的申請,介紹中NanopiK1plus的高大上優點之一就是“可運行深度
    發表于 06-04 22:32

    深度學習存在哪些問題?

    深度學習常用模型有哪些?深度學習常用軟件工具及平臺有哪些?深度學習存在哪些問題?
    發表于 10-14 08:20

    深度學習模型是如何創建的?

    具有深度學習模型的嵌入式系統應用程序帶來了巨大的好處。深度學習嵌入式系統已經改變了各個行業的企業和組織。深度
    發表于 10-27 06:34

    什么是深度學習?使用FPGA進行深度學習的好處?

    什么是深度學習為了解釋深度學習,有必要了解神經網絡。神經網絡是一種模擬人腦的神經元和神經網絡的計算模型。作為具體示例,讓我們考慮一個輸入圖像并識別圖像中對象類別的示例。這個例子對應機器
    發表于 02-17 16:56

    電磁現象的普遍規律_電動力學習題解答

    電磁現象的普遍規律_電動力學習題解答
    發表于 01-05 16:39 ?0次下載

    如何估算深度神經網絡的最優學習率(附代碼教程)

    深度學習課程中學習相關知識。目前這門課程還沒有對公眾開放,但是現在網絡上有去年的版本。 學習率如何影響訓練? 深度
    發表于 12-07 11:05 ?2511次閱讀

    深度學習領域Facebook等巨頭在2017都做了什么

    過去一年間,谷歌、Facebook、微軟等巨頭加持下,深度學習框架格局發生了極大改變,深度學習領域Facebook等巨頭在2017都做了什么,我們一一來
    發表于 01-02 10:19 ?2918次閱讀

    深度學習和機器學習深度的不同之處 淺談深度學習的訓練和調參

    近年來,深度學習作為機器學習中比較火的一種方法出現在我們面前,但是和非深度學習的機器學習相比(我
    發表于 05-02 10:30 ?4442次閱讀

    深度學習是什么?了解深度學習難嗎?讓你快速了解深度學習的視頻講解

    深度學習是什么?了解深度學習難嗎?讓你快速了解深度學習的視頻講解本文檔視頻讓你4分鐘快速了解
    發表于 08-23 14:36 ?16次下載

    深度強化學習已經達到了盡頭?

    不可否認,深度學習的熱度已經大大下降,贊美深度學習作為AI終極算法的推文少得多了,而且論文正在變得不那么“革命”,現在大家換了個詞,叫:進化
    的頭像 發表于 04-29 08:56 ?3484次閱讀

    讀懂深度學習,走進“深度學習+”階段

    人工智能的概念在1956年就被提出,如今終于走入現實,離不開一種名為“深度學習”的技術。深度學習的運作模式,如同一場傳話游戲。給神經網絡輸入數據,對數據的特征進行描述,在神經網絡中層層
    的頭像 發表于 01-14 23:34 ?1051次閱讀
    讀懂<b class='flag-5'>深度</b><b class='flag-5'>學習</b>,走進“<b class='flag-5'>深度</b><b class='flag-5'>學習</b>+”階段

    深度學習算法簡介 深度學習算法是什么 深度學習算法有哪些

    深度學習算法簡介 深度學習算法是什么?深度學習算法有哪些?? 作為一種現代化、前沿化的技術,
    的頭像 發表于 08-17 16:02 ?9536次閱讀

    什么是深度學習算法?深度學習算法的應用

    什么是深度學習算法?深度學習算法的應用 深度學習算法被認為是人工智能的核心,它是一種模仿人類大腦
    的頭像 發表于 08-17 16:03 ?2456次閱讀

    深度學習框架是什么?深度學習框架有哪些?

    深度學習框架是什么?深度學習框架有哪些?? 深度學習框架是一種軟件工具,它可以幫助開發者輕松快速
    的頭像 發表于 08-17 16:03 ?3200次閱讀

    深度學習框架和深度學習算法教程

    深度學習框架和深度學習算法教程 深度學習是機器學習
    的頭像 發表于 08-17 16:11 ?1285次閱讀
    主站蜘蛛池模板: 门鱼电影完整版免费版 | 丝袜美女被艹 | 精品国产乱码久久久久久上海公司 | 久久精品一本到99热 | 99视频导航 | 天天操天天干天天透 | 久久www成人看片 | 你的欲梦裸身在线播放 | 偷尝禁果H1V1幸运的山熊 | 四虎国产精品免费观看视频 | 日韩做A爰片久久毛片A片毛茸茸 | 美国兽皇zoo在线播放 | 乱h好大噗嗤噗嗤烂了 | xxx日本黄色 | 亚洲精品天堂无码中文字幕影院 | 97se se| 国产精品一区二区免费 | 一个人免费视频在线观看高清版 | 日本一二三区在线视频 | 中文字幕一区二区三区在线不卡 | 广西美女色炮150p图 | ai换脸在线全集观看 | 亚洲成年人影院 | 奶大B紧17p| 日日噜噜噜夜夜爽爽狠狠图片 | 亚洲精品午夜VA久久成人 | 一区二区三区国产 | 国产亚洲精品视频在线网 | wwwzzz日本| 狠狠色噜噜狠狠狠狠米奇777 | 亚洲地址一地址二地址三 | AAA级精品无码久久久国片 | 亚洲人人为我我为人人 | 亚洲乱码中文字幕久久孕妇黑人 | 美女被男人撕衣舔胸 | 99精品视频在线观看re | 祺鑫WRITEAS流出来了 | 娇妻中日久久持久久 | 国产高清亚洲日韩字幕一区 | 日日噜噜夜夜狠狠视频 | 翁公与小莹在客厅激情 |

    電子發燒友

    中國電子工程師最喜歡的網站

    • 2931785位工程師會員交流學習
    • 獲取您個性化的科技前沿技術信息
    • 參加活動獲取豐厚的禮品