色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

訓練深度神經網絡的感覺就像買彩票,“打了折”的深度學習

DPVg_AI_era ? 來源:lq ? 2019-05-10 09:09 ? 次閱讀

MIT CSAIL近期發表文章《彩票假設:尋找稀疏可訓練的神經網絡》認為神經網絡就像中彩票并不是每一張都有用,但應設法找到最能中獎的那個,因此可通過消除神經網絡結構件不必要的連接(也稱修剪)適應低功率設備,在一系列條件下不斷重復該過程,神經網絡可縮小10%到20%,但并不影響準確率,甚至比原始網絡跟快。

根據齊魯晚報報道,最近威海一彩民獲得了1219萬大獎,可以說是非常幸運了,看的一眾神經網絡“煉丹師”們羨慕不已。

訓練深度神經網絡的感覺就像買彩票

HackerNews網友opwieurposiu就吐槽,做DNN其實根本和買彩票沒什么區別:先是收集訓練數據,然后寫一個python腳本,支付大約1美元的GPU時間,跑一下。所不同的是,你盯著的不是輪盤的轉針,而是損失函數圖。

95%的時間都是廢的,但是每隔一段時間你就會得到很大的回報。中獎的時候,你可能覺得自己真是個天才!但復盤的時候又發現,你根本不知道為什么A方式有效而B就不行。這種感覺,跟壓彩票非常相似。

1美元的神經網絡很小了。為了更好地學習,神經網絡就必須非常大,需要海量數據集,整個訓練過程可能要持續好多天。投入100美元、1000美元、10000美元……的時候,你可能感受到的不僅僅是經費在燃燒了。

可是,如果說,實際上神經網絡不一定要那么大呢?

不修剪了,把沒用的部分直接砍掉!

MIT CSAIL的兩位研究人員Jonathan Frankle和Michael Carbin發表過一篇論文《彩票假設:尋找稀疏的、可訓練的神經網絡》剛剛被評為ICLR最佳論文。

論文指出,神經網絡剪枝技術可以在不影響精度的前提下,將訓練網絡的參數數量減少90%以上,降低存儲需求并提高推理的計算性能。然而,當前的經驗是,剪枝產生的稀疏架構從一開始就很難訓,然而同時也能提高了效率。

Frankle和Carbin發現,一個標準的修剪技巧可以自然的顯露出一個子網絡,初始化該網絡就能提高訓練效率。因此他們提出了 “彩票假設”(lottery ticket hypothesis):任何密集、隨機初始化的前饋網絡,都包含一個子網絡,以便在隔離訓練時可以在最多相同數量的訓練迭代中,匹配原始網絡的準確性。

然而,在成功的找到這個子網絡之前,必須經過多次訓練和“修剪”整個網絡。這就好像你去買了一大包彩票,然后從里面找出中獎的那個。神經網絡的好處是,所有的彩票都在你的手中,你總能找出來中獎的那個。

如果能確切的定位到原始網絡中哪個子網絡跟最終預測相關,那么也就用不著多次訓練和“修建”,直接砍掉無關的部分即可。這樣又進一步的降低了工作量,提高了效率。這就意味著,要通過一種技巧,使得每次買彩票必中!

彩票假設也可能遷移學習產生影響,在這種情況下,為圖像識別等任務訓練的網絡可以幫助完成不同的任務。

“打了折”的深度學習

感謝大家對神經網絡的過度熱捧,使得越來越多的人感嘆于神經網絡的神奇效果,但很少有人理解訓練一個神經網絡有多難。一來成本高昂,二來耗時漫長。所以研究人員必須做出許多讓步,在模型的大小、訓練耗時和最終表現等多個方面進行權衡。

包括今天兩位主角提出的“彩票假設”的驗證過程。他們首先采用一種通用的方法,用最低的“權重”“修剪”連接來消除受過訓練的網絡的不必要連接,使其適用于智能手機等低功耗設備。

“彩票假設”的關鍵創新,是發現經過網絡訓練之后,修剪連接可能根本就沒有必要。為了測試這個假設,他們嘗試再次訓練完全相同的網絡,但沒有修剪連接。

重要的是,他們將每個連接“重置”到訓練開始時分配的權重。這些初始權重對于幫助中獎來說至關重要,沒有它們,被修剪的網絡將無法學習。通過修剪越來越多的連接,最終確定了哪些是可以刪掉而不影響模型預測能力。

為了驗證這一假設,他們在各種條件下在許多不同的網絡上重復了這個過程數萬次。實驗結果顯示MNIST和CIFAR10的“中獎彩票”的規模,始終要小于幾個全連接架構和卷積前饋架構的10%-20%。這樣的話,不僅深度網絡在體積上打了折扣,成本、耗時都大打折扣。

下一步,該團隊計劃探索為什么某些子網特別擅長學習,以及有效找出這些子網的方法。

Google已經用Python實現了彩票假設算法,并在Github上開源:

https://github.com/google-research/lottery-ticket-hypothesis

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 神經網絡
    +關注

    關注

    42

    文章

    4779

    瀏覽量

    101052
  • 深度學習
    +關注

    關注

    73

    文章

    5512

    瀏覽量

    121419
  • 遷移學習
    +關注

    關注

    0

    文章

    74

    瀏覽量

    5575

原文標題:ICLR最佳論文:MIT科學家提出彩票假設,神經網路縮小10倍并不影響結果

文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    深度學習入門:簡單神經網絡的構建與實現

    深度學習中,神經網絡是核心模型。今天我們用 Python 和 NumPy 構建一個簡單的神經網絡神經網絡由多個
    的頭像 發表于 01-23 13:52 ?54次閱讀

    深度學習中的卷積神經網絡模型

    深度學習近年來在多個領域取得了顯著的進展,尤其是在圖像識別、語音識別和自然語言處理等方面。卷積神經網絡作為深度學習的一個分支,因其在圖像處理
    的頭像 發表于 11-15 14:52 ?393次閱讀

    FPGA在深度神經網絡中的應用

    隨著人工智能技術的飛速發展,深度神經網絡(Deep Neural Network, DNN)作為其核心算法之一,在圖像識別、語音識別、自然語言處理等領域取得了顯著成果。然而,傳統的深度神經網絡
    的頭像 發表于 07-24 10:42 ?773次閱讀

    殘差網絡深度神經網絡

    殘差網絡(Residual Network,通常簡稱為ResNet) 是深度神經網絡的一種 ,其獨特的結構設計在解決深層網絡訓練中的梯度消失
    的頭像 發表于 07-11 18:13 ?1164次閱讀

    pytorch中有神經網絡模型嗎

    當然,PyTorch是一個廣泛使用的深度學習框架,它提供了許多預訓練神經網絡模型。 PyTorch中的神經網絡模型 1. 引言
    的頭像 發表于 07-11 09:59 ?775次閱讀

    簡單認識深度神經網絡

    深度神經網絡(Deep Neural Networks, DNNs)作為機器學習領域中的一種重要技術,特別是在深度學習領域,已經取得了顯著的
    的頭像 發表于 07-10 18:23 ?1153次閱讀

    深度神經網絡概述及其應用

    深度神經網絡(Deep Neural Networks, DNNs)作為機器學習的一種復雜形式,是廣義人工神經網絡(Artificial Neural Networks, ANNs)的
    的頭像 發表于 07-04 16:08 ?1505次閱讀

    深度神經網絡與基本神經網絡的區別

    在探討深度神經網絡(Deep Neural Networks, DNNs)與基本神經網絡(通常指傳統神經網絡或前向神經網絡)的區別時,我們需
    的頭像 發表于 07-04 13:20 ?1034次閱讀

    深度神經網絡的設計方法

    深度神經網絡(Deep Neural Networks, DNNs)作為人工智能領域的重要技術之一,通過模擬人腦神經元之間的連接,實現了對復雜數據的自主學習和智能判斷。其設計方法不僅涉
    的頭像 發表于 07-04 13:13 ?526次閱讀

    bp神經網絡深度神經網絡

    BP神經網絡(Backpropagation Neural Network)是一種常見的前饋神經網絡,它使用反向傳播算法來訓練網絡。雖然BP神經網絡
    的頭像 發表于 07-03 10:14 ?929次閱讀

    卷積神經網絡訓練的是什么

    訓練過程以及應用場景。 1. 卷積神經網絡的基本概念 1.1 卷積神經網絡的定義 卷積神經網絡是一種前饋深度
    的頭像 發表于 07-03 09:15 ?483次閱讀

    深度學習與卷積神經網絡的應用

    隨著人工智能技術的飛速發展,深度學習和卷積神經網絡(Convolutional Neural Network, CNN)作為其中的重要分支,已經在多個領域取得了顯著的應用成果。從圖像識別、語音識別
    的頭像 發表于 07-02 18:19 ?1010次閱讀

    深度神經網絡模型cnn的基本概念、結構及原理

    深度神經網絡模型CNN(Convolutional Neural Network)是一種廣泛應用于圖像識別、視頻分析和自然語言處理等領域的深度學習模型。 引言
    的頭像 發表于 07-02 10:11 ?9894次閱讀

    深度神經網絡模型有哪些

    、Sigmoid或Tanh。 卷積神經網絡(Convolutional Neural Networks,CNN): 卷積神經網絡深度學習中最重
    的頭像 發表于 07-02 10:00 ?1591次閱讀

    利用深度循環神經網絡對心電圖降噪

    進行訓練。我們還研究了使用合成數據 集如何影響網絡性能。 我們建議使用深度循環去噪神經網絡(DRDNN) 對心電圖信號進行去噪。它們是一種深度
    發表于 05-15 14:42
    主站蜘蛛池模板: 亚洲精品无码成人AAA片 | 狠狠狠色丁香婷婷综合久久 | 亚洲蜜桃AV永久无码精品放毛片 | 国产成人精品s8p视频 | 秋霞网在线伦理免费 | 国产电影尺度 | 一本色道久久综合亚洲精品 | 范冰冰hdxxxx| 欧美 亚洲 另类 综合网 | 猫咪av永久最新域名 | 男女牲交全过程免费播放 | 自拍区偷拍亚洲视频 | 性春院 | 亚洲人成在线播放网站岛国 | 成人在线高清不卡免费视频 | 久久精品中文字幕 | 久久五月综合婷婷中文云霸高清 | 国产午夜视频 | 粉嫩无套白浆第一次jk | 午夜宅宅伦电影网中文字幕 | 最近免费中文字幕完整版HD | 小柔的性放荡羞辱日记 | 青青青视频在线 | 大胸女晃奶动态图 | 91精品国产色综合久久 | 免费精品美女久久久久久久久 | 成年人免费在线视频观看 | 日本亚洲电影 | 亚洲中文久久精品AV无码 | 色综合伊人色综合网站 | 男生射女生 | 正在播放黑人杂交派对卧槽 | 一区二区不卡在线视频 | 2021国产精品国产精华 | 免费在线观看的毛片 | 丰满老熟女白浆直流 | 夜色视频社区 | 99久久精品免费看国产免费 | 亚洲高清国产拍精品影院 | 中国少妇内射XXXX狠干 | 草草久久久无码国产专区全集观看 |