色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
电子发烧友
开通电子发烧友VIP会员 尊享10大特权
海量资料免费下载
精品直播免费看
优质内容免费畅学
课程9折专享价
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

一種WS新方法,那它可以超越GN、BN嗎?

電子工程師 ? 來源:lp ? 2019-04-08 14:36 ? 次閱讀

【導語】繼 BN、GN 方法提出后,大家還在不斷提出能加速神經網絡訓練與收斂的方法,而約翰霍普金斯大學幾位研究者在論文《Weight Standardization》中提出一種 WS 新方法,那它可以超越 GN、BN 嗎?且看本文對研究的初解讀,希望能給大家一點新思考!

批歸一化(Batch Normalization)是深度學習發展中的一項里程碑技術,它讓各種網絡都能夠進行訓練。然而,沿著批次維度的歸一化也帶來了新問題:當統計不準確導致批次的大小越來越小時,BN 的錯誤會急劇增加。在訓練更大的網絡,以及執行將特征遷移至包括探測、分割、視頻在內的計算機視覺任務時,BN 的使用就受到了限制,因為它們受限于內存消耗而只能使用小批次。

一年前,FAIR 團隊的吳育昕和何愷明提出了組歸一化(Group Normalization,簡稱 GN)的方法,GN 將信號通道分成一個個組別,并在每個組別內計算歸一化的均值和方差,以進行歸一化處理。GN 的計算與批量大小無關,而且在批次大小大幅變化時,精度依然穩定。

而今天 AI科技大本營要與大家探討的是近日上傳到 arXiv 上的一篇論文《Weight Standardization》,由來自約翰霍普金斯大學的幾位研究者發表。作者在文中提出了一種權重標準化(Weight Standardization, WS)的方法,它可以用于加速深度網絡的訓練,并稱穩定優于其它的歸一化方法,而這也引起了大家的好奇與討論,這個 WS 的方法是否真的可以超越 GN 與 BN?

接下來,AI科技大本營通過對 WS 方法的介紹、主要貢獻與實驗結果的展示為大家介紹這個在歸一化方法之上的權重標準化的工作。希望能引發關注此研究方向的小伙伴們一些思考與看法!

通常來說,在使用 Batch Normalization(以下將簡稱 BN)時,采用小批次很難訓練一個網絡,而對于不使用批次的優化方法來說,效果很難媲美采用大批次BN時的訓練結果。當使用 Group Normalization(以下將簡稱 GN),且 batch size 大小為 1 時,僅需要多寫兩行代碼加入權重標準化方法,就能比肩甚至超越大批次BN時的訓練效果。在微批次(micro-batch)的訓練中,WS 的方法能穩定優于其它的歸一化方法。與其他關注于激活值的歸一化方法不同,WS 關注于權重的平滑效果。該方法的實現就是標準化卷積層的權重值,論文通過實驗展示了這樣的操作能夠減少損失值和梯度值的 Lipschitz 常數。并且在多個計算機視覺任務,如目標檢測、圖像分類、實例分割等,驗證了該方法的有效性。

在許多的視覺任務中,大部分深度網絡通常都會使用 BN 層去加速訓練和幫助模型更好收斂。雖然 BN 層非常實用,但從研究者的角度看,依然有一些非常顯眼的缺點。比如(1)我們非常缺乏對于 BN 層成功原因的理解;(2)BN 層僅在 batch size 足夠大時才有明顯的效果,因此不能用在微批次的訓練中。雖然現在已經有專門針對微批次訓練設計的歸一化方法(GN),但圖 1 所示,它很難在大批次訓練時媲美 BN 的效果。

圖1:在Imagenet和Coco上,GN,BN,GN+WS三種方法的實驗結果對比

現在關于 BN 有效的一種解釋是它能緩解內部協變量轉移(Internal Covariate Shift, ICS)的問題。但是有關研究[參考文獻 1]也指出 BN 與 ICS 減少的問題無關,相反,BN 層使得相應優化問題的曲線更平衡。因此,根據[參考文獻 1]的結論,旨在提出一種歸一化技術可以進一步平滑該曲線。

與其他關注于激活值的歸一化方法不同,WS 關注于權重的平滑效果。本文一共有三個貢獻:

理論上,我們證明 WS 方法可以減少損失和梯度的 Lipsschitz 常數。因此,它能平滑損失曲線并提升訓練效果。

圖1 的實驗結果顯示,對于能夠使用大批次的任務(如 Imagenet 分類),在使用 batch size為 1 的 GN+WS 時,其效果能夠比肩甚至超過大批次下的 BN 效果。

圖1 的實驗結果顯示,對于僅能使用微批次訓練的任務(如Coco),GN+WS 可以大幅度的提升效果。

WS方法

圖2:歸一化和WS方法的比較

給定一個沒有偏置項的卷積層表達式如下圖所示:

其中 W^ 卷積層的權重,* 是卷積運算。將圖2 所示作為一個例子,WS方法不會直接在原始權重上進行優化,而是采用另一個函數 W^=WS(W)來表示原始權重 W^。然后使用 SGD 算法來更新 W。

與 BN 類似,WS 方法在卷積層中分別控制輸出權重的第一和第二階段,許多權重初始化方法也是這樣做的。不過不同的是,WS 是以可微的方式在反向傳播過程中來標準化梯度。但是 WS 方法沒有對 W^ 進行仿射轉化,因為作者認為 BN 或者 GN 還會對卷積層進行再一次的歸一化。

WS規范化梯度

下圖是在網絡前饋和反饋時,進行權重梯度標準化的計算表達式。

此時,在 feed-forwarding 過程中,計算方法變為:

banck-propagation 中計算方法為:

當然,論文的第二部分還通過公式推導了 WS 可以讓損失曲線更加平滑,從而加速訓練,提升效果的原因。而為了說明 WS 的有效性,作者在多個任務上進行了多個對比實驗。

第一個實驗:在Imagenet上的圖像分類

上面表格展示了基于 ResNet50 和 ResNet101 網絡結構的圖像分類錯誤率。除了帶 BN 層的網絡使用大的 batch size,其它的歸一化方法均設置 batch size 為 1。可以看出使用 WS 方法能夠在 batch size 為 1 的情況下,略好于大批次 BN 的網絡結果。在論文中,作者還做了更多與現有歸一化方法對比的實驗,來證明WS的效果。

第二個實驗:在Coco上的目標檢測和分割

上述表格給出了檢測框回歸和實例分割的結果。在用的是 Mask R-CNN 框架,RXnet 的 backbone,與圖像分類有相似的結果。值得注意的是,當網絡變得更復雜時,僅使用 GN 很難提升性能,而加上 WS 后,就可以訓練出更好的結果。這說明 WS 的歸一化技術可以幫助更輕松的訓練深層次網絡,而不用擔心內存和 batch size 的問題。

第三個實驗:在 Something-Something 上的視頻動作識別

在這項任務中,采用 TSM 作為框架,ResNet50 作為 backbone,從表格中可以發現,不管是 BN 是 GN,加上了 WS 方法后,效果均有了提升。

第四個實驗:在 PASCAL VOC 上的語義分割

在 PASCAL VOC2012 數據集上的實驗,采用 DeepLabv3 作為基準模型,Resnet101 為 backbone。實驗結果證明,WS 方法針對密集圖像預測任務,也能有穩定提升性能的表現。

第五個實驗:在ModelNet40上的點云分類

采用 DGCNN 作為基準模型,實驗結果也顯示了 WS 方法能夠有效的提升模型性能。

以上五個實驗,每個實驗的設置參數在論文中均有詳細的介紹。從實驗方面證明了 WS 方法可以顯著的提高性能。尤其是在某些情況下, GN 和 BN 可能無法達到很好的效果,通過結合 WS 的方法可以取得加速模型的訓練與收斂;此外,WS 的歸一化技術還可以幫助更輕松的訓練深層次網絡,而不用擔心內存和 batch size 的問題。

關于研究介紹到這里后,對權重標準化這個方法,你是怎么看的?是否可以超越 GN、BN 呢?歡迎大家發表自己的看法!

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 算法
    +關注

    關注

    23

    文章

    4666

    瀏覽量

    94162
  • 梯度
    +關注

    關注

    0

    文章

    30

    瀏覽量

    10422
  • 深度學習
    +關注

    關注

    73

    文章

    5533

    瀏覽量

    122183

原文標題:何愷明的GN之后,權重標準化新方法能超越GN、BN嗎? | 技術頭條

文章出處:【微信號:rgznai100,微信公眾號:rgznai100】歡迎添加關注!文章轉載請注明出處。

收藏 0人收藏

    評論

    相關推薦

    一種標定陀螺儀的新方法

    一種標定陀螺儀的新方法
    發表于 08-17 12:17

    一種在金上生成硫醇封端的SAM的新方法

    一種在金上生成硫醇封端的SAM的新方法 - 應用簡報
    發表于 10-30 11:05

    一種求解非線性約束優化全局最優的新方法

    本文提出了一種求解非線性約束優化的全局最優的新方法—它是基于利用非線性互補函數和不斷增加新的約束來重復解庫恩-塔克條件的非線性方程組的新方法。因為庫恩-塔克條
    發表于 08-11 10:53 ?16次下載

    一種級數混合運算產生SPWM波新方法

    一種級數混合運算產生SPWM波新方法_耿衛東
    發表于 01-07 18:39 ?0次下載

    一種求解動態及不確定性優化問題的新方法

    一種求解動態及不確定性優化問題的新方法_劉曉
    發表于 01-07 18:56 ?0次下載

    一種設計同步時序邏輯電路的新方法

    一種設計同步時序邏輯電路的新方法
    發表于 02-07 15:05 ?29次下載

    PC機與單片機串行通信的一種新方法

    PC機與單片機串行通信的一種新方法
    發表于 09-04 14:20 ?4次下載
    PC機與單片機串行通信的<b class='flag-5'>一種</b><b class='flag-5'>新方法</b>

    目前微通道面臨的限制,突破硅技術的一種新方法

    有用。Yuan說道,“我們介紹了一種以纖維方式制作微流控裝置的新方法,該方法與傳統基于芯片的形式相比具有諸多優勢。”
    的頭像 發表于 12-18 15:01 ?4567次閱讀

    一種精確測量儲能成本的新方法:LCUS

    儲能成本關乎行業發展前景,但其測算方法其實非常復雜,國外家能源公司提出了一種儲能成本精確測算的新方法——Levelized Cost of Using Storage(LCUS)。
    發表于 04-06 08:40 ?1636次閱讀

    一種新方法它可以讓用戶查看細菌是否會對抗生素有響應

    據麥姆斯咨詢報道,埃克塞特大學(University of Exeter)的科學家們開發出一種新方法它可以讓用戶查看細菌是否會對抗生素有響應。該研究目前還處于早期開發階段,研究團隊希望有朝
    的頭像 發表于 07-08 09:14 ?1803次閱讀

    一種復制和粘貼URL的新方法

    它也存在于瀏覽器中,Microsoft Edge也不例外。但是,雷蒙德(Redmond)的用戶啟用了一種復制和粘貼URL的新方法,該方法有些簡單,但并非所有用戶都知道如何利用它。這是最合乎邏輯的,因為在瀏覽器中處理地址的
    的頭像 發表于 12-21 16:55 ?4141次閱讀

    一種改善微波模塊增益指標溫度特性的新方法

    電子發燒友網站提供《一種改善微波模塊增益指標溫度特性的新方法.pdf》資料免費下載
    發表于 10-25 10:05 ?0次下載
    <b class='flag-5'>一種</b>改善微波模塊增益指標溫度特性的<b class='flag-5'>新方法</b>

    一種產生激光脈沖的新方法

    英國和韓國的科學家提出了一種產生激光脈沖的新方法,其功率是現有激光脈沖的1000多倍。
    的頭像 發表于 11-20 16:56 ?717次閱讀
    <b class='flag-5'>一種</b>產生激光脈沖的<b class='flag-5'>新方法</b>

    一種產生激光脈沖新方法

    等離子體中脈沖壓縮的概念 英國和韓國的科學家提出了一種產生激光脈沖的新方法,其功率是現有激光脈沖的1000多倍。 科學家們使用計算機模擬聯合研究,展示了一種壓縮光的新方法,以充分提高光
    的頭像 發表于 12-07 06:32 ?646次閱讀
    <b class='flag-5'>一種</b>產生激光脈沖<b class='flag-5'>新方法</b>

    一種無透鏡成像的新方法

    使用OAM-HHG EUV光束對高度周期性結構進行成像的EUV聚光顯微鏡 為了研究微電子或光子元件中的納米級圖案,一種基于無透鏡成像的新方法可以實現近乎完美的高分辨率顯微鏡。 層析成像是一種
    的頭像 發表于 07-19 06:20 ?587次閱讀
    <b class='flag-5'>一種</b>無透鏡成像的<b class='flag-5'>新方法</b>
    主站蜘蛛池模板: 色婷婷综合久久久久中文一区二区 | 国产精品嫩草影院一区二区三区 | 天天看高清影视在线18 | 毛片免费观看的视频 | 亚洲熟女片嫩草影院 | 成人免费网址在线 | 国产精品久久久久一区二区三区 | 纵欲(高H) | 亚洲精品久久久无码一区二区 | 国产欧美无码亚洲 | 日本无码专区亚洲麻豆 | 一个人免费观看在线视频播放 | 99精品免费在线观看 | 国精产品一区一区三区M | 久久777国产线看观看精品卜 | 成人在线视频国产 | 亚洲一卡久久4卡5卡6卡7卡 | 日韩欧美 亚洲视频 | 秋霞伦理机在线看片 | 亚洲精品在线播放视频 | 亚洲国产剧情中文视频在线 | 闺蜜撬开我的腿用黄瓜折磨我 | 短篇合集纯肉高H深陷骚 | 极品 女神校花 露脸91 | 欧美激情视频在线观看一区二区三区 | YELLOW在线观看高清视频免费 | 偷偷鲁青春草原视频分类 | 九九热在线视频观看这里只有精品 | 激情午夜307| 人妻插B视频一区二区三区 人妻 中文无码 中出 | 日韩人妻无码精品-专区 | 柏木舞子在线 | 亚洲成人免费在线观看 | 国产精品一区第二页 | 美女搜查官被高难度黑人在线播放 | 欧美精品一区二区三区视频 | 天天久久狠狠色综合 | 亚洲高清中文字幕免费 | 国产永久免费视频 | 99pao成人国产永久免费视频 | 久久久GOGO无码啪啪艺术 |

    電子發燒友

    中國電子工程師最喜歡的網站

    • 2931785位工程師會員交流學習
    • 獲取您個性化的科技前沿技術信息
    • 參加活動獲取豐厚的禮品