色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

一文解析網絡壓縮算法的原理實現及結果

454398 ? 來源:AI加速微信公眾號 ? 作者:AI加速微信公眾號 ? 2020-11-14 10:51 ? 次閱讀

引言

網絡壓縮在AI加速中可以說起到“四兩撥千斤”的作用,網絡參數的減小不僅僅降低了存儲和帶寬,而且使計算邏輯簡單,降低了LUT資源。從本篇開始,我們就一起挖掘一下網絡壓縮算法的類型,原理,實現,以及效果。寫這類算法類文章,一是學習,二是希望能夠令更多做FPGA的人,不再將眼光局限于RTL,仿真,調試,關心一下算法,定會發現FPGA的趣味和神通。

網絡結構

二值化網絡,顧名思義,就是網絡參數只有兩個數值,這兩個數值是+1和-1。在DNN網絡中主要是乘和加法運算,如果參數只有兩個數值,那么乘法的實現就很簡單,僅僅需要符號判斷就可以了。比如輸入數據A,如果和1乘,不變;和-1乘,變為負數。這用LUT很好實現,還節省了DSP的使用。相對于單精度浮點數,存儲減小16倍,帶寬也增加16倍。在計算單元數目相同情況下,比浮點運算速率提高了16倍。當然由于乘法和加法使用LUT數目減少,計算單元也會成倍增長,總的下來計算速率將大幅度提高。

網絡訓練中使用的都是浮點類型參數,這樣做是為了保證訓練的精度。那么這些浮點類型的參數如何量化的只有兩個數值呢?論文中提出了兩種方法,第一種是粗暴型,直接根據權重參數的正負,強行分出1和-1。即:

這里wb是二值參數,w是實際權重參數。量化可以看做在原來數據基礎上增加了噪聲,導致數據間最短距離變大。比如原來數據的分辨率為R0,如果增加一個高斯噪聲s,那么其分辨率就增大了。這樣在DNN中矩陣乘法中也引入了噪聲,為:

數據分辨率的降低導致了有效信息的損失,但是在大量權重情形下,平均下來可以補償一定的信息損失,即如果有:

那么在權重無窮多時,有:


圖1.1 數據增加了噪聲,導致數據分辨率降低

另外一種是隨機型,即以一定概率來選擇1和-1,論文中采用如下公式:

其中“hard sigmoid”函數為:

這實際上是對sigmoid函數進行了線性化,這樣做的目的可以減少計算量。因為線性計算只有一個乘法和加法,而sigmoid函數有指數計算。使用隨機量化更能均衡化量化引入的噪聲,消除噪聲造成的信息損失。粗暴型量化可能因為權重參數分布不同而發生較大的“不平衡”,比如負數權重較多,那么導致-1遠遠多于+1,這樣就會出現權重偏移在負方向多一些。如果使用隨機概率模型,即使負數權重多,也會有一定概率出現+1,彌補了+1較少的情況。

圖1.2 粗暴型和隨機型量化:隨機型量化的分布更加均勻

訓練過程

訓練過程主要包括三個部分:

1) 前向傳播:給定輸入數據,一層一層的計算,前一層激活函數的結果作為下一層的輸入;

2) 反向傳播:計算每一層代價函數的梯度,從最后一層開始計算,反向計算前一層,一直到計算出第一層的梯度值;

3) 更新參數:根據計算出來的梯度和前一時刻的參數,計算出下一時刻的參數。

計算過程可以用圖2.1表示:

圖2.1 訓練過程

圖2.2 訓練算法

每次量化發生在計算出浮點參數之后,然后在進行前向計算,得到代價函數,進行反向計算代價函數梯度,接著利用前一刻參數計算出下一刻數據,不斷迭代直到收斂。

結果

論文在三個數據集上進行了測試:MNIST,CIFAR-10,SVHN。

MNIST有6萬張內容為0-9數字的訓練圖片,以及1萬張用于測試的28x28大小的灰度圖片。論文研究了兩種量化方式下訓練時間,以及測試出錯率。從中看出隨機量化出錯率更低,更適合用于二值量化。

圖3.1 不同量化方式下的訓練時間以及測試錯誤率:點線表示訓練誤差,連續線表示測試錯誤率

CIFAR-10圖片內容比MNIST復雜一些,包含了各種動物。有5萬張訓練圖片和1萬張32x32大小的測試圖片。

SVHN也是0-9數字圖片,含有604K張訓練圖片和26K的32x32大小的測試圖片。以上三種數據集下使用二值網絡的結果如下圖:

圖3.2 三種數據集結果(錯誤率)比較

從中看出二值網絡錯誤率幾乎和其他網絡模型差不多,但是其大大壓縮了網絡模型。

結論

二值化網絡中參數只用兩個數值表示,實際上僅僅考慮了權重的符號作用。在三種小型簡單的數據集上表現良好。

文獻

1 Matthieu Courbariaux, Y.B., Binary Connect Training Deep Neural Networks with binary weights during propagations. ArXiv preprint, 2016.

編輯:hfy


聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • FPGA
    +關注

    關注

    1630

    文章

    21796

    瀏覽量

    605237
  • 算法
    +關注

    關注

    23

    文章

    4629

    瀏覽量

    93194
收藏 人收藏

    評論

    相關推薦

    EE-257:面向Blackfin處理器的引導壓縮/解壓縮算法

    電子發燒友網站提供《EE-257:面向Blackfin處理器的引導壓縮/解壓縮算法.pdf》資料免費下載
    發表于 01-07 13:56 ?0次下載
    EE-257:面向Blackfin處理器的引導<b class='flag-5'>壓縮</b>/解<b class='flag-5'>壓縮</b><b class='flag-5'>算法</b>

    【「從算法到電路—數字芯片算法的電路實現」閱讀體驗】+本介紹基礎硬件算法模塊實現的好書

    看下本書內容簡介,然后再瀏覽下各個章節的內容。 從簡介來看,本書也是關注最基礎,最常用的那部分算法的電路實現,比較貼合工程實踐,適合無基礎或者有定基礎的線工程人員閱讀。內容選擇
    發表于 11-20 13:42

    【BearPi-Pico H3863星閃開發板體驗連載】LZO壓縮算法移植

    算法能夠在BearPi-Pico H3863正常實現,但是壓縮算法還存在定的問題,需要在研究。 解壓
    發表于 11-10 21:45

    壓縮算法的類型和應用

    壓縮算法種通過減少數據量來節省存儲空間或傳輸數據的技術。壓縮算法可以分為兩種類型:有損壓縮
    的頭像 發表于 10-21 13:50 ?341次閱讀

    Huffman壓縮算法概述和詳細流程

    Huffman壓縮算法種基于字符出現頻率的編碼算法,通過構建Huffman樹,將出現頻率高的字符用短編碼表示,出現頻率低的字符用長編碼表示,從而
    的頭像 發表于 10-21 13:48 ?319次閱讀

    使用qboot時選擇了壓縮率更高的zip算法,但是發現編譯報錯,為什么?

    在使用qboot時選擇了壓縮率更高的zip算法,但是發現編譯報錯,如下圖:
    發表于 09-26 07:22

    精準捕捉拉曼信號——時間門控拉曼光譜系統實驗結果深度解析

    在上篇的文章(詳見文末目錄:閃光科技推出高性能時間門控拉曼光譜系統,為科學研究注入新動力!),中,我們詳細介紹了時間門控拉曼光譜系統的技術參數與應用場景。本篇我們將為您深入解析我們通過該系統所獲
    的頭像 發表于 08-13 10:38 ?414次閱讀
    精準捕捉拉曼信號——時間門控拉曼光譜系統實驗<b class='flag-5'>結果</b>深度<b class='flag-5'>解析</b>

    卷積神經網絡壓縮方法

    ,CNN模型的參數量和計算量也隨之劇增,這對硬件資源提出了嚴峻挑戰。因此,卷積神經網絡壓縮方法成為了研究熱點。本文將從多個角度詳細介紹卷積神經網絡壓縮方法,包括前端
    的頭像 發表于 07-11 11:46 ?412次閱讀

    bp神經網絡算法的基本流程包括哪些

    BP神經網絡算法,即反向傳播神經網絡算法,是種常用的多層前饋神經網絡訓練
    的頭像 發表于 07-04 09:47 ?725次閱讀

    神經網絡反向傳播算法的原理、數學推導及實現步驟

    傳播算法的原理、數學推導、實現步驟以及在深度學習中的應用。 神經網絡概述 神經網絡種受人腦啟發的計算模型,由大量的神經元(或稱為節點)組
    的頭像 發表于 07-03 11:16 ?914次閱讀

    神經網絡反向傳播算法原理是什么

    介紹反向傳播算法的原理、數學基礎、實現步驟和應用場景。 神經網絡簡介 神經網絡種受人腦啟發的計算模型,由大量的神經元(或稱為節點)組成。
    的頭像 發表于 07-02 14:16 ?740次閱讀

    【RTC程序設計:實時音視頻權威指南】音視頻的編解碼壓縮技術

    和技術可以實現不同的高效壓縮和解壓縮,常用的就是MP4件。 MP4是種容器格式,包含多種類型的媒體文件,如視頻,音頻,靜態圖像等,這
    發表于 04-28 21:04

    FPGA壓縮算法有哪些

    在圖像壓縮算法中可以采用哈夫曼編碼的方式對編碼冗余的信息進行壓縮,可以采用預測的方式來減少像素間冗余,可以采用量化的方式完成心理視覺冗余信息的去除
    的頭像 發表于 04-15 11:48 ?696次閱讀
    FPGA<b class='flag-5'>壓縮</b><b class='flag-5'>算法</b>有哪些

    基于門控線性網絡(GLN)的高壓縮比無損醫學圖像壓縮算法

    實現基于門控線性網絡(GLN)的高壓縮比無損醫學圖像壓縮算法,以提高醫學圖像存儲和分發系統的效率。與“傳統”的基于上下文的數據
    的頭像 發表于 04-08 10:29 ?715次閱讀
    基于門控線性<b class='flag-5'>網絡</b>(GLN)的高<b class='flag-5'>壓縮</b>比無損醫學圖像<b class='flag-5'>壓縮</b><b class='flag-5'>算法</b>

    基于FPGA的網絡加速設計實現

    首先是FPGA硬件的變化太多,各個模塊可配參數的變化(比如卷積模塊并行數的變化),另外個是網絡模型多種多樣以及開源的網絡模型平臺也很多(tensorflow,pytorch等)。網絡
    發表于 04-08 09:48 ?1085次閱讀
    基于FPGA的<b class='flag-5'>網絡</b>加速設計<b class='flag-5'>實現</b>
    主站蜘蛛池模板: 久久伊人草 | 永久免费看A片无码网站四虎 | 亚洲欧美中文字幕5发布 | 成人麻豆日韩在无码视频 | 国精品产露脸偷拍视频 | 儿子你得太大了慢点插 | 国产人妻精品无码AV在线五十路 | 91国偷自产一区二区三区 | 俄罗斯粗大猛烈18P 俄罗斯雏妓的BBB孩交 | 中国二级毛片 | 强开乳罩摸双乳吃奶视频 | 高清欧美性猛交xxxx黑人猛交 | 久久免费资源福利资源站 | 中国少妇内射XXXX狠干 | 露露的性战k8经典 | 日本妞欧洲 | 国产午夜精品理论片在线 | 九九在线精品视频 | 国产精品久久久久久AV免费不卡 | 亚洲欧美日韩国产另类电影 | 久久亚洲国产成人影院 | 久久国产亚洲电影天堂 | 忘忧草在线影院WWW日本二 | 欧美精品亚洲精品日韩专区一 | 99久久精品久久久 | 欧洲美女高清一级毛片 | 国产午夜精品自在自线之la | yellow片高清视频免费看 | 99国内精品 | 18禁在线无遮挡羞羞漫画 | 国产精品一区二区20P | 手机看片成人 | 热巴两次用约老师屁股发底线球 | 一本之道高清在线观看一区 | 在线免费观看国产精品 | pkf女尸studiosxnxx| 青青草在线 视频 | 欧美日韩久久久精品A片 | 日日夜夜操操操 | 2021乱码精品公司 | 红杏俱乐部 |