色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

許多不同的硬件架構在深度學習市場中共存

0BFC_eet_china ? 來源:未知 ? 作者:伍文輝 ? 2017-12-22 08:37 ? 次閱讀

在深度神經網絡(DNN)發展的簡短歷史中,業界不斷嘗試各種可提升性能的硬件架構。通用CPU最容易編程,但每瓦特性能的效率最低。GPU針對平行浮點運算進行了優化,性能也比CPU更高幾倍。因此,當GPU供貨商有了一大批新客戶,他們開始增強設計,以進一步提高DNN效率。例如,Nvidia新的Volta架構增加專用矩陣乘法單元,加速了常見的DNN運算。

即使是增強型的GPU,仍然受其圖形專用邏輯的拖累。此外,盡管大多數的訓練仍然使用浮點運算,但近來的趨勢是使用整數運算進行DNN推論。例如Nvidia Volta的整數性能,但仍然建議使用浮點運算進行推論。芯片設計人員很清楚,整數單元比浮點單元更小且功效更高得多;當使用8位(或更小)整數而非16位或32位浮點數時,其優勢更加明顯。

相較于GPU,DSP則是針對整數數學而設計的,特別適用于卷積神經網絡(CNN)中的卷積函數。向量DSP使用寬SIMD單元進一步加速推論計算,例如,Cadence的C5 DSP核心包括四個2048位寬度的SIMD單元;因此,核心在每個周期內可以完成1,024個8位整數乘法累加(MAC)作業。在16nm設計中,它能每秒處理超過1兆個MAC運算。聯發科技(MediaTek)即取得了Cadence的DSP IP授權,用于其最新智能手機處理器的DNN加速器。

新架構的機會

最有效率的架構是從頭開始設計DNN,消除其它應用的特性,并針對DNN需要的特定計算進行優化。這些架構能建置于專用ASIC或銷售至系統制造商的芯片(這些芯片稱為專用標準產品或ASSP)中。最顯著的DNN ASIC是Google的TPU,它為推論任務進行了優化,主要包括65,536個MAC單元的脈動數組和28MB內存,以容納DNN權重和累加器。TPU使用一個簡單的四階流水線,而且只執行少數指令。

多家新創公司也在為DNN開發客制架構。英特爾(Intel)去年收購了其中的一家(Nervana),并計劃在今年年底前出樣其第一款ASSP;但該公司尚未透露該架構的任何細節。Wave Computing為DNN開發了數據流處理器。其它為此獲得眾多資金的新創公司包括Cerebras、Graphcore和Groq。我們預計這些公司至少有幾家會在2018年投產組件。

另一種建置優化架構的方法是利用FPGA。微軟(Microsoft)廣泛采用FPGA作為其Catapult和Brainwave計劃的一部份;百度(Baidu)、Facebook以及其它云端服務器供貨商(CSP)也使用FPGA加速DNN。這種方法避免了數百萬美元的ASIC和ASSP投片費用,并提供了更快的產品驗證時程;只要設計改動,FPGA就能在幾分鐘內重新編程和設計。但它們作業于較低的時鐘速率,并且比ASIC所能容納的邏輯塊更少得多。圖1總結了我們對這些解決方案之間相對效率的看法。

許多不同的硬件架構在深度學習市場中共存
圖1:根據不同的硬件設計,各種深度學習加速器之間的性能/功耗比至少存在兩個數量級的差異

有些公司藉由客制程度更高的加速器來強化現有設計,從而提供了一定的空間與彈性,例如,Nvidia專為自動駕駛車設計的Xavier芯片增加了一個整數數學模塊以加速DNN推論。Ceva和新思科技(Synopsys)設計了類似的單元,以便增強其SIMD DSP核心。這些模塊只包含大量的整數MAC單元,從而提高了數學運算效率。然而,由于他們并未置換底層的GPU或DSP架構,所以也不像從頭設計那么有效率。

客制設計的挑戰之一在于深度學習算法持續迅速發展中。時下最流行的DNN開發工具TensorFlow兩年前才出現,數據科學家們已經在評估新的DNN結構、卷積函數和數據格式了。對于兩年后的DNN來說,如今為現有工作負載客制的設計可能不再是理想的選擇,或甚至無法發揮作用。為了解決這個問題,大多數的ASIC和ASSP設計都是可編程且靈活的,但是FPGA提供了最大靈活度。例如,微軟已經將專有的9位浮點格式定義為其Brainwave深度學習平臺的一部份。

融會貫通各種選擇

縱觀深度學習發展史,半導體產業通常首先在通用CPU中實現新應用。如果應用適用于現有的專用芯片,如GPU和DSP,那么接下來可能會轉移到這兩者。隨著時間的推移,如果新應用發展成一個規模市場,業界公司就會開始開發ASIC和ASSP,雖然這些組件可能保留一定的可編程性。只有當算法變得極其穩定時(例如MPEG),才能真的看到以固定功能邏輯的應用建置。

深度學習目前也正按這一發展路線展開。GPU和DSP顯然是適用的,而且因需求夠高,所以ASIC開始出現。幾家新創公司和其它公司正在開發即將在2018年及其后出貨的ASSP。至于少量或利基應用,FPGA通常更受歡迎;深度學習已經顯示出足以為ASIC投片帶來的前景了。

然而,哪一種DNN架構將會勝出?如今看來還不夠明朗。盡管深度學習市場正迅速成長,但仍遠低于PC、智能手機和汽車市場。因此,ASIC和ASSP的商業案例看起來還微不足道。相形之下,像英特爾和Nvidia這樣的公司可以采用來自其它市場的高性能處理器,并增強其深度學習,透過大量的軟件支持和持續的更新以提供具競爭力的產品。未來幾年,我們將會看到許多不同的硬件架構在深度學習市場中共存。


聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 深度學習
    +關注

    關注

    73

    文章

    5511

    瀏覽量

    121392
  • 硬件架構
    +關注

    關注

    0

    文章

    29

    瀏覽量

    9110
  • dnn
    dnn
    +關注

    關注

    0

    文章

    60

    瀏覽量

    9073

原文標題:誰才是深度學習架構之王?

文章出處:【微信號:eet-china,微信公眾號:電子工程專輯】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    GPU深度學習中的應用 GPUs圖形設計中的作用

    隨著人工智能技術的飛速發展,深度學習作為其核心部分,已經成為推動技術進步的重要力量。GPU(圖形處理單元)深度學習中扮演著至關重要的角色,
    的頭像 發表于 11-19 10:55 ?652次閱讀

    NPU深度學習中的應用

    設計的硬件加速器,它在深度學習中的應用日益廣泛。 1. NPU的基本概念 NPU是一種專門針對深度學習算法優化的處理器,它與傳統的CPU和G
    的頭像 發表于 11-14 15:17 ?779次閱讀

    pcie深度學習中的應用

    深度學習模型通常需要大量的數據和強大的計算能力來訓練。傳統的CPU計算資源有限,難以滿足深度學習的需求。因此,GPU(圖形處理單元)和TPU(張量處理單元)等專用
    的頭像 發表于 11-13 10:39 ?483次閱讀

    GPU深度學習應用案例

    GPU深度學習中的應用廣泛且重要,以下是一些GPU深度學習應用案例: 一、圖像識別 圖像識別是深度
    的頭像 發表于 10-27 11:13 ?455次閱讀

    FPGA加速深度學習模型的案例

    FPGA(現場可編程門陣列)加速深度學習模型是當前硬件加速領域的一個熱門研究方向。以下是一些FPGA加速深度學習模型的案例: 一、基于FPG
    的頭像 發表于 10-25 09:22 ?316次閱讀

    FPGA做深度學習能走多遠?

    的發展前景較為廣闊,但也面臨一些挑戰。以下是一些關于 FPGA 深度學習中應用前景的觀點,僅供參考: ? 優勢方面: ? 高度定制化的計算架構:FPGA 可以根據
    發表于 09-27 20:53

    深度學習算法嵌入式平臺上的部署

    隨著人工智能技術的飛速發展,深度學習算法各個領域的應用日益廣泛。然而,將深度學習算法部署到資源受限的嵌入式平臺上,仍然是一個具有挑戰性的任
    的頭像 發表于 07-15 10:03 ?1622次閱讀

    深度學習中的時間序列分類方法

    的發展,基于深度學習的TSC方法逐漸展現出其強大的自動特征提取和分類能力。本文將從多個角度對深度學習時間序列分類中的應用進行綜述,探討常用
    的頭像 發表于 07-09 15:54 ?1096次閱讀

    深度學習中的無監督學習方法綜述

    深度學習作為機器學習領域的一個重要分支,近年來多個領域取得了顯著的成果,特別是圖像識別、語音識別、自然語言處理等領域。然而,
    的頭像 發表于 07-09 10:50 ?874次閱讀

    深度學習視覺檢測中的應用

    能力,還使得機器能夠模仿人類的某些智能行為,如識別文字、圖像和聲音等。深度學習的引入,極大地推動了人工智能技術的發展,特別是圖像識別、自然語言處理、語音識別等領域取得了顯著成果。
    的頭像 發表于 07-08 10:27 ?831次閱讀

    深度學習與傳統機器學習的對比

    人工智能的浪潮中,機器學習深度學習無疑是兩大核心驅動力。它們各自以其獨特的方式推動著技術的進步,為眾多領域帶來了革命性的變化。然而,盡管它們都屬于機器
    的頭像 發表于 07-01 11:40 ?1504次閱讀

    深度學習自動駕駛中的關鍵技術

    隨著人工智能技術的飛速發展,自動駕駛技術作為其中的重要分支,正逐漸走向成熟。自動駕駛系統中,深度學習技術發揮著至關重要的作用。它通過模擬人腦的學習過程,實現對車輛周圍環境的感知、理解
    的頭像 發表于 07-01 11:40 ?833次閱讀

    深度學習編譯工具鏈中的核心——圖優化

    深度神經網絡模型可以看做由多個算子連接而成的有向無環圖,圖中每個算子代表一類操作(如乘法、卷積),連接各個算子的邊表示數據流動。部署深度神經網絡的過程中,為了適應硬件平臺的優化、
    的頭像 發表于 05-16 14:24 ?1052次閱讀
    <b class='flag-5'>深度</b><b class='flag-5'>學習</b>編譯工具鏈中的核心——圖優化

    深度解析深度學習下的語義SLAM

    隨著深度學習技術的興起,計算機視覺的許多傳統領域都取得了突破性進展,例如目標的檢測、識別和分類等領域。近年來,研究人員開始視覺SLAM算法中引入
    發表于 04-23 17:18 ?1350次閱讀
    <b class='flag-5'>深度</b>解析<b class='flag-5'>深度</b><b class='flag-5'>學習</b>下的語義SLAM

    FPGA深度學習應用中或將取代GPU

    硬件公司供貨的不斷增加,GPU 深度學習中的市場需求還催生了大量公共云服務,這些服務為深度
    發表于 03-21 15:19
    主站蜘蛛池模板: 免费看a毛片| 日本aaaa| 色狠狠AV老熟女| 超碰免费视频在线观看| 内射爽无广熟女亚洲| 中文无码字慕在线观看| 久久精品无码人妻无码AV蜜臀| 亚洲精品免费网站| 紧致肉肉高h| 伊人久久国产精品| 久久久久久久久女黄| 一个人免费观看在线视频播放| 极品美女穴| 越南女子杂交内射BBWXZ| 久久热这里面只有精品| 91麻豆精品国产一级| 欧美怡红院视频一区二区三区 | 一个人看的www视频动漫版| 精品久久久99大香线蕉| 伊人青青青| 免费啪视频观试看视频| 爱很烂qvod| 羞羞影院午夜男女爽爽免费| 狠狠躁日日躁人人爽| 中文字幕午夜乱理片| 免费完整版观看| yy4408午夜场理论片| 午夜亚洲国产理论片二级港台二级 | 中文成人在线视频| 蜜桃久久久亚洲精品成人| jizz破处| 午夜伦理伦理片在线观| 久草在在线免视频在线观看| 97碰成视频免费| 十七岁日本免费完整版BD| 果冻传媒视频在线观看完整版免费| 一二三四在线观看韩国| 欧美日韩中文在线字幕视频| 国产精品久久久久影院嫩草| 伊人久久大香线蕉综合网站| 日本人作爰啪啪全过程|