色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

基于FPGA的GNN加速器頂層架構

65eE_Broadcom_C ? 來源:Achronix ? 作者:Achronix ? 2021-08-27 09:44 ? 次閱讀

接上一篇......

GNN加速器頂層架構

此GNN加速器是為GraphSAGE算法設計的,但是它的設計也可以應用于其他類似的GNN算法加速。其頂層架構如下圖所示。

該架構由以下模塊組成:

圖中的GNN內核是算法實現的核心部分(詳情如下)。

RoCE-Lite是RDMA協議的輕量級版本,用于通過高速以太網進行遠程存儲訪問,以支持海量節點的圖計算。

400GE以太網控制器用于承載RoCE-Lite協議。

GDDR6存儲器用于存儲GNN處理過程中所需的高速訪問數據(DDR4作為備用大容量存儲器)。該存儲器用于存儲訪問頻率相對較低的數據,例如待預處理的圖形數據。

PCIeGen5 ×16 接口提供高速主機接口,用于與服務器軟件進行數據交互。

上述所有模塊均通過具有高帶寬的NoC實現互連。

GNN內核微架構

在開始討論GNN內核的微架構之前,有必要先回顧一下GraphSAGE算法。其內層循環的聚合和合并(包括卷積)占據了該算法的大部分計算和存儲訪問。通過研究,我們得出這兩個步驟的特點,具體如下。

表2:GNN算法中聚合和合并操作的對比(來源:https://arxiv.org/abs/1908.10834)

步驟 聚合操作 合并操作
存儲訪問方式 間接訪問,不規則 直接訪問,規則
數據重用
計算模式 動態,不規則 靜態,規則
計算量
性能瓶頸 存儲 計算

可以看出,聚合操作和合并操作在計算和存儲訪問模式上有著完全不同的需求。聚合操作涉及相鄰節點的采樣。然而,圖形是一種非歐幾里得數據類型——它的大小和維度是不確定且無序,矩陣稀疏,節點位置隨機。因此,存儲訪問是不規則的,并且難以重復利用數據。

在合并操作中,輸入數據是聚合結果(節點的低維表示)和權重矩陣。它的大小和維度是固定的,具有線性存儲位置。因此對存儲訪問沒有挑戰,但是矩陣的計算量非常大。 基于上述分析,我們決定在GNN內核加速器設計中選擇使用兩種不同的硬件結構來分別處理聚合和合并操作(如下圖示):

聚合器——通過單指令多數據(SIMD)處理器陣列,對圖形相鄰節點進行采樣和聚合。單指令可以預定義為mean()平均值計算,或其他適用的聚合函數;多數據是指單次mean()均值計算中需要多個相鄰節點的特征數據作為輸入,這些數據來自子圖采樣器。SIMD處理器陣列通過調度器Agg Scheduler進行負載平衡。子圖采樣器通過NoC從GDDR6或DDR4讀回的鄰接矩陣和節點特征數據h0v分別緩存在鄰接列表緩沖區(Adjacent ListBuffer)和節點特征緩沖區(Node Feature Buffer)。聚合的結果hkN(v)存儲在聚合緩沖區(Aggregation Buffer)中。

合并器——通過脈動矩陣PE對聚合結果進行卷積運算。卷積核是Wk權重矩陣。卷積結果由ReLU激活函數進行非線性處理,同時也存儲在PartialSum Buffer中,以用于下一輪迭代。

合并結果經過L2BN標準化處理后,即為最終的節點表示hkv。在一個典型的節點分類預測應用中,節點表示hkv可以通過一個全連接層(FC)來獲取節點的分類標簽。這個過程是傳統的機器學習處理方法之一,在GraphSAGE文獻資料中沒有體現,這個功能也沒有包含在這個架構中。

責任編輯:haq

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • FPGA
    +關注

    關注

    1630

    文章

    21796

    瀏覽量

    605258
  • 加速器
    +關注

    關注

    2

    文章

    806

    瀏覽量

    38018
  • GNN
    GNN
    +關注

    關注

    1

    文章

    31

    瀏覽量

    6361

原文標題:白皮書:一種基于FPGA的圖神經網絡加速器解決方案(WP024)(第二部分)

文章出處:【微信號:Broadcom_China,微信公眾號:博通Broadcom】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    數據中心加速器就看GRVI Phalanx FPGA加速器

    數據中心采用FPGA加速器已經成為主流,像MS的Catapult,Amazon基于Xilinx FPGA的AWS F1,Intel的Altera,Baidu公司等
    的頭像 發表于 10-16 11:49 ?8926次閱讀
    數據中心<b class='flag-5'>加速器</b>就看GRVI Phalanx <b class='flag-5'>FPGA</b><b class='flag-5'>加速器</b>

    機器學習實戰:GNN(圖神經網絡)加速器FPGA解決方案

    GNN架構在宏觀層面有著很多與傳統CNN類似的地方,比如卷積層、Polling、激活函數、機器學習處理(MLP)和FC層等等模塊,都會在GNN中得以應用。
    發表于 10-19 17:05 ?2796次閱讀
    機器學習實戰:<b class='flag-5'>GNN</b>(圖神經網絡)<b class='flag-5'>加速器</b>的<b class='flag-5'>FPGA</b>解決方案

    #硬聲創作季 電子制作:磁性加速器

    加速器DIY
    Mr_haohao
    發布于 :2022年10月19日 00:19:38

    機器學習實戰:GNN加速器FPGA解決方案

    與Achronix的Speedster7t1500 FPGA解決方案5.1 GNN加速器頂層架構GNN
    發表于 10-20 09:48

    GNN(圖神經網絡)硬件加速FPGA實戰解決方案

    5.1GNN加速器頂層架構GNN加速器針對GraphSAGE進行設計,但其
    發表于 07-07 08:00

    一種基于FPGA的圖神經網絡加速器解決方案

    在硬件層面進行升級和重新配置。復雜的設計豐富的硬IP減少開發時間、降低復雜性,NoC簡化模塊之間的互連并改善時序GNN加速器頂層架構GNN
    發表于 09-25 17:20

    【書籍評測活動NO.18】 AI加速器架構設計與實現

    經驗總結圖解NPU算法、架構與實現,從零設計產品級加速器當前,ChatGPT和自動駕駛等技術正在為人類社會帶來巨大的生產力變革,其中基于深度學習和增強學習的AI計算扮演著至關重要的角色。新的計算范式需要
    發表于 07-28 10:50

    《 AI加速器架構設計與實現》+第2章的閱讀概括

    首先感謝電子發燒友論壇提供的書籍和閱讀評測的機會。 拿到書,先看一下封面介紹。這本書的中文名是《AI加速器架構設計與實現》,英文名是Accelerator Based on CNN Design
    發表于 09-17 16:39

    高級語言(HLL)標準擴展大大簡化基于FPGA加速器的應用程序的開發

    擴展和利用FPGA實現加速的應用等內容。Convey公司制造了一整套的基于FPGA的硬件加速器板卡,支持PCIe計算接口和服務系統包裹Wo
    發表于 02-08 12:34 ?437次閱讀
    高級語言(HLL)標準擴展大大簡化基于<b class='flag-5'>FPGA</b><b class='flag-5'>加速器</b>的應用程序的開發

    優化基于FPGA的深度卷積神經網絡的加速器設計

    CNN已經廣泛用于圖像識別,因為它能模仿生物視覺神經的行為獲得很高識別準確率。最近,基于深度學習算法的現代應用高速增長進一步改善了研究和實現。特別地,多種基于FPGA平臺的深度CNN加速器被提出
    發表于 11-17 13:31 ?8103次閱讀

    基于Xilinx FPGA的Memcached硬件加速器的介紹

    本教程討論基于Xilinx FPGA的Memcached硬件加速器的技術細節,該硬件加速器可為10G以太網端口提供線速Memcached服務。
    的頭像 發表于 11-27 06:41 ?3756次閱讀

    基于FPGA的SIMD卷積神經網絡加速器

    一種基于FPGA的SIM卷積神經網絡加速器架構。以YOOV2目標檢測算法為例,介紹了將卷積神經網絡模型映射到FPGA上的完整流程;對加速器
    發表于 05-28 14:00 ?24次下載

    基于FPGA的深度學習CNN加速器設計方案

    因為CNN的特有計算模式,通用處理對于CNN實現效率并不高,不能滿足性能要求。 因此,近來已經提出了基于FPGA,GPU甚至ASIC設計的各種加速器來提高CNN設計的性能。
    發表于 06-14 16:03 ?2360次閱讀
    基于<b class='flag-5'>FPGA</b>的深度學習CNN<b class='flag-5'>加速器</b>設計方案

    Rapanda流加速器-實時流式FPGA加速器解決方案

    電子發燒友網站提供《Rapanda流加速器-實時流式FPGA加速器解決方案.pdf》資料免費下載
    發表于 09-13 10:17 ?0次下載
    Rapanda流<b class='flag-5'>加速器</b>-實時流式<b class='flag-5'>FPGA</b><b class='flag-5'>加速器</b>解決方案

    粒子加速器加速原理是啥呢?

    粒子加速器加速原理是啥呢? 粒子加速器是一種重要的實驗設備,用于研究粒子物理學、核物理學等領域。其主要原理是通過電場和磁場的作用,對帶電粒子進行加速,在高速運動過程中使其獲得較大的動
    的頭像 發表于 12-18 13:52 ?2269次閱讀
    主站蜘蛛池模板: 九九热这里只有精品视频免费 | 13一18TV处流血TV | 午夜亚洲动漫精品AV网站 | 欧美熟妇VIVOE精品 | 年轻的母亲4线在线观看完整 | 国产精品爽爽久久久久久蜜桃网站 | 久久久久伊人 | 曰本真人00XX动太图 | 不卡人妻无码AV中文系列APP | 久久视热频国产这里只有精品23 | 3D内射动漫同人资源在线观看 | 亚洲理论片在线中文字幕 | 国产av在线播放 | 黑色丝袜在线观看 | 亚洲 日韩 国产 中文视频 | 国产欧美一区二区三区在线看 | 把腿张开老子CAO烂你动态图 | 九九电影伦理片 | 耻辱诊察室1一4集动漫在线观看 | 俄罗斯12x13x处 | 人人看人人看 | 亚州笫一色惰网站 | 青青久在线视频免费观看 | 国产高清亚洲 | 无人影院在线播放 | 与邻居换娶妻子2在线观看 瑜伽牲交AV | 日本2021免费一二三四区 | 男人和女人一级黄色大片 | 给个男人都懂的网址2019 | 好爽好深太大了再快一点 | 1234成人网| 国产精品久久久久婷婷五月色 | 国产精品96久久久久久AV不卡 | 涩涩在线观看免费视频 | 国产人成无码视频在线观看 | 香蕉尹人综合精品 | 韩国黄色影院 | 中文字幕精品视频在线 | 色AV色婷婷97人妻久久久 | 在线自拍综合亚洲欧美 | 国产精品色午夜视频免费看 |