色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

電子發燒友App

硬聲App

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示
電子發燒友網>電子資料下載>可編程邏輯>TVM學習(二):算符融合

TVM學習(二):算符融合

2021-02-19 | pdf | 845.35KB | 次下載 | 2積分

資料介紹

作者:安平博,Xilinx高級工程師;來源:AI加速微信公眾號

算符融合將多個計算單元揉進一個計算核中進行,減少了中間數據的搬移,節省了計算時間。TVM中將計算算符分成四種:

1 injective。一一映射函數,比如加法,點乘等。

2 reduction。輸入到輸出具有降維性質的,比如sum。

3 complex-out。這是計算比較復雜的,比如卷積運算等。

4 opaque。無法被融合的算符,比如sort。

根據以上對算符的不同類型,TVM提供了三種融合規則:

從一定角度看,這種融合實際上是數據計算pipeline化,即兩次計算中間數據不再經歷store-load的過程,而是直接給到下一個計算單元完成計算。

在走入fuse ops代碼之前,還需要了解一些算法基礎知識。算符融合中應用了支配樹算法。在一個有向無環圖中,對于一個節點n來說,從初始節點s出發到達n的所有路徑都經歷一個節點m,那么m就是n的支配點。而距離n最近的支配點被稱作立即支配點。以r為樹根,將所有立即支配點按照支配關系連接起來就形成了支配樹。立即后支配點是從一個點n出發所有到終止節點的路徑中通過的最近節點,形成的支配樹是后支配樹。

在DAG中,對于一個點,所有能到達它的點在支配樹中的LCA,就是它支配樹中的父親。為什么算符融合要建立在后支配樹的基礎上呢?我猜測可能是因為對于兩個可融合算符在DAG中位置分為兩種,一種是父子關系,那么可以直接執行算符融合算法;另外一種是它們之間是后支配關系。對于具有后支配關系的兩個節點(n->m),就要判斷未來路徑上的節點是否都能夠和點m發生融合,如果可以,那么n也可以和m發生融合。比如下圖:

Conv2d要和elemwise add融合,必須判斷它的三個op是否能和elemwise add融合。

TVM中融合流程分為三步:

1 遍歷relay樹,建立DAG用于后支配樹分析;

2 建立后支配樹;

3 應用算符融合算法。

一 建立DAG圖

算符融合代碼在src/relay/transforms/fuse_ops.cc中。其中算符融合也應用在常量折疊中。

首先TVM中通過如下代碼來遍歷relay樹結構并建立DAG圖。


VisitExpr可以遞歸的調用在類IndexedforwardGraph中定義的VisitExpr_函數,通過深度優先搜索遍歷relay樹,并且建立DAG圖。深度優先搜索是從exit節點作為根節點反向搜鎖的,因此搜索樹是一個后序搜索樹。Outputs中保存了一個節點的輸入的邊,在構建后序支配樹會通過這些輸入邊求取LCA。那么在這個搜索樹基礎上應用支配樹算法,就能夠得到一個后序支配樹了。在這個類中針對不同節點類型重寫visitExpr_函數,節點類型有FunctionNode,ConstantNode, CallNode, TuppleNode等。我們來看CallNode的訪問函數定義:

在最后還會遞歸調用ExprVisitor::VisitExpr_函數,最終將深度優先搜索到的節點按照葉節點起始順序一次加入DAG圖中。只有ConstantNode的訪問函數中不再調用VisitExpr_,因為常量節點應該不存在葉節點了。在callNode中會將其輸入加入到DAG中,同時遍歷和輸入以及其op連接的節點,ExprVisitor中對CallNode訪問函數定義為:

因為ExprVisitor是被IndexForwardGraph繼承的,而VisitExpr_是虛擬函數,this就會指向IndexForwardGraph實例,最終就會調用這個類中定義的VisitExpr_函數,實現遞歸的遍歷relay樹。

這里要關注一下OpPatternKind,它定義了算子類型,是不同融合算法使用的依據。其定義在include/tvm/relay/op_attr_types.h文件中。

二 建立后序支配樹

接下來看后序支配樹的構建。構建函數是PostDom。因為根節點(DAG圖的出口)在post_dfs_order中最后,所以從根節點開始尋找每個節點出點的LCA,這個LCA就是后序支配點。

GetNode函數是獲得支配點,構建支配樹。在GetNode中,首先初始化根節點,然后求每個節點的輸入節點的LCA,即是這個節點的支配點。

LeastComonAncestor函數中主要代碼是:

通過兩兩求節點的LCA,來求取所有節點的LCA。程序會將計算圖中的末節點深度設置為1。然后向上逐層增加,那么LCA的共同祖先是相同的,深度也一定是一致。遍歷所有的節點,就得到一個后向支配樹。節點的pattern指向他的LCA。在計算支配點的pattern的時候,會依據pattern的定義,選擇pattern值最大的作為LCA的pattern。這塊不是太深入理解。可能是其定義的從最小值到最大值pattern可以向下進行融合,比如kElemWise=0, kInjective=2, 那么前者就能融合到KInjective中。

三 融合

完成了DAG和postDominator tree構建后,就開始融合操作。TVM中定義了group結構體,用于表示融合后的圖結構。Group結構體如下:

如果某些算符可以融合,那么就通過這個結構體中的parent,master_ref將這些節點建立連接關系。Group首先進行初始化和DAG相同的圖。然后分別遍歷dag,postDominator tree,以及group圖中節點,來判斷算符是否能被融合。Dag中和postDom中對應相同index的節點分別是被支配點和支配點。主要融合函數是以下兩個函數:


在runFuse中,有幾種情況是不進行算符融合的:

1 算符類型是Kopaque的。

2 該節點不存在支配點。

3 能夠融合的節點超過了一定數量。

融合操作算法基本上是考察當前節點到其支配點所有路徑上的節點是否都符合融合規則,如果符合就進行融合,不符合就不融合。函數CheckPath就是用于考察src到sink路徑是否能夠融合的。

融合分成了三個phase,每個phase處理不同可融合類型。這里我沒有深入研究。當判斷支配樹的前后節點可以融合后,就通過函數commitFuse執行融合操作。

完成融合之后,會遍歷節點創建新的graph。

下載該資料的人也在下載 下載該資料的人還在閱讀
更多 >

評論

查看更多

下載排行

本周

  1. 1電子電路原理第七版PDF電子教材免費下載
  2. 0.00 MB  |  1491次下載  |  免費
  3. 2單片機典型實例介紹
  4. 18.19 MB  |  95次下載  |  1 積分
  5. 3S7-200PLC編程實例詳細資料
  6. 1.17 MB  |  27次下載  |  1 積分
  7. 4筆記本電腦主板的元件識別和講解說明
  8. 4.28 MB  |  18次下載  |  4 積分
  9. 5開關電源原理及各功能電路詳解
  10. 0.38 MB  |  11次下載  |  免費
  11. 6100W短波放大電路圖
  12. 0.05 MB  |  4次下載  |  3 積分
  13. 7基于單片機和 SG3525的程控開關電源設計
  14. 0.23 MB  |  4次下載  |  免費
  15. 8基于AT89C2051/4051單片機編程器的實驗
  16. 0.11 MB  |  4次下載  |  免費

本月

  1. 1OrCAD10.5下載OrCAD10.5中文版軟件
  2. 0.00 MB  |  234313次下載  |  免費
  3. 2PADS 9.0 2009最新版 -下載
  4. 0.00 MB  |  66304次下載  |  免費
  5. 3protel99下載protel99軟件下載(中文版)
  6. 0.00 MB  |  51209次下載  |  免費
  7. 4LabView 8.0 專業版下載 (3CD完整版)
  8. 0.00 MB  |  51043次下載  |  免費
  9. 5555集成電路應用800例(新編版)
  10. 0.00 MB  |  33562次下載  |  免費
  11. 6接口電路圖大全
  12. 未知  |  30320次下載  |  免費
  13. 7Multisim 10下載Multisim 10 中文版
  14. 0.00 MB  |  28588次下載  |  免費
  15. 8開關電源設計實例指南
  16. 未知  |  21539次下載  |  免費

總榜

  1. 1matlab軟件下載入口
  2. 未知  |  935053次下載  |  免費
  3. 2protel99se軟件下載(可英文版轉中文版)
  4. 78.1 MB  |  537793次下載  |  免費
  5. 3MATLAB 7.1 下載 (含軟件介紹)
  6. 未知  |  420026次下載  |  免費
  7. 4OrCAD10.5下載OrCAD10.5中文版軟件
  8. 0.00 MB  |  234313次下載  |  免費
  9. 5Altium DXP2002下載入口
  10. 未知  |  233046次下載  |  免費
  11. 6電路仿真軟件multisim 10.0免費下載
  12. 340992  |  191183次下載  |  免費
  13. 7十天學會AVR單片機與C語言視頻教程 下載
  14. 158M  |  183277次下載  |  免費
  15. 8proe5.0野火版下載(中文版免費下載)
  16. 未知  |  138039次下載  |  免費
主站蜘蛛池模板: 日本湿姝在线观看 | 成人免费在线视频 | 一本久道久久综合婷婷五月 | 黄色三级网站在线观看 | 亚洲综合AV色婷婷五月蜜臀 | 稚嫩挤奶h调教h | 午夜理论在线观看不卡大地影院 | 欧美亚洲日韩自拍高清中文 | 国产自啪偷啪视频在线 | 2018高清国产一区二区三区 | 暖暖的高清视频在线观看免费中文 | 日本调教网站 | 最新精品国产 | xxx88中国| 韩国三级久久精品 | 免费精品国偷自产在线 | 性一交一乱一色一视频 | 嗯 用力啊 嗯 c我 啊哈老师 | 国产精品乱码一区二区三 | 色悠久久综合 | 国产成人a在一区线观看高清 | 99久久久A片无码国产精 | 久久综合亚洲色hezyo | 国产WW高清大片免费看 | 午夜男人免费福利视频 | 色宅男午夜电影网站 | 久久这里只精品热在线99 | 亚洲视频在线观 | 99re久久这里只有精品 | 高清无码色大片中文 | 国产中的精品AV一区二区 | 69夫妻交友网 | 精品人妻无码一区二区三区蜜桃臀 | 亚洲高清毛片一区二区 | 国内外成人免费在线视频 | 国产在线观看www | 色狗av影院 | 国产在线观看成人 | 小黄文污到你湿 | 美女胸禁止18以下看 | 暖暖视频大全免费观看 |