資料介紹
軟件簡介
AKG(Auto Kernel Generator)對深度神經網絡中的算子進行優化,并提供特定模式下的算子自動融合功能。AKG與MindSpore的圖算融合功能協同工作,可提升在不同硬件后端上運行網絡的性能。
AKG由四個基本的優化模塊組成:規范化、自動調度、指令發射和后端優化。
-
規范化:?為了解決polyhedral表達能力的局限性(只能處理靜態的線性程序),需要首先對計算公式IR進行規范化。規范化模塊中的優化主要包括自動運算符inline、循環拆分和公共子表達式優化等。
-
自動調度:?自動調度模塊基于polyhedral技術,主要包括自動向量化、自動切分、依賴分析和數據搬移等。
-
指令發射:?指令發射模塊的優化主要包括循環規范化、標簽自動生成和指令發射等。
-
后端優化:?后端優化模塊的優化主要包括雙緩沖區、存儲重寫和同步指令插入等。
硬件后端支持
當前支持Ascend910
,gpu v100/A100
等,更多硬件后端支持待開發。
構建
從MindSpore側構建
詳細細節請參考MindSpore README.md。
獨立構建
我們建議您從MindSpore側構建運行AKG代碼,但同時為了方便開發,我們提供了獨立編譯運行AKG的方式。 詳細的編譯依賴請參考MindSpore安裝指南。
bash build.sh -t $target // target can set 'gpu' or 'ascend'
運行
- 設置環境變量
-
Ascend910
cd tests source ./test_env.sh amd64 export export PATH=${PATH}:${YOUR_CCEC_COMPILER_PATH}
-
GPU V100/A100
cd tests source ./test_env.sh gpu
- 運行測試用例
-
Ascend910
cd tests/operators/vector pytest -s test_abs_001.py -m "level0" # 運行level0測試用例
-
GPU V100/A100
cd tests/operators/gpu python3 test_all.py -a "op_name" #運行op_name算子測試用例
- 基于深度遷移學習網絡的肺結節輔助CT診斷 8次下載
- 端到端的深度學習網絡人體自動摳圖算法 10次下載
- 基于預訓練模型和長短期記憶網絡的深度學習模型 19次下載
- 3小時學習神經網絡與深度學習課件下載 0次下載
- 深度神經網絡模型的壓縮和優化綜述 20次下載
- 深度模型中的優化與學習課件下載 3次下載
- 使用TensorFlow建立深度學習和機器學習網絡 18次下載
- 一種基于深度學習的地下淺層震源定位方法 10次下載
- 深度學習網絡訓練技巧的詳細資料匯總 10次下載
- 快速了解神經網絡與深度學習的教程資料免費下載 33次下載
- 深度學習優化器方法及學習率衰減方式的詳細資料概述 9次下載
- 深度學習是什么?了解深度學習難嗎?讓你快速了解深度學習的視頻講解 16次下載
- 基于卷積神經網絡的深度學習參數分布對網絡性能的影響 0次下載
- 基于深度學習的安卓惡意應用檢測 4次下載
- CDMA網絡深度覆蓋的天線應用與RSSI指標優化分析 23次下載
- 神經網絡優化器有哪些 298次閱讀
- 深度神經網絡(DNN)架構解析與優化策略 579次閱讀
- 神經網絡優化算法有哪些 268次閱讀
- 深度學習與卷積神經網絡的應用 542次閱讀
- 深度學習模型訓練過程詳解 424次閱讀
- 深度學習的模型優化與調試方法 432次閱讀
- 詳解深度學習、神經網絡與卷積神經網絡的應用 1564次閱讀
- 深度學習神器DYnet++:輕松駕馭復雜自由曲面,3D測量無難度! 502次閱讀
- 深度學習中的圖像分割 1106次閱讀
- 深度學習中多種優化算法 2477次閱讀
- 深度學習模型小型化處理的五種方法 4096次閱讀
- 深度學習和普通機器學習的區別 4345次閱讀
- 深度學習在各個領域有什么樣的作用深度學習網絡的使用示例分析 7512次閱讀
- 基于Keras搭建的深度學習網絡示例 8150次閱讀
- 如何估算深度神經網絡的最優學習率(附代碼教程) 2431次閱讀
下載排行
本周
- 1山景DSP芯片AP8248A2數據手冊
- 1.06 MB | 532次下載 | 免費
- 2RK3399完整板原理圖(支持平板,盒子VR)
- 3.28 MB | 339次下載 | 免費
- 3TC358743XBG評估板參考手冊
- 1.36 MB | 330次下載 | 免費
- 4DFM軟件使用教程
- 0.84 MB | 295次下載 | 免費
- 5元宇宙深度解析—未來的未來-風口還是泡沫
- 6.40 MB | 227次下載 | 免費
- 6迪文DGUS開發指南
- 31.67 MB | 194次下載 | 免費
- 7元宇宙底層硬件系列報告
- 13.42 MB | 182次下載 | 免費
- 8FP5207XR-G1中文應用手冊
- 1.09 MB | 178次下載 | 免費
本月
- 1OrCAD10.5下載OrCAD10.5中文版軟件
- 0.00 MB | 234315次下載 | 免費
- 2555集成電路應用800例(新編版)
- 0.00 MB | 33566次下載 | 免費
- 3接口電路圖大全
- 未知 | 30323次下載 | 免費
- 4開關電源設計實例指南
- 未知 | 21549次下載 | 免費
- 5電氣工程師手冊免費下載(新編第二版pdf電子書)
- 0.00 MB | 15349次下載 | 免費
- 6數字電路基礎pdf(下載)
- 未知 | 13750次下載 | 免費
- 7電子制作實例集錦 下載
- 未知 | 8113次下載 | 免費
- 8《LED驅動電路設計》 溫德爾著
- 0.00 MB | 6656次下載 | 免費
總榜
- 1matlab軟件下載入口
- 未知 | 935054次下載 | 免費
- 2protel99se軟件下載(可英文版轉中文版)
- 78.1 MB | 537798次下載 | 免費
- 3MATLAB 7.1 下載 (含軟件介紹)
- 未知 | 420027次下載 | 免費
- 4OrCAD10.5下載OrCAD10.5中文版軟件
- 0.00 MB | 234315次下載 | 免費
- 5Altium DXP2002下載入口
- 未知 | 233046次下載 | 免費
- 6電路仿真軟件multisim 10.0免費下載
- 340992 | 191187次下載 | 免費
- 7十天學會AVR單片機與C語言視頻教程 下載
- 158M | 183279次下載 | 免費
- 8proe5.0野火版下載(中文版免費下載)
- 未知 | 138040次下載 | 免費
評論
查看更多