色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

在開發平臺上使用VITIS AI加速AI應用

星星科技指導員 ? 來源:嵌入式計算設計 ? 作者:Vaibhav Kothari ? 2022-07-01 14:24 ? 次閱讀

VITIS 是一個用于開發軟件和硬件的統一軟件平臺,使用 Vivado 和其他用于 Xilinx FPGA SoC 平臺(如 ZynqMP UltraScale+ 和 Alveo 卡)的組件。VITIS SDK 的關鍵組件 VITIS AI 運行時 (VART) 為在邊緣和云上部署終端 ML/AI 應用程序提供了統一的接口

機器學習中的推理是計算密集型的,需要高內存帶寬和高性能計算,以滿足各種終端應用程序的低延遲和高吞吐量要求。

Vitis AI 工作流程

Xilinx Vitis AI 提供了一個工作流,可使用簡單的流程在 Xilinx 深度學習處理單元 (DPU) 上部署深度學習推理應用程序:

poYBAGK-kzmASgm-AAFdYdCFZ3o399.png

深度處理單元 (DPU) 是一種可配置的計算引擎,針對深度學習推理應用的卷積神經網絡進行了優化,并置于可編程邏輯 (PL) 中。DPU 包含高效且可擴展的 IP 內核,可進行定制以滿足許多不同應用的需求。DPU 定義自己的指令集,Vitis AI 編譯器生成指令。

VITIS AI 編譯器以優化的方式調度指令以獲得可能的最大性能。

在 Xilinx ZynqMP UltraScale+ SoC 平臺上運行任何 AI 應用程序的典型工作流程包括以下內容:

模型量化

模型編譯

模型優化(可選)

構建 DPU 可執行文件

構建軟件應用程序

集成 VITIS AI 統一 API

編譯和鏈接混合 DPU 應用程序

在 FPGA 上部署混合 DPU 可執行文件

人工智能量化器

AI Quantizer 是一種用于量化過程的壓縮工具,通過將 32 位浮點權重和激活轉換為定點 INT8。它可以在不丟失模型準確信息的情況下降低計算復雜度。定點模型需要更少的內存,因此比浮點實現提供更快的執行和更高的功率效率。

pYYBAGK-k0OAcg51AAEUfHmRVjg505.png

人工智能編譯

AI 編譯器將網絡模型映射到高效的指令集和數據流。編譯器的輸入是量化的 8 位神經網絡,輸出是 DPU 內核 - 可執行文件將在 DPU 上運行。在這里,不支持的層需要部署在 CPU 中,或者可以自定義模型來替換和刪除那些不支持的操作。它還執行復雜的優化,例如層融合、指令調度和片上存儲器的重用。

一旦我們能夠執行 DPU,我們需要使用 Vitis AI 統一 API 來初始化數據結構,初始化 DPU,在 CPU 上實現 DPU 不支持的層,并在 CPU 上添加預處理和后處理PL/PS 的需求基礎。

poYBAGK-k0uAGNFoAAD_TpKOAM8422.png

人工智能優化器

借助其模型壓縮技術,AI Optimizer 可以將模型復雜度降低 5-50 倍,而對準確性的影響最小。這種深度壓縮將推理性能提升到一個新的水平。我們可以實現所需的稀疏性并將運行時間減少 2.5 倍。

poYBAGK-k2CAB9qAAAGTFkNeeA4679.png

人工智能分析器

AI Profiler 可以幫助分析推理找到導致端到端管道瓶頸的警告。分析器為設計人員提供了 DPU/CPU/內存的通用時間線。此過程不會更改任何代碼,并且可以跟蹤功能并進行分析。

poYBAGK-k2eAHrZEAAKq6M1K_js563.png

人工智能運行時

VITIS AI 運行時 (VART) 允許應用程序使用統一的高級運行時 API 進行邊緣和云部署,使其無縫且高效。一些關鍵功能包括:

異步作業提交

異步作業收集

C++Python 實現

多線程和多進程執行

Vitis AI 還提供 DSight、DExplorer、DDump 和 DLet 等,用于執行各種任務。

DSight & DExplorer

DPU IP 為特定內核提供了多種配置,以根據網絡模型進行選擇。DSight 告訴我們每個 DPU 核心的百分比利用率。它還提供了調度程序的效率,以便我們可以調整用戶線程。還可以查看每一層和每個 DPU 節點的性能數據,例如 MOPS、運行時間和內存帶寬。

Softnautics選擇賽靈思 ZynqMP UltraScale+ 平臺進行高性能和計算部署。它提供最佳的應用程序處理、高度可配置的 FPGA 加速功能和 VITIS SDK,以加速高性能 ML/AI 推理。我們針對的此類應用之一是用于 Covid-19 篩查的面罩檢測。其目的是為戴口罩的人的 Covid-19 篩查部署多流推理,并根據各國政府對 Covid-19 預防措施指南的要求,實時識別違規行為。

pYYBAGK-k3GAIfo6AADA8d6GKDw058.png

我們準備了一個數據集并選擇了預訓練的權重來設計一個用于掩碼檢測和篩選的模型。我們通過 TensorFlow 框架訓練和修剪我們的自定義模型。這是面部檢測和面具檢測的兩階段部署。如此獲得的訓練模型通過前面章節中介紹的 VITIS AI 工作流程傳遞。與 CPU 相比,我們觀察到推理時間的 10 倍速度。Xilinx 提供了不同的調試工具和實用程序,它們在初始開發和部署期間非常有用。在我們最初的部署階段,我們沒有檢測到掩碼和非掩碼類別。我們嘗試將基于 PC 的推理輸出與名為 Dexplorer 的調試實用程序之一的輸出相匹配。但是,調試模式和根本原因導致問題進一步調試。在運行量化器時,我們可以使用更大的校準圖像、迭代和檢測來調整輸出,視頻輸入的準確率約為 96%。我們還嘗試使用 AI 分析器識別管道中的瓶頸,然后采取糾正措施以通過各種方式消除瓶頸,例如使用 HLS 加速來計算后處理中的瓶頸。

審核編輯:郭婷

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • cpu
    cpu
    +關注

    關注

    68

    文章

    10901

    瀏覽量

    212891
  • Xilinx
    +關注

    關注

    71

    文章

    2171

    瀏覽量

    122056
  • AI
    AI
    +關注

    關注

    87

    文章

    31493

    瀏覽量

    270182
收藏 人收藏

    評論

    相關推薦

    AI開發平臺如何賦能開發

    當下,AI開發平臺通過提供豐富的工具集、優化的開發環境以及高效的部署能力,極大地降低了AI應用的開發
    的頭像 發表于 01-17 14:47 ?61次閱讀

    NVIDIA發布Cosmos平臺加速物理AI開發

    )和機器人等物理AI系統的快速發展。 Cosmos平臺的核心在于其強大的生成式世界基礎模型,能夠模擬和預測復雜環境中的各種物理現象。結合高級tokenizer,Cosmos能夠高效地處理和分析大量數據,為物理AI系統的決策提供有
    的頭像 發表于 01-13 11:06 ?375次閱讀

    使用AMD Vitis進行嵌入式設計開發用戶指南

    Zynq MPSoC 和 AMD Alveo 數據中心加速器卡)為目標的異構嵌入式應用。 Vitis 工具包括: C++ 編譯器、庫和本征函數,適用于 AI 引擎和可編程邏輯( PL ) 適用于 Arm
    的頭像 發表于 01-08 09:33 ?627次閱讀
    使用AMD <b class='flag-5'>Vitis</b>進行嵌入式設計<b class='flag-5'>開發</b>用戶指南

    自動化AI開發平臺功能介紹

    自動化AI開發平臺集成了多種算法、工具和框架,旨在幫助開發者更快速、高效地設計、訓練、部署和管理AI模型。以下,
    的頭像 發表于 11-14 09:29 ?290次閱讀

    AI項目管理平臺怎么用

    AI項目管理平臺是一種集成了項目管理工具、AI開發環境和數據分析能力的綜合性平臺。接下來,AI
    的頭像 發表于 11-13 09:38 ?272次閱讀

    AI高性能計算平臺是什么

    AI高性能計算平臺不僅是AI技術發展的基石,更是推動AI應用落地、加速產業升級的重要工具。以下,是對AI
    的頭像 發表于 11-11 09:56 ?270次閱讀

    AI開發平臺可以干什么

    AI開發平臺是指提供一系列工具、庫、框架和服務,旨在幫助開發者更快速、更高效地設計、訓練、部署和管理AI模型的綜合性
    的頭像 發表于 11-05 09:53 ?220次閱讀

    Arm推出GitHub平臺AI工具,簡化開發AI應用開發部署流程

    專為 GitHub Copilot 設計的 Arm 擴展程序,可加速從云到邊緣側基于 Arm 平臺開發。 Arm 原生運行器為部署云原生、Windows on Arm 以及云到邊緣側的
    的頭像 發表于 10-31 18:51 ?2885次閱讀

    AI for Science:人工智能驅動科學創新》第4章-AI與生命科學讀后感

    很幸運社區給我一個閱讀此書的機會,感謝平臺。 《AI for Science:人工智能驅動科學創新》第4章關于AI與生命科學的部分,為我們揭示了人工智能技術在生命科學領域中的廣泛應用和深遠影響。
    發表于 10-14 09:21

    NVIDIA IGX平臺加速實時邊緣AI應用

    實時邊緣 AI 對于醫療、工業和科學計算至關重要,因為這些任務關鍵型應用需要即時數據處理、低延遲和高可靠性,以確保作出及時準確的決策。這些挑戰不僅涉及硬件平臺上的高帶寬傳感器處理和 AI 計算,還需要企業級
    的頭像 發表于 09-09 10:14 ?595次閱讀
    NVIDIA IGX<b class='flag-5'>平臺</b><b class='flag-5'>加速</b>實時邊緣<b class='flag-5'>AI</b>應用

    開發AI助手

    AI
    草帽王路飛
    發布于 :2024年07月22日 14:41:54

    開發者手機 AI - 目標識別 demo

    功能簡介 該應用是Openharmony 4.0系統上開發的一個目標識別的AI應用,旨在從上到下打通Openharmony AI子系統,展示Openharmony系統的
    發表于 04-11 16:14

    Vitis2023.2使用之—— classic Vitis IDE

    Vitis 已經更新到2023.2了,新版本相較于舊版本更新了嵌入式平臺,新版平臺增加了Versal? AI 引擎 DSP 設計的增強功能,全新的獨立
    發表于 03-24 16:15

    優美科攜手微軟打造AI平臺加速電動汽車電池材料研發

    優美科,一家電動汽車電池材料領域處于領先地位的公司,近日與全球科技巨頭微軟正式簽署合作協議。雙方將共同開發一個基于人工智能(AI)的電池材料研發平臺,旨在通過
    的頭像 發表于 02-18 17:29 ?776次閱讀

    【國產FPGA+OMAPL138開發板體驗】(原創)5.FPGA的AI加速源代碼

    OMAP-L138(定點/浮點DSP C674x+ARM9)+ FPGA處理器的開發板。 編寫一個用于AI加速的FPGA程序是一個相當復雜的過程,涉及硬件描述語言(如VHDL或Verilog)以及針對特定
    發表于 02-12 16:18
    主站蜘蛛池模板: 亚洲色播永久网址大全 | 男人和女人全黄一级毛片 | 国产成人aaa在线视频免费观看 | 一本到2019线观看 | 色橹橹欧美在线观看视频高清 | 色爰情人网站 | 国产精品视频大全 | 中文字幕亚洲无线码在线 | 狠狠狠狠狠狠干 | 亚洲三级黄色片 | 成人午夜精品久久久久久久秋霞 | 国产 高清 无码 在线播放 | 欧洲精品一区二区不卡观看 | 26uuu老色哥| 精品国产5g影院天天爽 | 中文文字幕文字幕亚洲色 | 国产欧美另类久久久精品免费 | 最近韩国日本免费观看mv免费版 | 辣文肉高h粗暴 | 大岛优香久久中文字幕 | 动漫AV纯肉无码AV电影网 | abp-146| 龙广在线收听 | 美女张开腿让男人桶爽无弹窗 | 国产色精品久久人妻无码 | 狠狠爱亚洲五月婷婷av | 亚洲国产精品VA在线看黑人 | 亚州精品视频 | WWW国产精品内射老师 | 2022久久精品国产色蜜蜜麻豆 | 国产一区亚洲 | 国产精品人妻一区免费看8C0M | 伊人大香线蕉精品在线播放 | 99RE6这里只有精品国产AV | 精品国产乱码久久久人妻 | 亚洲 欧美无码原创区 | a视频在线免费观看 | 亚洲综合色婷婷在线影院 | 老司机试看午夜 | 国产精品婷婷久青青原 | aa级毛片毛片免费观看久 |