色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

將TensorFlow Lite模型轉換為ONNX

電子設計 ? 來源:電子設計 ? 作者:電子設計 ? 2020-12-08 23:19 ? 次閱讀

文章轉載于微信公眾號:黎明灰燼
作者:黎明灰燼

簡介

由 Facebook 和 Microsoft 創建的開放格式神經網絡交換格式 ONNX,是一種用于表示機器學習模型。

圖1:ONNX愿景

TF2ONNX 將 TensorFlow 模型轉換為 ONNX,從而將 TensorFlow 訓練后的模型引入支持 ONNX 的系統。

然而 TF2ONNX 有一些局限(v1.5.5,即開始開發 TFLite2ONNX 的時候),例如不支持 TensorFlow 2.0量化。將/_易變/_的 TensorFlow 模型轉換為 ONNX 的工作量很大。并且,由于量化深度學習部署中扮演著越來越重要的角色。

另一方面,TFLite 的模型表示相對_穩定_,并且由 Google 統一維護的 TensorFlow 和 TFLite 的模型轉換器足夠健壯。該轉換器通過包括批量歸一化折疊激活函數融合在內的圖轉換簡化了 TensorFlow 模型。還可以處理在 TensorFlow Quantization-aware Training(QAT)期間生成的 FakeQuantWithMinMaxVars 節點。

此外,盡管某些模型由 TensorFlow 構建,但僅發布時只有 TFLite 格式的模型,例如 Google MediaPipe 。ONNX 生態系統無法使用這類模型。

TFLite2ONNX 可以將 TFLite 模型轉換為 ONNX。截至 v0.3,TFLite2ONNX 支持 TensorFlow 2.0(感謝 TFLite 轉換器)和量化。本文介紹了 TFLite2ONNX 為縮小 TFLite 與 ONNX 模型表示之間的語義差異的背景和實現。

數據布局語義轉換

最明顯的差距是數據布局問題—— TFLite 模型是 NHWC 格式,而 ONNX 是NCHW,在本文中被稱為_布局語義差異_。

問題與 TF2ONNX

TFLite 的數據布局格式在文檔或模型表示中均未提及,但在 TFLite 轉換器(TensorFlow 模型需要為 NHWC)和內核隱式協議。ONNX 則在算子表示和文檔(由算子表示生成)中明確聲明它使用NCHW。

圖2:TF2ONNX 的數據布局處理—— MobileNetV2 示例

TF2ONNX 將_內部_算子和張量轉換為 NCHW 數據布局,并允許用戶通過 --inputs-as-nchw 選擇是否需要將圖的輸入和輸出轉換為 NHWC 數據布局。默認情況(未指定 NCHW)會插入 Transpose 算子以橋接 NHWC 和 NCHW 子圖。上面的_圖2_是一個使用 TF2ONNX 將 MobileNetV2 TensorFlow模型轉換為 ONNX 的實例。(有關 TF2ONNX 處理數據布局的更多描述,請參見 GitHub issue。)

在 TFLite2ONNX 的開發過程中,我們嘗試了兩種方法:

  • _基于轉換的方法_—— v0.1啟用,v0.3 刪除。
  • _基于傳播的方法_—— v0.2引入并作為默認方法。

基于轉換的方法

一個關于_布局語義差異_的事實是,某些算子具有隱式數據布局,如 Conv;而其他則不是,如 Add

TFLite2ONNX 的_基于轉置的方法_在算子有_布局語義差異_的地方插入一個_轉置模式_。_轉置模式_是用一個 Transpose 算子將_源布局_(TFLite)和_目標的布局_(ONNX)連接起來。

例如,將 TFLite 模式 ? ? ?→[ ]?Datanhwc?→[Conv] 轉換為 ? ? ?→[ ]→? ? ?→[ ]?Datanhwc?→[Transpose]→?Datanchw?→[Conv]。(在這篇文章中,? ??TensorName? 和 [ ][Operator] 分別表示張量和算子。_圖3_是轉換MobileNetV2 的第一個 Conv 的示例。


圖3:通過 TFLite2ONNX 的基于轉置方法轉換的 ONNX 模型

使用這種方法,我們只需要處理一組有限的算子,例如 ConvPooling。其他的算子和張量轉換都是平凡的——沒有_布局語義上的差異_。

基于傳播的方法

盡管_基于轉換的方法_可以處理_布局語義差異_,但由于添加了太多的算子和張量(即_轉換模式_),因此生成的 ONNX 模型太大且復雜。基于傳播的方法可以在整個圖中傳播_布局語義差異_來解決這個問題。

默認情況下(對于大多數情況),對于給定的圖,某些張量具有隱式布局語義,例如直接連接到 Conv 的張量,而其他張量則沒有,例如 AbsAdd。后著的對布局是透明的,這意味著連接到算子的所有張量都必須具有相同的布局語義或不具有這種語義。

因此,當布局_透明_的算子連接到具有隱式布局張量的算子時,_透明_算子的所有張量都具有與連接這兩個算子的張量相同的布局語義。這便是_傳播_的含義。

例如,在轉換 TFLite 圖(省略了_kernel_和 _bias_) ? ? ?→[ ]→? ? ?→[ ]→? ???Anhwc?→[Conv]→?Bnhwc?→[Abs]→?C?? 到 ONNX 時,張量 ? ? ??Anhwc? 變成 ? ? ??Anchw? ,? ? ??Bnhwc? 變成 ? ? ??Bnchw?。因此 [ ][Abs] 的輸出? ??C? 應該與其輸入 ? ??B? 具有相同的格式。_基于傳播的方法會_將 ? ??B? 的格式傳播給 ? ??C?。因此我們得到 ONNX 圖 ? ? ?→[ ]→? ? ?→[ ]→? ? ??Anchw?→[Conv]→?Bnchw?→[Abs]→?Cnchw?,這其中未引入其他算子或張量。

在布局傳播中,如果張量是 _activations_,則布局變換會置換張量的形狀(即 ONNX 中的 value info),如果是_權重_的數據(即 ONNX 中的 initializer),還要轉換數據。

在實踐中,算子分為四類(_如圖5所示_):

  • _Implicit_:算子在_布局語義上有分歧_,例如 Conv 。它們是_布局語義差異_的來源。
  • _Transparent_:對布局不敏感的算子,例如 Abs。如果任何張量具有_布局語義差異_,則將其傳播到連接到此類算子的所有張量。
  • Attribute_:可以想 _Transparent 那樣傳播_布局語義差異_的算子,但需要特殊處理處理敏感屬性,例如 Concataxis 屬性。傳播后需要額外通過以調整這些屬性。
  • _Terminate_:沒有和不能傳播_布局語義差異的_算子,例如 Reshape。傳播在碰到此類算子時停止。

圖5:通過基于傳播的TFLite2ONNX方法生成的ONNX模型的一部分

在整個圖中傳播_布局語義差異_時,對于某個算子:如果它是 TransparentAttribute_,則在其張量之間傳播_布局語義差異_;如果是 _ImplicitTerminate_,則終止此方向上的傳播。_圖 5 是用_傳播基礎的方法_從 NASNet TFLite 模型轉換得到的 ONNX 模型的一部分。

顯式布局和廣播

通過_基于傳播的方法_,轉換后的 ONNX 模型可輕松處理_布局語義差異_,即無需引入其他算子或張量。

但是,有時可能存在不兼容的布局。考慮如下的 Reshape。如果 ? ??A? 被傳播而其他張量沒有,由于用戶可能會假設 ? ??B? 的維度和 ? ??A? 有某種關聯,那么輸出布局可能是意料之外的。(_基于轉換的方法_沒有問題,因為它的布局在模型級別上是 TFLite 格式的,_布局語義差異_在內部用 [ ]→[ ]→[ ][Transpose]→[OP]→[Transpose] 模式處理。) { ?}→? ?→[ ? ]→? ?? ?}→[ ]→? ?{Graph}→?A?→[Reshape]→?B??C?}→[Concat]→?D? 我們引入了_顯式布局_來處理這種情況。用戶可以給 TFLite2ONNX 提供 { : ( , )}{Tensor name:tuple(TFLite layout,ONNX layout)} 映射來描述 TFLite 布局和 ONNX 布局的關聯。而且,用戶可以靈活地為非 Transparent 的算子定義布局轉換。例如,我們對只有 Add 算子的 TFLite 圖執行 NHWC 到 NCHW 布局的轉換。

另一個問題是二元算子的廣播,例如 Add(有關更多信息,請參見此問題)。在下面的例子中, ? ??B? 需要廣播。如果 ? ??A? 從 NHWC 轉換為 NCHW,即 ? (2×5×3×4)??A(2×5×3×4)?,而 ONNX 模型中的 ? ??B? 無法廣播。更麻煩的是,_布局語義轉換_在 ? ??B? 處無法傳播,因為 ? ??A? 和 ? ??B? 具有不同的維度。 { ?}→? (2×3×4×5)?? (4×5)?}→[ ]→? ?{Graph}→?A(2×3×4×5)??B(4×5)?}→[Add]→?C? tflite2onnx 引入 _Reshape 模式_來處理廣播問題。對于像 ? ??B? 這樣的張量,拓展它的維度(插入1)使它們彼此相等,以便傳播和廣播可以正確地工作。傳播前的中間圖示例如下。 { ?}→? (2×3×4×5)?? (4×5)?→[ ? ]→? ′(1×1×4×5)?}→[ ]→? ?{Graph}→?A(2×3×4×5)??B(4×5)?→[Reshape]→?B(1×1×4×5)′?}→[Add]→?C?

量化語義轉換

TensorFlow 很早就提供了生產級的量化支持。通過將量化的 TFLite 模型轉換為 ONNX,我們可以將量化功能引入更多系統。(如果本節中的一些描述使您感到困惑,可以先閱讀神經網絡量化簡介。)

問題與 TF2ONNX

TensorFlow 和 TFLite 提供了許多量化解決方案:規范后訓練量化感知訓練。所有這些技術最后生成量化的 TFLite 模型——大多數情況下時 uint8 格式。這些模型由 TFLite 運行時中的量化版本算子運行。本文將量化張量的 uint8 數據、_scale_、_zero point_ 表示為_量化語義_。

另一方面,ONNX中的量化支持有兩個方面(wiki):

  • 接受低精度整數張量(uint8int8)的量化算子。
  • [QLinearConv](https://link.zhihu.com/?target=https%3A//github.com/onnx/onnx/blob/master/docs/Operators.md%23QLinearConv)[QLinearMatMul](https://link.zhihu.com/?target=https%3A//github.com/onnx/onnx/blob/master/docs/Operators.md%23QLinearMatMul) 產生低精度輸出,類似于 TFLite 的量化版 Conv
  • [ConvInteger](https://link.zhihu.com/?target=https%3A//github.com/onnx/onnx/blob/master/docs/Operators.md%23ConvInteger)[MatMulInteger](https://link.zhihu.com/?target=https%3A//github.com/onnx/onnx/blob/master/docs/Operators.md%23matmulinteger) 生成 int32 輸出,可以將其重新量化為低精度。
  • [QuantizeLinear](https://link.zhihu.com/?target=https%3A//github.com/onnx/onnx/blob/master/docs/Operators.md%23QuantizeLinear) 以及分別 [DequantizeLinear](https://link.zhihu.com/?target=https%3A//github.com/onnx/onnx/blob/master/docs/Operators.md%23DequantizeLinear)高精度floatint32 )與低精度轉換的算子。

TensorFlow 和 ONNX 之間的語義鴻溝很大。

在 TensorFlow 生態中,由于量化表示是為 TFLite 設計的,TensorFlow 圖量化支持有限。因此,TF2ONNX 不提供量化支持。

使用量化算子

在 TFLite2ONNX 最初的設計中,如果量化的 TFLite 算子具有在 ONNX 中有對應,則將其轉換為量化的 ONNX 算子,如 QLinearConv;否則轉換回浮點算子。

由于只有 ConvMatMul 在 ONNX 中具有量化算子,我們不可能生成端到端的量化 ONNX 模型。因此,在量化的 ONNX 算子兩端需要插入 Quantize 和 Dequantize。 ? ?? ?}→[ ]→? ?→[ ]→? ??Aq??Bq?}→[Addq]→?Cq?→[Convq]→?Fq? 例如,給定上面的 TFLite 圖,其中 q 表示張量或算子被量化,量化和反量化算子被插入 [ ][Conv] 兩端, 并將其他地方的張量和算子轉換回浮點,結果如下所示。 ? ?? ?}→[ ]→? ?→[ ]→? 8?→[ ]→? 8?→[ ]→? ??Afloat??Bfloat?}→[Add]→?Cfloat?→[QuantizeLinear]→?Duint8?→[QLinearConv]→?Euint8?→[DequantizeLinear]→?Ffloat? 對于主要由 Conv 構成的模型,例如 MobileNetV1(我們確實嘗試過轉換),這個問題還不大。但對于大多數其他模型,ConvMatMul 只占算子總數的一小部分,這要在 ONNX 模型中插入太多的新算子和張量。

而且,像其他許多深度學習系統一樣,ONNX 張量表示不具有量化語義。也就是說,低精度 uint8 張量就是單純的 uint8 數據,就像 numpy 一樣——沒有/_scale/_ 和 zero point 描述。對于轉換回浮點的張量,它們的_量化語義_已經丟失——這導致我們無法從量化感知訓練中獲益。

維護量化信息

TFLite2ONNX 不使用量化算子,而是通過插入_量化模式_在 ONNX 模型中維護_量化語義_。 [ ]→? ?→[ ]→?????? ?? /_ ?? ??????→[ ]→? ′ ?→[ ][OP]→?Tf?→[Quantize]→{?Tq??Tzero/_point??Tscale?}→[Dequantize]→?Tf′?→[OP] 具體而言,上面的 ONNX 圖是tflite2onnx 是從 TFLite 圖 [ ]→? ?→[ ][OPq]→?Tq?→[OPq] 生成的。

如果原始的 TFLite 模型具有 O 個算子和 T 個張量,則生成的模型中最多可能有 +2 O+2T 個算子和 3 3T 個張量。盡管這種機制增加了更多的張量,但成功在 ONNX 模型中保留了_比例_和_零點_語義。_圖6_ 是將一個量化的 TFLite Conv 模型轉換為 ONNX 的示例。

圖6:由 TFLite2ONNX 生成的量化 ONNX 模型

運行 ONNX 模型的框架可以決定如何啟用量化的 ONNX 模型。可以將量化圖轉換回非量化圖,或者使用其量化版本算子優化_量化模式_,以獲得更好的性能。

實現

截至 v0.3,TFLite2ONNX 是一個非常簡單的僅包含約 2000 行代碼的軟件包。這些代碼分為幾個部分:每個 TFLite 算子專用的轉換器類;Graph 級別管理的數據布局和量化處理;幫助函數或封裝,例如TensorLayout

截至 v0.3 ,許多卷積神經網絡已經得到支持(測試分支包含了一部分)。支持大約 20 個 TFLite 算子。有命令行工具和 Python 接口可用

目前的限制包括:

您可以在https://link.zhihu.com/?target=https%3A//github.com/jackwish/tflite2onnx/issues%3Fq%3Dis%253Aissue%2Blabel%253AStory">https://github.com/jackwish/tflite2onnx/issues?q=is%3Aissue+label%3AStory">帶有 Story 標記的 GitHub 問題中找到更多開發相關的背景。

推薦閱讀

審核編輯:符乾江
聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 人工智能
    +關注

    關注

    1791

    文章

    47244

    瀏覽量

    238362
  • 機器學習
    +關注

    關注

    66

    文章

    8414

    瀏覽量

    132604
  • TensorFlow Lite
    +關注

    關注

    0

    文章

    26

    瀏覽量

    621
收藏 人收藏

    評論

    相關推薦

    基于Pytorch訓練并部署ONNX模型在TDA4應用筆記

    電子發燒友網站提供《基于Pytorch訓練并部署ONNX模型在TDA4應用筆記.pdf》資料免費下載
    發表于 09-11 09:24 ?0次下載
    基于Pytorch訓練并部署<b class='flag-5'>ONNX</b><b class='flag-5'>模型</b>在TDA4應用筆記

    使用TensorFlow進行神經網絡模型更新

    使用TensorFlow進行神經網絡模型的更新是一個涉及多個步驟的過程,包括模型定義、訓練、評估以及根據新數據或需求進行模型微調(Fine-tuning)或重新訓練。下面我
    的頭像 發表于 07-12 11:51 ?408次閱讀

    請問ESP32如何運行TensorFlow模型

    請問ESP32如何運行TensorFlow模型
    發表于 07-09 07:30

    tensorflow簡單的模型訓練

    在本文中,我們詳細介紹如何使用TensorFlow進行簡單的模型訓練。TensorFlow是一個開源的機器學習庫,廣泛用于各種機器學習任務,包括圖像識別、自然語言處理等。我們將從安裝
    的頭像 發表于 07-05 09:38 ?645次閱讀

    keras模型tensorflow session

    在這篇文章中,我們討論如何Keras模型轉換為TensorFlow session。 Keras和T
    的頭像 發表于 07-05 09:36 ?519次閱讀

    如何使用Tensorflow保存或加載模型

    繼續訓練也是必要的。本文詳細介紹如何使用TensorFlow保存和加載模型,包括使用tf.keras和tf.saved_model兩種主要方法。
    的頭像 發表于 07-04 13:07 ?1499次閱讀

    導入keras或者onnx模型到cubeai進行分析,為什么會報錯?

    請問我導入keras或者onnx模型到cubeai進行分析,為什么會報錯,而且沒有報錯內容,cubeai版本9.0.0。換成8.1.0版本后報錯內容是invalid network。該怎么入手解決。
    發表于 07-03 07:55

    STM CUBE AI錯誤導入onnx模型報錯的原因?

    使用cube-AI分析模型時報錯,該模型是pytorch的cnn轉化成onnx ``` Neural Network Tools for STM32AI v1.7.0 (STM.ai v8.0.0-19389) INTER
    發表于 05-27 07:15

    ONNX是什么?

    ONNX是什么?
    的頭像 發表于 05-15 09:49 ?1833次閱讀

    cubemx ai導入onnx模型后壓縮失敗了怎么解決?

    cubemx ai導入onnx模型后壓縮失敗。請問我怎么解決
    發表于 03-19 07:58

    使用電腦上tensorflow創建的模型轉換為tflite格式了,導入后進度條反復出現0-100%變化,為什么?

    使用電腦上tensorflow創建的模型轉換為tflite格式了,導入后,進度條反復出現0-100%變化,卡了一個晚上了還沒分析好?
    發表于 03-19 06:20

    yolov5s的模型轉成.onnx模型,進行cube-ai分析時報錯的原因?

    報錯顯示張量不能大于四維的,想請教解決一下,我再此之后通過onnx-simplifier對.onnx進行簡化之后再通過cube-ai進行分析還是出現上述報錯,懇求指導,謝謝您!
    發表于 03-15 06:54

    谷歌模型怎么用PS打開文件和圖片

    谷歌模型本身并不是用Adobe Photoshop(簡稱PS)打開的文件和圖片格式。谷歌模型通常是用于機器學習和深度學習的模型文件,如TensorFlow
    的頭像 發表于 02-29 18:25 ?1442次閱讀

    通過新的ONNX導出器簡化模型導出流程

    大家好。我叫Manav Dalal,今天我講解如何通過新的ONNX導出器簡化模型導出流程。如果你還沒有聽說過ONNX,它是一種用于表示機器學習模型
    的頭像 發表于 01-10 09:45 ?945次閱讀
    通過新的<b class='flag-5'>ONNX</b>導出器簡化<b class='flag-5'>模型</b>導出流程

    如何使用TensorFlow構建機器學習模型

    在這篇文章中,我逐步講解如何使用 TensorFlow 創建一個簡單的機器學習模型
    的頭像 發表于 01-08 09:25 ?981次閱讀
    如何使用<b class='flag-5'>TensorFlow</b>構建機器學習<b class='flag-5'>模型</b>
    主站蜘蛛池模板: 御姐被吸奶| 中国少妇内射XXXHD免费| 欧美日韩精品一区二区三区四区| 午夜视频无码国产在线观看| 芳草地在线观看免费视频| 欧美视频 亚洲视频| a在线视频免费观看| 欧美黑人经典片免费观看| 99久久久国产精品免费调教| 毛片免费播放| 99视频这里只有精品国产| 欧美 亚洲 有码中文字幕| chinese国语露脸videos| 欧美特黄99久久毛片免费| 芭乐草莓樱桃丝瓜18岁大全| 青青草国产精品久久| 高清国产免费观看视频在线| 四虎影视永久无码精品| 国产欧美亚洲综合第一页| 亚洲精品一区国产欧美| 久久国产主播福利在线| 538prom精品视频我们不只是| 美女视频黄a视频全免费网站色窝| 99久久麻豆AV色婷婷综合| 热久久免费频精品99热| 国产精品96久久久久久AV不卡| 性欧美videosex18嫩| 久久99热这里只有精品66| 91免费精品国自产拍在线可以看| 欧美videosgratis杂交| 国产a在线不卡| 亚洲精品伊人久久久久| 老司机福利在视频在ae8| yy8090韩国理伦片在线| 午夜理伦片免费| 酒色.com| 国产成人综合在线观看| 亚洲一区精品伊人久久伊人| 麻豆国产MV视频| 国产成人小视频在线观看| 亚洲人成电影网站在线观看|