色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

基于FPGA的AIX語音識別解決方案

454398 ? 來源:AI加速微信公眾號 ? 作者:AI加速微信公眾號 ? 2020-11-14 12:09 ? 次閱讀

AIX(artificial intelligence aXellerator)是韓國SK公司語音識別提供的一個解決方案,應用于微軟的開源語音識別框架Kaldi。AIX使用了Xilinx的FPGA平臺,充分利用了FPGA能提供的外存訪問帶寬和DSP資源。在自動語言識別(ASR)中,在性能和功耗上超過了分別超過了最領先的CPU 10.2倍和流行的GPU20.1倍。

1. 硬件平臺和算法介紹
AIX使用了Xilinx Kintex Ultrascale KCU1500板卡,板卡包括一個KU115芯片,4塊4GB DDR4-2400的DRAM,每塊芯片有64個DQ引腳。最大可以支持76.8GB/s的帶寬。KU115芯片資源如下:

圖1.1 KU115資源

圖1.1 KU115資源

Kaldi是一個基于C++編寫的用于語音識別的開源工具,它依賴于兩個外部工具庫:一個是openFst,另外一個是線性計算,包括矩陣乘法,以及矩陣和向量的操作。openFst基于有限狀態轉換器算法,可以用于語音和語言識別中。所以在ASR中包含了大量的矩陣乘法運算。AIX主要的目的就是加速這些矩陣乘法運算。

圖1.2 Kaldi庫

圖1.2 Kaldi庫

一個基本的語音識別算法過程如下:首先采集人的語音信號,將語音信號分割成一段段向量,每個向量會有一些重疊。將每段語音信號經過FFT等操作,轉換為MFCC或者倒譜,實際上就是做了一些向量的轉換操作。MFCC或者倒譜的表達能更好的提取語音特征。在論文中每個向量長度為120。為了能夠表現不同向量之間的關系,將每個Ci向量最近鄰的2n個向量組合為一個整體,然后送到MLP進行運算。通過MLP提取特征,在進行HMM操作進行分類處理。AIX就是加速MLP這部分操作,因為這部分占據了整個算法的大部分運算,涉及到大量矩陣運算。

圖1.3 ASR算法過程

2. DNN硬件架構

圖2.1 AIX硬件架構

圖2.1 AIX硬件架構

在KU115上,AIX由兩個核組成,每個核的結構是一樣的。這兩個核分別分布在芯片的兩個die上。每個核使用兩個DDR4,每個提供38.4GB/s的帶寬。核心計算單元是脈動陣列結構,大小為64x40,總共使用了2560個DSP。語音向量從脈動陣列左側進入,權重數據從上邊脈動進入,然后在每個DSP進行乘法,每個DSP還進行累加。最后可以輸出一個64X40大小的矩陣。因此進入的語音向量,每次在緩存中獲得了40個120的語音向量后,進行轉置操作,得到120X40的向量組合,然后脈動送入陣列。完成矩陣乘法。這種算法在之前的文章《在DNN中FPGA都做了什么?》有詳細描述。這對語音向量的帶寬要求是一個FPGA時鐘周期40x16bit,權重為64x16bit。64的選擇可以適配DDR的帶寬38.4GB/s。這樣既充分利用了DSP資源,也更好的利用了DDR帶寬。這種方案適合處理矩陣乘矩陣,但是對于矩陣乘向量的DSP利用率就會很低了。因為權重的IO帶寬較低。

圖2.2 矩陣x矩陣計算陣列

圖2.2 矩陣x矩陣計算陣列

這個板卡是通過PCIE和主機連接,主機完成DNN之外的HMM,decoder等操作。開始主機通過PCIE將一定量的權重存儲到板卡的DDR中,然后AIX主動去獲取權重數據。權重數據是不斷被復用的,因此初始時刻被加載到DDR中以后,就不需要再加載權重了。除非權重很多超過了DDR的存儲空間。主要更新的是語音向量,需要通過PCIE不斷下載到片上。當片上向量隊列存儲了40個后,就可以進行轉置送到脈動陣列進行運算。

對于網絡中的其他操作,比如sigmoid,tangent,leakyRelu等,都是通過查找表完成的。查找表的方式可以更靈活的用于這些雜七雜八的運算。這些運算數學公式復雜,直接計算會耗費很多邏輯,不如查找表簡潔。缺點就是需要較大的存儲空間,空間是和數據精度有關的,精度越高消耗存儲空間越大。

3. 軟件架構
為了能夠將AIX更好的融入到基于Kaldi的ASR計算中,需要很好的和數據中心的軟件端進行匹配。因此提出三種軟件模型來解決這個問題。

一個模型用于對AIX的配置,即在AIX計算前,需要準備好權重和偏置數據。這種準備工作是由NN converter軟件來做的,主要就是判定一個網絡中哪些層可以被AIX加速,然后將這部分權重發送給AIX。

另外一個是監測模型。為了保證AIX的穩定運行,需要進行大量的邊緣條件測試,因此監測軟件來檢測一些異常情況。主要包括:功耗,溫度,資源利用,設備狀態。

最后一個是用于處理語音向量的軟件。為了保證實時處理語音數據,每8個語音向量組成一個batch,然后一起寫入AIX。為了提高脈動陣列的利用效率,語音緩存盡可能收集更多向量,然后開始計算。為了減小收集時間,軟件端提供了多個服務通道,同時準備語音向量,并向AIX發送或者接收來自AIX的結果。由于處理不同語音向量是有順序的,為了保證結果也能夠保持順序不變。每個通道增加了鎖機制來保持向量的發送和接收順序。當需要向AIX寫的時候,就產生一個有wlock的寫進程,直到wlock被解鎖,這個進程才開始往AIX發送數據。同理讀進程也有一個rlock。這些鎖會保證進程間的依賴和同步。

圖3.1 軟件架構

圖3.2 NN converter的作用

4. 結果
現在看資源利用率:

圖4.1 資源利用率

AIX的性能和Intel的E5-2620和Nvidia的P100 GPU進行了對比。同時考慮上功耗和語音識別時間,AIX都超過了CPU和GPU。

圖4.2 AIX和CPU以及GPU的性能對比

總結
AIX采用了脈動陣列的架構,充分利用了矩陣乘法中數據的復用率。能夠最大限度利用內存帶寬來獲得最大性能。

文獻
1. Minwook Ahn, S.J.H., Wonsub Kim, Seungrok Jung, Yeonbok Lee, Mookyoung Chung, Woohyung Lim, Youngjoon Kim, AIX A high performance and energy ef?cient inference accelerator on FPGA for a DNN-based commercial speech recognition. FPGA, 2019.

編輯:hfy


聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 加速器
    +關注

    關注

    2

    文章

    806

    瀏覽量

    38015
  • Xilinx
    +關注

    關注

    71

    文章

    2171

    瀏覽量

    121922
  • 語音識別
    +關注

    關注

    38

    文章

    1742

    瀏覽量

    112821
  • AIX
    AIX
    +關注

    關注

    0

    文章

    10

    瀏覽量

    9862
收藏 人收藏

    評論

    相關推薦

    CEVA攜Sensory力推先進的語音識別解決方案

    CEVA和Sensory宣布,兩家公司已合作推出一款先進的語音識別解決方案。該方案具有業界最低的功耗,以滿足嚴苛的電池壽命設計規范。
    發表于 03-12 09:57 ?1167次閱讀

    盲人閱讀器語音合成技術解決方案 #語音識別 #語音合成 #盲人閱讀器 #圖像識別#硬聲創作季

    語音圖像解決方案閱讀器圖像識別語音識別識別經驗分享
    電子知識科普
    發布于 :2022年10月27日 17:58:38

    語音識別有哪些成本稍微低的解決方案,訊飛或百度的能離線嗎

    語音識別有哪些成本稍微低的解決方案,訊飛或百度的能離線嗎如題 只識別命令
    發表于 07-07 14:50

    求一種基于LD332X的單芯片語音識別解決方案

    由于LD332X提供了真正的單芯片語音識別解決方案,可以非常方便地將LD332X集成進用戶的產品中,需要花費的開發成本很低。開發者可以先用語音識別
    發表于 07-30 06:01

    方言離線語音控制場景解決方案

      隨著科技的不斷發展,離線語音識別技術已經變得越來越成熟。在日常生活中,老人或小孩可能會遇到一些困難,如操作復雜的電子設備。為了解決這一問題,離線語音識別模塊成為了一個很好的
    發表于 11-17 17:57

    靈云遠場語音識別解決方案

    醒、聲源定向等關鍵技術,在引起產業界廣泛關注的同時,16日正式宣布推出面向智能終端的完整靈云遠場語音交互解決方案,該套方案完美整合了國內最新遠場語音
    發表于 10-13 11:54 ?0次下載

    華為云發布首款基于FPGA平臺語音識別加速解決方案

    高效語音識別引擎。該方案在亞馬遜AWS發布之后,迅速移植上線國內公有云市場。以語音識別為應用載體,對AI類應用推理計算進行全面加速。成為目前
    發表于 06-21 14:35 ?944次閱讀

    首款基于FPGA的原創深度學習語音識別加速解決方案面世,深鑒引領FPGA加速云市場

    高效語音識別引擎。該方案在亞馬遜AWS發布之后,迅速移植上線國內公有云市場。以語音識別為應用載體,對AI類應用推理計算進行全面加速。成為目前
    發表于 07-27 14:25 ?1875次閱讀

    一種低功耗的語音識別解決方案

    方案介紹概要:此設計提供了一種低功耗的語音識別解決方案。它通過實現波束賦形和噪聲抑制器功能來提高識別率,并且可以根據工作環境進行調整。系統優
    發表于 12-28 16:10 ?0次下載

    離線語音照明解決方案:讓你的照明更智能

    離線語音照明解決方案,它是將離線語音識別技術和照明控制技術相結合,為人們提供更加智能、便捷、安全的智能語音照明
    的頭像 發表于 05-19 17:03 ?2173次閱讀
    離線<b class='flag-5'>語音</b>照明<b class='flag-5'>解決方案</b>:讓你的照明更智能

    離線語音小夜燈解決方案

    離線語音小夜燈解決方案是一種基于離線語音識別技術的智能小夜燈解決方案,其主要功能是通過語音控制方
    的頭像 發表于 05-29 09:18 ?1489次閱讀
    離線<b class='flag-5'>語音</b>小夜燈<b class='flag-5'>解決方案</b>

    語音識別技術:端到端的挑戰與解決方案

    探討端到端語音識別技術的挑戰與解決方案。 二、端到端語音識別技術的挑戰 1.噪聲干擾和口音差異:端到端
    的頭像 發表于 10-18 17:06 ?1069次閱讀

    情感語音識別的技術挑戰與解決方案

    探討這些挑戰以及可能的解決方案。 二、情感語音識別的技術挑戰 情感表達的復雜性:人的情感表達是復雜且多變的,受到文化、個人經歷、語言習慣等多種因素的影響。這使得準確識別和理解人的情感狀
    的頭像 發表于 11-12 17:31 ?582次閱讀

    情感語音識別:現狀、挑戰與解決方案

    、挑戰與解決方案。 二、情感語音識別的現狀 技術發展:隨著深度學習技術的不斷進步,情感語音識別技術得到了快速發展。目前,基于卷積神經網絡(C
    的頭像 發表于 11-23 11:30 ?976次閱讀

    Achronix推出基于FPGA的加速自動語音識別解決方案

    提供超低延遲和極低錯誤率(WER)的實時流式語音轉文本解決方案,可同時運行超過1000個并發語音
    的頭像 發表于 11-29 15:18 ?734次閱讀
    主站蜘蛛池模板: 国产精品久久vr专区 | 午夜小视频免费观看 | 国产第一页浮力影院 | 日本不卡不码高清免费 | SM双性精跪趴灌憋尿调教H | 成3d漫二区三区四区 | 久啪久久全部视频在线 | a级全黄试频试看30分钟 | 一本大道熟女人妻中文字幕在线 | 欧美男男网站免费观看videos | 99热国产这里只有精品免费 | 簧片在线免费观看 | 男人插女人动态图 | 黄页网站免费视频大全9 | 国产AV精品久久久毛片 | 国产精品高清m3u8在线播放 | 国产亚洲精品免费视频 | asian极品呦女xx农村 | 国产亚洲精品免费视频 | 亚洲国产精品无码中文字满 | 午夜视频在线观看国产 | 动漫AV纯肉无码AV电影网 | TIMI1TV天美传媒在线观看 | 亚洲欧美偷拍视频一区 | 人妻免费视频公开上传 | 人妻中文字幕无码久久AV爆 | 欧美日韩中文国产一区发布 | 欧美MV日韩MV国产网站 | 亚洲精品国产高清嫩草影院 | 国产精品JIZZ视频免费 | 日日摸夜添夜夜夜添高潮 | 99re.05久久热最新地址 | 国产精品成人免费观看 | 黄色免费网址在线观看 | 99热都是精品 | 嫩草影院在线观看网站成人 | 国产一区二区三区四区五在线观看 | 色尼玛亚洲 | 国产a级黄色毛片 | 国产精品乱人无码伦AV在线A | 色婷婷综合久久久久中文一区二区 |