中文字幕在线日韩,亚洲阿v天堂,亚洲精品中文字幕久久久久久

寫在前面

能獲得企業(yè)大獎(jiǎng)其實(shí)是出乎預(yù)料的，論復(fù)雜程度我自己認(rèn)為可能也無法比的上其他學(xué)校的朋友們的(不過是因?yàn)榻衲隂]有線下交流，著實(shí)無法看到大家的作品)，但我覺得組委會(huì)能選擇我們組作為企業(yè)大獎(jiǎng)，可能也是想通過我們來拓寬大家的思路，而并不一定是我們的作品做的是多么完美。

學(xué)習(xí)了近幾年ARM杯的作品，感覺大家都是在同一個(gè)領(lǐng)域做文章(當(dāng)然去年那組BLDC的hxd例外)，那就是視覺和圖像處理方面。這方面感覺大家做的都非常好了，無論是用現(xiàn)成的算法拆分成verilog中的矩陣運(yùn)算，還是利用HLS這類高層次綜合工具，我覺得如果繼續(xù)做視覺方面的內(nèi)容我們可能再怎么努力也無法達(dá)到他人積累多年經(jīng)驗(yàn)的程度，所以我們選擇換一個(gè)角度。

人類有五種感官，嗅覺和味覺目前來說無法做到輔助(笑，還剩下聽覺、視覺和觸覺，視覺被我們直接否定了，那么觸覺呢？目前高精度的傳感器也不是我們能企及做到的了，這和生物醫(yī)學(xué)電子有關(guān)，那么我們的眼前就只有一個(gè)選擇了：聽覺。

這也正是我們選擇做這個(gè)系統(tǒng)的原因之一，還有一個(gè)原因是我們能感覺得到現(xiàn)在的消費(fèi)電子都逐漸在向聲學(xué)方面走，例如蘋果的HomePod，華為的Sound X，還有小米最近剛推出的小米Sound，這些都是非常高端的走計(jì)算聲學(xué)方向的家居產(chǎn)品，它們的受眾非常廣，而且在這兩年疫情的影響下，更多的人會(huì)選擇在線會(huì)議，那么一個(gè)優(yōu)秀的聲學(xué)處理裝置就顯得更為重要了。

1.設(shè)計(jì)簡(jiǎn)介

1.1 總體介紹

本作品是基于Coretex-M3 Design Start的語音識(shí)別和聲源定位識(shí)別系統(tǒng)，包括Digilent NexysVideo開發(fā)板、自制麥克風(fēng)矩陣模塊、ESP8266無線互聯(lián)模塊、LCD屏幕、載體小車以及安卓端APP組成。

本系統(tǒng)在Xilinx Artix-7中搭建ARM Cortex-M3軟核作為中央處理器，使用自制的MEMS硅片麥克風(fēng)陣列作為聲音信號(hào)采集器，利用Artix-7中自帶的XADC將麥克風(fēng)輸出的模擬量信號(hào)轉(zhuǎn)換為數(shù)字信號(hào)并通過AXI4-FULL傳輸給DDR3控制器，DDR3控制器根據(jù)用戶的控制選擇輸入和輸出，當(dāng)開始語音識(shí)別后，將開啟后1s內(nèi)的數(shù)據(jù)從DDR3中直接利用Burst讀入語音識(shí)別模塊，該模塊利用HLS綜合，包括語音的MFCC特征提取、BP神經(jīng)網(wǎng)絡(luò)的執(zhí)行等過程，將最終得出的語音識(shí)別結(jié)果保存在寄存器中并能使CPU通過AXI4-Lite讀??；當(dāng)開啟聲源定位后，數(shù)據(jù)利用AXI4-Stream直接搬移到算法電路模塊，對(duì)四路麥克風(fēng)同時(shí)進(jìn)行流水線處理，經(jīng)過信號(hào)的處理和變換后得到聲源方位數(shù)據(jù)通過UART串口輸出到ESP8266，ESP8266利用局域網(wǎng)將數(shù)據(jù)傳至安卓APP。

有一點(diǎn)我們的體會(huì)可以分享給其他朋友們，如果我們?cè)谝欢螘r(shí)間內(nèi)只需要處理一段定長(zhǎng)的數(shù)據(jù)，那么我們可以不利用DMA，而是僅僅利用AXI的Burst傳輸即可，例如采集1s的信號(hào)寸到DDR中一段連續(xù)區(qū)域以后，將這些的音頻信號(hào)數(shù)據(jù)整個(gè)Burst到加速器中，這樣可以充分發(fā)揮總線橋的作用，并節(jié)省一個(gè)DMA的資源，還可以減小數(shù)據(jù)搬移過來過去的時(shí)延。

1.2 硬件架構(gòu)

在本系統(tǒng)中，由于最終制作的語音識(shí)別加速器和聲源定位加速器都使用AXI系列總線配置寄存器和讀寫數(shù)據(jù)，同時(shí)DDR3由AXI總線接口的MIG管理，因此為了方便實(shí)用和同一總線，使整個(gè)架構(gòu)簡(jiǎn)潔，我們將除了ITCM和DTCM外的所有外設(shè)連接在由AHB轉(zhuǎn)換之后的AXI總線橋上。

1.3 語音識(shí)別加速器

語音識(shí)別采用的方案是利用MFCC提取特征，之后利用BP神經(jīng)網(wǎng)絡(luò)擬合特征系數(shù)對(duì)應(yīng)的神經(jīng)網(wǎng)絡(luò)隱含層參數(shù)。首先輸入的語音數(shù)據(jù)從DDR經(jīng)過Burst傳輸?shù)叫盘?hào)處理模塊中，經(jīng)過預(yù)處理(去工頻噪聲、音量均衡)后提取MFCC，再利用BP網(wǎng)絡(luò)將MFCC系數(shù)與訓(xùn)練過的語句一一對(duì)應(yīng)輸出對(duì)應(yīng)的結(jié)果。語音識(shí)別的網(wǎng)絡(luò)的權(quán)重參數(shù)采用的是MATLAB離線訓(xùn)練的方法，然后把訓(xùn)練的權(quán)重?cái)?shù)據(jù)保存在coe文件中，利用HLS綜合出IP。

流程圖如下：

1.4 聲源定位加速器

聲源定位加速器融合了TDOA(Time Difference of Arrival 到達(dá)時(shí)間差)和空域波束指向性加權(quán)的方法。

由四個(gè)全向性麥克風(fēng)M1, M2, M3, M4組成的差分麥克風(fēng)列，如圖2.10所示。四麥克風(fēng)等間隔的分布在直徑為D的圓周上。

差分麥克風(fēng)陣列的輸出信號(hào)包括原點(diǎn)處的聲壓信號(hào)和原點(diǎn)處振速的兩個(gè)正交分量，可以得到聲源在原點(diǎn)處的聲強(qiáng)，進(jìn)而由聲強(qiáng)的方向得到目標(biāo)方位的估計(jì)值。需要指出的是，基于聲強(qiáng)估計(jì)的聲源定位方法通常只適用于單聲源的情況。同時(shí)，對(duì)于全向麥克風(fēng)而言(不同于“心”形指向麥克風(fēng))，并沒有對(duì)特定角度的聲源信號(hào)進(jìn)行增強(qiáng)或削弱，這就使得在進(jìn)行聲源定位時(shí)往往受到其他方向的干擾。采用空域波束指向性加權(quán)的方法，可以只增強(qiáng)期望方向上的信號(hào)，削弱其他方向上的干擾信號(hào)，提高信干比，使得輸出結(jié)果中特定方向上的信息能量增大。

2.作品外觀和使用體驗(yàn)

作品成品外觀如下：

審核編輯：李倩

阅读全文

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴

語音識(shí)別

語音識(shí)別

+關(guān)注

關(guān)注
38

文章
1757

瀏覽量
113251
識(shí)別系統(tǒng)

識(shí)別系統(tǒng)

+關(guān)注

關(guān)注
1

文章
138

瀏覽量
18896
CORETEX

CORETEX

+關(guān)注

關(guān)注
0

文章
2

瀏覽量
6341

原文標(biāo)題：【2021集創(chuàng)賽作品分享】第三期 | Cortex-M3語音識(shí)別聲源定位系統(tǒng)

文章出處：【微信號(hào)：Ithingedu，微信公眾號(hào)：安芯教育科技】歡迎添加關(guān)注！文章轉(zhuǎn)載請(qǐng)注明出處。

評(píng)論

相關(guān)推薦

雷卯針對(duì)遠(yuǎn)場(chǎng)六麥克風(fēng)陣列板科大訊飛6語音識(shí)別模塊防護(hù)示意圖

一、應(yīng)用場(chǎng)景 1. 實(shí)時(shí)翻譯 2. 會(huì)議定向錄音 3. TTS文字轉(zhuǎn)音頻 4. 聲源定位 5. 回聲消除 6. 離線語音識(shí)別 7. 音頻降噪

發(fā)表于 02-10 10:43 ?145次閱讀

雷卯針對(duì)遠(yuǎn)場(chǎng)六麥克風(fēng)陣列板科大訊飛6<b class='flag-5'>語音</b><b class='flag-5'>識(shí)別</b>模塊防護(hù)示意圖

新唐科技基于NuMaker-M55M1平臺(tái)的人臉識(shí)別系統(tǒng)

人臉識(shí)別技術(shù)已成為現(xiàn)代科技的重要基石，廣泛應(yīng)用于安全監(jiān)控、門禁系統(tǒng)以及用戶身份認(rèn)證等領(lǐng)域。新唐科技基于 NuMaker-M55M1 平臺(tái)的人臉識(shí)別系統(tǒng)，結(jié)合多種核心技術(shù)組件，包括圖像處

發(fā)表于 01-20 10:31 ?259次閱讀

幾款性價(jià)比很不錯(cuò)的門禁人臉識(shí)別系統(tǒng)及其常見應(yīng)用

在當(dāng)今智能化時(shí)代，門禁系統(tǒng)作為安全管理的重要一環(huán)，正逐步向更高效、更便捷的人臉識(shí)別技術(shù)轉(zhuǎn)型。其中，遠(yuǎn)景達(dá)物聯(lián)網(wǎng)推出的F3與F6門禁人臉識(shí)別系統(tǒng)，憑借其卓越的性能與廣泛的應(yīng)用領(lǐng)域，成為了

發(fā)表于 01-03 14:49 ?245次閱讀

幾款性價(jià)比很不錯(cuò)的門禁人臉<b class='flag-5'>識(shí)別系統(tǒng)</b>及其常見應(yīng)用

基于語音識(shí)別的智能會(huì)議系統(tǒng)具備哪些交互功能

標(biāo)貝科技專注智能語音交互領(lǐng)域多年，在語音識(shí)別和語音合成領(lǐng)域有著多項(xiàng)大型企業(yè)合作案例，標(biāo)貝與多個(gè)智能會(huì)議系統(tǒng)廠商合作，成功將

發(fā)表于 12-20 10:35 ?306次閱讀

RFID識(shí)別系統(tǒng)

隨著信息技術(shù)的快速發(fā)展，RFID（射頻識(shí)別）技術(shù)在各行各業(yè)的應(yīng)用日益廣泛，其中RFID識(shí)別系統(tǒng)作為核心應(yīng)用，已經(jīng)成為智能化管理不可或缺的基石。通過無線射頻信號(hào)的非接觸式識(shí)別與數(shù)據(jù)傳輸，RFID

發(fā)表于 12-06 17:57 ?433次閱讀

物聯(lián)網(wǎng)系統(tǒng)智能控制產(chǎn)品的語音識(shí)別方案_離線語音識(shí)別芯片分析

01 物聯(lián)網(wǎng)系統(tǒng)中為什么要使用離線語音識(shí)別芯片物聯(lián)網(wǎng)系統(tǒng)中使用離線語音識(shí)別芯片的原因主要基于以

發(fā)表于 09-26 17:56 ?929次閱讀

WTK6900FC語音識(shí)別模塊

語音識(shí)別

WT-深圳唯創(chuàng)知音電子有限公司
發(fā)布于 :2024年09月25日 17:35:07

智能玩具用離線語音識(shí)別芯片有什么優(yōu)勢(shì)

的語音識(shí)別系統(tǒng)，應(yīng)用場(chǎng)景相對(duì)單一。典型應(yīng)用：智能家電、語音遙控器、智能玩具、車載聲控、智能家居等當(dāng)離線語音識(shí)別芯片應(yīng)用在智能玩具中，能夠提供

發(fā)表于 09-20 10:00 ?389次閱讀

基于FPGA的指紋識(shí)別系統(tǒng)設(shè)計(jì)

隨著人們對(duì)安全問題的日益重視，指紋識(shí)別作為一種高效、可靠的生物識(shí)別技術(shù)，在多個(gè)領(lǐng)域得到了廣泛應(yīng)用。本文設(shè)計(jì)并實(shí)現(xiàn)了一種基于FPGA的嵌入式指紋識(shí)別系統(tǒng)，該系統(tǒng)利用FPGA的高集成度、低

發(fā)表于 07-17 16:33 ?1594次閱讀

多目標(biāo)智能識(shí)別系統(tǒng)

智慧華盛恒輝多目標(biāo)智能識(shí)別系統(tǒng)是一種利用現(xiàn)代計(jì)算機(jī)視覺技術(shù)和人工智能算法，從圖像或視頻中同時(shí)識(shí)別和分類多個(gè)目標(biāo)物體的系統(tǒng)。這種系統(tǒng)廣泛應(yīng)用于自動(dòng)駕駛、智能監(jiān)控、人機(jī)交互、軍事偵察、災(zāi)害

發(fā)表于 07-16 10:42 ?1.9w次閱讀

基于OpenCV的人臉識(shí)別系統(tǒng)設(shè)計(jì)

基于OpenCV的人臉識(shí)別系統(tǒng)是一個(gè)復(fù)雜但功能強(qiáng)大的系統(tǒng)，廣泛應(yīng)用于安全監(jiān)控、人機(jī)交互、智能家居等多個(gè)領(lǐng)域。下面將詳細(xì)介紹基于OpenCV的人臉識(shí)別系統(tǒng)的基本原理、實(shí)現(xiàn)步驟，并附上具體的代碼示例。

發(fā)表于 07-11 15:37 ?1.7w次閱讀

語音識(shí)別和自然語言處理的區(qū)別和聯(lián)系

Recognition） 1. 定義語音識(shí)別，又稱為自動(dòng)語音識(shí)別（Automatic Speech Recognition, ASR），是指將人類的

發(fā)表于 07-05 10:09 ?2222次閱讀

基于GIS的SAR多目標(biāo)智能識(shí)別系統(tǒng)

智慧華盛恒輝基于GIS的SAR多目標(biāo)智能識(shí)別系統(tǒng)是一個(gè)集成了合成孔徑雷達(dá)(SAR)和地理信息系統(tǒng)(GIS)技術(shù)的先進(jìn)系統(tǒng)，旨在實(shí)現(xiàn)高分辨率雷達(dá)圖像中的多目標(biāo)智能識(shí)別。以下是該

發(fā)表于 06-26 14:26 ?603次閱讀

車載語音識(shí)別系統(tǒng)語音數(shù)據(jù)采集標(biāo)注案例

車載語音識(shí)別系統(tǒng)是指利用機(jī)器學(xué)習(xí)算法實(shí)現(xiàn)的一種自然語言處理技術(shù)，載語音識(shí)別系統(tǒng)通過辨別聲音的語調(diào)、語速和音量，將所聽到的語音轉(zhuǎn)化成可讀取的語

發(fā)表于 06-19 15:52 ?449次閱讀

車載語音識(shí)別系統(tǒng)語音數(shù)據(jù)采集標(biāo)注案例

車載語音識(shí)別系統(tǒng)是指利用機(jī)器學(xué)習(xí)算法實(shí)現(xiàn)的一種自然語言處理技術(shù)，載語音識(shí)別系統(tǒng)通過辨別聲音的語調(diào)、語速和音量，將所聽到的語音轉(zhuǎn)化成可讀取的語

發(fā)表于 06-19 15:49 ?634次閱讀

色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

搜索歷史

基于Coretex-M3 Design Start的語音識(shí)別和聲源定位識(shí)別系統(tǒng)

評(píng)論

雷卯針對(duì)遠(yuǎn)場(chǎng)六麥克風(fēng)陣列板科大訊飛6語音識(shí)別模塊防護(hù)示意圖

新唐科技基于NuMaker-M55M1平臺(tái)的人臉識(shí)別系統(tǒng)

幾款性價(jià)比很不錯(cuò)的門禁人臉識(shí)別系統(tǒng)及其常見應(yīng)用

基于語音識(shí)別的智能會(huì)議系統(tǒng)具備哪些交互功能

RFID識(shí)別系統(tǒng)

物聯(lián)網(wǎng)系統(tǒng)智能控制產(chǎn)品的語音識(shí)別方案_離線語音識(shí)別芯片分析

WTK6900FC語音識(shí)別模塊

智能玩具用離線語音識(shí)別芯片有什么優(yōu)勢(shì)

基于FPGA的指紋識(shí)別系統(tǒng)設(shè)計(jì)

多目標(biāo)智能識(shí)別系統(tǒng)

基于OpenCV的人臉識(shí)別系統(tǒng)設(shè)計(jì)

語音識(shí)別和自然語言處理的區(qū)別和聯(lián)系

基于GIS的SAR多目標(biāo)智能識(shí)別系統(tǒng)

車載語音識(shí)別系統(tǒng)語音數(shù)據(jù)采集標(biāo)注案例

車載語音識(shí)別系統(tǒng)語音數(shù)據(jù)采集標(biāo)注案例

電子發(fā)燒友