1 AP7003簡介
AP7003是一款新型、低成本語音識別專用集成電路,內置有麥克風放大器、A/D轉換器、語音處理器和I/O控制器,經預處理后可識別12組不同的字詞,每組1.5秒時長,可連詞或單詞識別。AP7003包括AP7003-01(由CPU串行控制)和AP7003-02(由按鍵直接控制)兩種型號,且具有高度的I/O可編程性,使用簡單方便,可廣泛應用于玩具、識別轉控、自動答錄等領域。
AP7003的功能框圖如圖1所示。
其主要特性如下:
· 內置麥克風放大器
· 內置A/D轉換器;
· DIP40雙列直插式封裝;
· 識別12組1.5秒時長字詞;
· I/O口具有2個普通輸入、4個觸發輸入、2個輸出口(分別有4個和12個輸出)、2個LED驅動;
· 指令優化以方便用戶使用;
· 2.4V~4.5V工作電壓,且具備低功耗模式。
2 AP7003功能說明
AP7003具有兩種工作模式,即錄音模式和識別模式。在使用識別模式之前,應先將目標詞錄入芯片內。AP7003內有12個存儲體用于存儲12組不同的字句,每個存儲體可存儲1.5秒時長的字詞,可通過鍵盤或按程序編制的順序選擇存儲體錄入及存放目標詞。語音可通過外部麥克風或其它媒體錄入芯片內,經內部處理后以不同的數字特征信號保存于存儲體中。
目標詞錄入芯片內后即可將工作模式轉換到識別模式,工作時芯片將當前語音與事先已錄入存儲體的目標詞語音相比較,如果有語音特征相匹配,則在芯片的相應輸出端口輸出高電平或低電平。需要時可以將芯片編程為省電模式以節省電能,當有按鍵信號時芯片將被喚醒。
AP7003采用DIP40封裝,引腳功能如表1所示,其典型應用電路如圖2所示。
表1AP7003引腳功能說明
引腳號引腳名稱功能說明
1PORES清除A輸出口(POA)輸出狀態,高有效
2GNDD數字地
3LED1驅動LED,低有效,可編程用于指示語音錄音的狀態
4LED2驅動LED,低有效,可編程用于指示語音識別的結果
8~5POB1~POB4B輸出口,可編程用于鍵盤驅動識別的結果
12~9PIT1~PIT4低脈沖觸發輸入,內部有上拉電阻,可編程用于鍵盤輸入
13VDDD數字電源
14CAPV通過電容接地,對內部電壓進行濾波
15OSC1振蕩頻率控制,通過56KΩ電阻接地
17、18PIM1、PIM2普通輸入引腳,可編程用于芯片工作模式控制:PIM1=1時,芯片具有識別功能;PIM2=1時,A端口可以輸出。反之不能 進行識別或A端口不能輸出
19TEST測試端,芯片出廠時測試用
20POSL對A輸出口有效電平進行選擇:高時A口高有效;低時A口低有效
21GNDA模擬地涑隹謨行У縉澆
22TREF語音輸入門限控制端
23A2OUT第二級放大器輸出端
24A1IN第一級放大器負輸入端
26A1OUT第一級放大器輸出端
28VDDA模擬電源
29~40POA1~POA12A輸出口,可編程用于語音錄入/語音識別對的存儲體指示
16、25NC未用引腳
3 AP7003-01的應用
AP7003-01可通過串行口與微控制器連接,應用圖如圖3所示。
AP7003-01共有22個輸入指令和15個輸出指令,如表2所示。AP7003-01工作時序及時間定義如圖4所示。
系統上電后必須先給AP7003-01發清除指令Clear Word以清除12個存儲體內的內容,然后發出一個存儲指令(Store Word1~Store Word12之一)將目標詞錄入芯片相應的存儲體內。當LED1有效時表示芯片準備好錄入目標詞。通過指令Set R_Model或Set R_Mode2可選擇兩種識別模式:Set R_Model為單詞識別模式,該模式下識別操作完成后芯片進入省電狀態以等待新的指令;Set R_Mode2為連詞識別模式,該模式下識別操作完成后芯片返回語音錄入狀態。
進入語音識別狀態前必須通過指令Set R_Levell~Set R_Level4設置識別時要求的匹配度,Set R_Level4要求匹配程度最高,而Set R_Level1最低,可以根據經驗設定為中間某一個值。跟在一個Store Word1~12指令之后的Store Flag指令將前面錄入的語音存入指定的存儲體以作為目標詞。Clear Outputs指令用于清除A端口輸出狀態(POA1~POA12)。Shut Down指令將芯片轉入關閉模式以節省電能。
當數據格式或時序出現在串行數據(SERIAL DATA)輸入口PIT3、PIT2、PIT1時,芯片將發送錯誤代碼到串行數據輸出口POB4,同時將數據、時鐘發送到串行數據輸出口POB2、POB3。
指令Store Word1~12、Store Flag、Clear Word、Set R_Level1~4和Clear Outputs執行完成后芯片將輸出一個Done代碼。芯片每次執行完語音識別后,輸出一個匹配指示代碼(Match Word1~Match Word12或NO Match)。當有一個語音匹配時,LED2有效,如果PIM2被拉高(端口A使能),則A端口相應的引腳變為有效。如果PIM1引腳被拉低,芯片的語音識別功能被禁止。
4 AP7003-02的應用
AP7003-02可以單獨使用,無需控制器,適合于用鍵盤直接控制。芯片有8鍵控制和12鍵控制兩種鍵盤操作模式,如圖5所示。各鍵及其功能見表3(a)、(b)。
表3(a) AP7003-02鍵盤模式
Modey8Key
PIM1=012Key
PIM1=1
Key NO.
1Store WordStore Word1
2Word UpStore Word2
3Word DownStore Word3
4Set R_Level1Store Word4
5Set R_Level2Store Word5
6Set R_Level3Store Word6
7Clear OutputStore Word7
8Shut DownStore Word8
9N.A.Set R_Level1
10N.A.Set R_Level2
11N.A.Clear Output
12N.A.Shut Down
PIT3Store WordN.A.
PIT4Clear WordClear
表3 b AP7003-2按鍵功能
鍵名功 能 說 明
Clear Word清除12個存儲體內容,之后進入存儲目標詞1(Store Word1)狀態
Store Word選擇當前存儲體以存儲錄入的語音!?/td》
Store Word1~8選擇12個存儲體中的一個以存儲錄入的語音
Wor Up選擇后一個存儲體以存儲錄入的語音;存儲體12的“后一個”是存儲體1
Word Down選擇前一個存儲體以存儲錄入的語音;存儲體1的“前一個”仍是存儲體1
et R_Level1~3設置語音識別的匹配度,之后進入語音識別初始狀態
Clear Output清除POA1~POA12和LED2狀態,之后進入語音識別初始狀態
Shut Down將芯片轉入省電模式
上電后POB1~POB4均被置成低電平。當有鍵按下時,芯片按POB1→POB2→POB3→POB4的順序依次發出鍵盤掃描信號,掃描信號為16ms低脈沖加64ms間隔,且循環進行,按鍵信號從PIT1~PIT4輸入芯片。鍵盤陣列如表3(c)所示。
表3(c)AP7003-02鍵盤陣列
POB1POB2POB3POB4
PIT1KEY1KEY2KEY3KEY4
PIT2KEY5KEY6KEY7KEY8
PIT3KEY9KEY10KEY11KEY12
上電后12個存儲體在錄入目標詞之前必須首先清空。開始錄入目標詞時LED1及POA1~POA12之一(與所選擇的存儲體相對應的一個)有效,目標詞錄入到存儲體后芯片進入識別模式。
在識別模式初始狀態,只有LED1是有效的。識別完成后,如果沒有詞相匹配,LED1閃爍3秒鐘后回到識別模式初始狀態;如果有詞相匹配,LED2有效,與匹配詞所在存儲體相對應的POA輸出端口也有效。如果芯片被設置成自動模式(PIM2=0),則LED2及POA的輸出將在3分鐘后被清除,之后回到識別模式初始狀態。當PIM2=0時,如果連續8分鐘沒有語音輸入芯片,將自動進入省電模式。
5 應注意的問題
1、語音識別電路對外部麥克風(MIC)的分貝值有一定的要求。使用經驗表明,本語音識別電路中選用56dB的麥克風可達到最佳效果。
2、語音識別前設置的匹配度是一個影響識別率高低的重要因素,在實驗過程中需要根據使用環境、使用要求等情況多次實驗才能確定最佳值。
3、AP7003的工作電壓為2.4V~4.5V。對于3V的應用系統,可直接使用;如果您的應用系統是5V工作電壓,建議通過一個二極管給AP7003供電,以保證系統長期穩定可靠地工作,也有利于降低系統功耗。
應用表明,AP7003使用簡單方便,具有較高的識別率,一般可達80%以上,是一款較好的語音識別芯片。
-
集成電路
+關注
關注
5391文章
11617瀏覽量
362846 -
放大器
+關注
關注
143文章
13627瀏覽量
214016 -
轉換器
+關注
關注
27文章
8742瀏覽量
147779 -
語音識別
+關注
關注
38文章
1742瀏覽量
112831
發布評論請先 登錄
相關推薦
評論