關鍵詞: 技術 , 壓縮 , 音頻 , 語音
本應用報告將介紹 IMA 自適應差分脈沖代碼調制 (ADPCM) 的壓縮/解壓縮算法,討論在 MSP430 上使用 ADPCM 庫的相關步驟。我們在介紹 ADPCM 庫的使用時,將給出兩種均采用 MSP430 微控制器片上信號鏈解決方案的語音記錄器實例。
1 引言
采用微控制器 (MCU) 來實施語音記錄器比較簡單。許多 MCU 均采用集成模數 (A/D)轉換器。擴音器將捕獲到的聲音提供給放大器,然后再饋送給 A/D 轉換器的模擬輸入。可將錄制的聲音存儲在閃存或 RAM等存儲器中,按下按鈕就能觸發 MCU 以播放錄制到的聲音,其原理是將存儲的數據先提供給數模 (D/A) 轉換器,然后再提供給音頻功率放大器。
利用 MSP430 很容易實現這種語音記錄器。MSP430 微控制器利用集成外設來實現片上模擬信號鏈。此外,MSP430 的 CPU 處理能力非常強大,足以執行錄制聲音的壓縮。
2 壓縮與解壓縮算法
舉例來說,實現語音記錄器的最簡單辦法就是將 A/D 轉換器轉換結果(如 12 位采樣)直接存儲在閃存中。音頻數據大多數時間都不使用整個 A/D 轉換器范圍,也就是說,冗余數據也存儲在閃存中。壓縮算法可去除這些冗余信息,從而減小所存儲數據的容量。
自適應差分脈沖代碼調制 (ADPCM) 就是此種類型的壓縮算法。ADPCM 算法存在各種類型,但都使用量化器差分編碼與量化器中自適應量化階步長方案。在進一步討論 IMA ADPCM 算法用于相關代碼之前,我們首要來簡單介紹一下差分 PCM 編碼。
2.1 差分脈沖代碼調制 (DPCM)
DPCM通過使用當前采樣與前一個采樣的差值來對模擬音頻輸入信號進行編碼。圖 1 顯示了DPCM 編碼器與解碼器的結構圖。在本例中,我們用信號估算Se(n) 而非前一個輸入來決定信號差值d(n),從而確保了編碼器使用的信息與解碼器相同。如果編碼器使用的是上一個輸入采樣的話,那么就會造成量化的累積錯誤,從而使重建信號與原始輸入信號不同。通過采用如圖 1 所示的信號估算,我們能避免重建信號 Sr(n) 與原始輸入信號出現差異。重建信號 Sr(n) 是預測器(predictor) 的輸入,其決定了下一個信號估算 Se(n+1)。
圖 1. DPCM 編碼器與解碼器結構圖
圖 2 顯示了一小段錄制音頻流,并通過兩個示意圖給出了模擬音頻輸入采樣(PCM 值)與連續采樣(DPCM 值)間差值的比較。
{{分頁}}
PCM 值的范圍在 26 到 203 之間,總共 177 個步長。編碼的 DPCM 值范圍在 –44 至 46之間,總共 90個步長。盡管量化器步長僅為 1,但這種 DPCM 編碼已經實現了輸入數據的壓縮功能。只需選擇較大的量化器步長即可將編碼 DPCM值的范圍進一步縮小。
圖 2. 8 位音頻數據與連續采樣差值的比較
(差分 PCM 步長 = 1)
2.2適應差分脈沖編碼調制 (ADPCM)
ADPCM 是 DPCM的一個變體,編碼器步長會有差異。語音輸入信號的強度差異體現在不同的揚聲器器上,也體現在語音輸入信號的語音和非語音部分上。量化器步長對每個采樣都進行適應調節,確保高低輸入信號強度都能實現同樣的編碼效率。圖 3 顯示了采用步長調節技術的修訂版 DPCM結構圖。
圖 3. ADPCM 編碼器和解碼器結構圖
ADPCM 編碼器通過解碼 ADPCM 代碼進行信號估算 (Se),這就是說,解碼器是 ADPCM 編碼器的一部分,因此已經編碼的音頻數據流只能用解碼器進行重放,這樣解碼器就必須對編碼器加以跟蹤。
最初的編碼器和解碼器信號估算等級以及步長大小調節等級必須在開始編碼或解碼前就加以定義,否則,編碼或解碼的值就會超過范圍。
3 MSP430 片上信號鏈
MSP430 系列微控制器支持多種片上外設。為了實現完整的片上信號鏈解決方案,MSP430 至少必須提供 1 個 A/D 轉換器模擬輸入和 1 個 D/A 轉換器。下面我們將介紹兩種 MSP430 解決方案。
{{分頁}}
3.1 MSP430F169 片上信號鏈解決方案
MSP430F169 包括 1 個集成 12 位 SAR A/D 轉換器,作為一種硬件乘法器模塊,它能高效支持數字濾波器,此外 MSP430F169 還包括 1 個集成 12 位 D/A 轉換器模塊。圖 4 給出了 MSP430F169 信號鏈電路圖。
圖 4. MSP430F169 片上信號鏈解決方案
上述配置也適合采用外部串行閃存的情況,從而可以滿足音頻數據的存儲需求。外部閃存可通過 MSP430 的 I2C 或 SPI 接口來連接。MSP430F169 DMA 模塊可自動將接收到的數據傳輸給 RAM,從而大幅降低了 CPU 的負載。
3.2 MSP430FG4618 片上信號鏈解決方案
我們用 MSP430FG4618 可以實現另一種片上信號鏈解決方案。MSP430F169 可支持 60 KB 的集成閃存,而 MSP430FG4618 則可支持 116 KB 的閃存。MSP430FG4618 的另一優勢在于,它還集成了運算放大器模塊。運算放大器可用于放大擴音器的輸入及數模轉換器的模擬輸出。圖 5 顯示了 MSP430FG4618 信號鏈電路圖。具體配置采用的是 TI 推出的 MSP430FG4618/F2013 試驗板。該評估板可與相關代碼示例配合使用。
圖 5. MSP430FG4618 片上信號鏈解決方案
擴音器的輸出信號非常小,必須放大。MSP430的運算放大器可用于不同的運算模式。如果用于 PGA 模式,那么最大只能放大到 15倍,對擴音器放大器來說還不夠。因此,需要通過外部組件來加大增益。圖 5 中的運算放大器 OA0 即用于通用放大器模式。放大器共有 8種設置方式,可以使增益-帶寬乘積和轉換率等性能與電流消耗達到最佳平衡。圖中的所有放大器 OA0、OA1 及 OA2均采用了高性能模式(快速模式)。
如欲了解有關運算放大器使用的更多詳情,敬請參見 MSP430FG4618/F2013 試驗板用戶指南。
利用通用串行通信接口 (USCI) 可將音頻數據存儲到外部閃存中。我們也可通過 I2C 總線或 SPI 總線與外部存儲器相連。
4 MSP430 性能
相關代碼文件中有一些 *.wav 文件示例,可表明解碼 ADPCM 數據的質量。我們可在 PC上用媒體播放器等軟件來比較這些文件,這樣就能體驗 ADPCM壓縮算法的實際質量了。請注意,通過提高音頻采樣率和音頻采樣大小(分辨率),我們可以進一步提高音頻質量。
4.1 使用相關代碼
相關代碼中包含了兩個軟件項目,這兩個版本都基于第三部分中所介紹的內容,也都采用 IMA ADPCM 算法。
{{分頁}}
ADPCM 函數的使用非常簡單。首先,必須在應用代碼中包含 ADPCM.h 首標文件。該首標文件定義了 ADPCM.c 文件的ADPCM 函數。在每次音頻數據的錄制或重放工作之前,必須調用 ADPCM_Init() 函數。該函數定義了信號估算 (Se)的起始值以及用作量化器步長調節的步長指針。編碼器和解碼器通過設置可實現同步。調用 ADPCM_Encoder(int value)函數就能進行編碼,每個音頻采樣調用 ADPCM_Decoder() 函數就能進行回放。以下代碼段顯示了如何完成上述工作。
#include "ADPCM.h"
void main(void)
{ // 應用軟件初始化
while(1) // 主循環
{ // 應用軟件
if (P1IN & 0x01)
record();
if (P1IN & 0x02)
play();
}
}
void record(void)
{ // 初始化后,以便 A/D 轉換器、定時器、放大器等的錄制
ADPCM_Init(); // 須在開始錄制之前完成
// 開始錄制
}
void play(void)
{ //初始化后,以便 A/D 轉換器、定時器、放大器等的錄制
ADPCM_Init(); //須在開始錄制之前完成
// 開始回放
}
接下來,我們用 IAR Embedded Workbench™ KickStart™ version 3.42A 來測量 ADPCM 函數執行的次數。測量時,采用的是默認優化設置。
ADPCM_Encoder() 函數調用需要 114~126 個循環。
ADPCM_Decoder() 函數調用需要 99~109 個循環。
請注意,這只包含壓縮/解壓縮算法。要實現錄制和回放功能,還需要更多代碼。
5 參考書目
1. MSP430x4xx 系列用戶指南 (SLAU056)
2. MSP430F169 產品說明書 (SLAS368)
3. MSP430FG4618 產品說明書 (SLAS508)
4. 基于 TMS32010 的 32kbps ADPCM (SPRA131)
5. 基于 MSP430F13x 的低成本 12 位語音編解碼器設計 (SLAA131)
6. MSP430FG4618/F2013試驗板用戶指南(SLAU213)
評論
查看更多