音頻是許多物聯網應用不可或缺的組成部分, 包括消費品(如揚聲器、耳機、可穿戴設備),醫療設備(如助聽器),自動化工業控制應用、娛樂系統和汽車的信息娛樂設備等。
物聯網的聲音可大致分為三類: 流媒體(即音樂、聲音和數據)、語音識別 / 命令, 以及藍牙和 Wi-Fi 無線連接播放(例如, 將多通道音頻通過 Wi-Fi 傳輸到家庭環繞立體聲系統)。 然而, 設計一個高質量、不間斷的音頻子系統可能是一個挑戰, 因為工程師必須遵守基于物聯網設備所要求的嚴格約束。
更復雜的設計需要包括先進的功能, 例如語音識別, 使驅動控制汽車的信息娛樂系統就像手機一樣輕松易用。 由于 MCU是所有這些音頻系統的核心, 選擇一個集成設計可能是一個可靠無噪音音頻系統所需的。 本文探討了設計此類系統所需的音頻技術。
音頻子系統的組件
如前所述,物聯網的音頻包括三個主要的活動: 高質量的語音 / 數據流, 無線傳輸和語音控制。 圖1顯示了嵌入式系統中的重要構件。
圖1 音頻處理子系統
需要注意的是, 許多這些功能可以集成在一個現代化的單片機中, 如本例所用的 Cypress CYW43907與集成的 Wi-Fi 802.11 n。 一些基于物聯網系統的重要音頻技術可能包括:
音頻應用
一個帶有音頻功能的單片機,允許工程師對大多數流行媒體播放器和內容提供商使用 mp3 / 4流。 許多設計也需要支持 WMA 和蘋果的 AAC 解碼, 這需要更多的處理能力。 通常可以在消費者音頻應用程序中使用低成本的音頻單片機, 或者管理音頻配件中的數字音樂流, 如數字揚聲器集。
在這些應用程序中, 一幀 PCM 音頻數據(封裝在 USB 音頻類格式中)通過處理器的 SPI/ I2C 串行通道可達1 ms。 視來源而定, 音頻流一般以多種格式中的一種形式出現, 但是, 一些低成本的編碼器只能接受一個特定的格式。 在這些情況下, MCU 在確保數據在輸入到編解碼器之前的正確對齊方面發揮了重要作用。
由于并非所有音頻來源都使用相同的采樣率, 所以編解碼器還必須將其采樣頻率進行調整, 或依靠單片機將取樣數據流轉換成一個通用采樣率(見圖2)。 在這些情況下, MCU 必須管理數據流, 以避免在其他情況下導致靜默、持久性污染和音頻中斷, 這種情況會隨著數據丟失而產生, 并擾亂用戶的聽力體驗。 需要注意的是, 音頻單片機也可以用來實現音頻子系統的其他功能, 例如在音頻播放過程中控制照明。
圖2 音頻單片機可能執行格式轉換、采樣率調整和數據流管理, 以及支持音頻用戶界面
為了在廣泛的應用中使用音頻, 音頻 MCU 需要支持各種音頻技術。 圖3顯示了這些音頻技術的例子。
圖3 音頻技術
音頻編碼器(編碼器 / 解碼器)
音頻編解碼器是音頻系統的主要前端組件。 許多在物聯網應用程序架構的 MCU支持硬件中的編解碼功能。 這使得系統可以減少數字音頻樣本的大小, 以加速無線傳輸(節省電力)和減少存儲空間(減少內存容量的壓力)。 一個編碼器可以支持各種音頻格式, 如 AAC, AC-3和 ALAC等。 要做到這一點, 它需要一個解碼接入單元(AU) , 這個單元在任何音頻后處理(如 DSOLA, SOLA)之前實現。 當使用像 AAC, AC-3和 ALAC 這樣的標準音頻格式時, 音頻的分類方式使得后續音頻樣本在音頻包數據流中指定的格式范圍內。 分組間隔也需要被管理, 以允許最小的交叉抖動和不間斷操作。 AU 的有效負載大小允許任何需要執行。
基帶處理
基帶信號是模擬或數字波形中的一組基本頻率, 可以通過電子電路進行處理。 基帶信號可以由單個頻率或一組頻率組成, 如果在數字域中, 數據流通過一個非多路通道發送。 基帶被定義為帶有載波信號的基帶混合, 以產生調制信號。 需要注意的使, 在支持物聯網音頻的MCU 中, 音頻編解碼器與基帶處理以及RF 可以集成在一個芯片上。 音頻編解碼器可以在各種無線收發器中實現, 以提供語音數據和/或音樂功能。 它還有單音頻和立體聲音頻輸出通道, 以及立體聲輸入。
包丟失隱藏和數據復制
過度的延遲、數據包丟失和高延遲抖動都會影響通信質量。 突發數據包丟失的可能性隨著網絡負載的增加而增加, 并導致了用戶可以聽到的中斷。 通過高級功能, 如丟包隱藏技術, 可以增強通過 Wi-Fi音頻傳輸。 系統體系結構的源 / 接收器如下: 一個源捕獲音頻, 通過 RTP 流結構將 PCM 數據消除, 并使時鐘與 PLC 連接的所有源同步。
需要注意的, 無線通信鏈接的性能取決于鏈接預算性能的質量。 這種連接預算由三個因素決定: 傳輸功率、發射天線增益和接收天線增益。 例如, 如果連接路徑的功率衰減空間損耗大于接收無線電的最低接收信號水平, 那么就可以在802.11網絡上進行可靠的通信(見圖4)。
圖4 無線通信的鏈接預算性能
語音清晰度提升(SIE)
音頻系統中的背景噪聲降低了語音的可理解性。 如果噪音超出一定水平, 那么用戶將很難理解這樣的語音。 對于嵌入式設備而言,實時連續語音識別的可用性要求系統能夠提高信噪比。 選擇一個支持移植和優化的大詞匯量持續語音識別系統的單片機可以簡化開發過程。
喚醒詞檢測(WUPD)
通過這個功能,用戶可以通過語音激活設備, 以一種不用手的方式打開系統(見圖5)。
圖5 喚醒式短語檢測
-
音頻
+關注
關注
29文章
2899瀏覽量
81781 -
IOT
+關注
關注
187文章
4229瀏覽量
197304
發布評論請先 登錄
相關推薦
評論