由于硬件和軟件的進化突破,語音用戶界面或各種尺寸和價格點的支持 VUI 的產品現在都可以推向市場。與直到今天定義語音控制體驗的“對著麥克風說話并等待”模型不同,新系統現在可以以最終用戶謹慎甚至不可見的方式嵌入到產品中,并具有即時響應時間,而不是“ t 體驗云延遲。
在評估智能揚聲器和云的語音控制替代方案時,產品開發人員面臨著新的機遇和挑戰。開發人員必須考慮尺寸和位置,因為高度微型化的設備被嵌入到家具和電器中。將語音應用程序與邊緣機器學習相結合對于讓產品隨著時間的推移變得更加智能是必要的。同時,設備也越來越依賴電池供電,需要開發人員進行工程設計以實現最佳能源管理。最后,開發人員必須考慮用戶對功能的期望。對于消費者來說,精心設計的語音控制感覺無處不在,能夠聽到角落和穿墻的聲音。所有這些以及更多內容匯集了在構建支持 VUI 的產品時必須考慮的幾個設計元素。
語音控制 2.0 更自由的方面之一是可以自由地說出語音命令,而無需附近的智能揚聲器。集成在智能家居設備中的語音可以使整個家庭成為一個可聽區域,在識別喚醒詞或其他可定義的聲音時隨時可用。專門的硬件和軟件用于產生準確的遠場音頻捕獲。
設計技巧
為了在遠場環境中有效地捕捉聲音,一些設計技術開始發揮作用,包括:端口方向:聲學端口是可以在沒有物理障礙的情況下接受音頻信號的地方。端口的位置(頂部或底部)由單個設備的外形尺寸決定。為了簡化設計,聲學端口通常位于麥克風附近,如下所示。但是,端口孔應與揚聲器和其他聲學噪聲源(例如電機和放大器)足夠遠,以最大限度地減少麥克風輸入處的不需要的信號。
圖 1. 頂部和底部加載聲學端口配置的橫截面(來源:Knowles)
麥克風陣列和波束成形:使用多個麥克風稱為“陣列”。在任何給定時刻,麥克風陣列都會同時聽到來自各個方向的聲音。除了口頭命令外,他們還會聽到家中的其他聲音和動作。通過一種稱為波束成形的技術,可以對麥克風陣列進行編程,以選擇性地捕獲來自一個方向的聲音,同時拒絕來自其他方向的聲音。波束成形算法的最終結果是選擇性地調諧出來自所需方向的信號以外的信號。波束成形是數字信號處理鏈中的第一步。
數字信號處理 (DSP) 算法:DSP 是任何語音控制系統的基石。這就是想要的音頻信息的意義——捕捉它、聚焦它、凈化它、放大它——這樣音素就可以發出文字、命令和噪音,而不會破壞這個過程。DSP 幾乎用于語音交互的所有階段,從音頻捕獲和語音增強到語音處理。
圖 2. 遠場語音拾取(來源:Jerry Lu)
以便利為設計理念
除了針對功能進行設計之外,支持 VUI 的設備還需要針對便利性和可用性進行設計。喚醒詞的兩個主要設計考慮圍繞能源管理和處理能力。由于 VUI 必須始終處于“偵聽”模式以等待喚醒詞,因此電池供電的 VUI 和 VCD 必須設計用于極低的能量消耗以及立即喚醒。此外,設備在過濾掉不需要的聲音的同時區分想要的語音命令的能力需要不可忽視的處理能力,這需要準確性和即時性。包含強大音頻邊緣處理器的產品現在可以提供計算能力和低功耗、低延遲操作,從而實現即時用戶體驗。
即使在今天的早期階段,語音控制的爆炸式增長也充分證明了智能家居中語音控制的市場機會。智能家居的支柱任務,包括安全、能源管理、娛樂和高級安全,都通過語音控制變得更簡單、更容易訪問。語音最終可以作為整個智能家居的統一控制器,從房子的任何房間發出命令……如果它們的設計考慮到用戶并利用語音控制技術的重大進步。
審核編輯 黃昊宇
-
設計方法
+關注
關注
0文章
12瀏覽量
9109 -
語音控制
+關注
關注
5文章
483瀏覽量
28252
發布評論請先 登錄
相關推薦
評論