、熟悉 Siri、Google Now、Cortana、S-Voice 和/或 Echo 的每個(gè)人都熟悉過(guò)去十年語(yǔ)音識(shí)別的進(jìn)步和改進(jìn)。這種改進(jìn)大部分來(lái)自基于云的識(shí)別器在大數(shù)據(jù)上部署“深度學(xué)習(xí)”。
盡管它經(jīng)常不在聚光燈下,但嵌入式系統(tǒng)的語(yǔ)音識(shí)別已經(jīng)取得了很大進(jìn)展。事實(shí)上,大多數(shù)主要的語(yǔ)音引擎都部署了嵌入式和基于云的識(shí)別的組合。這在“Hey Siri”、“OK Google”、“Hey Cortana”、“Hi Galaxy”和“Alexa”等命令中最為明顯。所有這些基于云的識(shí)別系統(tǒng)都使用嵌入的“觸發(fā)”短語(yǔ)來(lái)打開云連接,為語(yǔ)音識(shí)別做好準(zhǔn)備。
嵌入式觸發(fā)短語(yǔ)允許一些基于云的方法的改進(jìn)和實(shí)用性。一方面,擁有一個(gè)“永遠(yuǎn)在線”的嵌入式識(shí)別器比讓你的對(duì)話上傳到云端讓谷歌和其他人以他們想要的任何方式分析要少得多。由于它在設(shè)備上,因此在說(shuō)出觸發(fā)短語(yǔ)之前不會(huì)進(jìn)行語(yǔ)音錄制或傳輸,并且觸發(fā)偵聽是實(shí)時(shí)完成的,而不會(huì)發(fā)送您的語(yǔ)音。
嵌入式喚醒觸發(fā)器也有實(shí)際原因,其中一個(gè)主要原因是功耗。僅在云中運(yùn)行需要大量數(shù)據(jù)傳輸和分析,使得電池供電或“綠色”產(chǎn)品不切實(shí)際。許多主要的 DSP 公司都為“始終開啟”的 DSP 提供解決方案,這些 DSP 以 2 mA 或更低的電流運(yùn)行 Sensory 的 TrulyHandsfree 喚醒觸發(fā)選項(xiàng)。使用健全的活動(dòng)檢測(cè)方案,平均電池消耗可以低于 1 mA,將其置于電池泄漏領(lǐng)域。
嵌入式語(yǔ)音識(shí)別的其他流行用途是在需要對(duì)有限命令進(jìn)行快速準(zhǔn)確響應(yīng)的設(shè)備中。我最喜歡的例子之一是三星 Galaxy 智能手機(jī),在相機(jī)模式下,用戶可以啟用語(yǔ)音命令來(lái)拍照。這適用于我在 20 英尺遠(yuǎn)的安靜環(huán)境或 5 英尺遠(yuǎn)的嘈雜位置。這是隨身攜帶自拍桿的絕佳替代品,每當(dāng)我向人們展示此功能時(shí),他們都會(huì)很快獲得并喜歡它。
嵌入式揚(yáng)聲器驗(yàn)證也被更頻繁地部署,并且通常被合并到喚醒觸發(fā)器中,以降低其他人喚醒您的設(shè)備的可能性。對(duì)于語(yǔ)音識(shí)別和說(shuō)話人驗(yàn)證,總是需要在錯(cuò)誤接受(接受錯(cuò)誤的用戶)和錯(cuò)誤拒絕(拒絕正確的用戶)之間進(jìn)行權(quán)衡。首選的喚醒觸發(fā)設(shè)置通常是以偶爾讓正確的人進(jìn)入為代價(jià)來(lái)保持極低的錯(cuò)誤拒絕。在需要更復(fù)雜的揚(yáng)聲器驗(yàn)證以確保安全的系統(tǒng)中,可以部署不需要最低要求的更復(fù)雜的算法功耗,以增加電流消耗為代價(jià)獲得更好的精度。
隨著消費(fèi)產(chǎn)品和手機(jī)使用更復(fù)雜的處理器,我預(yù)計(jì)更高比例的語(yǔ)音識(shí)別使用將轉(zhuǎn)移到嵌入式設(shè)備,并且會(huì)出現(xiàn)“分層”語(yǔ)音識(shí)別方法,從而在設(shè)備上進(jìn)行快速初始分析并做出響應(yīng)如果設(shè)備對(duì)成功有很高的信心(自我認(rèn)知),但如果它不太確定自己的響應(yīng)或需要基于云的搜索,則將其傳遞給云端。
審核編輯:郭婷
-
處理器
+關(guān)注
關(guān)注
68文章
19342瀏覽量
230227 -
嵌入式
+關(guān)注
關(guān)注
5086文章
19143瀏覽量
306092 -
深度學(xué)習(xí)
+關(guān)注
關(guān)注
73文章
5507瀏覽量
121272
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論