有數(shù)據(jù)顯示,到2020年,全球語(yǔ)音市場(chǎng)規(guī)模預(yù)計(jì)將達(dá)到 191.7 億美元。語(yǔ)音識(shí)別作為研究人工智能的方向之一,隨著語(yǔ)音交互技術(shù)的發(fā)展,語(yǔ)音AI芯片也隨之誕生。現(xiàn)在不論是互聯(lián)網(wǎng)巨頭,還是AI 初創(chuàng)公司,都陸續(xù)宣布進(jìn)軍芯片領(lǐng)域。
回頭看國(guó)內(nèi)車載語(yǔ)音市場(chǎng),真正開始發(fā)展可以說(shuō)是在2013年。在此之前,車內(nèi)語(yǔ)音部分的運(yùn)用最多也就是聽音樂(lè)和廣播,雖然車載語(yǔ)音已經(jīng)出現(xiàn),但系統(tǒng)還處于初級(jí)階段,準(zhǔn)確率還不夠高,市場(chǎng)普及度很低。
2013年是一個(gè)轉(zhuǎn)折點(diǎn),行業(yè)開始變革,更多人開始關(guān)注車載語(yǔ)音市場(chǎng)的發(fā)展。2015年之后側(cè)重云端方向,和智能汽車、車聯(lián)網(wǎng)的發(fā)展方向相關(guān),產(chǎn)品形態(tài)也越來(lái)越標(biāo)準(zhǔn)。
2016年,隨著人工智能領(lǐng)域的發(fā)展,很多公司在智能語(yǔ)音部分加大了力度, 特別是對(duì)語(yǔ)音芯片的研發(fā)。今年更是語(yǔ)音芯片“爆發(fā)”的一年,并且在之后的一段時(shí)間,語(yǔ)音芯片還會(huì)持續(xù)作為熱點(diǎn)。
多場(chǎng)景、低功耗
不同的語(yǔ)音技術(shù)公司研發(fā)語(yǔ)音芯片的考慮可能都不太一樣,大體上來(lái)講有幾方面原因。
首先是快速集成和低功耗的需要。語(yǔ)音芯片能夠更好地將本地功能進(jìn)行集成,同時(shí)由于現(xiàn)在涉及深度學(xué)習(xí)的計(jì)算量巨大,終端設(shè)備對(duì)功耗的要求也很高,低功耗的芯片成為市場(chǎng)需求。
其次是IoT時(shí)代下多樣化場(chǎng)景的需要。物聯(lián)網(wǎng)場(chǎng)景下,設(shè)備形態(tài)是多樣化的,需要一個(gè)硬件載體,成本低,算力強(qiáng),同時(shí)能承載多樣化終端設(shè)備的需求,芯片在這個(gè)過(guò)程中扮演著核心的角色。
此外還有盈利的目的。任何語(yǔ)音技術(shù)公司,推出產(chǎn)品或者技術(shù)、以及軟硬件一體化的方案,最終都是為了盈利。研發(fā)語(yǔ)音芯片也不例外,現(xiàn)在正是物聯(lián)網(wǎng)時(shí)代推動(dòng)產(chǎn)品落地的時(shí)間點(diǎn),增加硬件功能之后的產(chǎn)品會(huì)帶來(lái)更高的市場(chǎng)效益。
語(yǔ)音芯片,從IOT到車載
不久前,云知聲,思必馳、出門問(wèn)問(wèn)等語(yǔ)音技術(shù)公司相繼發(fā)布了自己的AI芯片計(jì)劃。
5月16日,云知聲發(fā)布了首款面向物聯(lián)網(wǎng)領(lǐng)域的AI芯片UniOne,同時(shí),億咖通和云知聲簽署了戰(zhàn)略合作,將攜手在UniOne芯片的基礎(chǔ)上打造車規(guī)級(jí)AI芯片,這一芯片可以為用戶與車之間提供更深層次的智能語(yǔ)音交互能力。
5月24日,出門問(wèn)問(wèn)發(fā)布了國(guó)內(nèi)首款已經(jīng)量產(chǎn)的AI語(yǔ)音芯片模組“問(wèn)芯”Mobvoi A1,它可以幫助傳統(tǒng)家電廠商獲得遠(yuǎn)場(chǎng)語(yǔ)音交互的能力,之后會(huì)在創(chuàng)維電視和微鯨電視上實(shí)現(xiàn)合作落地。
6月26日,智能語(yǔ)音技術(shù)公司思必馳宣布已完成新一輪融資,并宣布已與某芯片巨頭在AI芯片方面達(dá)成合作,雙方將成立合資公司,并且適用于智能語(yǔ)音交互的AI芯片已在研發(fā)過(guò)程中。
雖然語(yǔ)音技術(shù)公司陸續(xù)宣布自己在研發(fā)語(yǔ)音芯片,但高工智能汽車咨詢了多家語(yǔ)音技術(shù)公司以及主機(jī)廠,了解到現(xiàn)在還沒(méi)有專門針對(duì)車載領(lǐng)域的語(yǔ)音芯片。
云知聲芯片負(fù)責(zé)人李霄寒博士介紹,云知聲5月16日發(fā)布的這款芯片是UniOne 系列芯片中的第一款,從語(yǔ)音AI切入,芯片命名“雨燕”,主要面向的是IoT領(lǐng)域,適合智能家電、智能車載等多個(gè)人機(jī)交互場(chǎng)景。目前在積極推進(jìn)車規(guī)級(jí)芯片設(shè)計(jì),預(yù)計(jì)明年推出符合車規(guī)要求的“雨燕”產(chǎn)品。
另一家語(yǔ)音公司思必馳宣布研發(fā)的AI芯片,也不是專門針對(duì)車載領(lǐng)域的語(yǔ)音芯片,預(yù)計(jì)下半年流片;出門問(wèn)問(wèn)推出“問(wèn)芯”Mobvoi A1是語(yǔ)音芯片模組,即語(yǔ)音模組和芯片的結(jié)合,最先是在智能家居領(lǐng)域,也不是針對(duì)車載領(lǐng)域的語(yǔ)音芯片。
現(xiàn)在市場(chǎng)上推出的“語(yǔ)音芯片”可以稱作是傳統(tǒng)芯片的“智能化”,將芯片和語(yǔ)音技術(shù)融合在一起,相比傳統(tǒng)的芯片和語(yǔ)音技術(shù)獨(dú)立而言,語(yǔ)音和芯片一體化之后,二者相互結(jié)合,如果芯片能夠和語(yǔ)音技術(shù)很好地匹配,不僅能夠解決兼容性的問(wèn)題,同時(shí)還能實(shí)現(xiàn)降低功耗需求。
車規(guī)級(jí)的語(yǔ)音芯片是市場(chǎng)需求
車載領(lǐng)域的語(yǔ)音芯片首先一定要滿足車規(guī)的技術(shù)要求,通過(guò)溫度、穩(wěn)定性的測(cè)試才可以上車,研發(fā)出可以通過(guò)車規(guī)的語(yǔ)音芯片還存在難點(diǎn)。
技術(shù)上,開發(fā)芯片本身就有一定的難度。軟件和芯片要結(jié)合在一起,其實(shí)就是把交互的東西放到硬件載體上,配比和兼容就是有難度的,還要做到識(shí)別速度快、適配不同的CPU、最后到實(shí)現(xiàn)量產(chǎn),都需要強(qiáng)大的技術(shù)支撐。
雖然現(xiàn)在缺乏車載領(lǐng)域的語(yǔ)音芯片,隨著汽車智能化以及車載語(yǔ)音交互的發(fā)展,未來(lái)車規(guī)級(jí)的語(yǔ)音芯片會(huì)成為市場(chǎng)需求。
吉利汽車負(fù)責(zé)HMI的相關(guān)人士表示,現(xiàn)在車載語(yǔ)音控制能力還遠(yuǎn)遠(yuǎn)不夠,就目前已經(jīng)上市的車型而言,語(yǔ)音的在線控制識(shí)別速度很慢,而本地詞庫(kù)又很少,自然語(yǔ)音狀況下語(yǔ)音內(nèi)容和詞庫(kù)無(wú)法匹配,就會(huì)出現(xiàn)無(wú)法識(shí)別或識(shí)別有誤。
而目前市面上推出“云+端+芯片”或者“云端芯”一體化的芯片,優(yōu)化了網(wǎng)絡(luò)識(shí)別的能力,但本地識(shí)別的能力依舊比較差,識(shí)別速度慢,用戶是比較難接受的。
語(yǔ)音芯片需要提高本地識(shí)別功能,但未來(lái)比較理想的是,隨著網(wǎng)絡(luò)傳輸速度的完善,研發(fā)出能夠?qū)⒈镜刈R(shí)別和在線識(shí)別結(jié)合在一起的語(yǔ)音芯片。
億咖通相關(guān)人士表示,隨著車聯(lián)網(wǎng),人工智能的發(fā)展,車載芯片性能遠(yuǎn)遠(yuǎn)不能滿足汽車娛樂(lè)和多樣化交互功能需求。語(yǔ)音作為車載系統(tǒng)的剛需和亮點(diǎn),更希望有強(qiáng)勁的硬件加速能力和適應(yīng)力的平臺(tái),車規(guī)級(jí)智能語(yǔ)音芯片會(huì)是大勢(shì)所趨。
響應(yīng)速度和識(shí)別率如何提升
最近,首款搭載“祺云概念”智聯(lián)系統(tǒng)的中期換代車型傳祺GS4搭載的智能語(yǔ)音控制系統(tǒng),用戶發(fā)出語(yǔ)音指令,系統(tǒng)便能在1.2秒內(nèi)快速反應(yīng)。官方宣稱,速度和靈敏度遠(yuǎn)超同級(jí)。
傳祺智能語(yǔ)音控制系統(tǒng)能夠在正常環(huán)境中實(shí)現(xiàn)95%識(shí)別正確率并具備多方言口音普通話的識(shí)別能力,離線語(yǔ)音識(shí)別能力、汽車訓(xùn)練的麥克陣列降噪能力、語(yǔ)音打斷技術(shù)、可見(jiàn)即可說(shuō)、自定義語(yǔ)音喚醒等多項(xiàng)核心技術(shù)能力。
針對(duì)傳祺GS4智能語(yǔ)音控制系統(tǒng)這一大賣點(diǎn),有業(yè)內(nèi)人士表示:“在網(wǎng)速、使用環(huán)境、車機(jī)CPU、內(nèi)存等各方面最佳工況時(shí),達(dá)到1.2S響應(yīng)、95%識(shí)別率并不難。”
而在實(shí)際應(yīng)用中,車輛噪音、網(wǎng)速波動(dòng)、車機(jī)后臺(tái)多進(jìn)程、硬件資源被占用、第三方執(zhí)行器件延遲等等,都會(huì)造成語(yǔ)音控制系統(tǒng)延遲
科大訊飛相關(guān)人士表示:“影響語(yǔ)音識(shí)別響應(yīng)時(shí)間有:音頻后端檢測(cè)、網(wǎng)絡(luò)傳輸、引擎處理和應(yīng)用處理四個(gè)方面。”
音頻后端點(diǎn)檢測(cè)是影響語(yǔ)音響應(yīng)速度最重要的部分,也是不可減少和用時(shí)最長(zhǎng)的部分。講完一句語(yǔ)音指令,系統(tǒng)需要800ms-1000ms靜音段來(lái)識(shí)別講話是否結(jié)束,減少這個(gè)時(shí)間,則會(huì)帶來(lái)體驗(yàn)下降。例如,用戶說(shuō)話停頓,系統(tǒng)誤認(rèn)為用戶已經(jīng)說(shuō)完了,導(dǎo)致錯(cuò)誤的識(shí)別結(jié)果。
引擎處理,車機(jī)硬件配置低或其它進(jìn)程占用CPU、內(nèi)存等硬件資源,導(dǎo)致語(yǔ)音處理進(jìn)程沒(méi)有足夠的系統(tǒng)資源,引起處理延遲。
通過(guò)升級(jí)車機(jī)硬件和優(yōu)化引擎算法兩種方案可以有效解決問(wèn)題,但升級(jí)硬件配置需要增加成本,所以主機(jī)廠更加傾向于,優(yōu)化引擎算法,在低成本硬件平臺(tái)上實(shí)現(xiàn)高效語(yǔ)音系統(tǒng)應(yīng)用。
網(wǎng)絡(luò)速度慢、不穩(wěn)定也是會(huì)導(dǎo)致語(yǔ)音識(shí)別延遲的一大因素。通過(guò)提升網(wǎng)絡(luò)傳輸速率,如未來(lái)的5G通訊,也可以有效減少延遲。
除此之外,優(yōu)化信源(地圖、音樂(lè)、電臺(tái)等等)和第三方執(zhí)行器件(開車內(nèi)燈、開天窗、座椅加熱等等),也能減少語(yǔ)音控制系統(tǒng)延遲,提升用戶體驗(yàn)。
語(yǔ)音控制、觸屏、機(jī)械按鍵等都屬于控制層,最終做出執(zhí)行反饋的是信源和第三方執(zhí)行器件。如果信源和第三方執(zhí)行器件運(yùn)行緩慢,也會(huì)影響用戶對(duì)語(yǔ)音控制系統(tǒng)的體驗(yàn)。
目前,車載領(lǐng)域已經(jīng)量產(chǎn)的語(yǔ)音產(chǎn)品大多數(shù)響應(yīng)時(shí)間在1.5s-3s之間,當(dāng)響應(yīng)時(shí)間達(dá)到2s以上時(shí),用戶能夠感覺(jué)到明顯的延遲。
低NVH可提高識(shí)別率
識(shí)別率對(duì)用戶體驗(yàn)至關(guān)重要,識(shí)別率太低、不準(zhǔn)確,用戶好似對(duì)牛彈琴,不但不能體現(xiàn)語(yǔ)音控制系統(tǒng)的便利性,反而會(huì)成為雞肋配置。
主機(jī)廠相關(guān)人士表示:“提升語(yǔ)音識(shí)別率除了技術(shù)方面,降低車輛NVH也是一個(gè)重要的途徑。”
車輛行駛中,外界環(huán)境噪音、發(fā)動(dòng)機(jī)震動(dòng)噪音、胎噪、風(fēng)噪、車身共振等等都會(huì)影響語(yǔ)音指令識(shí)別率,所以除了不斷對(duì)語(yǔ)音系統(tǒng)優(yōu)化之外,降低車輛NVH也是提升語(yǔ)音識(shí)別率和用戶體驗(yàn)的方法之一。
-
芯片
+關(guān)注
關(guān)注
456文章
51156瀏覽量
426461 -
AI
+關(guān)注
關(guān)注
87文章
31491瀏覽量
270000 -
人工智能
+關(guān)注
關(guān)注
1796文章
47642瀏覽量
239787 -
車聯(lián)網(wǎng)
+關(guān)注
關(guān)注
76文章
2606瀏覽量
91744
原文標(biāo)題:“語(yǔ)音AI芯片”持續(xù)發(fā)酵,車載語(yǔ)音去向何處?| GGAI深度
文章出處:【微信號(hào):ilove-ev,微信公眾號(hào):高工智能汽車】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論