在今年的國際消費電子展(CES 2018)上,語音(voice)、連接(connectivity)和人工智能(AI)成為最受關注的焦點。如果說今年的CES能為我們帶來什么指標,那么這三項建構模塊將是組成2018年及未來消費電子設備缺一不可的神圣“三位一體”。
語音助理已經準備好進入可穿戴設備、耳機、嬰兒監視器、燈具、電視遙控器和車輛。DSP Concepts創辦人兼首席技術官Paul Beckmann在接受《EE Times》時說:“我們似乎正見證著一場圍繞著語音的‘寒武紀大爆發’。”
DSP Concepts首席技術官Paul Beckmann
在CES上,被稱為“中國Google”的百度大力向開發商展示并開放其基于Duer OS的平臺。無論是其聲控臺燈或掛在天花板上的投影機和屏幕,都不需要Alexa或Google Assist。就像百度常掛在嘴邊的“中國速度”,越來越多的廠商開始朝向語音發展。
百度展示了一款整合臺燈功能的聲控智能喇叭(來源:Baidu)
消費設備必須具備連接能力已經是不爭的事實。Silicon Labs首席執行官Tyson Tuttle強調,接下來的必備功能是“混搭”不同的無線網絡。他解釋說,直接將原本為智能手機設計的連接芯片加進物聯網(IoT)設備,已經無法滿足要求了。系統需要動態的多協議軟件,以及為不同的無線網絡劃分時間的能力。
盡管AI在高度自動化汽車中占據主導地位,但Ceva首席執行官Gideon Wertheizer告訴我們:“我看到AI開始擺脫幻想世界。”供應商如今正試著“設置參數,在隨機環境中使用AI來解決特定問題。”
Ceva首席執行官Gideon Wertheizer
換句話說,許多公司開始學習在小規模應用中導入AI,并將其用于特定任務,而非依靠AI來解決世界上的問題。
語音隨車上路
無論是在家庭或開車行駛中,語音都將至關重要。
博世(Robert Bosch)在CES宣布計劃將其語音助理設計在方向盤后方。博世管理董事會成員Dirk Hoheisel表示:“我們正致力于讓駕駛艙內的按鈕亂象劃下句點。”Elektrobit在CES上承諾,該公司將成為亞馬遜(Amazon) Alexa的第一批汽車軟件整合商之一。
Bosch開發“自然語言”車內語音輔助系統(來源:Bosch)
百度宣布其基于Duer OS的Apollo 2.0平臺被稱為“自動車輛的Android”,并稱語音輔助系統將成為該平臺的一部份。百度總裁兼COO陸奇表示:“家庭與車輛之間已經不存在界限了。無論你在家中做什么,應該也都可以在車子里實現。”
Wertheizer則指出,無論是在家中還是車內,隔離聲音以及直接向云端發送清晰的訊號都非常困難。 “我們的周遭充斥著噪音和噪聲著。”很自然地,家庭和汽車的解決方案必須能夠因應一連串完全不同的嘈雜環境。
語音算法缺少標準
讓問題變得更復雜的原因在于業界還沒有任何標準的語音算法。
Wertheizer表示:“每一家公司都有自家處理語音的專有算法。”
系統業者開始求助于學術界發表的技術論文,競相找出如何最有效隔離語音的解決之道。而當他們使用不同的麥克風和揚聲器類型時,還必須優化其算法,以因應不同的設置要求。
而在Ceva,Wertheizer說:“我們必須建立一個類似原子庇護所的工作室”,用于研究所有的選擇,并開發波束成形、遠場和近場、回聲消除和環境降噪等算法。
Beckman也呼應了這個觀點。就像人們喜歡語音作為自然的用戶接口一樣,他說:“遺憾的是,對于實際執行的產品設計人員來說,它是最具挑戰的技術之一。”他已經看到了太多的語音項目出錯了,最終得回到草圖階段重新開始。
Beckman曾經在Bose Corp.擔任研究工程師長達9年,在2000年初成立了他的咨詢業務。當他與客戶討論語音項目時,他發現業界需要一套有效執行的“完整軟件解決方案,以及能為其實現差異化的底層技術”。但是,最主要的關鍵在于賦予其能夠自行調整系統的能力。
隨著語音市場爆發,Beckman的業務也隨之成長。DSP Concepts不再只是一家咨詢公司,現在還提供了一套完整的算法作為軟件庫和除錯工具,有助于客戶調整系統。Beckman說:“我們提供調整、整合和驗證工具。”
語音UI解決方案需要一套完整的算法(來源:DSP Concepts)
DSP Concepts的語音用戶接口(UI)技術稱為Audio Weaver,它是第一家獲得亞馬遜(Amazon) Alexa產品認證的第三方軟件公司。DSP Concepts共同創辦人兼首席執行官Chin Beckmann展示一款Audio Weaver語音助理產品——相較于亞馬遜Echo使用了7支麥克風,Audio Weaver僅用了2支麥克風,據稱就能夠“聽”得比Echo或Google Home更清楚。
在邊緣實現AI
Wertheizer說,隔離語音是第一步,但接下來還有其他步驟:語音助理必須辨識語音的位置,而且必須能夠追蹤語音。而且,它必須能偵測以及辨識誰在房間里說話。
直到最近,云端才剛被認為是處理和學習的地方。如今,這個假設將在2018年發生改變。
Wertheizer解釋說:“我看到人們對于AI的態度越來越務實。他們希望在邊緣設備執行AI而非在云端進行,以避免隱私、延遲和成本等問題。”
聯發科技(MedaTek)首席財務官顧大為對此表示認同。相較于亞馬遜在其Echo設備中推動云端到云端的服務,聯發科看到了“邊緣和云端”融合模式的可能性。他在CES時告訴我們,語音助理競賽如今已經著重于在本地增加“智慧”、區別人類與非人類的聲音分開、消除背景音樂、辨識聲音模式等。
Petcube Wi-Fi寵物照相在遠程進行機監測并與寵物互動(來源:Petcube)
Wertheizer說:“以Petcube設計的交互式Wi-Fi寵物相機為例,它能在主人不在家時,透過雙向音訊和1080p高分辨率(HD)視頻攝影機進行監控,以及與狗或貓互動”。Wertheizer說:“我不確定Petcube是否意識到這是一家物聯網公司。但是,像這樣的連網產品中,語音識別系統顯然必須能夠辨識狗吠聲,并且確定狗是處于壓力還是處于危機之中。換句話說,系統需要有智能才能進行學習。”
Neupro低功耗AI處理器
雖然Ceva為語音系統的設計者提供了名為ClearVox的語音算法,但它也知道系統廠商需要的更多。系統制造商希望在其物聯網設備中整合學習和推論的能力,使其產品能夠持續變得更加智能化。
目前的市場上亟需AI處理器。為了滿足這一需求,Ceva在CES上推出了NuePro,這是一款“專用的低功耗AI處理器系列,用于在邊緣進行深度學習”。NuePro是一款獨立的專用AI處理器,可廣泛用于物聯網、智能手機、安全監控、汽車、機器人、醫療和工業等市場。
Ceva推出AI處理器(來源:Ceva)
值得注意的是,Ceva并非深度學習領域的新手。據報導,NeuPro是以Ceva在計算機視覺應用深層神經網絡方面的經驗為基礎。
Wertheizer說,NeuPro AI處理器是Ceva從頭開始研發的第一款“非DSP”技術。他在發布Neupro時說:“我有點緊張。但是你必須知道AI并不是訊號處理方面的問題。”
NeuPro處理器搭載兩個硬件——NeuPro引擎和NeuPro VPU (向量處理單元)。Wertheizer指出,雖然引擎處理定義良好的人工智能算法,如CNN、啟動和規范層,但是,可編程的向量引擎NeuPro VPU是執行專有AI算法的一種延伸。“我們選擇了這種硬聯機的建置方式,而不是使用GPU或CPU,讓我們能夠增加AI處理器的利用率。”
Ceva聲稱,這款新的專用AI處理器系列帶來了“相當高的性能提升,從入門級處理器的2TOPS到為最高階配置的12.5TOPS”。
NeuPro硬件模塊;Ceva首席執行官Gideon Wertheizer強調,“NeuPro VPU和NeuPro引擎之間的無縫切換至關重要”。 (來源:Ceva)
Ceva表示,NeuPro AI處理器將于2018年第二季向客戶提供授權,并計劃在第三季全面發布。
同樣地,聯發科準備推出一款由意騰科技(Intelligo Technology)設計的AI處理器和算法。Intelligo是2016年時從聯發科獨立而出的新創公司。
Intelligo設計的這款AI SoC被稱為“智能DNN語音處理器”應用范圍較有限。聯發科表示,該處理器提供“可配置的深度神經網絡和高效率推論引擎(每秒每瓦特1 TOPS運算性能)”。
顧大為表示,聯發科正在尋找一種小型的AI加速器,為辨識20到30個關鍵詞而設計。另一方面,聯發科也正推廣其“分布式處理”的觀念,期望語音和AI功能不只是整合于像Echo或Google Home的智能音箱,而是更落實于廣泛的小型設備——如電燈開關。
-
CES
+關注
關注
4文章
1041瀏覽量
70786 -
語音
+關注
關注
3文章
385瀏覽量
38052 -
人工智能
+關注
關注
1791文章
47314瀏覽量
238624
原文標題:語音和人工智能應用在CES 2018上的爆發
文章出處:【微信號:gh_bee81f890fc1,微信公眾號:面包板社區】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論