近日,美國專利商標(biāo)局公布了一系列來自蘋果公司的69項新授權(quán)專利。在這份特定的報告中,介紹了蘋果申請的3D人機(jī)接口發(fā)明,它能夠?qū)崿F(xiàn)用戶的手勢識別與交互,進(jìn)而對Mac電腦的功能進(jìn)行控制。
這背后是被蘋果收購的以色列PrimeSense公司,它是蘋果公司TrueDepth攝像頭和點(diǎn)陣投影器(Dot projector)背后的技術(shù)支持提供商。
在全球范圍內(nèi),“老牌”的Leap Motion和“新生”的Untouch(未動科技)、uSens(凌感科技)、微動、京龍睿信、車蘿卜、光暈Halo以及極魚科技等多家手勢識別公司算是中國代表公司。
從最早的消費(fèi)類電子市場(手機(jī)、VR頭顯)到如今的汽車市場,手勢識別讓用戶能感受到“碟中諜”系列中阿湯哥在車內(nèi)對空氣揮手就能操作信息的場景。
而從目前的技術(shù)發(fā)展來看,實際上自動駕駛汽車中間很重要的一環(huán)就是體驗,VR技術(shù)、AR技術(shù),所有這些技術(shù)都是用來增強(qiáng)用戶體驗的。目前,利用攝像頭進(jìn)行手勢識別已經(jīng)成為部分高端車型的配置功能。
奧迪、奔馳、寶馬、大眾、福特等知名主機(jī)廠都在旗下的量產(chǎn)或概念汽車產(chǎn)品上加入了手勢識別技術(shù),但這些產(chǎn)品的識別率及使用流暢程度并不完美。此外,包括偉世通、德爾福以及微軟、谷歌、三星等Tier1和IT公司也有發(fā)布類似產(chǎn)品方案。
在那些主打手勢控制的車中,寶馬7系無疑是一個典型代表。它可以識別6種預(yù)設(shè)手勢操作,實現(xiàn)音量、導(dǎo)航、通話和空調(diào)等的設(shè)置。大眾高爾夫的系統(tǒng)可以通過手勢滑動控制菜單選項、電臺、滾動播放列表和瀏覽媒體庫,可操作選項會出現(xiàn)光暈提示,同時還有可視化交互反饋。
而在2015年初,奧迪帶來了處于開發(fā)階段的手勢識別技術(shù)展示產(chǎn)品。有了它,后排乘客就可以通過手勢來控制后排娛樂系統(tǒng)的各項功能。
根據(jù)硬件實現(xiàn)方式的不同,目前行業(yè)內(nèi)所采用的手勢識別大約有三種:結(jié)構(gòu)光(Structure Light)、光飛時間(Time of Flight)以及多角成像(Multi-camera)。其中,寶馬、大眾等廠商采用的ToF,英特爾的結(jié)構(gòu)光技術(shù),以及谷歌的毫米波雷達(dá)技術(shù)。
同時,手勢識別在實際落地上,也正在與中控、智能后視鏡、HUD等硬件進(jìn)行集成。而早前,谷歌更是宣稱,無人駕駛汽車已經(jīng)可以探測“數(shù)百種情況”,能自我識別交警舉起的停車標(biāo)志以及騎自行車的人所做的手勢。
同時,手勢識別與語音識別的集成交互,也在成為趨勢。目前,國內(nèi)包括思必馳、云知聲等語音技術(shù)公司均有投資相關(guān)的手勢識別廠商。
此外,目前國內(nèi)多家自主品牌的下一代互聯(lián)智能車載系統(tǒng)中,都已經(jīng)將手勢識別作為其中一項功能進(jìn)行集成。從目前的車型規(guī)劃來看,2019年發(fā)布車型有望出現(xiàn)手勢識別的第一波高峰。
去年奇瑞汽車舉辦了一場小型內(nèi)部技術(shù)成果發(fā)布會,發(fā)布了一系列AR(增強(qiáng)現(xiàn)實)+語音控制+手勢識別等人工智能技術(shù)。按照目前透露的技術(shù)路線圖,這些技術(shù)有望在2018年左右陸續(xù)在奇瑞產(chǎn)品上量產(chǎn)應(yīng)用。
而將于近日上市的寶馬全新5系插電混動版配備了全新“五維人機(jī)交互界面”,包含了自然語音識別、手勢控制、觸控屏幕、iDrive系統(tǒng)和熱敏按鍵。
Untouch(未動科技)
去年7月,Untouch(未動科技)正式發(fā)布4款3D視覺交互產(chǎn)品:3D手勢識別產(chǎn)品——黎曼平臺,3D人臉識別產(chǎn)品——?dú)W拉平臺,SLAM產(chǎn)品——笛卡爾平臺,及場景重建產(chǎn)品——高斯平臺。
全球著名的ToF深度傳感器廠商PMD也宣布,選擇Untouch(未動科技)的黎曼平臺作為中間件為客戶提供非接觸式的交互方案,雙方深度合作,推出了完整的手勢識別軟硬件一體方案。
未動科技(Untouch)的核心競爭優(yōu)勢一個是構(gòu)建了智能視覺交互技術(shù)的基礎(chǔ)性平臺,另一個數(shù)以PB計的深度數(shù)據(jù)積累,二者結(jié)合保證了未動科技國內(nèi)領(lǐng)先的嵌入式智能視覺交互技術(shù)。
目前,未動科技(Untouch)推出了車載智能視覺交互產(chǎn)品。該產(chǎn)品基于未動科技自主研發(fā)的國內(nèi)頂尖的3D手勢識別與3D人臉識別技術(shù),實現(xiàn)車內(nèi)智能座艙的非接觸式手勢控制、身份認(rèn)證與駕駛員狀態(tài)監(jiān)控,從而提供一種安全愉悅的車載人機(jī)交互體驗。
未動科技(Untouch)正在加強(qiáng)和拓展與Tier1的合作關(guān)系,從而把視覺交互技術(shù)應(yīng)用到更多的新車型中。
uSens(凌感)
2016年,uSens便與戴姆勒中國IT創(chuàng)新實驗室一起展示了最新合作成果。這個車載手勢交互應(yīng)用了uSens的26自由度手勢追蹤以及6自由度頭部追蹤技術(shù),體驗者不僅可以在ARVR場景中觀察3D汽車模型的內(nèi)外部細(xì)節(jié),而且可以進(jìn)行交互。
uSens和Leap Motion采用的是相似的原理,都是使用復(fù)數(shù)的紅外相機(jī)來識別人手的運(yùn)動。公司把這款自研的搭載紅外相機(jī)的手勢識別模組稱為Fingo。
uSens在2017年2月正式公開發(fā)售其手部追蹤解決方案——Fingo。Fingo集成軟硬件為一體,硬件上通過兩個紅外攝像頭及三個紅外輔助燈追蹤手部動作,軟件上基于計算機(jī)視覺及深度學(xué)習(xí)等算法,實現(xiàn)對雙手骨骼的識別,大部分常用手勢均可實現(xiàn)精準(zhǔn)低延遲識別。
隨后,uSens發(fā)布新版Fingo SDK,在手勢算法底層進(jìn)行了改進(jìn),新增一系列雙手交互動作,如握拳、手心寫字、十指交叉等,在同類產(chǎn)品中,率先實現(xiàn)對大面積遮擋的雙手交疊類手部動作的識別,并可實現(xiàn)對十個手指的細(xì)微運(yùn)動追蹤。
微動Vidoo
在去年4月份的上海車展上,微動Vidoo發(fā)布了Vdrive車載手勢識別解決方案,實現(xiàn)傳感器定制到UI人機(jī)交互界面設(shè)計全閉環(huán)。
微動Vidoo從功能需求出發(fā),進(jìn)行算法優(yōu)化裁剪,生成定制化方案;制定硬件通信接口與通信協(xié)議;量身打造標(biāo)準(zhǔn)化動作指令設(shè)計、UI設(shè)計、操作反饋設(shè)計。此外,通過HMI的動作設(shè)計環(huán)節(jié)以及底層的基礎(chǔ)數(shù)據(jù)分析,還可以明確區(qū)分用戶是有意進(jìn)行手勢操作指令的下達(dá)還是不經(jīng)意的無意識動作。
公開資料顯示,微動手勢識別技術(shù)的獨(dú)特之處主要體現(xiàn)在,復(fù)雜的核心算法以及大量的數(shù)據(jù)運(yùn)算不依賴于主機(jī)去完成,而是依靠硬件設(shè)備上的FPGA獨(dú)立運(yùn)算單元。Vdrive的手勢識別解決方案,采用120Hz高頻雙目深度傳感器,結(jié)合SoC架構(gòu)的FPGA芯片,將圖形圖像、人工智能算法都跑在車載Vdrive內(nèi)部完成,與上位車機(jī)進(jìn)行指令級通信。
極魚科技
去年,國內(nèi)以TOF方案實現(xiàn)手勢識別模塊的創(chuàng)業(yè)公司極魚科技宣布,已完成2000多萬元的A輪融資,將主要用于車內(nèi)手勢識別模塊的研發(fā)和生產(chǎn)。彼時,極魚科技的手勢識別方案可以各識別5-10種動態(tài)和靜態(tài)手勢,車廠可以自選3-5個手勢,并自定義相應(yīng)功能。識別精度在1-2cm,識別準(zhǔn)確度可達(dá)95%以上。延遲率則可控制在25ms內(nèi)。
目前極魚科技現(xiàn)在可以提供中控手勢交互、HUD手勢交互、車內(nèi)乘客娛樂交互三種系統(tǒng)方案。去年12月,極魚科技進(jìn)入Startup Autobahn中國第一期加速器,并且獲得了和戴姆勒合作的機(jī)會,推出基于手勢識別的車載娛樂系統(tǒng)。
京龍睿信
定位前裝及準(zhǔn)前裝HUD定向研發(fā)與銷售平臺的京龍睿信,除了HUD本身,還自帶主要交互方式語音識別,同時輔以手勢識別。其中,手勢識別主要通過“上下左右”四個方向的手勢動作來識別相應(yīng)的指令;這個是通過HUD機(jī)體面向車主一側(cè)的夜視紅外線傳感器實現(xiàn),它可以識別用戶動作。
去年,京龍睿信與阿里YunOS達(dá)成合作,雙方將基于YunOS系統(tǒng),合力推出京龍第三代HUD產(chǎn)品H3。這款產(chǎn)品將進(jìn)一步實現(xiàn)圖像效果、距離、溫度的優(yōu)化匹配,在實現(xiàn)語音、手勢等智能交互的基礎(chǔ)上,將手勢芯片和產(chǎn)品上揚(yáng)窗口改版完成。在保證圖像清晰、色彩不眩暈、明暗環(huán)境可識別的前提下,增加角度識別力,讓產(chǎn)品與更多車型達(dá)到匹配。
2016年底,總部位于深圳的初創(chuàng)團(tuán)隊光暈網(wǎng)絡(luò)科技也發(fā)布其HUD產(chǎn)品光暈Halo,該產(chǎn)品歷經(jīng)約兩年時間的研發(fā)。作為一個專注于車內(nèi)交互功能的團(tuán)隊,光暈網(wǎng)絡(luò)科技讓他們的首款HUD產(chǎn)品主打手勢識別、語音交互以及AR導(dǎo)航三位一體的集成體驗。
光暈Halo的攝像頭以自上而下的角度識別用戶特定的手勢,從而執(zhí)行命令。該技術(shù)由光暈網(wǎng)絡(luò)科技團(tuán)隊利用人工智能技術(shù)對200多萬張不同手勢的特定姿態(tài)圖片進(jìn)行訓(xùn)練;通過數(shù)據(jù)壓縮,他們將5TB的原始手勢數(shù)據(jù)庫控制在5MB左右,這樣大幅減少實際應(yīng)用中耗費(fèi)的計算資源。
樂駕科技(車蘿卜)
北京樂駕科技有限公司于2015年7月1日正式發(fā)布了全球首個基于語音與手勢操控的“車蘿卜”(Carrobot)HUD智能車載機(jī)器人。成立于2015年1月的樂駕科技,憑借在語音技術(shù)方面(思必馳)的積累和優(yōu)勢,樂駕成立之初就定位于將打造一個基于語音操控和人機(jī)對話技術(shù)的人車交互平臺。
其基于機(jī)器視覺的疲勞駕駛與視線偏離檢測技術(shù)應(yīng)用,通過在產(chǎn)品前置的攝像頭,不僅可以完成手勢識別的應(yīng)用,還可以實現(xiàn)基于機(jī)器視覺的疲勞駕駛與視線偏離檢測,主要包括三部分:檢測人臉檢測技術(shù)、臉部特征定位技術(shù)和疲勞檢測技術(shù)。
評論
查看更多