十年前,微軟發(fā)布了一款劃時代的游戲設(shè)備:Kinect。
這款設(shè)備顛覆了傳統(tǒng)游戲的單一操作,不需要使用任何控制器,依靠相機捕捉三維空間中玩家的運動軌跡,就能對游戲進行精準操控。
遺憾的是,一度被認為引發(fā)了人機互動革命的Kinect,幾年后終因游戲內(nèi)容生態(tài)不足而被砍掉。
而這,也帶來了3D體感技術(shù)在世界范圍內(nèi)的一度沉寂。
幸運的是,Kinect所采用的3D體感技術(shù)后期并未折戟沉沙,而是換了條賽道,悄然應(yīng)用在醫(yī)療健康、新零售等領(lǐng)域。
「或許Kinect 作為游戲控制器的時代已經(jīng)結(jié)束,但現(xiàn)在它又以另一重身份進入到大眾視野中,盡管我們可能完全不知道。」外媒IGN如此說道。
其實,微軟之外,國內(nèi)很多廠商也意識到了3D體感技術(shù)的“高能”,并積極探索。
華捷艾米,就是其中之一。
成立于2014年的華捷艾米,自2010年就開始專注于3D體感交互技術(shù)和深度學(xué)習(xí)的研發(fā),并推出了3D感知芯片、3D感知模組、體感設(shè)備等一系列產(chǎn)品和解決方案。
“3D體感交互的本質(zhì)就是‘人、物、場的數(shù)據(jù)化’。數(shù)據(jù)化后,就能理解人的想法,幫助人更好的控制一顰一笑、動作行為,從而與機器進行互動。人和機器交互模式,就會發(fā)生一場革命。”華捷艾米董事長李驪對3D體感交互,顯然有著更大的期許。
3D體感交互正走向更適合的場景
各大公司在3D視覺及體感布局已久,但一直未出現(xiàn)大規(guī)模應(yīng)用。其中,硬件是制約因素,而算法的復(fù)雜性,以及未找到合適的應(yīng)用場景則是主要原因。
那么3D視覺及體感技術(shù),適合的應(yīng)用場景在哪里?
蘋果開辟了先河的手機3D人臉解鎖及支付領(lǐng)域,首先是兵家必爭之地。
2017年,蘋果率先將3D結(jié)構(gòu)光帶到了手機上,也逐漸引發(fā)了3D人臉解鎖及支付的新潮流。如商湯、曠視等廠商都加入到提供軟件解決方案的行列中,而如華捷艾米等廠商則提供軟硬一體的解決方案。
華捷艾米的布局在于3D Sensing手機前置與后置結(jié)構(gòu)光方案,除攝像頭等重要器件外,也植入了3D結(jié)構(gòu)光、AR尺子、3D建模等關(guān)鍵算法。
而在零售上,除了目前已逐漸落地的刷臉支付外,實現(xiàn)人員進出、人物追蹤、取放物體識別等諸多功能的無人貨柜,也在落地嘗試中。
華捷艾米介紹道,通過顧客拿取物品的手勢,方案能自動識別物品屬性并將其加入購物車,通過多個攝像頭對手勢信息、臉部信息、骨架信息的共同標定,多維度確認,能實現(xiàn)30秒自動刷臉結(jié)賬。
“通過刷臉進店后,就能綁定個人信息,實現(xiàn)軌跡跟蹤、行為識別和行為分析。若有偷盜行為,后臺還能直接進行報警。”李驪介紹道。
目前新零售正從單純的監(jiān)控設(shè)備服務(wù)向數(shù)據(jù)服務(wù)轉(zhuǎn)變,不過目前數(shù)據(jù)服務(wù)還不夠成熟。華捷艾米在做的,就是逐漸從全程獲取用戶行為數(shù)據(jù),整合零散數(shù)據(jù),實現(xiàn)路徑規(guī)劃、行為分析等。
而在安防領(lǐng)域,由于目前監(jiān)控攝像頭多采用的是二維人臉識別,受光線、角度等因素影響較大,并難以進行活體識別。因而,3D體感也逐漸在安防領(lǐng)域打開市場。
3D體感在安防的應(yīng)用,更多是在人證核驗、智能門鎖等場景。而如監(jiān)獄等場所,對識別犯人是否有肢體沖突等要求較高,通過三維深度信息更好對其進行判別,也是3D體感落地的方向之一。
華捷艾米在此方面,則和安防廠商合作,發(fā)力智能門鎖,并在地鐵、火車站等進行人證核驗等。
在醫(yī)療領(lǐng)域,華捷艾米還能通過智能大屏,內(nèi)置深度攝像頭與體感控制模組,結(jié)合自主研發(fā)的人臉識別、三維重建等核心技術(shù),讀取30多項人體體脂、體維數(shù)據(jù)。
除此之外,在軟件之外,華捷艾米研發(fā)了硬件設(shè)備3D 攝像頭。其自研的3D 攝像頭,基于散斑結(jié)構(gòu)光原理,獲取目標的深度信息,適用于0.28 ~1m的近距離人臉識別、深度數(shù)據(jù)采集,立體與平面判斷等。
由于對使用距離的要求較高,如新零售的人臉支付、火車站的人證核驗等,相對近距離物體識別場景,是目前3D 攝像頭落地的主要方向。
3D體感技術(shù)和芯片間猶如“零和一”
但3D體感在落地過程中,也還存在一系列難點。
3D視覺及體感的產(chǎn)業(yè)鏈,可大致分為器件、芯片、模組、系統(tǒng)和方案設(shè)計廠商、算法廠商,及產(chǎn)品和應(yīng)用廠商等環(huán)節(jié),目前產(chǎn)業(yè)分工上,其實還較為模糊。三維產(chǎn)業(yè)的鏈條還需要廠家自己捋順和打通。
華捷艾米在方案的實施中也發(fā)現(xiàn)了這一問題。僅靠產(chǎn)品體系其實并不能實現(xiàn)長遠的增長預(yù)期,在具體的行業(yè)應(yīng)用場景中,往往涉及到一系列專業(yè)算法的運用,尤其現(xiàn)有芯片不能滿足相應(yīng)需求。
李驪認為,“3D技術(shù)的行業(yè)應(yīng)用和芯片間的關(guān)系可以‘零和一’來形容。沒有合適的芯片,整體的應(yīng)用就很難順暢的進行。”
目前,復(fù)現(xiàn)一個MR的場景,至少幾個算法同時運行。而以常用的傳統(tǒng)芯片進行調(diào)試,只能放置兩個算法。
另外,3D的視頻帶寬也很大,約為180M,難以上傳。因而,就需要通過芯片在前端對視頻進行解析,數(shù)據(jù)化之后再進行傳輸,才能更好的實現(xiàn)端云分析。
再有,人的行為動作反應(yīng)很快。從想到做一個動作再到實施,整個過程只有8-12毫秒,單純通過軟件的方式很難大幅提高運行效率。
因而,這就需要一個單獨的服務(wù)芯片,去集中解決商業(yè)問題。
基于以上判斷,華捷艾米從2016年起便自主研發(fā)專用MR芯片,目前已研發(fā)了三款提供3D測量解決方案的芯片,包括IMI1180、IMI3000芯片及用于提供嵌入式解決方案IMI2280。
其中前兩款芯片主要解決原始數(shù)據(jù)成像問題,不具備分析功能。IMI2280芯片則搭載了華捷艾米自研的3D骨架算法、3D SLAM、3D手勢識別、3D場景結(jié)構(gòu)化等九大算法,可實現(xiàn)人體識別、物體識別、環(huán)境識別,及本地化分析。
“3D體感技術(shù),微軟研究了20多年,蘋果投入200多億美金,研發(fā)了七年。對于初創(chuàng)公司而言,這項技術(shù)若要重新開始復(fù)制,至少需要4-5年。如突破各類算法就要一年半,數(shù)據(jù)采集就要一年多,芯片開發(fā)也要兩年多時間。這其中的技術(shù)壁壘就是我們的競爭優(yōu)勢。”李驪說道。
積十年之功,華捷艾米這樣形容自己的領(lǐng)先優(yōu)勢。
雙攝像頭后的下個時代是什么?
3D體感的技術(shù)是光學(xué)精密儀器與制造、模式識別、圖形圖像、機器學(xué)習(xí)和神經(jīng)網(wǎng)絡(luò)技術(shù)集大成者,跨越多個領(lǐng)域的高精尖技術(shù)。
2010年微軟Kinect推出以來,鮮有公司和研究機構(gòu)完全突破包括3D拍攝、人物提取和骨架識別等的體感交互的所有技術(shù)環(huán)節(jié)。
不過,麥姆斯咨詢認為,3D成像和傳感技術(shù)已經(jīng)在高端市場的“庇護”下逐漸成熟,并逐步取得了成功。
繼雙攝像頭時代的下個時代會是什么?
如華捷艾米等公司給出的答案,是不斷突破3D體感技術(shù)的技術(shù)環(huán)節(jié),開發(fā)出低成本、高準確度、嵌入式的體感交互產(chǎn)品,并在手機支付、新零售、安防等多個場景推動落地。
國產(chǎn)的3D體感技術(shù),正在逐漸打開一個新的市場。
-
微軟
+關(guān)注
關(guān)注
4文章
6627瀏覽量
104323 -
3D
+關(guān)注
關(guān)注
9文章
2910瀏覽量
107795
原文標題:我國首座中等規(guī)模球形托卡馬克聚變實驗裝置建成
文章出處:【微信號:cas-ciomp,微信公眾號:中科院長春光機所】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論