電子發燒友網報道(文/李彎彎)由于比2D更精準、更安全,3D視覺逐漸在一些行業中得到應用,不過新技術在成長初期,都會有技術不夠成熟、成本過高的問題,那么3D如何跨越規模應用的鴻溝,的盧深視創始人兼CEO戶磊日前在第四屆全球人工智能創業者大會上做了精彩分享。
的盧深視2015年8月成立,專注于三維機器視覺和人工智能領域,是國內唯一打通“真三維全棧技術、并實現國家級項目落地應用的公司。的盧在高精度深度感知成像、三維實時高精度重建、三維跟蹤識別及感知等技術方向上,都處于業界領先水平。
戶磊表示,從技術賽道來看,的盧深視以人為對象,實現3D機器視覺智能架構,比如將人的身份、行為軌跡精準數字化。最初從3D人臉切入,比如表情捕捉,通過人臉高精度重建、精準識別,現在開始做人體重建,包括動作、手勢識別以及人體特征體系,后面會進一步做人體動作特征,拓展到更多推理和大數據應用。
技術升級、成本降低,3D視覺逐漸走向規模應用
3D和2D的區別,除了通常講的數據、算法外,還有3D相機傳感器。3D最終是數據、算法、相機傳感器通過各種各樣的模塊形態,或解決方案形成規模應用。那么3D視覺規模應用存在哪些問題?
數據方面,2D圖像數據在現實生活中比較普遍,戶磊介紹道,“以人臉識別為例,我們比較容易通過公開數據或社交網絡搜索圖像,標注實現還不錯的人臉識別算法研究數據集,但3D數據現在比較稀少,需要從源頭開始積累。同時,好的3D數據沒有公開標準。”
圖形算法方面,2D圖像是規則的矩陣,比較容易用神經網絡的方式處理,而3D數據是不規則數據,3D和2D在網絡結構和算法設計上會有所不同。
相機傳感器方面,現在近距離、高精度已經比較成熟,并且已經走向應用,而遠距離、高精度,包括復雜光照下的抗光性等方面,還有很多問題需要解決。
雖然如此,現在隨著各種各樣應用的深入,3D其實開始逐步走向規模應用,以人臉識別為例,人臉識別技術本身的應用就非常普遍,不管從管理、服務、體驗來看,身份認證都是各行業開展業務時需要用到的重要環節。只不過最初大家普遍通過圖像方式進行人臉識別,比如照片。
人臉身份認證技術,還需要一個更完善的人臉識別身份認證方案。在戶磊看來,一個完善的身份認證方案需要有幾個元素:一是有很好的威信;二是有很好的體驗;三是有很強的安全性,主要是指有防攻擊、防偽的能力;四是要快,并且在各種環境下,比如各種光照下都可以準確識別。
在前期的應用中,人臉識別也逐漸呈現出對唯一性、安全性有更高的要求,因此就有了3D技術的應用,3D技術的優勢在目前的一些應用案例中,有很好的體現。
比如金融刷臉支付,因為刷臉支付直接和錢相關,如果要解決在支付過程中,不被照片、平面的一些物體攻擊,就需要引入3D相機,從數據的源頭上百分之百杜絕低成本的攻擊方式。
再比如在一些大場景支付中的應用,軌交刷臉進站,戶磊表示,“這可能就是千萬級用戶的應用,每天都有千萬級的人流量,在千萬級用戶下做精準識別,就需要有更多特征和更準確的識別率。”
3D應用要涉及到3D數據、3D的庫以及3D前端設備,3D設備必然會帶來成本的增加,但是隨著規模化應用,3D應用也會逐步走向平民化。事實上,通過應用普及和規模化量產,以及產業的努力、技術迭代和更新,現在3D相機在成本上已經和很多傳感器成本非常接近了。
戶磊認為,除了產業鏈的發展,應用能夠規模化以外,3D在技術上還有很多需要探究的地方。在他看來,技術升級帶來成本下降和規模應用帶來成本下降一定是交織狀態,兩者不斷交織往前推進,最終跨越規模應用的鴻溝。
的盧深視完備的工程化能力助力3D跨越規模應用鴻溝
從技術本身來看,的盧是創新基因與市場需求結合的團隊,戶磊介紹道,“的盧提供光電和算法一體設計的整體解決方案,從市場需求出發,通過科學家團隊和高校緊密合作,把所有系統研發分成實現領先性的技術規劃和支撐產品的技術規劃,并通過新技術預研,到產品原型驗證,再到產品研發的突破式迭代,最終實現可規模量產的產品。”
這一套體系由一個三維視覺工程化平臺支撐,包括光學驗證、仿真平臺,算法驗證、仿真和測試平臺,機械和電氣驗證、仿真和測試平臺。
戶磊認為,光學和算法一體化設計非常重要,算法和光學一定要做交互設計。
光學部分,包括設計仿真平臺,有散射仿真,隨機點針仿真、光學表面設計和激光器件仿真設計,還包括原型驗證平臺和可靠性驗證平臺。
算法部分,包括結構光系統驗證平臺、雙目系統驗證平臺、深度數據質量評測平臺和復雜光照模擬系統等,還包括100萬標準3D人像數據庫,千萬標準3D人像數據庫、十萬標準3D人體數據庫,活體檢測驗證系統等。
機械、電氣部分相對來說會更常見一些,包括要做大規模的百萬級、千萬級量產所必需的一些基本驗證和仿真測試的工具。
所有這些構成了一個完備的工程化能力。
在產業鏈的定位上,的盧是三維視覺感知系統整體解決方案提供商,提供從3D相機成像系統設計、3D算法、以及這兩個融合在一起形成的完整3D感知技術模組,和在一些行業中,根據行業屬性,提供3D終端產品。
在提升易用性和性價比方面,的盧還自研結構光深度恢復算法,有完整的FPGA、ARM、GPU平臺方案,了解算法需求;有自研的散斑增強算法,提升模組的環境適應性;有自研的光學系統補償算法,可以對溫漂、裝配誤差進行補償,保證一致性和良率。
的盧的相機目前已經廣泛應用于刷臉支付、地鐵軌交刷臉過閘、以及現在醫保身份認證等很多場景中。
高精度結構光RGBD相機,可用于刷臉支付終端、銀行ATM、無人機貨柜、地鐵刷臉閘機、AR/VR、物品體積測量等場景,該款產品體積小巧易于集成,同時內置低功耗AI加速芯片,可支持Face ID、活體檢測。
在刷臉支付方面,的盧與金融頭部企業合作共同推進刷臉支付建設。
另外的盧還面向其他智能家居場景推出了3D Face ID智能模組,可應用于家庭智能門鎖、只能保險柜、酒店公寓智能鎖、智能門禁等場景中。該模組集成了3D結構光深度恢復算法、人臉識別算法等,不需要任何主控,直接對接硬件和軟件接口即可。
該產品使門鎖可以長期低功耗工作,實現在電池供電的情況下,至少9個月不需要充電,戶磊認為,我們已經真正具備了可以成熟應用的能力,現在正在和一些互聯網巨頭合作智能門鎖項目,預計今年年底或者明年就可以在市場上大規模普及。
總結
整體而言,在戶磊看來,3D要跨越規模應用鴻溝,需要具備幾大特質:技術成熟、安全升級、體驗升級、成本極致。
戶磊認為,在技術成熟方面,技術方案一定要能夠滿足真正的應用需求,或者遠高于應用需求,其在應用場景中要比較容易落地;在安全升級方面,目前隨著應用的普及,越來越多的應用被發現容易受到攻擊,而3D的安全性則比2D更高;在體驗升級方面,即需要考慮在更大角度的情況下,復雜光線、完全黑暗等的情況下,是否可以達到一致的識別體驗;在成本方面,一個好的方案同時一定也要做到成本的極致,它的成本一定不能給用戶或者場景帶來更多負擔。
-
3D視覺
+關注
關注
4文章
434瀏覽量
27556 -
的盧深視
+關注
關注
0文章
5瀏覽量
1475
發布評論請先 登錄
相關推薦
評論