近日,奧比中光在VALSE 2021(視覺與學習青年學者研討會)上首次展示了公司自研的3D智能摳圖算法。該算法專門為直播帶貨、視頻會議等場景研發(fā),可清晰地摳取雜亂背景下的3D人像與物品,吸引了眾多青年學者與學子駐足交流。
奧比中光研究院算法團隊負責人錢貝貝博士VALSE 2021演講時,為聽眾分享3D視覺從“感知”到“認知”的基本原理,并介紹了奧比中光在3D視覺算法方面的最新研發(fā)突破。同臺演講的企業(yè)還包括百度、騰訊優(yōu)圖、美團、格靈深瞳、海康威視等。
3D智能摳圖算法首次亮相,可摳取雜亂背景中的人像與物品
奧比中光最新研發(fā)的3D智能摳圖算法實現(xiàn)了基于背景建模的輕量化前景摳圖,能夠?qū)崟r摳取雜亂背景中的3D人像及物品,彌補了諸多2D摳圖的缺陷。另外,3D智能摳圖不限類別,并可自定義摳圖距離,過濾掉背景中不相關的人物,從而保護用戶隱私。
錢貝貝博士在演講中介紹,奧比中光通過背景+人圖軟分割的方法,設計了輕量化的Stage Block網(wǎng)絡框架,并基于大量數(shù)據(jù)訓練,實現(xiàn)了人、物與背景的精確分割,并可根據(jù)不同需求平衡摳圖的精度與速度。
圖注:奧比中光研究院算法團隊負責人錢貝貝博士在VALSE 2021發(fā)表演講。
3D智能摳圖算法有何應用場景?據(jù)了解,奧比中光這一算法專為直播帶貨、視頻會議等場景研發(fā),還可應用在游戲渲染、場景理解、自動駕駛、目標跟蹤、混合顯示、電影制作等多元領域。
以近年來爆火的直播帶貨為例,主播往往需要將普通的辦公室、居家背景替換成華麗的直播間,借此吸引粉絲;在直播過程中,主播要在眾多品類的商品中向觀眾展示主推產(chǎn)品。傳統(tǒng)的2D摳圖算法在應對這一場景的需求時,常常會出現(xiàn)無法摳取物品、細節(jié)丟失、多摳背景中的無關人物等問題。
圖注:現(xiàn)有在線視頻會議軟件中的2D摳圖和奧比中光3D摳圖效果對比。
奧比中光的3D智能摳圖則能較好地解決以上問題。據(jù)悉,3D摳圖的基本思想就在于利用三維空間的距離信息來區(qū)分需要摳取的前景(如主播、商品、參會人員)與不需要被摳出的背景(如墻面、雜物與不相干人物)。高精度3D數(shù)據(jù)的加持為算法提供了先驗信息,有利于將細節(jié)處理得更好,同時能給完成相似紋理下的高難度摳圖,并且能通過自定義距離過濾背景人物,保護隱私。
3D視覺感知技術加速迭代,賦能多元應用開發(fā)
奧比中光自研的3D智能摳圖算法,正是公司在3D視覺感知技術領域全面布局、全棧縱深的又一次成果展示。
據(jù)悉,奧比中光作為一家3D視覺感知整體技術方案提供商,在技術縱向上對包括深度引擎芯片、感光芯片、專用光學系統(tǒng)等在內(nèi)的核心底層技術及SDK、行業(yè)應用算法等全鏈路技術進行全棧式自主研發(fā),并在技術橫向上對結構光、iToF、雙目、dToF、Lidar、工業(yè)三維測量進行全領域布局。
圖注:觀眾在奧比中光展位上觀看3D智能摳圖算法演示。
奧比中光此次推出的3D智能摳圖算法,很大程度上依托于公司此前在3D視覺感知技術上的積淀。如要使得算法更好地摳取人像、物品,就需要在輸入環(huán)節(jié)保證3D數(shù)據(jù)的精確度,而奧比中光研發(fā)的一系列3D攝像頭能夠為之提供硬件級支撐。
同時,奧比中光所布局的幾種3D視覺感知技術在底層原理上具有共通性,這使得算法研發(fā)過程中可以借鑒原有技術的成熟模型,在此基礎上迭代創(chuàng)新,實現(xiàn)更優(yōu)的性能。
基于從感知到認知全鏈路的技術,奧比中光得以賦能智能化行業(yè)向3D化升級。奧比中光近期展出的FemtoiToF相機、3D視覺機器人開發(fā)套件等產(chǎn)品,可助力3D視覺行業(yè)的眾多專業(yè)人才開發(fā)各行各類3D應用,促進3D視覺行業(yè)加速發(fā)展。
fqj
-
3D
+關注
關注
9文章
2910瀏覽量
107788 -
視覺感知
+關注
關注
0文章
44瀏覽量
3209
發(fā)布評論請先 登錄
相關推薦
評論