借助機器人的本體感覺對足式運動進行研究已有數十年。在以往的研究手段中,研究人員往往采用基于模型的方法開發神經網絡控制器。但是,這類方法無法在那些現實世界里沒有見過的環境中得到應用。
近年來,為了獲得更好的泛化性和魯棒性,研究者們開始采用無模型強化學習,在模擬中訓練控制器,然后將學習到的策略直接轉移到真實的機器人上。
那么,如何在無需遙控器操控的條件下,讓四足機器人實現在復雜地形上自由流暢地行走呢?
近期,來自美國加州大學圣地亞哥分校和麻省理工學院的研究團隊,開發了一個可以提高機器人 3D 感知能力的模型,能夠支配四足機器人在各種困難地形場景下完成自動化行走,比如爬樓梯、踩石頭、在樹林中走路等。
如視頻所示,該四足機器人的額頭上裝有前置的深度攝像頭,該攝像頭向下傾斜的角度,可以幫助該機器人前面的兩足,根據所看到的前方場景和腳下地形做出正確的行動決策。但其后面的兩足必須先記住前面看過的內容,才能確保在經過時踩在正確的位置上。
所以,這中間存在一個重要的問題,即需要一個短期的 3D 環境記憶體,能夠使得機器人的四足都對三維環境有良好的感知和模擬。
為此,該團隊構建了一種神經體積記憶(Neural Volumetric Memory,NVM)架構,可以先借助自監督方法對視頻幀中的三維特征進行學習,再用幾何變換把這些三維特征投影到同一個空間下面,最后通過模型將所有的特征信息融合在一起,讓機器人對它所處的 3D 環境建立起短期記憶。
其中,需要說明的是,將上述帶有特征的全部視覺信息綜合在一起,可以幫助四足機器人記住其看到的內容,以及足部之前做過的動作,并利用這些記憶指導它下一步行動。這也表明,NVM 能為機器人執行決策提供可靠的 3D 結構信息,并為足式機器人利用視覺進行觀察開辟新的可能性。
2023 年 3 月,相關論文以《用于視覺運動控制的神經體積記憶》(Neural Volumetric Memory for Visual Locomotion Control)為題發表在CVPR上,并被選為Highlight論文[1]。
圖丨相關論文(來源:arXiv)
據介紹,該研究始于 2022 年 1 月。在當時的條件下,該團隊先在模擬器環境下進行訓練,再轉至機器人上進行部署和測試。NVM 模塊可以令四足機器人在模擬環境和真實世界中穿越復雜地形,并獲得更好的模擬-真實泛化結果。
但是,由于模擬器和機器人在物理和視覺方面都存在一些差距,因此需要克服許多有難度的工程問題。此外,從模擬器中制定任務,以及做強化學習訓練所需的代碼,也需要該團隊自行開發。
圖丨實際部署(來源:arXiv)
據了解,這項成果建立在該團隊之前的一項研究上,此前,該團隊使用強化學習和基于 Transformer 的模型,將本體感受和視覺信息相結合,使得四足機器人能夠避開障礙物,在不平整的地面上行走和奔跑 [2]。
“我們目前這項研究是在不同幀上抽取三維特征,把它們放到同一個三維空間下進行合并,而之前的那項研究僅僅將不同幀直接合并起來,當做一個視頻放入卷積神經網絡中,沒有做太多三維理解。”談及本項成果取得的進展,王小龍表示,“并且,之前機器人能完成的任務比較簡單,不能實現爬樓梯或踩木樁這種比較困難的任務。”
不過,該團隊也表示,他們目前開發的模型還存在一些局限性。首先,不能引導四足機器人到達指定的目的地;其次,完成部署后,機器人只能簡單地走一條直線,如果看到障礙物,會通過另一條直線避開;此外,機器人還不能精確控制其去向。
從應用層面上看,相較于安裝輪子才能走路的機器人,四足機器人的通用性更強。比如,其可以用于應急救援領域,執行受困人員搜救、廢墟清理等任務;用于下水管道探測等。
后續,該團隊不僅計劃開發更多用于規劃機器人的技術,還打算在四足機器人上增加機械臂,來執行抓取、開門等任務;同時,他們也想讓機器人實現更多創意性的技能,諸如跳躍、踢球等。
-
機器人
+關注
關注
211文章
28632瀏覽量
208005 -
模型
+關注
關注
1文章
3298瀏覽量
49075 -
3D感知
+關注
關注
0文章
20瀏覽量
3741
原文標題:科學家開發可提高3D感知能力的模型,實現四足機器人自由行走
文章出處:【微信號:tjrobot,微信公眾號:天津機器人】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論