蘋果入局人形機(jī)器人,先做感知系統(tǒng)!還一次性用了40個激光雷達(dá)!
關(guān)于蘋果涉足人形機(jī)器人領(lǐng)域的傳聞早已甚囂塵上。近日,該公司確實有新動作——研發(fā)了一套名為ARMOR的新型以自我為中心的機(jī)器人感知系統(tǒng)。ARMOR系統(tǒng)的創(chuàng)新之處在于采用分布式感知方案。研究團(tuán)隊在機(jī)器人的手臂和手掌上戰(zhàn)略性地布置了40個小型ToF激光雷達(dá)傳感器,每邊手臂20個。這些傳感器體積小巧、成本低廉、功耗低,讓機(jī)器人獲得了類似人類皮膚般的全方位感知能力,最大程度減少了盲區(qū),大大提升了運動規(guī)劃和避障效果。
軟件方面,蘋果開發(fā)了一個基于Transformer的AI驅(qū)動ARMOR-Policy,能夠從人類動作中學(xué)習(xí),幫助機(jī)器人動態(tài)規(guī)劃行動。
研究結(jié)果令人驚喜。與使用四個頭戴式及外部安裝的深度攝像頭(外心感知)的傳統(tǒng)法案相比,ARMOR系統(tǒng)使碰撞降低了63.7%,成功率提高了78.7%。與基于采樣的運動規(guī)劃專家系統(tǒng)cuRobo相比,ARMOR-Policy讓碰撞減少31.6%,成功率提高16.9%,計算延遲降低26倍,大大提高了機(jī)器人的機(jī)動性。
研究團(tuán)隊還通過在傅利葉GR-1人形機(jī)器人上部署28個ToF激光雷達(dá),實現(xiàn)了15Hz的實時軌跡規(guī)劃和避障控制,實際驗證了ARMOR系統(tǒng)在真實環(huán)境中的應(yīng)用可行性。
當(dāng)前,傳統(tǒng)人形機(jī)器人通常依賴頭部或軀干安裝的集中式攝像頭和激光雷達(dá)進(jìn)行環(huán)境感知,這種方式雖然易于集成且能提供較好的視野范圍,但在手臂和手部區(qū)域常常存在嚴(yán)重的遮擋問題。
ARMOR系統(tǒng),提供了一種創(chuàng)新的硬件和軟件整合設(shè)計。
與集中式RGBD攝像頭一次性捕捉密集幀中的全部細(xì)節(jié)不同,研究團(tuán)隊選擇了SparkFun VL53L5CX飛行時間(ToF)激光雷達(dá)作為基礎(chǔ)傳感單元,將稀疏感知分布在多個傳感器上,形成“以自我為中心的感知”。
該激光雷達(dá)傳感器尺寸僅6.4×3.0×1.5毫米。單個激光雷達(dá)可以以15Hz的頻率(特定配置下最高30Hz)采集8×8分辨率的深度圖像,對角視場角63°,探測范圍4000毫米。
研究團(tuán)隊在機(jī)器人的每個手臂上布置了20個這樣的激光雷達(dá),共計40個激光雷達(dá)形成分布式感知網(wǎng)絡(luò)。 每4個激光雷達(dá)連接到一個XIAO ESP微控制器,通過I2C總線進(jìn)行數(shù)據(jù)讀取,再通過USB傳輸?shù)綑C(jī)器人的板載計算機(jī)(Jetson Xavier NX),最后無線傳輸?shù)脚鋫銷VIDIA GeForce RTX 4090 GPU的Linux主機(jī)進(jìn)行處理,確保整個系統(tǒng)能夠維持15Hz的刷新率。 ARMOR不僅在硬件上實現(xiàn)了創(chuàng)新,其基于深度學(xué)習(xí)的避障策略同樣亮眼。研究團(tuán)隊基于Transformer架構(gòu)開發(fā)了ARMOR-Policy,讓機(jī)器人能夠快速高效地規(guī)劃無碰撞軌跡。
該策略的核心是一個條件生成模型,它可以基于當(dāng)前關(guān)節(jié)狀態(tài)、目標(biāo)位置、ToF激光雷達(dá)觀測值以及潛變量z來預(yù)測未來的動作序列。網(wǎng)絡(luò)采用了類似ACT(Action Chunking Transformers)的編碼器-解碼器結(jié)構(gòu)。 為了訓(xùn)練智能避障策略,研究團(tuán)隊使用了AMASS數(shù)據(jù)集中的311922個人類真實運動序列(約86.6小時),這些數(shù)據(jù)包含了各種相關(guān)的人類姿態(tài),如操作、舞蹈和社交行為等。
研究團(tuán)隊將這些人類動作軌跡重定向到機(jī)器人的關(guān)節(jié)配置上,并在軌跡周圍生成緊湊的障礙物,確保軌跡本身不發(fā)生碰撞。 訓(xùn)練數(shù)據(jù)的生成采用了三種策略:避障運動、緊急停止和無碰撞運動。
ARMOR-Policy的網(wǎng)絡(luò)架構(gòu)設(shè)計考慮到了運動規(guī)劃可能存在多個有效解的特點。通過引入額外的編碼器層來推斷潛在變量z,使策略能夠通過調(diào)整z生成不同的運動軌跡候選。 在推理階段,系統(tǒng)會并行計算N個候選軌跡,并通過最小化機(jī)器人與點云之間的距離來選擇最優(yōu)路徑。網(wǎng)絡(luò)輸入包括潛在變量z、當(dāng)前和目標(biāo)關(guān)節(jié)位置(28維向量),以及40個ToF激光雷達(dá)傳感器的深度圖像數(shù)據(jù)。
深度圖像通過修改后的單通道ResNet18骨干網(wǎng)絡(luò)處理,提取512維特征。整個網(wǎng)絡(luò)架構(gòu)包含約84M參數(shù)。 實驗驗證顯示,ARMOR系統(tǒng)在多個方面都優(yōu)于現(xiàn)有方案。
據(jù)彭博社爆料,蘋果正在尋找其“下一個重大項目”,機(jī)器人正是其關(guān)注的領(lǐng)域之一。
研究團(tuán)隊計劃在后續(xù)工作中進(jìn)一步拓展ARMOR的應(yīng)用場景。特別是在復(fù)雜的靈巧操作任務(wù)中,分布式的近距離感知有望幫助機(jī)器人實現(xiàn)更精確的動作控制。此外,這種類似人類皮膚的感知方式,也為實現(xiàn)更自然的人機(jī)交互開辟了新的可能。
ARMOR也為人形機(jī)器人的發(fā)展提供了新的思路。它展示了分布式感知和深度學(xué)習(xí)結(jié)合的潛力,也證明了從人類生物特征中汲取靈感的價值。通過模仿人類皮膚的分布式感知方式,ARMOR讓機(jī)器人獲得了更全面的環(huán)境感知能力,為實現(xiàn)更智能靈活的機(jī)器人控制奠定了基礎(chǔ)。
參考來源:https://arxiv.org/pdf/2412.00396v1;https://x.com/Dr_Singularity/status/1873374876867723435;量子位;機(jī)器人大講堂。
來源:激光雷達(dá)老炮兒
-
人機(jī)交互
+關(guān)注
關(guān)注
12文章
1229瀏覽量
56064 -
機(jī)器人
+關(guān)注
關(guān)注
212文章
29273瀏覽量
210842 -
蘋果
+關(guān)注
關(guān)注
61文章
24518瀏覽量
202404 -
激光雷達(dá)
+關(guān)注
關(guān)注
970文章
4152瀏覽量
191565 -
感知系統(tǒng)
+關(guān)注
關(guān)注
1文章
73瀏覽量
16131
發(fā)布評論請先 登錄
相關(guān)推薦
AI驅(qū)動的人形機(jī)器人,成為激光雷達(dá)產(chǎn)業(yè)的下一個爆發(fā)點

【「# ROS 2智能機(jī)器人開發(fā)實踐」閱讀體驗】+內(nèi)容初識
LD Gen2 Lite激光雷達(dá):賦予機(jī)器人 “感知力” 的關(guān)鍵
速騰聚創(chuàng)第100萬臺激光雷達(dá)下線,用于人形機(jī)器人?
洛微科技參與起草《機(jī)器人用激光雷達(dá)通用技術(shù)條件》標(biāo)準(zhǔn)正式發(fā)布

洛微科技助力機(jī)器人領(lǐng)域激光雷達(dá)技術(shù)升級
禾賽拒絕“激光雷達(dá)無用論”

禾賽科技推出面向機(jī)器人領(lǐng)域的迷你3D激光雷達(dá)
【「具身智能機(jī)器人系統(tǒng)」閱讀體驗】2.具身智能機(jī)器人的基礎(chǔ)模塊
禾賽科技12月激光雷達(dá)交付量突破10萬臺
《具身智能機(jī)器人系統(tǒng)》第1-6章閱讀心得之具身智能機(jī)器人系統(tǒng)背景知識與基礎(chǔ)模塊
禾賽將推出機(jī)器人領(lǐng)域迷你3D激光雷達(dá)

激光雷達(dá)技術(shù)的基于深度學(xué)習(xí)的進(jìn)步
人形機(jī)器人感知系統(tǒng)的特點:多模態(tài)感知、高精度、實時性
基于FPGA的激光雷達(dá)控制板

評論