去年年底,波士頓動力發布的機器人組團載歌載舞賀新年的視頻賺足了全球觀眾的眼球。這幾天,江西圖書館兩個斗嘴機器人也迅速圈了一批粉。今天,我們來瞧瞧“絕影”機器狗get到的新功夫:無論推倒我還是踢翻我,我都能自己學著站起來。
人類在面對從未遇到的新情況時,可以本能地切換不同的技能來進行嘗試和應對,但對機器人來說卻是一項不小的挑戰。波士頓動力的機器人雖然舞技超人,但還都是基于預先設定好的程序,一旦超出預定程序以外很難做到隨機應變。
據《科學·機器人》雜志報道,浙江大學和愛丁堡大學的聯合研究團隊開發出了一套新的人工智能(AI)加強式學習方案。它能利用所謂的多專家學習架構(MELA),讓浙大的“絕影”機器狗掌握自行應對陌生情況的技能。
研究人員從培訓可以指導虛擬機器狗的軟件開始。他們開發了具有8種算法“專家”的學習體系,可以幫助機器狗產生復雜的行為。對于每種方式,都使用深度神經網絡來訓練機器狗的計算機模型以實現一個特定技能,這八項技能包括:站立平衡、大步小跑、左轉、姿勢控制、摔倒后翻正、小步小跑、側滾和右轉。
如果虛擬機器人的嘗試更接近目標,它將獲得一次數字獎勵;如果它做得不太理想,就給它記上一次數字過失。這個過程被稱為強化學習。經過許多次這樣的嘗試后,模擬機器人就成為了某項技能的專家。 一旦對8位算法“專家”進行了培訓,“他們”就需要學習團隊合作。研究人員將它們組合成一個總體網絡,以充當教練或隊長的角色。
這使機器人的人造大腦可以利用每位“專家”的知識——如何奔跑,轉身或正確站立。研究人員解釋說,教練或隊長會告訴誰做什么,或者誰和誰應該一起工作。所有“專家”都可以在一個團隊中一起協作,從而大大提高了技能的能力。例如,當機器人跌倒并需要恢復時,系統可以檢測到該運動并喚醒負責平衡的“專家”。
如動圖所示,8位“專家”相對應的數據條會顯示在屏幕左上角。當虛擬機器人在模擬環境中移動,追逐浮動的綠球時,網絡會根據特定時刻所需的技能來調高或調低每個“專家”的專業技能的影響力。
然后,研究人員可以將數字機器人在模擬中學到的東西移植到現實世界中的機器人大腦中。在上面的動圖中,機器狗大腦中的“教練”正在與AI專家進行協調,以幫助機器狗在滑過石子路時保持其立足點。當專業人員用棍子推倒“絕影”時,機器狗在原地重新站立了起來。對任何環境下的四足機器人來說,這都是非凡的能力,更不用說是需要行走在石子路上的機器人了。
當然,研究人員并不滿足于讓機器狗輕松過關,他們甚至還抓住機器狗頭部的手柄,將它摔個臉著地。但每次這只機器狗都會重新站起來。這并不是因為研究人員編寫了針對這種特殊攻擊類型的反應代碼,而是因為“絕影”現在已學會了就其行為策略咨詢它的AI專家。當研究人員讓機器人在光滑的表面或草地上而不是石子路上行走時,它也適應了這種情況。
這項研究的總體思路是使機器人學習步態的方式與人類幼兒類似。對機器人運動進行編碼的傳統方法是在機器上加載有關現實世界工作原理的假設。例如,腳如何以不同的方式在硬木地板和地毯上踩穩,并逐點給出指令。但是想象一下,你告訴一個小孩:要爬上樓梯,就必須這樣移動胳膊和腿,他們根本不會聽你的。他們會通過各種試錯來學會如何行動。他們必須通過體驗,來學會在不同場景下如何調整其運動方式。
同樣,一臺機器人不能僅通過遵循腳本來適應環境,因為現實世界中的環境極其復雜。研究人員表示,“所有預設在您進入野外時都會被徹底打破,因為您沒有關于此環境的完整信息。” 因此,解決方案是讓“絕影”機器狗像人類一樣學習,使其能夠實時組合其靈巧和自適應的技能,來處理它從未見過的各種不同任務。
責任編輯:xj
原文標題:“絕影”機器狗學會新功夫:人類再也弄不翻我了
文章出處:【微信公眾號:天津機器人】歡迎添加關注!文章轉載請注明出處。
-
機器人
+關注
關注
211文章
28524瀏覽量
207533 -
四足機器人
+關注
關注
1文章
91瀏覽量
15229 -
波士頓
+關注
關注
1文章
61瀏覽量
16402
原文標題:“絕影”機器狗學會新功夫:人類再也弄不翻我了
文章出處:【微信號:tjrobot,微信公眾號:天津機器人】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論