作者:蘭灃卜,趙文博,朱凱,張濤 來源:基于具身智能的移動操作機器人系統發展研究[J].中國工程科學,2024,26(1):139-148. ?
具身智能是新一輪科技革命與產業變革中的戰略性技術,是當前世界各國重點競爭的前沿高地之一;移動操作機器人系統因其優秀的運動、規劃、執行能力成為具身技術首選的硬件載體;基于具身智能的移動操作機器人系統作為實現跨領域、多場景、多功能的自主具身智能平臺,將成為引領未來新一代信息技術和人工智能發展的關鍵。
中國工程院院刊《中國工程科學》2024年第1期刊發清華大學張濤教授研究團隊的《基于具身智能的移動操作機器人系統發展研究》一文。文章從基于具身智能的移動操作機器人系統發展的需求出發,總結基于具身智能的移動操作機器人系統的發展現狀,分析該領域發展面臨的問題和挑戰,提出共性關鍵技術和對策建議,以期助力具身智能發展浪潮下我國移動操作機器人領域的長足發展。
一、前言
人工智能(AI)是引領新一輪科技革命與產業變革的戰略性技術之一,對助力我國現代化產業體系建設、推動戰略性新興產業融合集群發展、賦能各行各業發展具有重要意義。隨著通用AI技術的加速突破,技術基礎扎實且可多場景適用的移動操作機器人作為具身智能的優質載體,在全球科技界與產業界掀起了新一輪的研究浪潮,成為新一輪科技革命中的前沿技術高地之一。
基于具身智能的移動操作機器人系統(簡稱“具身智能移動操作機器人”)旨在構建具備自主環境感知、充分理解認知、流暢人機交互、可靠智能決策與自然運動操作規劃的機器人系統,依托跨領域、多場景、多功能的自主具身智能平臺,為傳統移動操作機器人升級賦能,引領未來移動操作機器人的行業發展。在具備可感知、理解與決策的類腦結構后,移動操作機器人能夠自主理解并完成人類下達的高級指令,實現真正的通用智能。
與傳統移動機器人相比,具身智能移動操作機器人能夠完成一些通常需要人類智慧才能完成的復雜工作,隨著其技術不斷發展與成熟,必將給人類社會帶來革命性的變革。具身智能移動操作機器人在服務、餐飲、醫療、智能家居、無人配送等民用領域,智能工廠、智能制造等工業領域以及單兵作戰等軍事領域,都擁有廣闊的應用前景。目前,國內外對于具身智能移動操作機器人的研發大多仍處于實驗室測試階段,針對特定場景、特定任務的具身智能移動操作機器人雖然有了較大的發展,但整體技術并不成熟,尚未實現產業化與商品化。學術界對于移動操作機器人的研究主要圍繞環境感知、運動控制、路徑規劃、車臂協同等方面展開,對具身智能技術和移動操作機器人技術的研究處于平行發展階段。文章從具身智能移動操作機器人發展的需求出發,厘清具身智能移動操作機器人的發展現狀,分析面臨的挑戰,總結相關關鍵技術,并提出發展建議,以期為具身智能移動操作機器人研究提供參考。
二、基于具身智能的移動操作機器人系統發展現狀
移動操作機器人泛指具備移動與抓取操作能力的機器人,基本結構由移動基座、機械臂、操作末端共同組成,進而發展出類人結構。移動操作機器人擁有形態優勢和移動操作能力,是最接近人類形態的機器人構型,是具身智能最理想的硬件載體。移動操作機器人技術發展歷史悠久,經過長足發展,已形成相對成熟的技術體系。具身智能作為通用AI技術的重要實現手段,近年來正在不斷取得全新突破,具身智能移動操作機器人呈現出廣闊的應用前景。
(一)移動操作機器人
移動操作機器人需要在未知環境中完成感知、導航與控制等任務,主要由移動底盤、機械臂和操作末端三部分組成,核心技術包括感知、導航與控制技術,靈巧操作控制技術等。移動操作機器人技術的發展使機器人能夠更精確、快速、穩定地利用多模態數據來感知周圍環境,進行更高效的運動控制和路徑規劃。隨著深度學習技術的發展和應用,基于深度學習和強化學習的機器人控制技術、多模態感知技術將得到進一步發展,推動移動操作機器人的感知、規劃、控制能力進一步提升。
移動操作機器人在感知、導航與控制技術方面的發展現狀如下。① 在感知技術層面,移動操作機器人依靠傳感器來感知外部的物理世界,通過裝配相機、雷達、超聲波、紅外等感知傳感器以及慣性測量單元、編碼器等傳感器來確定自身位置姿態和運動狀態。通過多傳感器融合技術,移動機器人可以利用多源感知數據來提高自身感知的精度和魯棒性,實現對環境的高精度實時感知。此外,感知層還需要完成對未知環境的建圖任務。定位與建圖技術用于解決移動機器人在真實物理世界中的環境重建和自身定位問題,是移動機器人的關鍵技術之一。目前,定位與建圖技術研究通常采用激光測距儀、計算機視覺兩類方法:前者構建的點云地圖精度較高,算法相對簡單,在光照不足、明暗變化大的環境下魯棒性強,但是難以展現較好的環境細節信息;后者得到的視覺圖像包含更加豐富的環境特征信息,使機器人能夠在更大范圍內完成任務,但是算法設計復雜,對光照等條件要求比較苛刻。② 在導航技術層面,移動操作機器人根據目標點和感知地圖,實時生成離散航路點序列或連續期望軌跡的算法。移動操作機器人導航技術主要包括全局路徑規劃、局部避碰與避障等技術。移動操作機器人導航任務主要包括以地圖的形式生成世界模型,計算從起始位置到目標位置的無碰撞軌跡,沿著計算的軌跡移動,避免與障礙物碰撞。③ 在控制技術層面,移動操作機器人不僅需要具備移動機器人的感知、定位與導航運動能力,還需要具備精確控制移動機器人抵達預期航路點的能力。目前,機器人控制技術相對成熟,通過對機器人建立運動學和動力學模型,采用基于全局線性化的控制、基于近似線性化的控制、基于李雅普諾夫理論的控制等方法,實現較為穩定的控制。經典的機器人控制策略有計算力矩控制、魯棒控制、滑模控制、自適應控制、神經網絡控制、模糊邏輯控制、自抗擾控制與柔性控制。
在靈巧操作控制技術方面,傳統機器人的操作末端通常為夾爪或夾手,缺乏機動性與靈巧性;移動操作機器人將具備更加靈巧通用的操作末端,如類手結構、柔順捕獲結構等,以提升末端抓取的通用性,擁有任意物體抓取、工具使用、柔性物體操作等高級技能,進而可以在工業環境中完成裝配、焊接、搬運等任務以及在家庭場景中完成廚具使用、家庭清潔等工作。除此之外,計算機視覺技術可以幫助移動操作機器人與周圍環境進行互動,增強其智能化和自主性,使其像人一樣感知、理解和響應環境,對提升機器人視覺跟蹤、物體識別、移動抓取、人機交互等能力都有重要意義。機械臂控制技術和靈巧操作技術助力移動操作機器人完成高精度、高性能的復雜任務。移動操作機器人可以通過相機等視覺傳感器、壓敏陣列等觸覺提升智能操作、靈巧操作和交互操作能力。受限于硬件資源與工作場景,移動操作機器人主要通過圖像數據強化其操作能力,利用計算機視覺技術輸入相機等傳感器的圖像像素并轉換為環境中物體的類別、位置、姿態、速度以及人類的面部表情、手勢等具體信息,運用計算機算法和機器學習算法對數字圖像進行分析、處理、識別和理解,進而實現智能化應用。
得益于其感知、移動、抓取和靈巧操作等能力的提升,移動操作機器人在民用和軍用等領域均擁有廣闊的應用前景和應用價值。① 在民用領域,移動操作機器人在智慧醫療、智能工廠、交通物流、實驗室助手、家居服務、餐飲服務、住宿服務等行業涌現出多種落地產品,為智慧社會構建提供了強大推力。在醫療方面,移動操作機器人可以完成藥品和工具遞送、病人看護、輔助診療等任務。在制造業中,移動操作機器人可以實現傳統機械臂無法實現的功能,提升工業生產的自主化水平。在實驗室助手方面,移動操作機器人可以幫助實驗人員開展化學實驗工作,如中國科學技術大學集成移動機器人、化學工作站、智能操作系統、科學數據庫,研制出數據智能驅動的全流程機器“化學家”。在家居服務方面,移動操作機器人可以完成物品遞送、開門關門、垃圾清理等便捷居民生活的任務。在餐飲和住宿服務方面,智能移動機器人可以輔助完成上餐、餐具回收、物品遞送等任務。② 在軍用領域,移動操作機器人可以輔助作戰部隊開展偵察、跨越險阻、彈藥運輸、后勤保障等任務,提高作戰效率和豐富作戰手段。具備一定或較高智能的移動操作機器人的廣泛應用,為具身智能移動操作機器人產業化提供了需求與應用場景。
(二)具身智能移動操作機器人
具身智能概念在1950年首次被提出,指能夠與環境交互感知,具備自主規劃、決策、行動、執行能力的機器人或虛擬環境中的仿真人,是AI的終級形態。具身智能具備自主感知、認知、理解、推理、行動等類人或高于人類的能力,具備由“大腦”“小腦”“腦干”組成的完整人腦結構以及可實現行動的機器身體,如圖1所示。其中,“大腦”部分負責對場景進行認知、理解、推斷、分析,“小腦”部分開展柔性控制、協同控制、交互控制、靈巧操作等技能學習,“腦干”部分則承擔能源調配、環境感知、信號分析與計算等工作。隨著時代的發展和科技的進步,具身智能的概念被不斷迭代和更新,尚未形成定論,但通識的理解是具有身體的智能技術,即為智能技術賦予行動能力。具身智能的實現依賴于AI領域的計算機視覺技術、多模態感知融合技術、自然語言處理技術、因果推斷技術、移動導航與規劃技術等。區別于離線智能,具身智能要求機器人具備高度自主化且可進行感知、理解與決策的“腦”,具有穩定、安全、運動自然的機器人“身體”。此外,機器人還要具備在執行人類高級指令及與環境交互過程中進行在線學習、更新“腦”和“身體”的能力。
圖1 具身智能的內涵及其應用場景
2022年,OpenAI公司研發的大語言模型ChatGPT被視為通用AI技術領域取得的重要突破,進而使得具身智能被重新提起。大規模網絡模型基于海量優質數據訓練后,在個性化應答、機器翻譯、語言理解、圖像理解等方面的性能獲得顯著提升,應用價值大幅提高。以大模型為內核,移動操作機器人可以具備思考、理解、認知的能力。目前,全球已出現多個成功商品化的大模型,國內包括百度公司研發的文心一言、阿里巴巴公司研發的通義千問等;國外包括OpenAI公司最新研發的GPT-4和圖像生成大模型DALL.E 3、谷歌公司研發的Gemini、微軟公司研發的數學推理大模型WizardMath、谷歌與柏林工業大學共同推出的視覺語言模型PaLM-E等。這些大模型在常識推理、代碼完善、知識遷移等領域展現出較強的應用能力。在語言識別與理解方面,基于大模型的聊天機器人可以和人自由交流,完成資料檢索、總結歸納、日程安排、出行規劃、行為規劃等任務,具備強大的文本認知與理解能力;針對圖像信息,大模型可以準確識別其中包含的各類物品,實現像素級細粒度分割,并具備初步的空間識別能力;在點云信息處理方面,大模型能夠準確分割空間中的點云區域,根據點云實現零訓練的分類任務;在數學推理、代碼生成方面,部分專用大模型已經可以完成定理證明、數學推導與計算,并可以自主編程實現相應任務。目前,部分綜合大模型已經具備較強的文本、圖像、點云的信息關聯能力,能夠根據文本信息準確地識別、分割或生成所需的圖像、點云模型,并且支持將真實世界的連續傳感器模態直接結合到語言模型中,從而建立單詞文本和感知之間的聯系。在近期的研究中,綜合大模型已經可以對人類高級命令生成分步指令。例如,由人類給出整理房間的指令,大模型可以根據當前的圖片信息判斷各類物品應擺放于何處,進而生成分布執行指令完成該任務。
與傳統移動操作機器人相比,具身智能移動操作機器人最大的進步在于其具備智慧大腦,能夠實現對世界的認知理解進而進行智能決策。具身智能發展的核心是機器人“大腦”能力的進步。當前的具身智能發展主要集中在對移動操作機器人“大腦”層面的研究。隨著大模型技術尤其是多模態綜合大模型技術的高速發展,具身智能移動操作機器人將具備更強大的思考、感知、認知、決策能力,實現更加通用自主的機器智能,利用多模態數據進行自我學習、自我適應、自我優化,自主篩選出最優的行動策略與最佳的解決方案以執行任務。
隨著機器人技術和AI技術的快速發展,移動操作機器人實物系統不斷落地,出現了多個具備感知、導航、操作能力的移動操作機器人系統,如北京字節跳動科技有限公司的端到端機器人操作模型GR-1、斯坦福大學Mobile ALOHA機器人、谷歌DeepMind公司的視覺 ? 文本多模態大模型RT-2以及最新推出的AutoRT等。沈陽新松機器人自動化股份有限公司于2021年推出了全新的多可移動協作機器人,可搭載自主研發的視覺和夾具等執行單元,實現對物料的搬運、裝配、檢測和精密加工等功能應用。杭州迦智科技有限公司推出了新款復合作業機器人MORA300,具有自主充電、自主定位導航、智能路徑規劃、第三方設施對接交互等功能。庫卡機器人有限公司(KUKA)近年來推出了KMR iisy、KMR iiwa等移動協作機器人平臺,可以與人一起合作,并以毫米級精度在工件上作業。此外,KUKA公司的完全自主作業式移動機器人平臺不需要電感線圈、地面標記或磁鐵。2023年7月,谷歌DeepMind公司推出的機器人模型RT-2是一個全新的視覺 ? 語言 ? 動作模型,可以通過網絡和機器人的數據進行學習,并將這些知識轉化為機器人控制的通用指令。2023年11月,One X公司與OpenAI公司深度合作,開發了一款具身智能類人機器人EVE,可以實現對人類日常工作環境的認知理解,在與環境交互的過程中學習、糾正、收集數據,完成自主居家、辦公幫手任務。波士頓動力公司研發了Spot機器狗,能夠實現敏捷快速的探索與運動,支持在機器狗上擴展機械臂等多種外設;可以集成更多的傳感器,提升通信和計算能力;通過元學習方式支持自主導航與探索,實現物理世界交互與無邊界探索。
總體而言,具身智能移動操作機器人擁有支持感覺和運動的機器身體,增強了主動感知與靈活執行的能力;不僅具備傳統移動操作機器人的功能,還能夠聽懂人類語言,感知并理解外部環境,并據此分解任務、規劃子任務,在移動中識別物體,與物理環境交互、最終完成相應任務。具身智能移動操作機器人正朝著形態多樣化、功能全面化、任務通用化、行為自主化、交互人性化的方向發展,不斷涌現出新的移動操作機器人設計思路和功能任務。移動操作機器人平臺和實物系統的產業化進程不斷加快,但其對外部環境和人類指令的理解和認知能力還有待提升,仍需人來發送具體的指令。未來,具身智能和移動操作機器人系統深入結合與落地,將推動移動操作機器人產業的進一步發展。
三、基于具身智能的移動操作機器人系統關鍵技術
當前,具身智能移動操作機器人發展形成的關鍵技術包括多模態感知技術、世界認知與理解技術、智能自主決策技術、運動與操作聯合規劃技術(見圖2),旨在推動移動操作機器人的系統的發展。
圖2 具身智能移動操作機器人發展與研究框架
(一)多模態感知技術
多模態感知技術能夠使具身智能移動操作機器人實現更高的自主性、高效性、通用性,增強對周圍環境的局部感知能力,并為機器人提供豐富、穩定、準確的環境數據。室內復雜場景的運動感知信息往往存在多源性、異構性、動態性等特征,同時機器人需要面對環境光強變化、非全局特征感知、遮擋復原與推斷等問題。對此,機器人可通過多角度圖像信號、激光雷達(LiDAR)等不同模態信息數據關聯以及多源圖像數據融合,完成對周圍局部環境的立體重建。針對室外開闊場景與復雜高噪環境,通過圖像、LiDAR、熱成像檢測、全球定位系統等多源多模態傳感器的多元融合技術,實現多傳感器的優勢互補,確保感知信息完備有效。通過目標檢測、目標分割等技術,構建感知環境與實際環境的空間映射關系,形成多模態環境數據“一站式”融合智能處理系統,實現對局部環境空間、物體的即時感知與虛擬重建,為移動操作機器人系統對環境的認知與理解提供可靠數據來源。
(二)世界認知與理解技術
具身智能移動操作機器人與傳統移動操作機器人相比,具備能夠自主感知、認知理解、任務規劃的智慧大腦。具身智能移動操作機器人構建感知世界與現實世界理解認知的共性關鍵技術發展方向主要有兩種,一是基于深度學習方法,構建大模型,以環境感知數據為輸入,通過迭代訓練,形成對感知世界的經驗認知與理解;二是通過對物理世界的物體認知,對物體運動、物體形變、工具使用等客觀現象進行物理仿真和建模分析,構建世界共性物理模型,實現對局部環境的認知與理解。移動操作機器人系統利用智能技術完成對環境的感知與理解,進而對人類指令進行分析以構建上層任務的解析與規劃,最終形成基于自然感知環境數據、可以獨立自主對人類命令進行分析、實現任務分解的上層規劃系統。
(三)智能自主決策技術
魯棒、安全、最優的智能決策系統是具身智能移動操作機器人與環境和人類穩定交互、可靠執行、可行決策的關鍵。通過智能化技術,移動操作機器人具備自主決策與社交能力,可以通過自主生成、人機交互、機器人間交互三類方式生成決策。決策系統包含局部世界環境感知與物體認知理解的相互映射匹配和對齊、人類與機器人指令交互的雙向價值對齊、人類命令與機器人可執行指令對齊三個主體部分。具體來說,具身智能移動操作機器人在獲得人類高級命令后,融合移動操作機器人系統環境感知數據與物體認知理解,構建局部環境空間映射和物體種類、用途、使用方式的關聯關系。在此基礎上,決策系統進一步生成人類分步指令集,完成上游命令的任務分解,在人機交互過程中以在線學習方式動態進行雙向人機價值對齊,保障分步決策符合人類價值體系。最終,構建人類命令與機器人可執行指令的轉化系統,完成分步決策結果到移動操作機器人可執行指令的對齊轉換,形成與環境和人類穩定交互、自主決策的移動操作機器人決策系統。與一般智能機器人相比,該系統通常具備社交導航、物體導航、人機協作、多機協作等高級能力。現有的機器人自主決策研究主要有兩種方式,一種是以大語言模型為核心,通過對人類指令進行預編碼解碼分析,設計輸入信息,利用大語言模型給出決策方案以實現自主決策;另一種則是通過對人類行為與物理世界進行解析分析,理解人類行為與價值評判,進而根據當前感知信息推斷規劃生成最優決策。這兩種方式各有優劣,目前由于大語言模型技術的快速發展,第一種方法在近年來更受關注。
(四)運動與操作聯合規劃技術
隨著移動機器人技術的發展,移動操作機器人的種類不斷增多,機器人的移動導航相關技術發展日趨成熟,機械臂的規劃控制魯棒性、自抗擾性、柔性控制技術日益完善。然而,移動操作機器人系統作為具身智能的實際載體,其運動與操作聯合規劃技術尚未完備,致使具身智能的部署與應用受到較大掣肘。具身智能移動操作機器人已經具備對上游高級命令進行自動感知、自主決策、多機協作、人機交互的決策能力,而這對導航運動與操作的協同規劃提出了更高的要求,單一的導航運動與操作控制無法滿足其靈巧性、高效性、連貫性、穩定性、安全性的需求。具身智能移動操作機器人的運動與操作聯合規劃技術需要具備移動基座與機械臂的協同規劃控制能力,多機協作、人機協作的工作能力。在此基礎上,具身智能移動操作機器人能夠在復雜空間約束環境下完成典型任務,包括在室內外復雜約束地形與環境下的移動、抓取、搜索、運輸、交互,融合環境感知數據進行局部建圖與定位、多關節路徑規劃、協同交互式操作、工具理解與使用等;能夠與其他機器人和人類并行統一協作或串行交互傳遞完成難以獨立完成的、更為復雜的高級任務。此外,在共享同一工作空間的典型社會化人機交互場景中,由于機器人的安全性和性能與人類的運動自然耦合,機器人需要對人類未來的運動進行實時推斷,規劃出安全、高效、符合社會規范的路徑,讓人類長期接受機器人作為合作者,實現社交導航。未來,移動操作機器人均需要在動態社會化環境中進行安全的自主導航,人類也需要很好地理解移動操作機器人的行為以便對其未來的行為做出預測。人機交互共融技術將逐漸成為移動操作機器人領域的研究重點。
四、基于具身智能的移動操作機器人系統發展面臨的問題與挑戰
當前,對機器人自主化、智能化的要求不斷提高,傳統離線智能模式的局限逐漸增多,已不能滿足國家的戰略需求與行業應用需要。隨著多模態感知、AI、人機交互、自然語言處理、任務和運動規劃等技術的不斷發展,現有的具身智能移動操作機器人關鍵技術仍有待演進提升,具身智能移動操作機器人發展依然面臨諸多問題與挑戰。
(一)感知方面
在感知方面,具身智能移動操作機器人主要面臨如下問題。一是自主感知能力欠缺。具身智能移動操作機器人不再局限于接受指令后僅對當前所在位置進行局部感知,而能夠在復雜場景下根據人類提供的高級指令,自主判斷對當前環境的感知程度,并進一步通過自主規劃運動,實現動態感知,豐富自身對環境的感知程度,因此對其自主感知能力提出了更高的要求。二是交互感知能力薄弱。具身智能移動操作機器人不再單獨依靠人類低級指令進行規劃執行,而是通過人類高級指令進行感知規劃,完善對當前局部環境的多粒度探索,豐富環境感知數據。目前,移動操作機器人在約束環境下的自主感知技術仍處于發展階段,沒有有效的感知手段,對人機交互感知的準確性、即時性、有效性都提出了挑戰。三是多模態數據融合與局部環境構建緩慢。移動操作機器人需要對周圍局部環境進行充分完備的感知與重建,需要實現多模態數據融合與環境空間的三維映射,重建局部三維地圖;具身智能移動操作機器人需要具備快速響應、自主規劃能力,而當前技術在效率上無法保證即時高效。
(二)認知與理解方面
在認知與理解方面,具身智能移動操作機器人主要面臨如下問題。一是對環境物體的形態、功能、使用、交互方式存在認知欠缺。在具身智能下,移動操作機器人需要基于環境感知數據,完成對環境中各類物體的用途與使用方式等的認知和推斷。當前,AI領域的大模型技術雖然對常見物品具備一定的通識理解能力,但和人類經驗之間仍存在偏差,無法構建環境中物體的關聯關系,也難以根據環境中物體的實際形態、狀態實現信息融合。這對移動操作機器人的決策生成與規劃執行帶來了可行性挑戰。二是對人機交互的高級命令存在理解不足。在面對人類給出的諸如整理房間、完成倉庫中貨物運輸、搜救被困人員等高級指令時,現有以大語言模型為基礎的AI技術尚無法通過與感知環境數據融合以給出合理的認知與任務分解,容易陷入經驗認知陷阱,缺乏交互學習與矯正能力。
(三)決策方面
在決策方面,具身智能移動操作機器人主要面臨如下挑戰。一是自主智能決策能力薄弱。具身智能移動操作機器人的智慧大腦需要實現環境感知與世界認知理解結果的融合匹配,依照人類價值體系生成合理、可行的決策方案,構建移動操作機器人系統可執行的指令集,完成人類執行方案與機器人系統指令集的關聯映射,形成移動操作機器人解決方案。因此,移動操作機器人系統在決策時需要具備類人的價值標準、環境物體與認知物體的理解對齊能力、將人類高級指令分解為機器人可執行指令序列的能力等,這些對移動操作機器人技術與具身智能發展提出了挑戰。當前,具身智能決策方法主要圍繞大語言模型進行認知理解與推斷,加入先驗信息引導或加入后驗信息反饋矯正。由于大語言模型存在的幻覺、偽邏輯等問題,可能生成一系列機器人難以執行的指令;同時在引入先驗信息時,由于具身智能移動操作機器人的工作場景及任務通常需要即時決策,對細粒度圖像與點云進行分割、特征提取的現有方法雖然效果與泛化能力很強,但計算成本與耗時均較高(如SAM),不利于即時導航與決策。近期,LLaMA、LLaVA等通過預訓練模型、有監督微調、近端優化等方式,其性能得到進一步提高,但依然存在指令通用性太強,無法具體執行的問題。
(四)運動與操作的聯合規劃方面
傳統運動導航與機械臂運動規劃相結合的方式存在靈活性差、穩定度低、空間路徑次優等諸多問題。一是在復雜的室內外場景,如家庭室內環境、工廠車間環境、災后搜救環境等,針對目標的尋找、捕獲和運輸等任務存在很強的空間、時間條件約束,現有算法存在運動不連續、不自然、不穩定、不安全的問題。二是在動態環境中,基于局部感知進行移動導航與操作存在規劃求解緩慢、效率較低等問題。雖然在靜態和已知環境中的機器人導航方面已經開展了大量研究,但當機器人從靜態或受控環境轉變為動態環境時,多個智能體以不同的模式移動,會面臨諸多挑戰。三是移動操作機器人與公共空間中其他動態機器人或人類進行交互時,對安全性提出了新的更高要求。人類可以依靠常識和經驗來理解其他智能體的行為,但當前的智能移動操作機器人僅限于執行預設的交互模型完成與有限人類行為的交互,且移動操作機器人行為的有效性需要在人機系統中進行評估。然而,由于人機混合系統的高度復雜性,難以進行理論分析和全面仿真評估;在試驗評估中,人的安全性至關重要,與人相關的失敗容忍度極低,因此開發更安全有效的人機交互系統評估平臺至關重要。
(五)通用仿真實驗平臺方面
目前,移動操作機器人領域技術研發過程中缺乏通用、可靠、多接口的多場景綜合仿真實驗平臺,技術研發速度減緩,衍生出諸多實物部署中需要面臨的兼容性、穩定性、準確性、泛化性問題。具身智能移動操作機器人的技術更新與迭代速度快,構建軟硬件上下游系統的成本較高,但由于仿真環境多樣性的限制,適用場景十分有限,亟需在仿真平臺進行研發與實驗驗證,推進技術落地與產業化。目前,學界與業界缺乏具備通用接口、真實物理引擎、包含多場景的機器人綜合仿真平臺,阻礙了具身智能移動操作機器人的發展,成為桎梏具身智能移動操作機器人發展的一大關鍵節點。因此,在當前具身智能發展的浪潮下,移動操作機器人系統的研發對綜合仿真實驗平臺需求更加迫切。
五、基于具身智能的移動操作機器人系統發展建議
(一)緊抓具身智能移動操作機器人持續發展與產業生態構建
我國具身智能移動操作機器人發展應著眼形成涵蓋優質數據、前沿關鍵技術、實驗測試平臺、實體開發與成果轉化的科技研發與落地全鏈條,與國內外高水平研發機構、高科技領軍企業、交叉領域相關單位充分聯合,有效凝聚科技協同創新的戰略資源,探索高效的有機協同機制,形成“產學研用”一體化的優勢互補發展模式;以國家重大戰略需求與政策為引導,推進我國基礎技術、關鍵技術、應用部署技術的研究與突破,形成跨領域的產業化發展優勢,滿足國家建設、社會經濟發展的戰略需求,加速推進智慧社會與智慧城市的構建。
(二)注重關鍵技術領域的原創性突破
圍繞具身智能移動操作機器人的共性關鍵技術,在環境感知、認知理解、智能決策、運動與操作聯合規劃等核心技術方面進行突破。建議行業主管部門發布具身智能共性關鍵技術研究計劃,加強行業對新技術態勢下的移動操作機器人系統的智能化、自主化、通用化、靈巧化、安全化的重視程度,切實推動具身智能發展。加速AI技術對移動操作機器人的賦能,構建完備的軟硬件交互平臺,持續推進具備自動感知、自主決策、自然交互、安全執行能力的移動操作機器人系統構建。
(三)重視發展智能科學與機器人領域,關注智能科學與技術學科建設和人才培養
推進校企聯合開展關鍵技術研究與突破,整合創新資源,加強研究機構與上下游企業的深度合作與資源共享,圍繞共性關鍵技術研究與工程化集成應用突破,構建具身智能移動操作機器人的創新鏈條與產業鏈條。同時,進一步完善學科領域布局,推進智能科學與技術的一級學科建設,設立智能機器人專業,增加智能機器人相關碩士研究生和博士研究生的招生名額;完善智能機器人相關學科的培養與教學方案,拓寬智能機器人學科交叉范圍,與數學、物理學、生物學、計算科學等學科教育進行交叉融合。強化實驗實踐與實物部署在教學中的占比,提升AI技術到實體移動操作機器人的部署能力,為國家智能機器人領域發展提供充足的人才資源。
(四)鼓勵建設多場景移動操作機器人系統通用驗證平臺
與醫療、教育、消防、交通、家庭服務、工業生產等領域中的相關單位展開深入合作,為具身智能移動操作機器人提供應用場景與示范驗證平臺,推進多場景智能機器人的通用性測試驗證基地建設,為智能移動操作機器人發展提供充足的研究數據,為社會智能升級積累經驗。借助我國與“一帶一路”及其他地區的經貿合作關系,推廣我國具身智能移動操作機器人的相關技術與產品,擴大領域影響力,推動形成技術與產品的全球布局。
(五)協調具身智能移動操作機器人與人類社會和諧發展
具身智能移動操作機器人技術在發展過程中因其自主性、智能性、交互性等特點,在人類社會中安全、可靠、穩定的運作依然需要在倫理、法律層面予以保障,進而確保相關技術的安全研發。在倫理層面,對于移動操作機器人的自主決策過程,技術研發需恪守白盒方式,明確機器人的完整推理與決策過程,保障人類的可靠干預,確保機器人的行為正常無風險。在法律層面,針對具身智能可能對社會帶來的影響,充分考慮并予以法律保障。例如,對于移動操作機器人的自主決策與運動規劃行為,需明確界定其法理責任;對于移動操作機器人可能替代的行業人群,需從法律角度協調機器人的生產進程,保障人類公民的就業與生存等;配合明晰機器人行為生成的相關技術模塊,便于明確責任人和責任關系,為法律執行提供合理的判罰標準與論據。
審核編輯:黃飛
評論
查看更多