具身智能是一種基于物理身體進行感知和行動的智能系統,其通過智能體與環境的交互獲取信息、理解問題、做出決策并實現行動。具身智能的核心要素包括本體和智能體。本體作為實際的執行者,在物理或虛擬世界負責感知和執行任務,而智能體則是具身于本體之上的智能核心,負責感知、理解、決策、控制等核心工作。
區別于機器人,具身智能具備自我決策能力。根據盧策吾教授在機器之心AI 科技年會上發表的《具身智能是通往 AGI 值得探索的方向》中提到,智能體通過感知器和執行器與環境進行交互后,能夠實現獲取信息、理解問題等功能, 并根據環境的變化做出相應的決策和行動。
2023年,GPT-4 Turbo發布,其參數量高達1.8萬億。2024 年4月,國內商湯科技“ 日 日新 ”大模型體系正式發布,其中中文語言大模型參數達1800 億。隨著大模型參數量的大幅增長傳統穿戴設備、手機等無法消化大模型大算力。 從目前市場上的端側大模型來看,通常設備端越大(功能越多),其端側大模型的參數量也越大。
而具身智能需要處理更復雜的任務,如環境感知、運動控制、決策制定等, 其算法和模型需要快速處理大量數據并做出決策,因此具身智能需要更大的模型參數來支持其更廣泛的功能和更高的智能需求。谷歌開發的 PaLM-E 具身多模態大模型參數量達 5620 億;華為盤古 Pangu S 大模型參數達萬億。相比小型端側設備,具身智能機器人能夠消化大模型、大算力!
大模型使智能體由被動編程控制走向主動決策。與智能體結合后,具身智能以任務目標為導向,不僅僅是機械地完成程序,其可以根據環境變化,對行動細節進行實時修正,并消除在特定條件下為特定任務反復編程的需要。依托大模型的涌現能力,具身智能能夠從原始訓練數據中學習并發現新的特征和模式,在僅僅依靠網絡數據知識的情況下就可以對從未見過的對象或場景執行操作任務。
【仿真為智能體賦能的主流路徑】
主流的具身智能訓練方法主要包括遙操作、動捕、大模型等。其中,單一的遙操作或動捕需由人類操作員直接控制,無法實現機器替人。大模型和智能體深度融合,具備較強泛化型。在數據選擇上,可采用仿真數據或真實數據。
仿真通過構建虛擬環境生成大量數據,成本較低,適合在新的環境中大范圍學習技能;利用真實數據能夠形成細分場景的數據壁壘,但成本及獲取難度相對較高。
大模型具備較強泛化性,仿真數據有望大范圍應用。谷歌 RT 采用該種技術路徑。谷歌在 RT-1 和 RT-2 的框架上使用 X-Embodiment 數據集進行訓練,該數據集包含在 22 個機器人上采集的能夠完成 16 萬個任務的上百萬條數據。其中,RT-1充當小腦層級的控制器,由大模型負責頂層理解和指令分解,例如打開抽屜、將物體從抽屜里拿出來等。RT-2 采取端到端路徑,將語言、動作 tokens 進行對齊,微調后得到 VLA 模型,使得模型能夠通過視覺輸入和語言指令生成正確的動作標記序列。大模型使機器人從 Model-Based 向 Learning-Based 轉變,在解決復雜和高維度的運動控制問題上具備更高的上限。但是大模型的訓練需要海量數據,按數據來源分類,可分為真實數據和仿真數據。真實數據效果最好,但需要耗費大量人力和硬件成本。仿真數據成本低,可以大規模獲取,但通常存在 sim-to-real gap。
【數據是具身智能發展的核心】
小模型時代算法的數量和質量對于機器人至關重要;然而大模型的 Scaling Law 表明通過增加數據量、擴大模型規模以及延長訓練時間,可以實現模型性能的持續提升,數據重要性凸顯。并且不同于語言、圖像或視頻等二維模型的訓練, 具身智能底層模型的訓練,需要在物理世界絕對坐標系下的精確測量數據,數據獲取難度、成本、標注周期都遠超語言模型。
從產業發展進程看,類比自動駕駛,特斯拉大規模采集的數據推動了 FSD 性能的提升,具身智能產業發展的核心在于數據。
區別于大模型可以從網絡中獲取數據并進行訓練,具身智能如果想要具備高泛化性和可靠性,則需要在真實物理世界里獲取數據來完善模型,而獲取真實物理世界的數據的關鍵就在于商業化落地。根據 1X AI 副總裁 Eric Jang 在個人博客網站上發表的“All Roads Lead to Robotics ”一文,具身智能的商業化路徑主要包括三種:通用場景軟硬結合、 軟件路徑、以及垂直領域軟硬結合。
從具身智能訓練層面,建議關注具備柔性、流體仿真等技術的廠商,如索辰科技。從具身智能商業化路徑層面,建議關注英偉達、華為合作廠商,如九號公 司、中堅科技、高新興、潤和軟件、安聯銳視等以及細分領域龍頭廠商如海康機機器人。
我們篩選出以下潛力標的
中堅科技(002779)2024年 2 月份,公司根據經營及戰略發展的需要,公司擬與兆新股份全資孫公司香港兆新實業共同設立海外SPV 公司,并通過 SPV 公司投資海外人工智能機器人 1XHoldingAS 公司。
索辰科技(688507)公司 2024 年成立的機器人事業部:該部門的使命在于開發針對機器人行業的專業軟件和解決方案。公司的機器人設計軟件將涵蓋并聯機器人(包括人形機器人)本體的完整研發過程,從功能設計、構型綜合、性能分析到結構設計優化。
安聯銳視(301042)公司自主研發了監控行業的人工智能 AI 技術應用,如人臉識別技術、人形偵測技術、車型偵測技術。
參考資料:中銀證券-智能體專題報告之二:智能體時代來臨,具身智能有望成為最佳載體.pdf
免責聲明:本文由投資顧問: 馮利勇(執業證書編碼:A1280620060001)、羅力川(登記編號:A1280622110002)等編輯整理,僅代表團隊觀點,任何投資建議不作為您投資的依據,您須獨立作出投資決策,風險自擔。請您確認自己具有相應的權利能力、行為能力、風險識別能力及風險承受能力,能夠獨立承擔法律責任。 所涉及個股僅作投資參考和學習交流,不作為買賣依據。投資有風險,入市需謹慎!
審核編輯 黃宇
-
機器人
+關注
關注
211文章
28632瀏覽量
208002 -
人工智能
+關注
關注
1794文章
47642瀏覽量
239674 -
智能體
+關注
關注
1文章
164瀏覽量
10604
發布評論請先 登錄
相關推薦
評論