電子發燒友網報道(文/李彎彎)作為人工智能發展的一個重要分支,具身智能常被人提及。簡單來說,人工智能系統主要關注于數據處理和算法的優化,好比是人的大腦,而具身智能則更加注重機器與環境的互動和交流,是大腦和身體的結合。
那么具身智能終端有哪些?在日前芯原AI專題技術研討會上,神頂科技(南京)有限公司董事長兼CEO袁帝文展示了一些例子,如工業機器人、人形機器人、自動駕駛、低空飛行、MR/AR、AGV/AMR等。而且,袁帝文認為,具身智能終端的發展需要大模型和3D空間計算。
國內外科技企業致力于將大模型接入機器人
自從2022年底大模型技術進入大眾視野以來,國內外科技企業都在積極推進大模型的技術和應用,而將大模型接入機器人也是各大科技企業、機器人公司重點研究的方向。
早在2023年7月,AI科學家李飛飛帶領的團隊發布了具身智能最新成果,即大模型接入機器人,把復雜指令轉化成具體行動規劃,人類可以很隨意地用自然語言給機器人下達指令,機器人也無需額外數據和訓練。
李飛飛團隊將該系統命名為VoxPoser,相比傳統方法需要進行額外的預訓練,這個方法用大模型指導機器人如何與環境進行交互,直接解決了機器人訓練數據稀缺的問題。
可以看到,隨著大模型技術的發展,過去一年多時間來,從 OpenAI 到 Google DeepMind,幾乎所有掌握人工智能技術的大型科技公司,都在致力于將支持聊天機器人的多功能學習算法接入機器人中。這樣做的目的是讓機器人具備常識性知識,從而能夠處理各種任務。
如有消息稱,隨著對人工智能機器人投資的升溫,OpenAI將重啟其機器人業務,目前正在積極招募研究工程師,以重建曾經解散的機器人團隊。
特斯拉的人形機器人也是備受關注,6月14日凌晨,特斯拉在美國得克薩斯州總部舉行2024年股東大會,馬斯克在大會上表示,特斯拉將于2025年開始“限量生產”人形機器人Optimus,并于明年在自有工廠測試類人機器人。他預測,明年特斯拉將擁有“超過1000個,甚至數千個在運行的Optimus機器人”。
近期,國產機器人領域也動作頻頻,全球首例純電驅全尺寸人形機器人“天工”首次在北京人形機器人創新中心實現“擬人奔跑”、宇樹科技發布瞄準老年人陪護市場的新型人形機器人Unitree G1、工業版人形機器人Walker S進入蔚來總裝車間“實訓”當起“見習廠工”等。
科大訊飛近日也表示,公司已于2023年全球“1024開發者節”上正式發布了“大模型+具身智能”的人形機器人技術原型。2024年5月31日,公司啟動訊飛機器人超腦平臺2.0項目,將以視聽融合的多模感知交互和基于大模型的機器人大腦,通過軟硬件一體的方式構建機器人新交互,將訊飛星火大模型進一步賦能機器人領域。
過去大半年時間,手機和PC大模型迅猛發展,手機和PC通過大語言模型可以提供非常多服務,如智能辦公助手、個性化推薦系統、圖象與視頻處理、健康監測與管理、教育與學習、創意寫作與內容創作。袁帝文在日前的大會上談到,大模型在手機和PC上的發展,其實也有助于機器人大模型的發展。因為機器人本身就是一個終端,它所需要的功能包含了手機和PC的基本功能。
不過,袁帝文認為,機器人大模型的挑戰要高于手機和PC。首先是,機器人需要多模態數據處理,使機器人綜合利用多種感知信息,全面理解環境和任務需求;其次是自主導航和定位需求,機器人需要自主移動,進行路程規劃和障礙物避讓;第三是物理空間交互,機器人不僅處理信息,還要能與物理環境交互,執行搬運、組裝、清潔等物理任務;第四,實時性要求,機器人執行任務時需要低延遲的控制系統,確保動作的準確性和及時性,特別是在高速移動或精細操作時。
大模型機器人對芯片有更高要求
據袁帝文介紹,機器人部署AI大模型面臨3D空間計算、多傳感器融合、高實時性的要求。
3D空間計算,即機器人在真實的物理空間中自主導航,進行各種操作,需要精確和高幀率的空間計算能力;多傳感器融合,即需要對不同傳感器產生的數據,進行空間及時間上的同步和融合;高實時性,即高精度、高實時性的3D空間計算能力軟硬件協同優化。
這使得機器人對計算資源、內存和帶寬、功耗要求較高。計算資源方面:機器人大模型通常包含數十億以上的參數,需要具備強大算力來實時處理這些模型的推理和計算;內存和帶寬方面:由于模型參數量大,需要大量的內存來存儲和訪問模型參數和中間計算結果;功耗方面:對于移動機器人來說,電池壽面是一個關鍵問題,芯片需要平衡計算和功耗,保證電池供電。
機器人大模型端側芯片的關鍵技術之一是高實時性NPU。一是需要有更高算力· 多核并行,以提升多模型運行的并發性能,提升運算的吞吐量;二是高效Transforme運算,提升Transformer的運算效率和利用率,提升大模型的實時性能;三是低比特量化,降低內存需求、降低存儲需求、降低帶寬需求、提升運行的實時性;四是權重壓縮,提升帶寬利用率、降低系統帶寬需求、降低數據搬運的延時、提升模型運行的實時性。
機器人大模型端側芯片關鍵技術二是3D空間計算處理能力。其一,空間計算專用處理單元——深度計算引擎,同等計算算力資源遠超嵌入式CPU;最先進的3D感知處理器,提供工業級別三維點云信息;類人化融合數據信息、賦予同步多維度感知能力。
其二,空間計算專用處理單元——感知融合引擎,對于三維世界的感知,可以通過多個3D傳感器,融合出質量更高、細節更豐富的三維世界信息;獨特的時間融合單元,使得多個傳感器之間的感知時刻偏差小于0.1ms,使得精細多傳感器感知和控制精度大幅提高。沒有一個傳感器在任何場景下都適用,所以多傳感器融合非常重要。
寫在最后
最近,人們都在談“物理智能”“物理AI”,Meta人工智能研究員之前說過,“真正智能的最后一步必須是物理智能(physical intelligence)。”而機器人與之前的手機、PC有所不同,它會進一步推進人工智能的發展,讓人工智能從數字世界走向物理世界。
-
機器人
+關注
關注
211文章
28476瀏覽量
207416 -
大模型
+關注
關注
2文章
2477瀏覽量
2835
發布評論請先 登錄
相關推薦
評論