色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

一種避免碰撞的算法—GA3C-CADRL分析

ml8z_IV_Technol ? 來源:未知 ? 作者:李倩 ? 2018-05-11 10:38 ? 次閱讀

一般來說,在行人間行進的智能體在進行導航時,需要能夠對當前的環境做出相應的觀察,以避免碰撞,進行下一步動作。在本文中,麻省理工學院航空航天控制實驗室的Michael Everett和 Jonathan P. How教授,以及Oculus Research的Yu Fan Chen教授,提出一種新型避免碰撞的算法—GA3C-CADRL,通過深度強化學習進行模擬訓練,而不需要智能體對其他智能體的動態行為有所了解,并通過在網絡的輸入端使用LSTM,使得算法能夠依據對相鄰智能體的觀察結果來做出決策,進而選擇下一個動作。

一般來說,在行人之間進行導航的機器人是使用避免碰撞算法(collision avoidance algorithms)來實現安全且高效的操作的。在最近的一些研究中,提出了將深度強化學習算法作為對復雜的交互和協作進行建模的框架。然而,當環境中智能體的數量增加時,該操作的實現是通過對其他智能體偏離現實的行為的關鍵性假設來實現的。這項研究對我們以往的研究方法進行了擴展,開發出一種算法,該算法可以在各種類型的動態智能體中學習避免碰撞,而不必假設它們遵循任何特定的行為規則。此外,這項研究還引入了一種使用長短期記憶網絡(LSTM)的策略,該策略使得算法能夠使用任意數量的其他智能體的觀測值,而不是像以往那些需要具有固定觀測值大小的方法。當智能體的數量增加時,我們所提出的算法在模擬中的性能表現要優于我們以往的方法,并且該算法是在一個沒有使用3D激光雷達的、以人類行走速度行駛的全自動機器車輛上運行得以證明的。

可以這樣說,在行人之間進行導航的機器人將能夠觀察到許多人類行為,例如合作或遺忘。行人不僅能夠移動障礙物,而且還可以不斷地做出機器人只能部分觀察的決策。這項研究解決了在存在其他決策智能體的世界中運行的智能體所面對的避免碰撞問題,特別是考慮到機器人—行人領域。分散式避免碰撞算法的一個基本問題是:智能體所知道和假定的其他智能體的信念狀態、策略和意圖是什么?如果沒有智能體之間的溝通,這些屬性不是可以直接進行衡量的,但它們可以通過推理得到。

圖1:機器人在行人之間進行導航。機器人使用機載傳感器來感知環境并運行避免碰撞算法以保持安全和有效的操作。

智能體對其他智能體行為的假設將會影響其決定采取何種行動。在最簡單的情況下,智能體假設其他智能體是靜態的,并且足夠快地進行重新規劃以避免碰撞。另一種方法是,假定其他智能體是動態障礙,但速度保持不變。此外,智能體可以假定其智能體是決策制定者,其中,它們的速度可能會隨時根據已知或未知的策略(決策規則)進行改變。即使機器人知道行人的決策規則,但因為其他智能體的意圖是未知的(例如目標目的地),所以也不可能完全預測其他非溝通的決策智能體(例如行人)將如何響應智能體所作出的決策。因此,與其試圖明確預測其他智能體的行為,最近的研究方法已經使用強化學習(RL)來對智能體之間復雜的相互作用和協作進行建模。

圖2:LSTM展開以顯示每個輸入。在每個決策步驟中,智能體將一個可觀察的狀態向量,即每個附近的智能體,依次送入LSTM單元。LSTM單元將相關信息存儲在隱藏狀態中,hi。 最終隱藏狀態hn,將其他智能體的整個狀態編碼成固定長度的向量,然后饋送到網絡的前饋部分。智能體的順序是通過減少到自我智能體的距離來進行排序的,以便最近的智能體對hn有近因效應(recent effect)。

雖然基于學習的方法已被證明在這個領域內具有良好的性能表現,但現有方法對其他智能體,如同質性或短時間尺度上的特定運動模型做了細微的假設。在這項研究中,我們對以往的研究方法進行了擴展以學習避免碰撞策略,而不假設其他智能體遵循任何特定的行為模型。

圖3:網絡架構。附近智能體的的可觀察狀態被按順序饋送到LSTM中。

避免碰撞的另一項關鍵挑戰是環境中其他智能體的數量有所不同,而在這一領域中使用的前饋神經網絡需要固定維度的輸入?,F有的策略明確了網絡可觀察到的智能體的最大數量,或使用原始傳感器數據作為輸入。本次研究采用自然語言處理的思想,通過在網絡輸入端使用長短期記憶網路(LSTM)單元,將現實世界中不同的大小狀態(例如:其他智能體的位置)編碼成固定長度的向量。這使得該算法可以根據機器人周圍任意數量的智能體,來做出相應的決策。

本次研究的主要貢獻在于:

?我們對避免碰撞的算法做了擴展,使其不必假定其他智能體的行為。

?我們提出了一種策略,使得算法能夠利用任意數量智能體的觀察結果。

?我們通過模擬結果證明了新框架的優點。

?在不使用3D激光雷達的情況下,通過在行人間運行的機器人進行了算法演示。

目前,該軟件已經作為開源ROS軟件包cadrl_ros發布。

圖4:機器人硬件。這款緊湊、低成本(<1000美元)的感測套件使用單個2D激光雷達和3個Intel RealSense R200攝像頭??倐鞲衅骱陀嬎憬M件的高度小于3英寸,為貨物留出足夠的空間。

本次研究提出了一種避免碰撞的算法—GA3C-CADRL,該算法僅通過深度強化學習進行模擬訓練,而不需要對其他智能體的動態有所了解。此外,我們還提出了一種策略,通過在網絡的輸入端使用LSTM,使得算法能夠依據對任意數量的相鄰智能體的觀察結果來做出決策進而選擇下一個動作。隨著環境中智能體數量的增加,新方法的性能將優于現有方法。研究結果表明,該算法能夠在不被明確執行(explicity enforced)的情況下學習問題結構,并支持使用LSTM將大量智能體在現實世界中的狀態編碼為固定長度的表征。新算法在一個小型真實機器人上成功運行,該機器人在不使用3D激光雷達的情況下,可以在保持人類行走速度的同時,在行人之間進行導航。今后的研究將利用本文全新的、更為通用的公式,借助智能體的行為選擇,更為明確地研究信號意圖所帶來的影響。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 機器人
    +關注

    關注

    211

    文章

    28632

    瀏覽量

    208272
  • 算法
    +關注

    關注

    23

    文章

    4629

    瀏覽量

    93292
  • 導航
    +關注

    關注

    7

    文章

    533

    瀏覽量

    42537
  • 激光雷達
    +關注

    關注

    968

    文章

    4024

    瀏覽量

    190361

原文標題:MIT提出使用「深度強化學習」幫助智能體在運動中做出「動作決策」

文章出處:【微信號:IV_Technology,微信公眾號:智車科技】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    一種基于MASt3R的實時稠密SLAM系統

    精心設計的集成式硬件與軟件堆棧,實現穩健且精準的視覺SLAM已成為可能。然而,SLAM尚未能成為一種即插即用的算法,因其需要硬件方面的專業知識以及校準操作。即便對于僅配備單個攝像頭且無諸如IMU等額外傳感器的最簡設置而言,也不存在一種
    的頭像 發表于 12-27 15:25 ?414次閱讀

    一種混合顏料光譜分區間識別方法

    古代彩繪顏料的分析是科技考古與文物保護研究的重要內容,高光譜是近年來發展迅速的新興技術,在物質識別上具有廣泛應用,提出一種基于高光譜分區間的混合顏料識別方法。 一種混合顏料光譜分區間識別方法 古代
    的頭像 發表于 12-02 16:22 ?136次閱讀
    <b class='flag-5'>一種</b>混合顏料光譜分區間識別方法

    ?ISP算法及架構分析介紹

    、ISP算法及架構分析介紹 ISP即Image Signal Processor,是一種圖像處理架構,不是我們用的下載器。 ISP其實算是圖像處理的
    的頭像 發表于 11-26 10:05 ?615次閱讀
    ?ISP<b class='flag-5'>算法</b>及架構<b class='flag-5'>分析</b>介紹

    一種基于深度學習的二維拉曼光譜算法

    近日,天津大學精密儀器與光電子工程學院的光子芯片實驗室提出了一種基于深度學習的二維拉曼光譜算法,成果以“Rapid and accurate bacteria identification
    的頭像 發表于 11-07 09:08 ?291次閱讀
    <b class='flag-5'>一種</b>基于深度學習的二維拉曼光譜<b class='flag-5'>算法</b>

    一種利用CSD16327Q3實現企業固態硬盤鉭電容短路保護的方法

    電子發燒友網站提供《一種利用CSD16327Q3實現企業固態硬盤鉭電容短路保護的方法.pdf》資料免費下載
    發表于 10-25 10:22 ?0次下載
    <b class='flag-5'>一種</b>利用CSD16327Q<b class='flag-5'>3</b>實現企業固態硬盤鉭電容短路保護的方法

    一種完全分布式的點線協同視覺慣性導航系統

    在本文中,我們提出了一種完全分布式的點線協同視覺慣性導航系統。我們通過蒙特卡羅模擬和真實環境數據集,在稠密特征或稀疏特征環境下將所提出的算法與其他四算法進行了比較。所有結果表明,我們
    的頭像 發表于 09-30 14:45 ?497次閱讀
    <b class='flag-5'>一種</b>完全分布式的點線協同視覺慣性導航系統

    人員軌跡分析算法有哪些?

    時段等。這些信息可以對城市規劃、交通管理、公共安全等方面具有重要的指導意義。而為了實現人員軌跡分析,我們需要使用些專門的算法和技術。 下面是幾種常用的人員軌跡分析
    的頭像 發表于 09-26 10:42 ?503次閱讀

    安寶特產品 安寶特3D Analyzer:智能的3D CAD高級分析工具

    安寶特3D Analyzer包含多種實用的3D CAD高級分析工具,包括自動比對模型、碰撞檢測、間隙檢查、壁厚檢查,以及拔模和底切分析,能夠
    的頭像 發表于 08-07 10:13 ?426次閱讀
    安寶特產品  安寶特<b class='flag-5'>3</b>D Analyzer:智能的<b class='flag-5'>3</b>D CAD高級<b class='flag-5'>分析</b>工具

    GA-Z77-DS3H主板電路圖

    技嘉GA-Z77-DS3H主板電路圖583304 GA-Z77-DS3H-R10.pdf
    發表于 07-29 13:18 ?16次下載

    GA-Z77X-UD3H主板電路圖

    電子發燒友網站提供《GA-Z77X-UD3H主板電路圖.pdf》資料免費下載
    發表于 07-29 13:17 ?7次下載

    rup是一種什么模型

    RUP(Rational Unified Process,統建模語言)是一種軟件開發過程模型,它是一種迭代和增量的軟件開發方法。RUP是由Rational Software公司(現為IBM的
    的頭像 發表于 07-09 10:13 ?1385次閱讀

    一種手掌大小的氣體傳感器和分析儀,可實時檢測多種有毒氣體

    據麥姆斯咨詢報道,歐洲的個研究項目正在開發一種手掌大小的氣體傳感器和分析儀,能夠安裝在燈柱上實時檢測多種有毒氣體。
    的頭像 發表于 05-07 09:06 ?725次閱讀
    <b class='flag-5'>一種</b>手掌大小的氣體傳感器和<b class='flag-5'>分析</b>儀,可實時檢測多種有毒氣體

    別克ELECTRA E5榮獲中保研C-IASI安全碰撞測試全優評級

    別克ELECTRA E5榮獲中保研C-IASI安全碰撞測試全優評級
    的頭像 發表于 03-19 17:08 ?681次閱讀
    別克ELECTRA E5榮獲中保研<b class='flag-5'>C</b>-IASI安全<b class='flag-5'>碰撞</b>測試全優評級

    請問ST25RU3993-HPEV的自適應防碰撞算法是在板子上面實現的嗎?

    請問ST25RU3993-HPEV的自適應防碰撞算法是在板子上面實現的?還是在STSW-ST25RU001上位機上面實現的?這個算法可否提供?STSW-ST25
    發表于 03-19 06:50

    AEB是一種汽車主動安全技術,主要由哪3大模塊構成?

    AEB是一種汽車主動安全技術,主要由哪3大模塊構成
    發表于 02-20 06:06
    主站蜘蛛池模板: 国产最新精品亚洲2021不卡 | 超碰最新网站 | 丰满的女朋友韩国版在线观看 | 天天影视网网色色欲 | 久久无码av三级 | 最近中文字幕在线中文高清版 | 毛片在线播放网址 | 国产日韩欧美高清免费视频 | 伊人精品影院一本到综合 | 亚州AV中文无码乱人伦在线 | 亚洲蜜桃AV色情精品成人 | 秋霞久久久久久一区二区 | 簧片高清在线观看 | 精品亚洲麻豆1区2区3区 | 暖暖视频免费观看高清完整版 | 999在线观看精品免费 | 亚洲精品无码国产爽快A片百度 | 动漫美女脱小内内露尿口 | 97午夜理论片影院在线播放 | 亚洲熟女乱色一区二区三区 | 欧美日韩国产在线一区二区 | 双腿打开揉弄高潮H苏安安秦慕深 | 一个人免费完整在线观看影院 | 第一福利在线永久视频 | 精品国产乱码久久久久久下载 | 日产精品久久久久久久蜜殿 | av老司机色爱区综合 | 旧里番6080在线观看 | 亚洲精品无码国产爽快A片百度 | 国产麻豆精品传媒AV国产在线 | 伊人青青久 | 邪恶肉肉全彩色无遮盖 | 久久精品亚洲AV中文2区金莲 | 同居了嫂子在线观看 | 日本50人群体交乱 | 无码日韩人妻精品久久蜜桃入口 | 色多多污网站在线观看 | 校花在公车上被内射好舒服 | 久久全国免费久久青青小草 | 欧美激情视频在线观看一区二区三区 | 经典WC女厕所里TV |