本文提出了一種基于A*算法的用于道路場景的軌跡規劃方法,該方法中,使用了圖形搜索近似,并且通過一種新的推理技術來考慮其他車輛的不確定預測,這種新的推理技術允許高效計算一組模擬場景類型的危險結果的概率。研究者相信本文提出的幾何推斷方法可以很好地適應模型傳感器范圍和遮擋限制。
什么是路徑規劃和軌跡規劃?
車輛自主駕駛系統從本質上講是一個智能控制機器,其研究內容大致可分為信息感知、行為決策及操縱控制三個子系統。
路徑規劃是智能車輛導航和控制的基礎,是從軌跡決策的角度考慮的,可分為局部路徑規劃和全局路徑規劃。全局路徑規劃的任務是根據全局地圖數據庫信息規劃出自起始點至目標點的一條無碰撞、可通過的路徑。由于全局路徑規劃所生成的路徑只能是從起始點到目標點的粗略路徑,并沒有考慮路徑的方向、寬度、曲率、道路交叉以及路障等細節信息,加之智能車輛在行駛過程中受局部環境和自身狀態的不確定性的影響,會遇到各種不可測的情況。
因此,在智能車輛的行駛過程中,必須以局部環境信息和自身狀態信息為基礎,規劃出一段無碰撞的理想局部路徑,這就是局部路徑規劃。通常路徑規劃的方法有:空間搜索法、層次法、動作行為法、勢場域法、柵格法、模糊邏輯法和神經網絡法等。
汽車自動駕駛任務可以分為三層,如圖所示,每層執行不同任務,包括上層路徑規劃,中層行駛行為規劃和下層軌跡規劃。
上層路徑規劃在已知電子地圖、路網以及宏觀交通信息等先驗信息下,根據某優化目標得到兩點之間的最優路徑,完成路徑規劃的傳感信息主要來自于GPS定位信息以及電子地圖。
中層行駛行為規劃是指根據主車感興趣區域內道路、交通車等環境信息,決策出當前時刻滿足交通法規、結構化道路約束的最優行駛行為,動態規劃的行駛行為序列組成宏觀路徑。行為規劃的傳感信息主要來自車載傳感器如雷達、照相機等,用以識別道路障礙、車道線、道路標識信息和交通信號燈信息等。
下層軌跡規劃是指在當前時刻,以完成當前行車行為為目標,考慮周圍交通環境并滿足不同約束條件,根據最優目標動態規劃決策出的最優軌跡。同時,車輛的動力學約束也會在下層得到體現,下層軌跡規劃除了必要的外部環境信息外,還需要對主車狀態信息進行測量或估計。
車輛路徑規劃問題中的幾個關鍵點:路網模型、路徑規劃算法和交通信息的智能預測,涉及的方面較多。本文主要探討軌跡規劃。
用于道路場景的軌跡規劃方法
A概述
本文提出了一種基于A*算法的用于道路場景的軌跡規劃方法,該方法中,使用了圖形搜索近似,并且通過一種新的推理技術來考慮其他車輛的不確定預測,這種新的推理技術允許高效計算一組模擬場景類型的危險結果的概率。同時研究者還將這種軌跡規劃方法與基于蒙特卡羅方法的POMDP求解器進行了比較,發現雖然POMDP求解器可以規劃比該研究的方法更保守更復雜的行為,但是它遭受粒子剝奪,這可能會導致危險的行為。這是因為蒙特卡羅方法有時不會有足夠多的樣本用于罕見但危險的未來情況。相反,我們的方法使用了對未來信念狀態的參數化描述,并且沒有遭受這個問題的困擾,并且運行時間明顯更長。
圖1:道路行駛功能系統架構
圖1顯示了用于自主道路操作的模塊的高級視圖。全局規劃模塊處理任務,為軌跡規劃模塊提供路線,這也需要定位、附近車道模型和描述附近物體狀態和行為的模型。軌跡規劃模塊應該為自主車輛(稱為ego車輛)找到合適的軌跡,以便遵循公式:
其中xe是自我車輛的狀態,Th是預測范圍的長度。這是通過優化成本函數來實現的,其中高風險的軌跡具有高成本。通過分析由 i 指數的附近其他車輛的不確定預測來估計風險。在不確定性下的這種計劃將在該方法中以固定間隔重復,而當前最佳計劃由下級控制模塊執行。
這里,我們通過借用[13]中的符號和定義簡要概述不確定條件下的軌跡規劃問題。我們假設環境狀態x =(xe,xi),i = 0,..,K在計劃范圍的離散時間步長中演變:
其中xik是車輛 i 在時刻tnow+kΔtp的狀態,uk是對于自我車輛的控制動作,ωk是擾動,并且N = Th/Δtp其中Δtp是時間離散化。我們每次都會對環境進行嘈雜的測量:
其中νk模擬測量噪聲。一般來說,我們不能直接觀察xk,而是總結信息狀態Ik中的所有可用信息。目標是為計劃范圍找到最優策略Π* = {π*0(I0),...,π*N-1(IN-1)},給出我們的控制動作,在給定信息狀態的情況下最小化未來預期成本,對于附加成本函數:
為了找到最優政策,我們計劃在信念空間中,并對未來的測量做出不同的假設,以獲得易處理的問題。在信念狀態bk被定義為bk= p(xk| Ik)并且Ik是歷史I狀態的情況下:Ik=(I0,u0:k-1,y0:k-1)。這個問題可以重新表述為隨機動態規劃(SDP)問題。
我們可以使用部分可觀察的決策過程(POMDP)方法來逼近SDP問題的解決方案,或者我們可以以后退的方式解決一系列控制動作,忽略未來的測量。我們在本文中使用的后一種方法稱為開環后退水平控制(OLRHC),這里信念狀態是“對象的開環預測分布”[13],反饋是通過重新規劃實現的。
如[5] [14]中所述,我們的軌跡規劃算法描述了自主車輛的狀態,在道路對齊的坐標系中,橫坐標對應于沿參考路徑的弧長s,縱坐標表示有符號的橫向距離。路徑d。我們假設我們可以精確地測量與參考路徑(se0,de0)相關的當前狀態,并且可以獲得其他車輛的開環預測列表。設xik是慣性參考系中車輛 i 的姿態和速度,xik=(x,y,θ,v),xik是與參考路徑 r 相關的狀態,xik,r=(sik,r, dik,r, sik,r)和g(xik,r)= xik是在它們之間進行映射的函數。 對每個其他車輛的預測表示為高斯混合序列,其中每個高斯模型表示車輛狀態相對于特定路線的分布:
其中αj是高斯prj(xik,r(j))=N(μir(j),k,Σir(j),k)的混合分量權重,描述了假設 j 的路徑 r(j)的車輛 i 的狀態分布。該表示允許我們表達單個車輛的多個運動假設,例如,我們模擬車輛是否將使用不同的αj值轉向兩個假設的不確定性,每個假設屬于不同的路線。分布N(μir(j),k,Σir(j),k)可以用不同的方法估計,例如[15],或者諸如執行卡爾曼濾波器的預測步驟的簡單方法。我們還假設我們知道每條車輛沿其路線的縱向范圍。
軌跡規劃算法可以訪問道路模型,在該道路模型中,軌道規劃算法可以快速確定兩條路線是否相鄰,例如,檢查車輛是否在我們的左側或右側,如果一輛車與另一輛車合并或者路線是否交叉。本文描述風險評估方法主要基于兩條車輛在路線上占據相同縱向位置的距離和車輛的相對速度。
B圖形搜索近似
決定什么時候改變車道,或者當駕駛到兩個車道合并的道路的一部分時是一個非凸的問題,特別是我們經??梢赃x擇在另一輛車前面或后面,每個車輛都有一個局部最佳值選擇。 通過允許為我們的解決方案用一組采樣狀態值,我們將軌跡優化轉換為圖搜索問題:從有限集中找出狀態值的序列,其具有最低成本,滿足我們的約束并達到狀態預測范圍的結束。我們通過對和時間進行采樣來構造一個格子超過允許狀態,并定義模擬我們的控制動作的運動原語u從時間k的狀態(s,d,v)轉換到時間k的另一個狀態 k+1,k后的Δtp秒,從而形成可能的狀態序列的圖形表示。我們使用了一個簡化的模型來說明車輛在道路對齊坐標系中的移動方式:
其中運動原語由不同的預定義加速度和橫向速度組成。速度v被限制為在上面被vmax限制為非負,并且d被縮放到1和1之間,其中1是參考路徑右邊的一個車道寬度和左邊一個車道寬度。允許速度的集合是從v = 0開始可達到的任何速度,其是非負的并且在規劃步驟的整個時間期間使用A中的任何加速度小于vmax,假設步驟之間的加速度瞬時變化。允許縱向位置的集合是時間步長k = 0,...,N 從 s = 0 開始以初始速度進入并且使用A中的加速度行進的距離的集合。在我們的簡化模型中,我們允許加速度的瞬時變化這個誤差假設最多是dmin的縱向位置誤差,它是從執行模塊轉換為非完整運動的距離中減去的。
對于我們在A *算法中的啟發式,我們使用進入結束狀態(k = N)的最優成本,假設如果dk不在車道的中心并且在時間步長k,k + 1之間將發生橫向移動,并且沒有其他車輛。 這些成本是針對每個s,v,k組合離線計算的并存儲在查找表中。 這低估了達到目標狀態的成本,因為cl和cd總是大于或等于零,啟發式是可以接受的。
總結
自動駕駛車輛的軌跡規劃應試圖在傳感器數據噪聲和不確定預測的情況下最小化預期風險。本文提出了一種基于圖搜索近似的道路場景軌跡規劃方法。其他車輛的不確定預測是由一種新的推理技術來解釋的,這種推理技術可以有效地計算建模情況類型集的危險結果的概率。對于高速公路合并場景,這里使用簡單的恒速預測,研究者并不考慮傳感器范圍和遮擋。未來的工作將考慮更復雜的預測模型,研究者相信本文提出的幾何推斷方法可以很好地適應模型傳感器范圍和遮擋限制。例如,為了對超出傳感器范圍的可能車輛所構成的風險進行建模,研究者可以在給定未知車輛速度和位置的統一概率的情況下,整合約束違反概率。
-
傳感器
+關注
關注
2552文章
51366瀏覽量
755730 -
智能車輛
+關注
關注
0文章
18瀏覽量
19269 -
自動駕駛
+關注
關注
784文章
13922瀏覽量
166798
原文標題:道路場景中的風險最小化軌跡規劃
文章出處:【微信號:IV_Technology,微信公眾號:智車科技】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論