作者簡(jiǎn)介
Dr. Liu,劍橋大學(xué)博士,是復(fù)睿微電子英國(guó)研究中心AI算法專家,常駐英國(guó)劍橋研究所。長(zhǎng)期從事和深耕信號(hào)處理和深度學(xué)習(xí)領(lǐng)域,是機(jī)器人定位領(lǐng)域理論專家。在圖神經(jīng)網(wǎng)絡(luò),強(qiáng)化學(xué)習(xí),機(jī)器人路徑規(guī)劃與導(dǎo)航領(lǐng)域發(fā)表了大量論文,目前從事GRUK自動(dòng)駕駛規(guī)控決策領(lǐng)域重點(diǎn)前沿研發(fā)。
一、引言:
隨著科技的飛速發(fā)展,自動(dòng)駕駛技術(shù)逐漸走進(jìn)了人們的視野。在過(guò)去的幾年里,特斯拉、Waymo和Uber等公司在自動(dòng)駕駛領(lǐng)域的投入和研發(fā)引起了廣泛關(guān)注。盡管自動(dòng)駕駛技術(shù)有望改變交通行業(yè),帶來(lái)諸多便利,但在其廣泛應(yīng)用之前,我們還需要解決許多關(guān)鍵問(wèn)題和挑戰(zhàn)。本文將重點(diǎn)關(guān)注自動(dòng)駕駛規(guī)控決策方面的問(wèn)題和挑戰(zhàn),分析當(dāng)前所面臨的困境,并提出一些建設(shè)性的建議與解決方向。
我們首先將深入剖析目前在制定自動(dòng)駕駛規(guī)控策略過(guò)程中所面臨的問(wèn)題和挑戰(zhàn),如模型泛化、安全性可靠性、計(jì)算效率等。最后,結(jié)合國(guó)內(nèi)外的先進(jìn)經(jīng)驗(yàn)與實(shí)踐,我們將提出潛在的解決方向與趨勢(shì),以期為自動(dòng)駕駛技術(shù)的發(fā)展和普及提供有益的參考。
通過(guò)本文的闡述,我們希望能夠提高人們對(duì)自動(dòng)駕駛規(guī)控決策問(wèn)題和挑戰(zhàn)的認(rèn)識(shí),促使業(yè)界加強(qiáng)合作與溝通,共同應(yīng)對(duì)未來(lái)自動(dòng)駕駛技術(shù)帶來(lái)的挑戰(zhàn),為人類社會(huì)帶來(lái)更為安全、高效、可持續(xù)的交通出行方式。
二、規(guī)控決策的重要性:
規(guī)控決策在自動(dòng)駕駛領(lǐng)域的重要性不容忽視,因?yàn)樗苯佑绊懙阶詣?dòng)駕駛技術(shù)實(shí)際應(yīng)用的成功與否。首先,規(guī)控決策對(duì)于確保自動(dòng)駕駛車輛的安全性至關(guān)重要,通過(guò)合理的規(guī)控,可以有效地降低交通事故的發(fā)生率,確保人們的生命財(cái)產(chǎn)安全。其次,高效的規(guī)控決策有助于提升道路通行效率,緩解交通擁堵,降低能源消耗和尾氣排放,從而為實(shí)現(xiàn)可持續(xù)交通發(fā)展做出貢獻(xiàn)。
此外,規(guī)控決策還需要充分考慮法規(guī)合規(guī)性,這意味著自動(dòng)駕駛技術(shù)的發(fā)展必須在法律框架內(nèi)進(jìn)行,以確保道路安全并維護(hù)公共利益。規(guī)范的規(guī)控決策將有助于引導(dǎo)自動(dòng)駕駛技術(shù)朝著更加合規(guī)、安全的方向發(fā)展。同時(shí),公眾對(duì)自動(dòng)駕駛技術(shù)的信任度也是衡量規(guī)控決策重要性的一個(gè)關(guān)鍵因素。通過(guò)透明、合理的規(guī)控,可以加強(qiáng)公眾對(duì)自動(dòng)駕駛技術(shù)的信任,為其更廣泛的應(yīng)用奠定基礎(chǔ)。
綜上所述,規(guī)控決策在自動(dòng)駕駛領(lǐng)域具有舉足輕重的地位。它關(guān)乎自動(dòng)駕駛系統(tǒng)的安全性、效率、法規(guī)合規(guī)性以及公眾接受度,為實(shí)現(xiàn)自動(dòng)駕駛技術(shù)的成功實(shí)施與廣泛應(yīng)用提供關(guān)鍵支持。因此,深入研究規(guī)控決策問(wèn)題,尋求有效的解決方案,是推動(dòng)自動(dòng)駕駛技術(shù)健康發(fā)展的重要任務(wù)。
三、問(wèn)題與挑戰(zhàn):
在接下來(lái)的文章中,我們將深入探討當(dāng)前決策規(guī)劃在自動(dòng)駕駛領(lǐng)域所面臨的問(wèn)題與挑戰(zhàn),以及相關(guān)的潛在解決方向和趨勢(shì)。我們將重點(diǎn)關(guān)注以下幾個(gè)方面: ?
1.模型泛化
2.不確定性估計(jì),數(shù)據(jù)質(zhì)量和數(shù)量評(píng)估
3.多智能體與智能體-環(huán)境交互
4.安全與可靠性
5.計(jì)算效率
6.利用多模態(tài)融合進(jìn)行最優(yōu)決策
7.可解釋性和可說(shuō)明性
8.無(wú)需高清地圖的自動(dòng)駕駛
9.與現(xiàn)有基礎(chǔ)設(shè)施的集成
本篇文章將著重模型泛化、不確定性估計(jì)以及數(shù)據(jù)質(zhì)量和數(shù)量評(píng)估和多智能體與智能體-環(huán)境交互這三個(gè)方面
3.1 模型泛化
自動(dòng)駕駛汽車必須具備在各種環(huán)境和多樣化條件下的運(yùn)行能力。然而,這些環(huán)境和條件可能與用于開(kāi)發(fā)決策模型的訓(xùn)練數(shù)據(jù)存在差異,從而導(dǎo)致模型的泛化能力不足,即在新的和未曾遇到的情況下表現(xiàn)欠佳?[1]。自動(dòng)駕駛模型應(yīng)具備適應(yīng)不斷變化的環(huán)境條件的能力,例如不同的光線、惡劣天氣、突發(fā)障礙、異常交通模式、多方交通參與者以及不同的道路表面,從而實(shí)現(xiàn)在這些多變環(huán)境中的多智能體互動(dòng)模型的泛化能力。
為確保自動(dòng)駕駛汽車的安全性和可靠性,模型必須對(duì)環(huán)境變化表現(xiàn)出魯棒性。反之,若對(duì)這些變化過(guò)于敏感的模型可能在泛化能力上不足,從而導(dǎo)致在實(shí)際駕駛場(chǎng)景中的表現(xiàn)不盡如人意。
潛在的解決方向和趨勢(shì)
1.正則化和Dropout:正則化和dropout技術(shù)在深度學(xué)習(xí)領(lǐng)域中被廣泛應(yīng)用,它們可以幫助防止模型過(guò)擬合,從而提高模型的泛化能力?[3]。正則化方法主要通過(guò)在損失函數(shù)中添加懲罰項(xiàng),以抑制過(guò)于復(fù)雜的模型,常見(jiàn)的正則化方法有L1和L2正則化。與此同時(shí),Dropout作為另一種特殊的正則化技術(shù),其在訓(xùn)練過(guò)程中通過(guò)隨機(jī)丟棄一部分神經(jīng)元,以減少網(wǎng)絡(luò)中參數(shù)的共適應(yīng)現(xiàn)象,降低模型復(fù)雜度,并增強(qiáng)模型對(duì)噪聲和不同數(shù)據(jù)分布的適應(yīng)性。這兩種技術(shù)在實(shí)踐中可以組合使用,共同提升深度學(xué)習(xí)模型在復(fù)雜應(yīng)用場(chǎng)景中的穩(wěn)定性和可靠性。
?圖2.?載有多傳感器的車輛?[4]
2.多傳感器融合:為了確保自動(dòng)駕駛系統(tǒng)在面對(duì)各種環(huán)境變化時(shí)具有較高的魯棒性,開(kāi)發(fā)出這種能夠適應(yīng)復(fù)雜場(chǎng)景的模型至關(guān)重要。要實(shí)現(xiàn)這一目標(biāo),我們需要借助先進(jìn)的算法處理諸如光線條件、天氣以及道路表面變化等多種因素。多傳感器融合技術(shù)可以有效提高系統(tǒng)的魯棒性,這主要通過(guò)整合來(lái)自不同類型傳感器(例如攝像頭、激光雷達(dá)以及雷達(dá))的數(shù)據(jù)實(shí)現(xiàn)?[5]?[6]。這樣一來(lái),自動(dòng)駕駛系統(tǒng)將具備更全面、更精確的環(huán)境感知能力,從而提高整體的安全性和性能。
3.遷移學(xué)習(xí)/元學(xué)習(xí)/域適應(yīng)/域泛化:遷移學(xué)習(xí)、元學(xué)習(xí)、域適應(yīng)和域泛化等技術(shù)在自動(dòng)駕駛系統(tǒng)中發(fā)揮著重要作用。遷移學(xué)習(xí)是一種強(qiáng)大的機(jī)器學(xué)習(xí)方法,它通過(guò)利用預(yù)訓(xùn)練模型作為新模型訓(xùn)練的基礎(chǔ),從而提高模型的泛化能力?[7]。這種方法在自動(dòng)駕駛領(lǐng)域尤為重要,因?yàn)樗軌蛴行p少訓(xùn)練新模型所需的數(shù)據(jù)量,并在面對(duì)新的、未見(jiàn)過(guò)的數(shù)據(jù)時(shí),提高自動(dòng)駕駛系統(tǒng)的性能表現(xiàn)。元學(xué)習(xí)通過(guò)學(xué)習(xí)如何在不同任務(wù)之間迅速適應(yīng)和轉(zhuǎn)移知識(shí),進(jìn)一步提高了自動(dòng)駕駛系統(tǒng)在各種情況下的泛化性能。領(lǐng)域適應(yīng)和領(lǐng)域泛化則關(guān)注如何在不同駕駛環(huán)境(如城市道路、鄉(xiāng)村道路或者不同國(guó)家的交通規(guī)則)下實(shí)現(xiàn)有效的知識(shí)遷移,使得自動(dòng)駕駛系統(tǒng)具有更廣泛的適用性和更高的穩(wěn)定性?[8]??傊?,這些先進(jìn)的機(jī)器學(xué)習(xí)方法都在推動(dòng)自動(dòng)駕駛技術(shù)的發(fā)展,提升自動(dòng)駕駛系統(tǒng)在不同場(chǎng)景下的安全性和可靠性。
4.人機(jī)交互:人機(jī)交互是一種將人類專家反饋納入模型訓(xùn)練過(guò)程的先進(jìn)技術(shù)?[9]。這種方法在自動(dòng)駕駛系統(tǒng)中具有重要價(jià)值,因?yàn)樗梢燥@著提高模型的泛化能力,同時(shí)幫助及時(shí)發(fā)現(xiàn)那些僅僅依靠模擬或虛擬測(cè)試無(wú)法捕獲的潛在安全問(wèn)題。通過(guò)人機(jī)交互技術(shù),自動(dòng)駕駛系統(tǒng)能夠更好地理解復(fù)雜的駕駛場(chǎng)景,以及在特定情況下應(yīng)采取的最佳行動(dòng)。這有助于彌補(bǔ)傳統(tǒng)機(jī)器學(xué)習(xí)方法在面對(duì)異常或罕見(jiàn)情況時(shí)可能出現(xiàn)的不足。此外,這種方法還可以促進(jìn)自動(dòng)駕駛系統(tǒng)與人類駕駛員之間的協(xié)同作戰(zhàn),提高整體道路安全水平。總之,人機(jī)交互技術(shù)對(duì)于提升自動(dòng)駕駛系統(tǒng)的性能、安全性以及可靠性具有重要意義。
3.2 不確定性估計(jì),數(shù)據(jù)質(zhì)量和數(shù)量評(píng)估
自動(dòng)駕駛系統(tǒng)的運(yùn)行依賴于精密且復(fù)雜的決策方法,這要求對(duì)不確定性進(jìn)行準(zhǔn)確的估計(jì),并對(duì)數(shù)據(jù)的質(zhì)量和數(shù)量進(jìn)行全面的評(píng)估。這些高度先進(jìn)的系統(tǒng)利用各種傳感器,如攝像頭、激光雷達(dá)和雷達(dá),來(lái)獲取關(guān)于周圍環(huán)境的詳細(xì)信息,并基于這些數(shù)據(jù)作出行駛決策。然而,這些數(shù)據(jù)通常存在噪聲、不完整性,以及受到各種誤差來(lái)源的影響,這可能導(dǎo)致不準(zhǔn)確的決策和潛在的不安全駕駛行為。因此,在開(kāi)發(fā)和優(yōu)化自動(dòng)駕駛系統(tǒng)時(shí),關(guān)鍵是要設(shè)計(jì)出能夠有效識(shí)別和處理這些問(wèn)題的算法,確保在各種情況下都能實(shí)現(xiàn)穩(wěn)定、安全的駕駛。
子挑戰(zhàn)
1.數(shù)據(jù)收集不確定性和質(zhì)量評(píng)估?[11]:傳感器信號(hào)可能受到天氣、光線、灰塵以及其他傳感器故障的顯著影響,導(dǎo)致我們無(wú)法準(zhǔn)確知道傳感器數(shù)據(jù)的噪聲水平。此外,在訓(xùn)練自動(dòng)駕駛模型時(shí),邊緣場(chǎng)景與正常場(chǎng)景之間往往存在訓(xùn)練類別不平衡的問(wèn)題,這使得我們難以獲取足夠的邊緣場(chǎng)景案例數(shù)據(jù)來(lái)進(jìn)行有效的模型訓(xùn)練。此外,自動(dòng)駕駛系統(tǒng)還面臨著有偏訓(xùn)練數(shù)據(jù)的問(wèn)題。由于數(shù)據(jù)收集往往僅在非常有限或特定的場(chǎng)景中進(jìn)行,這可能導(dǎo)致數(shù)據(jù)分布的偏斜,從而影響模型的泛化能力。
2.正確標(biāo)注數(shù)據(jù)并正確推廣到大規(guī)模未標(biāo)注數(shù)據(jù):首先,由領(lǐng)域?qū)<疫M(jìn)行數(shù)據(jù)標(biāo)注的成本非常高,這包括勞動(dòng)和時(shí)間成本,以及標(biāo)簽標(biāo)準(zhǔn)化在某些情況下可能存在的歧義?[12]。其次,在將已標(biāo)注數(shù)據(jù)正確推廣到未標(biāo)注數(shù)據(jù)方面也存在困難。自動(dòng)駕駛系統(tǒng)需要將大量已標(biāo)注的訓(xùn)練數(shù)據(jù)輸入深度學(xué)習(xí)模型,但由于并非總能對(duì)所有訓(xùn)練樣本進(jìn)行手動(dòng)標(biāo)注,這可能導(dǎo)致模型訓(xùn)練過(guò)程中梯度反向傳播的不準(zhǔn)確,從而降低模型性能。最后,對(duì)錯(cuò)誤標(biāo)注數(shù)據(jù)的檢測(cè)和修訂也是一個(gè)棘手的問(wèn)題。訓(xùn)練樣本有時(shí)可能被錯(cuò)誤地標(biāo)注,因此需要開(kāi)發(fā)有效的工具來(lái)檢測(cè)這些錯(cuò)誤標(biāo)簽并自動(dòng)進(jìn)行糾正。
3.微調(diào)模型結(jié)構(gòu)以最小化預(yù)測(cè)誤差和模型不確定性:尋找最優(yōu)模型結(jié)構(gòu)和超參數(shù)集是一個(gè)具有挑戰(zhàn)性的任務(wù),因?yàn)樗婕暗皆邶嫶蟮膮?shù)空間中進(jìn)行搜索和優(yōu)化。其次,微調(diào)過(guò)的深度學(xué)習(xí)模型在給定輸入輸出時(shí)通常只能提供確定性的點(diǎn)估計(jì),而缺乏不確定性估計(jì),這對(duì)于評(píng)估模型預(yù)測(cè)的可靠性具有很大的局限性。最后,在模型訓(xùn)練階段解耦噪聲成分也是一個(gè)難以解決的問(wèn)題。檢測(cè)和診斷噪聲來(lái)源對(duì)于可靠地控制車輛至關(guān)重要,但實(shí)際操作中卻十分困難。
潛在的解決方向和趨勢(shì)
1.數(shù)據(jù)收集的不確定性和質(zhì)量評(píng)估:首先,針對(duì)部署中未知的傳感器數(shù)據(jù)質(zhì)量問(wèn)題,可以采用硬閾值工程解決方案來(lái)處理和過(guò)濾噪聲。其次,在解決邊緣場(chǎng)景與正常場(chǎng)景之間的訓(xùn)練類別不平衡問(wèn)題時(shí),數(shù)據(jù)增強(qiáng)技術(shù)可以幫助改善數(shù)據(jù)分布,以提高模型在不同情況下的泛化能力?[13]。針對(duì)有偏訓(xùn)練數(shù)據(jù)問(wèn)題,可以通過(guò)重新采樣和數(shù)據(jù)增強(qiáng)來(lái)調(diào)整數(shù)據(jù)分布,以便在訓(xùn)練過(guò)程中減輕偏差。通過(guò)應(yīng)用這些方法,研究人員和工程師們可以在自動(dòng)駕駛系統(tǒng)中實(shí)現(xiàn)更高的性能和穩(wěn)定性,從而提升整體的駕駛安全性。
2.正確標(biāo)注數(shù)據(jù)并正確推廣到大規(guī)模未標(biāo)注數(shù)據(jù):在自動(dòng)駕駛系統(tǒng)的數(shù)據(jù)處理過(guò)程中,降低領(lǐng)域?qū)<疫M(jìn)行數(shù)據(jù)標(biāo)注的成本顯得尤為重要。為了實(shí)現(xiàn)這一目標(biāo),可以采用自動(dòng)標(biāo)注技術(shù)來(lái)減輕專家的工作負(fù)擔(dān)?[12]。在將已標(biāo)注數(shù)據(jù)正確推廣到未標(biāo)注數(shù)據(jù)方面,弱監(jiān)督學(xué)習(xí)和半監(jiān)督學(xué)習(xí)方法有望提供有效的解決方案,從而在有限的標(biāo)注數(shù)據(jù)情況下實(shí)現(xiàn)更好的模型性能。此外,在錯(cuò)誤標(biāo)注數(shù)據(jù)的檢測(cè)和修訂方面,自動(dòng)標(biāo)注和自動(dòng)標(biāo)簽修正技術(shù)可以幫助發(fā)現(xiàn)并糾正錯(cuò)誤的標(biāo)簽,從而進(jìn)一步提高數(shù)據(jù)質(zhì)量。
3.微調(diào)模型結(jié)構(gòu)以最小化預(yù)測(cè)誤差和模型不確定性:在自動(dòng)駕駛系統(tǒng)中,尋找最優(yōu)模型結(jié)構(gòu)和超參數(shù)集是一項(xiàng)具有挑戰(zhàn)性的任務(wù)。針對(duì)這一問(wèn)題,研究人員可以通過(guò)神經(jīng)結(jié)構(gòu)搜索技術(shù)或手動(dòng)調(diào)整來(lái)進(jìn)行優(yōu)化。另一方面,微調(diào)過(guò)的深度學(xué)習(xí)模型通常只能為給定輸入輸出提供確定性的點(diǎn)估計(jì),而缺乏不確定性估計(jì)。為了解決這一問(wèn)題,可以采用貝葉斯深度學(xué)習(xí)方法,例如MCDropout?[14],從而在預(yù)測(cè)時(shí)提供不確定性估計(jì),有助于評(píng)估模型預(yù)測(cè)的可靠性。
3.3 多智能體與智能體-環(huán)境交互
在復(fù)雜的交通場(chǎng)景中,自動(dòng)駕駛汽車需要與道路上的各種智能體進(jìn)行高效且安全的互動(dòng),這些智能體包括其他自動(dòng)駕駛汽車、人類駕駛的汽車、行人和騎自行車的人。這些智能體的行為可能具有難以預(yù)測(cè)的性質(zhì),因此對(duì)自動(dòng)駕駛汽車的決策系統(tǒng)提出了巨大挑戰(zhàn)。一個(gè)智能體的行為可能會(huì)引發(fā)連鎖反應(yīng),從而影響環(huán)境中其他智能體的行為和動(dòng)態(tài)。為了應(yīng)對(duì)這種復(fù)雜性,自動(dòng)駕駛系統(tǒng)需要具備高度的適應(yīng)性和響應(yīng)能力,以便在實(shí)時(shí)變化的交通環(huán)境中進(jìn)行有效的決策。此外,自動(dòng)駕駛汽車還需能夠根據(jù)實(shí)際情況預(yù)測(cè)其他智能體的意圖和行為,從而在確保行車安全的同時(shí)提高道路通行效率。
子挑戰(zhàn)
1.準(zhǔn)確預(yù)測(cè)多個(gè)智能體的行為并做出決策?[16]:準(zhǔn)確預(yù)測(cè)多個(gè)智能體(如乘客、其他駕駛員和行人)的行為并準(zhǔn)確地做出相應(yīng)的決策至關(guān)重要。這些智能體的行為通常受到周圍其他智能體的影響,因此自動(dòng)駕駛系統(tǒng)需要具備高度的洞察能力和實(shí)時(shí)響應(yīng)性。
2.人機(jī)自主交互,以避免可能導(dǎo)致碰撞的錯(cuò)誤決策:隨著自動(dòng)駕駛汽車與人類駕駛的汽車逐漸共存,深入研究駕駛員和乘客在各種情況下如何感知和與自動(dòng)駕駛汽車互動(dòng)變得越發(fā)關(guān)鍵。事實(shí)上,研究表明,人類與自動(dòng)化系統(tǒng)的互動(dòng)在不同的駕駛場(chǎng)景下表現(xiàn)出差異性,這為進(jìn)一步了解和優(yōu)化人機(jī)自主交互提供了研究方向。
潛在的解決方向和趨勢(shì)
1.博弈論模型:博弈論模型是解決多智能體互動(dòng)挑戰(zhàn)的有效方法之一?[17]?[18]。博弈論模型能夠有效地捕捉智能體之間的相互作用,為多智能體決策提供了有力的理論支持。博弈論模型可用于建模多個(gè)智能體(如自動(dòng)駕駛汽車、人類駕駛的汽車、行人等)的行為,并在各種復(fù)雜場(chǎng)景中預(yù)測(cè)它們的行動(dòng)。通過(guò)分析智能體之間的競(jìng)爭(zhēng)與合作關(guān)系,博弈論模型有助于自動(dòng)駕駛汽車作出更加合理的決策,以實(shí)現(xiàn)安全、高效的道路交通環(huán)境。
圖5.?博弈論模型示例?[19]
2.多智能體強(qiáng)化學(xué)習(xí):多智能體強(qiáng)化學(xué)習(xí)是解決復(fù)雜交通環(huán)境中智能體交互問(wèn)題的有力方法之一?[16]。多智能體強(qiáng)化學(xué)習(xí)是一種高效的學(xué)習(xí)策略,通過(guò)這種策略,各個(gè)智能體可以在不斷嘗試和犯錯(cuò)的過(guò)程中學(xué)習(xí)彼此的交互行為,從而不斷優(yōu)化自身的決策策略。多智能體強(qiáng)化學(xué)習(xí)在自動(dòng)駕駛領(lǐng)域的應(yīng)用可以幫助車輛更好地理解和適應(yīng)不同的交通場(chǎng)景,包括與其他自動(dòng)駕駛車輛、人類駕駛車輛、行人等的交互。此外,通過(guò)領(lǐng)域自適應(yīng)與遷移學(xué)習(xí)技術(shù),多智能體強(qiáng)化學(xué)習(xí)可以有效地在不同環(huán)境和場(chǎng)景中實(shí)現(xiàn)知識(shí)和策略的遷移,進(jìn)一步提升自動(dòng)駕駛系統(tǒng)的泛化能力。
四、小結(jié)
本文主要探討了自動(dòng)駕駛領(lǐng)域的三個(gè)關(guān)鍵問(wèn)題:模型泛化、不確定性估計(jì)與數(shù)據(jù)質(zhì)量和數(shù)量評(píng)估,以及多智能體與智能體-環(huán)境交互。在模型泛化方面,我們討論了如何通過(guò)遷移學(xué)習(xí)、領(lǐng)域適應(yīng)和領(lǐng)域泛化技術(shù)來(lái)提高自動(dòng)駕駛系統(tǒng)在不同場(chǎng)景下的性能。在不確定性估計(jì)與數(shù)據(jù)質(zhì)量和數(shù)量評(píng)估方面,我們強(qiáng)調(diào)了準(zhǔn)確評(píng)估傳感器數(shù)據(jù)質(zhì)量、處理有偏訓(xùn)練數(shù)據(jù)問(wèn)題以及訓(xùn)練類別不平衡的重要性。在多智能體與智能體-環(huán)境交互方面,我們關(guān)注了自動(dòng)駕駛汽車如何通過(guò)博弈論模型和多智能體強(qiáng)化學(xué)習(xí)技術(shù)來(lái)實(shí)現(xiàn)與其他道路使用者的高效互動(dòng)。在后續(xù)的文章中,我們將會(huì)繼續(xù)深入分析其他問(wèn)題與挑戰(zhàn)。
參考引用
[1]S. Kuutti, . R. Bowden, . Y. Jin and P. Bar, “A Survey of Deep Learning Applications to Autonomous Vehicle Control,” IEEE Transactions on Intelligent Transportation Systems, vol. 22, pp. 712-733, 2021.?
[2]IANS, “Mumbai Firm Genesys Empowering Self-Driving Cars in US with High-Precision HD Mapping,” 26 06 2018. [Online]. Available: https://beebom.com/mumbai-firm-empowering-self-driving-cars-in-us-with-high-precision-hd-mapping/. [Accessed 21 04 2023].
[3]?M. J. Mirza, J. Micorek, H. Possegger and H. Bischof, “The Norm Must Go On: Dynamic Unsupervised Domain Adaptation by Normalization,” in 2022 IEEE/CVF Conference on Computer Vision and Pattern Recognition, Hybrider Event, New Orleans, 2022.
[4]A. Novikova, “DON’T DRIVE ME CRAZY: FEATURES TO ENSURE SELF-DRIVING CAR SAFETY,” 14 08 2022. [Online]. Available: https://intersog.co.il/blog/dont-drive-me-crazy-features-to-ensure-self-driving-car-safety/. [Accessed 21 04 2023].
[5]H. Shao, L. Wang, R. Chen, H. Li and Y. Liu, “InterFuser: Safety-Enhanced Autonomous Driving Using Interpretable Sensor Fusion Transformer,” in 2022 Conference on Robot Learning, Auckland, New Zealand, 2022.?
[6]K. Chitta, A. Prakash, B. Jaeger, Z. Yu, K. Renz and A. Geiger, “TransFuser: Imitation with Transformer-Based Sensor Fusion for Autonomous Driving,” IEEE Transactions on Pattern Analysis and Machine Intelligence , 2022.?
[7]H. Shu, T. Liu, X. Mu and D. Cao, “Driving Tasks Transfer Using Deep Reinforcement Learning for Decision-Making of Autonomous Vehicles in Unsignalized Intersection,” IEEE Transactions on Vehicular Technology, vol. 71, pp. 41-52, 2022.?
[8]K. Zhou, Z. Liu, Y. Qiao, T. Xiang and C. C. Loy, “Domain Generalization: A Survey,” IEEE Transactions on Pattern Analysis and Machine Intelligence, vol. 45, pp. 4396-4415, 2023.?
[9]J. Wu, Z. Huang, C. Huang, Z. Hu, P. Hang, Y. Xing and C. Lv, “Human-in-the-Loop Deep Reinforcement Learning with Application to Autonomous Driving,” arXiv preprint arXiv:2104.07246., 2021.
[10]A. BAKER-CAMPBELL, “FAIR WEATHER FRIEND: HOW DO LIDAR SYSTEMS COPE IN RAIN & FOG?,” 18 12 2020. [Online]. Available: https://www.autovision-news.com/adas/lidar-systems-rain-fog/. [Accessed 21 04 2023].
[11]R. Michelmore, M. Wicker, L. Laurenti, L. Cardelli, Y. Gal and M. Kwiatkowska, “Uncertainty Quantification with Statistical Guarantees in End-to-End Autonomous Driving Control,” in 2020 IEEE international conference on robotics and automation (ICRA), 2020.?
[12]F. Lambert, “Tesla releases new footage of auto labeling tool for its self-driving effort,” 01 12 2021. [Online]. Available: https://electrek.co/2021/12/01/tesla-releases-new-footage-auto-labeling-tool-self-driving/. [Accessed 21 04 2023].
[13]W. Tong, J. Xie, T. Li, H. Deng, X. Geng, R. Zhou, D. Yang, B. Dai, L. Lu and H. Li, “3D Data Augmentation for Driving Scenes on Camera,” arXiv preprint arXiv:2303.10340., 2023.?
[14]P. Goel and L. Chen, “On the Robustness of Monte Carlo Dropout Trained with Noisy Labels,” in the IEEE/CVF Conference on Computer Vision and Pattern Recognition, Nashville, TN, USA, 2021.
[15]“Multi-agent behavior understanding for autonomous driving,” [Online]. Available: https://archiveweb.epfl.ch/transport.epfl.ch//research-overview/vehicles-infrastructures/intelligent-vehicles/adas-vita-en/.
[16]S. Shalev-Shwartz, S. Shammah and A. Shashua., “Safe, Multi-Agent, Reinforcement Learning for Autonomous Driving,” arXiv preprint arXiv:1610.03295, 2016.?
[17]J. F. Fisac, E. Bronstein, E. Stefansson, D. Sadigh, S. S. Sastry and A. D. Dragan, “Hierarchical Game-Theoretic Planning for Autonomous Vehicles,” in 2019 International conference on robotics and automation (ICRA), Montreal, Canada, 2019.?
[18]N. Smirnov, Y. Liu, A. Validi, W. Morales-Alvarez and C. Olaverri-Monreal, “A Game Theory-Based Approach for Modeling Autonomous Vehicle Behavior in Congested, Urban Lane-Changing Scenarios,” Sensors, vol. 21(4), p. 1523, 2021.?
[19]D. Cossins, “How to win at game theory,” 09 12 2015. [Online]. Available: https://www.newscientist.com/article/mg22830510-700-how-to-win-at-game-theory/. [Accessed 21 04 2023].
編輯:黃飛
評(píng)論
查看更多