自動(dòng)駕駛感知的實(shí)現(xiàn)需要軟硬件結(jié)合,本文從傳感器和算法的角度帶大家來(lái)了解一下自動(dòng)駕駛的感知。首先看一下自動(dòng)駕駛目前的行業(yè)現(xiàn)狀。
行業(yè)現(xiàn)狀
自動(dòng)駕駛是目前發(fā)展最為迅猛的產(chǎn)業(yè)之一,十年之前,消費(fèi)者就接觸過“定速巡航(ACC)”這個(gè)功能,而現(xiàn)在ACC功能幾乎成為量產(chǎn)車型的標(biāo)配。目前量產(chǎn)乘用車市場(chǎng)正在專注于L2.5或L3功能的實(shí)現(xiàn),如車道居中輔助(LKA)、主動(dòng)緊急制動(dòng)(AEB)、交通擁堵輔助(TJA);而創(chuàng)業(yè)公司和研究機(jī)構(gòu)則專注于L4或L5等級(jí)的技術(shù)研發(fā),并且也取得了非常大的進(jìn)展,如全自動(dòng)代客泊車、點(diǎn)到點(diǎn)的無(wú)人駕駛出租車、倉(cāng)庫(kù)到倉(cāng)庫(kù)的無(wú)人駕駛貨車等。
(該圖片來(lái)源于創(chuàng)業(yè)邦)
自動(dòng)駕駛迅猛發(fā)展的背后到底有哪些力量在推動(dòng)呢?
兩個(gè)方面:一是消費(fèi)者的訴求;二是科技的發(fā)展。
首先看消費(fèi)者的訴求
汽車已經(jīng)越來(lái)越融入到老百姓的生活中,行車安全是消費(fèi)者最為關(guān)心的問題之一,目前老年人占據(jù)了用戶人群的一大部分,已經(jīng)變的越來(lái)越不能忽視,有調(diào)查報(bào)告指出有93%的交通事故都是由人為操作失誤引起,由此可見,消費(fèi)者尤其是操作不夠靈活的老年人群體對(duì)行車安全的訴求越來(lái)越強(qiáng)。另外車輛是一個(gè)安全舒適的生活延伸,不再是讓人疲憊不堪的駕駛環(huán)境,車輛的智能化可以使消費(fèi)者從駕車中解放出來(lái)。
再來(lái)看科技的發(fā)展,科技的發(fā)展包括硬件和軟件的發(fā)展
首先硬件性能得到了全面提升。一方面,芯片算力能耗比巨幅提升。前幾年,芯片算例不足或是能耗太高,導(dǎo)致用在車上時(shí)實(shí)時(shí)性很難保證,因此這成為了智能汽車發(fā)展的重要瓶頸,最近芯片行業(yè)已經(jīng)得到了大力的發(fā)展,以Mobieye為例,從2010年發(fā)布eq1平臺(tái)到今年發(fā)布eq4平臺(tái),提出eq5平臺(tái)。8年時(shí)間,他們芯片每瓦的算力提升了80多倍,給無(wú)人駕駛技術(shù)的發(fā)展提供了無(wú)限的可能。另外,傳統(tǒng)傳感器得到優(yōu)化,新型傳感器不斷研發(fā)。傳統(tǒng)傳感器如攝像頭、毫米波雷達(dá)、超聲波雷達(dá),或新型的傳感器如激光雷達(dá)等。在性能提高的同時(shí),它們的制作成本也控制的越來(lái)越好。
芯片和傳感器性能的提升為自動(dòng)駕駛的快速發(fā)展做好了充分的準(zhǔn)備。
其次軟件算法不斷推陳出新。提到軟件,不得不提深度學(xué)習(xí),深度學(xué)習(xí)相比于傳統(tǒng)的機(jī)器學(xué)習(xí),很好的實(shí)現(xiàn)了端到端感知。有業(yè)內(nèi)人士形象的形容深度學(xué)習(xí)的感知:只需要給自動(dòng)駕駛系統(tǒng)一張封面的圖像,它就能反饋出方向盤這時(shí)候有個(gè)轉(zhuǎn)角。當(dāng)然這個(gè)形容有待討論,但是不得不說(shuō)深度學(xué)習(xí)的出現(xiàn)對(duì)自動(dòng)駕駛系統(tǒng)所要求的自動(dòng)化、一體化的完整性都帶來(lái)了很大的幫助。
感知是自動(dòng)駕駛的第一環(huán),是車輛和環(huán)境交互的紐帶。一個(gè)自動(dòng)駕駛系統(tǒng)的整體上表現(xiàn)好壞,很大程度上都取決于感知系統(tǒng)的做的好壞。
講到感知,首先不得不講到傳感器。傳感器是自動(dòng)駕駛感知環(huán)節(jié)中最主要的工具,我們必需對(duì)傳感器能夠提供的數(shù)據(jù)類型、適用的工況以及局限性都非常了解和熟悉,才能讓算法工程師更好的適配傳感器所采集和提供的數(shù)據(jù)寫出更好的算法,自動(dòng)駕駛的傳感器主要分為以下四種。
常用傳感器簡(jiǎn)介
高清攝像頭
攝像頭一般提供的RGB數(shù)據(jù),沒有深度信息,雖然可以利用雙目攝像頭做一些深度信息,或者用算法基于單目攝像頭做一個(gè)深度信息的融合,但是在實(shí)際使用過程中誤差是很大的,而且單目攝像頭在每次使用前都需要做一次標(biāo)定,非常麻煩,因此業(yè)界一般只使用攝像頭的RGB的信息。
攝像頭有兩個(gè)比較重要的參數(shù)信息,一個(gè)是解析度,解析度越高,能提供的細(xì)節(jié)信息越多;另一個(gè)是FOA,F(xiàn)OA直接決定了自動(dòng)駕駛的攝像頭感知視野的寬窄。
攝像頭工作的時(shí)候,對(duì)光照的條件要求比較高,需要一個(gè)好的穩(wěn)定的光照條件,那什么是不好的光照條件呢?舉個(gè)例子,當(dāng)載有攝像頭的車輛進(jìn)入隧道的時(shí)候,曝光不足,出隧道的時(shí)候會(huì)發(fā)生曝光過度,如此一來(lái),呈現(xiàn)畫面上就沒有太多的細(xì)節(jié)信息,這就對(duì)于感知算法來(lái)說(shuō)會(huì)造成很大的困擾。
目前基于攝像頭的感知已經(jīng)發(fā)展的比較成熟,比如特斯拉的Autopilot,它的車道線識(shí)別是完全基于攝像頭來(lái)做的,并且在很多的工況下都會(huì)有很好的表現(xiàn)。
毫米波雷達(dá)
毫米波雷達(dá)是一個(gè)基于多普勒效應(yīng)的傳感器,它可以檢測(cè)物體的距離、距離變化率和放向信息,毫米波雷達(dá)原始數(shù)據(jù)采用的是極坐標(biāo),因此它的速度是鏡像的速度,優(yōu)勢(shì)是對(duì)雨、霧、灰塵等的穿頭性特別強(qiáng),而且因?yàn)?a href="http://m.1cnz.cn/v/tag/773/" target="_blank">工作原理不會(huì)受到光照條件的影響。因此毫米波雷達(dá)是一個(gè)可全天時(shí)工作的傳感器。
毫米波雷達(dá)的主要參數(shù)是頻率,頻率越高,探測(cè)距離就會(huì)越遠(yuǎn),主要頻率是24GHZ和77GHZ,目前也有公司在研發(fā)79GHZ頻率的毫米波雷達(dá);頻率越高的另一個(gè)好處是帶寬就會(huì)越大,分辨率就會(huì)越好,分辨率定義為,比如說(shuō)我這邊有兩個(gè)物體,這兩個(gè)物體隔開多遠(yuǎn)毫米波雷達(dá)就會(huì)認(rèn)為它們是兩個(gè)物體。比如像24GHZ的分辨率為60厘米左右,77GHZ的分辨率可以到20厘米左右。像77GHZ的遠(yuǎn)距離探測(cè)的毫米波雷達(dá)一般放在車前保險(xiǎn)杠附近,作用是對(duì)前方障礙物的檢測(cè);24GHZ的毫米波雷達(dá)一般會(huì)放在汽車的左右側(cè)或后側(cè),主要做盲區(qū)的檢測(cè)。
毫米波雷達(dá)簡(jiǎn)要總結(jié):
數(shù)據(jù)類型
距離、徑向速度、方位
采用極坐標(biāo)
主要參數(shù)
頻率高——探測(cè)距離遠(yuǎn)
頻率高——帶寬大,分辨率好
適用工況
穿透霧、煙、灰塵能力強(qiáng)
具有全天候、全天時(shí)特點(diǎn)
主要應(yīng)用
盲區(qū)監(jiān)測(cè)——變到輔助
前車車距監(jiān)測(cè)——ACC、AEB
超聲波雷達(dá)
超聲波雷達(dá)的測(cè)量原理其實(shí)非常簡(jiǎn)單,主要通過測(cè)量發(fā)出超聲波到超聲波碰到物體彈回來(lái)接收后的時(shí)間差來(lái)計(jì)算物體與車輛之間的距離。
基于此原理會(huì)帶來(lái)一些誤差,因?yàn)檫@樣傳播的介質(zhì)是空氣,我們知道空氣在不同的天氣條件(如雨、霧天等)下,對(duì)超聲波傳播的波速都有影響,而且超聲波雷達(dá)傳播的波速本身就比較慢,因此在車輛高速行駛的時(shí)候,它測(cè)量的實(shí)時(shí)性會(huì)比較差,而且如果測(cè)量距離較遠(yuǎn)的情況下超聲波雷達(dá)的回?fù)?a target="_blank">信號(hào)較弱,就會(huì)帶來(lái)一系列的問題,一方面是誤差大、另一方面是方向性的信息會(huì)比較糟糕。
超聲波雷達(dá)的好處是體積小、售價(jià)低,因此超聲波雷達(dá)一般會(huì)被用在低速、短距離的場(chǎng)景下使用,如倒車。
超聲波雷達(dá)總結(jié)
數(shù)據(jù)類型
與障礙物的距離
主要參數(shù)
頻率高——靈敏度高,但FOV小
適用工況
短距離低速測(cè)距(0.1-3米)
距離遠(yuǎn)——誤差大、方向性不佳
車速高——波速慢,實(shí)時(shí)性差
主要應(yīng)用
低速短——距倒車?yán)走_(dá)
激光雷達(dá)
激光雷達(dá)它的數(shù)據(jù)是點(diǎn)云數(shù)據(jù),是可以描繪3D信息的點(diǎn)云數(shù)據(jù)。點(diǎn)云是一個(gè)一個(gè)點(diǎn),每個(gè)點(diǎn)都有自己(x,y,z)的空間坐標(biāo)信息,還有它的反射率和方向的信息。
激光雷達(dá)有兩款形式分為固態(tài)激光雷達(dá)和機(jī)械式激光雷達(dá)。它們的區(qū)分主要看激光發(fā)射器是固定的還是運(yùn)動(dòng)式的。
傳統(tǒng)的機(jī)械式激光雷達(dá)是把激光發(fā)射器和接收器安裝在一個(gè)裝置上,該裝置是可以整體旋轉(zhuǎn)的,每旋轉(zhuǎn)一圈就會(huì)完成對(duì)周圍信息的一次掃描,缺點(diǎn)是體積較大、活動(dòng)的部件較多,因此它的使用壽命較低和也不好維護(hù),另一個(gè)缺點(diǎn)是機(jī)械式激光雷達(dá)在出廠的時(shí)候發(fā)射點(diǎn)再出廠的時(shí)候就已經(jīng)做在里面的,因此角分辨率后期不能通過一些算法去做調(diào)整。
機(jī)械式激光雷達(dá)
相比之下,固態(tài)激光雷達(dá)的出現(xiàn)就很好的解決了這方面的問題。固態(tài)激光雷達(dá)的發(fā)射源和接收器都是固定在一個(gè)裝置內(nèi)不動(dòng)的,它會(huì)通過一系列的方法把激光導(dǎo)向空間的各個(gè)方向,實(shí)現(xiàn)對(duì)周圍空間的掃描,方法一般分為Flash、OPA和MEMS。
固態(tài)激光雷達(dá)
Flash激光雷達(dá)目前還處在研究的初步階段,我們可以把它想象成一個(gè)探頭,往四周各個(gè)方向發(fā)射,并且接收各個(gè)方向返回來(lái)的激光信號(hào),這樣的原理會(huì)自身存在固有的一些問題,比如它的能量會(huì)隨著距離的增加衰退的非常快,所以有效監(jiān)測(cè)距離一般只在小幾十米左右。但是如果加大它的能量就會(huì)對(duì)人眼造成傷害。目前激光雷達(dá)的工程樣機(jī)都非常少,還處在初步的階段。
OPA激光雷達(dá)是相控陣原理,它是做了非常多的激光發(fā)射頭,把激光發(fā)射頭排列成一個(gè)陣,然后我們通過調(diào)節(jié)不同激光發(fā)射頭在發(fā)射激光的時(shí)候的相位差,實(shí)現(xiàn)激光方向的導(dǎo)向。 OPA運(yùn)用相干原理(類似的是兩圈水波相互疊加后,有的方向會(huì)相互抵消,有的會(huì)相互增強(qiáng)),采用多個(gè)光源組成陣列,通過控制各光源發(fā)光時(shí)間差,合成具有特定方向的主光束。然后再加以控制,主光束便可以實(shí)現(xiàn)對(duì)不同方向的掃描。
MEMS激光雷達(dá)在激光發(fā)射頭前面做了很小的一個(gè)微震的鏡片,通過這個(gè)鏡片的旋轉(zhuǎn)抖動(dòng)把激光導(dǎo)向各個(gè)方向。
現(xiàn)在業(yè)界OPA和MEMS都是比較成熟的激光雷達(dá)解決方案,目前它們的角分辨率最好的目前已經(jīng)可以做到0.01°。
受益于工作原理,激光雷達(dá)受雨天、霧天、霧霾天的影響是比較小的。雖然在雨天雖然在點(diǎn)數(shù)上會(huì)有一些點(diǎn)的缺失,在霧霾天時(shí),空間上會(huì)有一些噪點(diǎn),但是都可以通過一些簡(jiǎn)單的算法把這些問題解決。激光雷達(dá)在自動(dòng)駕駛中扮演了非常重要的角色。
激光雷達(dá)小總結(jié):
固態(tài)激光雷達(dá)
工作原理:激光的發(fā)射源和接收器固定,采用Flash、OPA、MEMS的方法控制激光束方向,進(jìn)行空間掃描。
特點(diǎn)
體積較小
角分辨率較高可達(dá)0.01°
角分辨率與掃描頻率可調(diào)
探測(cè)距離一般,約100米
橫向FOV較小,約100米
機(jī)械式激光雷達(dá)
工作原理:激光的發(fā)射源和接收器都固定在一個(gè)部件上整體旋轉(zhuǎn)
特點(diǎn)
體積一般較大
活動(dòng)部件多,工作壽命不佳
角分辨率不高,約0.9°,且不可調(diào)
探測(cè)距離較遠(yuǎn),約200米
可360度全方位掃描
數(shù)據(jù)類型
(x,y,z,r)點(diǎn)云數(shù)據(jù)
主要參數(shù)
角分辨率-點(diǎn)云更稠密,更能體現(xiàn)物體特征
有效探測(cè)距離
掃描頻率
適用工況
不收光照條件影響,全天時(shí)
非極端氣象條件均可用
主要應(yīng)用
目標(biāo)識(shí)別與分類、目標(biāo)跟蹤
可行駛區(qū)域分割、車道線識(shí)別
SLAM高精自定位
說(shuō)完傳感器,接下來(lái)我們就要想辦法從傳感器中提取到對(duì)我們有用的信息,這個(gè)時(shí)候就是算法需要登場(chǎng)的時(shí)候了。說(shuō)到算法,這里重點(diǎn)講一下深度學(xué)習(xí)。
深度學(xué)習(xí)與感知
深度學(xué)習(xí)可以實(shí)現(xiàn)端到端的感知效果。什么叫端到端?
舉個(gè)例子,比如說(shuō)我這邊有張圖,我們想做一個(gè)摳圖,把圖上的一個(gè)人摳出來(lái),傳統(tǒng)的CV的方法,無(wú)論是基于圖割、最小割還是隨機(jī)場(chǎng)的算法,都需要標(biāo)一下這張圖的前景還有后景分別是什么,而且跑完算法之后會(huì)發(fā)現(xiàn)算法分錯(cuò)了還得需要提供額外的信息進(jìn)一步區(qū)分前景和后景,這就說(shuō)明算法在運(yùn)行的時(shí)候需要進(jìn)行非常多的人為干預(yù);然而深度學(xué)習(xí)可以被理解為全自動(dòng)的算法,可以在沒有人干預(yù)的情況下完成一個(gè)算法的流程,這是深度學(xué)習(xí)相較于傳統(tǒng)機(jī)器學(xué)習(xí)最大的優(yōu)勢(shì)所在。
深度學(xué)習(xí)的模型是由不同的計(jì)算層構(gòu)成的,所謂的計(jì)算層是由自身的一個(gè)參數(shù),它把自身的參數(shù)和收到的數(shù)據(jù)做一個(gè)簡(jiǎn)單的數(shù)學(xué)計(jì)算,然后再把計(jì)算結(jié)果傳輸給下一層,這就完成了這一層的工作,每一層都有不同的職責(zé),比如說(shuō),直觀解釋來(lái)講,像卷積層,可以理解為它是把圖像信息做了一個(gè)提取;像池化層,它是數(shù)據(jù)做了一個(gè)降維處理,保留了有效的信息,同時(shí)把數(shù)據(jù)的體積做了一個(gè)剪裁;像激活層,可以理解為對(duì)有效信息的一個(gè)過濾,它把無(wú)效信息給濾走,它是模仿人腦的神經(jīng)元,對(duì)數(shù)據(jù)的非線性的計(jì)算處理;像全連接層,大家可以理解為,把之前提取的高層的信息做了一個(gè)整合,幫助模型做整個(gè)判斷。
深度學(xué)習(xí)是有監(jiān)督學(xué)習(xí)的一種,說(shuō)到訓(xùn)練,就要看兩個(gè)東西,一個(gè)是叫做ground-truth,是我們希望模型達(dá)到的最理想值;還有一個(gè)就是提供給它的數(shù)據(jù)。
我們是如何訓(xùn)練的呢?我會(huì)通過比較ground-truth和這個(gè)模型自己計(jì)算出的一個(gè)結(jié)果,我們會(huì)量化的計(jì)算一個(gè)誤差值,這個(gè)誤差值就是我們的一個(gè)損失值,我們通過調(diào)整模型的參數(shù)把這個(gè)損失值降到最低就會(huì)完成模型的一個(gè)訓(xùn)練。
那如何調(diào)整參數(shù)呢?我們可以想象一下一個(gè)凹函數(shù)它是由很多自變量構(gòu)成,它的因變量就是損失值,把損失值往零去優(yōu)化的一個(gè)方法就是梯度下降的方法,這也是深度學(xué)習(xí)中優(yōu)化每一層的方法。
那深度學(xué)習(xí)有很多層,層與層之間是如何優(yōu)化的呢?這時(shí)候我們就會(huì)采用偏微分里面的一個(gè)鏈?zhǔn)椒▌t,把每一層的梯度不斷地往前傳,這樣一個(gè)鏈?zhǔn)降牧鞒叹蜁?huì)實(shí)現(xiàn)反向傳播深度學(xué)習(xí)的訓(xùn)練。
深度學(xué)習(xí)為什么可以做到端到端的模型?因?yàn)閿?shù)學(xué)的輸入量和最終的輸出量是可以做自己的自定義的,從數(shù)據(jù)的輸入到模型的輸出之間它是由一系列的數(shù)學(xué)表達(dá)式相連接,它就是可以使用這種反向傳播的模式進(jìn)行優(yōu)化的。所以這也就是深度學(xué)習(xí)能夠?qū)崿F(xiàn)端到端的原因。
雖然深度學(xué)習(xí)能實(shí)現(xiàn)非常棒的端到端的感知能力,實(shí)際上業(yè)界在使用深度學(xué)習(xí)的時(shí)候也發(fā)現(xiàn)了一系列的問題。下面主要列舉三個(gè)例子,一塊討論一下業(yè)界和學(xué)術(shù)界目前遇到的這些問題以及業(yè)界和學(xué)術(shù)界的差異化,以及業(yè)界解決問題的方法。
學(xué)術(shù)界VS業(yè)界
數(shù)據(jù)前融合
學(xué)術(shù)界為了體現(xiàn)算法的先進(jìn)性,他們會(huì)盡量采用盡量少的數(shù)據(jù),去擬合出盡可能多的信息。舉個(gè)例子,很多研究論文都會(huì)集中于說(shuō)我通過一張圖片就可以擬合出它的深度信息,可以做一個(gè)車輛三維姿態(tài)的估計(jì),實(shí)際上對(duì)于業(yè)界來(lái)講,會(huì)認(rèn)為這樣來(lái)做誤差會(huì)比較大,比較好的擬合的結(jié)果誤差可能在1米左右。
1米是什么概念呢?想象一下,汽車在路上以60千米/小時(shí)行駛的時(shí)候,沒有0.1秒車子就會(huì)駛過1.6米左右,因此我們會(huì)覺得這個(gè)誤差比較大。作為業(yè)界來(lái)講,希望如果有的信息能夠用傳感器做一個(gè)準(zhǔn)確的測(cè)量的話,寧愿多裝一個(gè)傳感器,而不是用算法去擬合,因?yàn)闃I(yè)界覺得數(shù)據(jù)的可靠性是最重要的。
這就會(huì)牽扯到業(yè)界會(huì)把不同的傳感器都會(huì)做一個(gè)數(shù)據(jù)的前融合。所謂的數(shù)據(jù)前融合就是把數(shù)據(jù)送到算法,得出一個(gè)結(jié)構(gòu)化數(shù)據(jù)之前,我們?cè)谠紨?shù)據(jù)上做一個(gè)前融合,業(yè)界會(huì)把激光雷達(dá)數(shù)據(jù)和攝像頭數(shù)據(jù)做一個(gè)前融合,這樣激光雷達(dá)的點(diǎn)云數(shù)據(jù)從原先的四維數(shù)據(jù)(x,y,z,r)變?yōu)?維數(shù)據(jù)。融合的好處是原始數(shù)據(jù)中有一個(gè)非常精確的三維的信息,并且對(duì)材料本身的一些信息,如反射率、顏色等也得到了一個(gè)信息的補(bǔ)充。
有人可能會(huì)問,這樣融合時(shí)候,計(jì)算量會(huì)不會(huì)增加很多?實(shí)際上并不會(huì)。因?yàn)椋紫葟纳疃葘W(xué)習(xí)的角度來(lái)講,你的數(shù)據(jù)的維度是多少就等同于你的數(shù)據(jù)的通道數(shù)是多少,通道數(shù)量對(duì)模型的前一兩層并不會(huì)增加很大的計(jì)算量。而且作為深度學(xué)習(xí)來(lái)說(shuō),我們有很多的技巧來(lái)減少該計(jì)算量,比如說(shuō),我們可以做一些池化的處理、可以做一些一對(duì)一的卷積降維的處理,而且這些數(shù)據(jù)在進(jìn)入深度學(xué)習(xí)運(yùn)算之前,會(huì)做一些柵格化的處理,這樣一來(lái)就會(huì)有效地控制好數(shù)據(jù)計(jì)算量的增幅。而我們得到的信息就會(huì)豐富很多。
數(shù)據(jù)后融合
所謂的數(shù)據(jù)后融合就是把不同傳感器的算法的數(shù)據(jù)結(jié)構(gòu)化處理后再做一個(gè)融合,這點(diǎn)學(xué)術(shù)界并不感興趣,因?yàn)楹笕诤弦话愫茈y體現(xiàn)他們算法的先進(jìn)性。
這里舉一個(gè)核心區(qū)域分割的例子
學(xué)術(shù)界一般采用的是像素集語(yǔ)義分割的方式對(duì)行駛區(qū)域的查找,像素集語(yǔ)義分割就是把圖像上的無(wú)論是路面還是車,每一個(gè)像素都打上標(biāo)簽,這樣一來(lái)就會(huì)有一系列的問題,比如說(shuō),上圖中,可行駛區(qū)域邊緣分割的并不是特別光滑,而且在收到光照的干擾的情況下邊緣會(huì)出現(xiàn)明顯的分類的錯(cuò)誤,雖然非常多的論文和研究機(jī)構(gòu)在說(shuō)如何改進(jìn)這一點(diǎn),但是這的確是目前扔然存在的一個(gè)問題。
這時(shí)候業(yè)界會(huì)如何保證算法的魯棒性呢?這時(shí)業(yè)界會(huì)采用另一個(gè)傳感器來(lái)做同一件事情,兩個(gè)傳感器所產(chǎn)生的數(shù)據(jù)進(jìn)行比較。之所以這樣來(lái)做是為了盡量減少做同一件事情的時(shí)候的關(guān)聯(lián)性。這樣通過兩種不同方法得出的同樣的數(shù)據(jù)作比較的時(shí)候才會(huì)有互相做檢查的安全的意義。
數(shù)據(jù)后融合的方法,如上圖右側(cè),我們會(huì)看到點(diǎn)的數(shù)據(jù),這里的算法并沒有牽扯到深度學(xué)習(xí),它是取一個(gè)點(diǎn),然后對(duì)這個(gè)點(diǎn)取一大一小兩個(gè)半徑,通過兩個(gè)半徑再找兩個(gè)平面,然后再計(jì)算這兩個(gè)平面的法向量,再把這兩個(gè)法向量做一個(gè)差。對(duì)于每個(gè)點(diǎn)都做這樣一個(gè)操作之后就會(huì)得到一個(gè)路面幾何信息變化率的數(shù)據(jù),這個(gè)計(jì)算并不會(huì)增加額外的計(jì)算量,因?yàn)樗⒉幌裆疃葘W(xué)習(xí)又要跑一個(gè)很龐大的網(wǎng)絡(luò),只是基于紙質(zhì)運(yùn)算所得到一個(gè)數(shù)據(jù),而這樣得到的數(shù)據(jù)是通過另一種方法來(lái)的,它跟基于圖像得到的結(jié)構(gòu)化數(shù)據(jù)的關(guān)聯(lián)性幾乎是沒有的,這樣是一種比較保險(xiǎn)的做法。
自適應(yīng)模塊化網(wǎng)絡(luò)架構(gòu)
對(duì)于學(xué)術(shù)界只是想證明自己算法的優(yōu)越性,希望通過一個(gè)模型應(yīng)對(duì)所有場(chǎng)景,導(dǎo)致的結(jié)果是過長(zhǎng)的端到端,可解釋性會(huì)差;另外強(qiáng)調(diào)泛化性,全局最優(yōu)主導(dǎo)下的局部不足;還有模型尺寸過大,參數(shù)過多,對(duì)運(yùn)算力的需求會(huì)很高。
因?yàn)樽詣?dòng)駕駛在實(shí)際使用的過程中,場(chǎng)景變化并不會(huì)特別的頻繁,所以很多時(shí)候希望說(shuō)我有一個(gè)模型可以很好的應(yīng)對(duì)當(dāng)前的情況,而不是說(shuō)我有一個(gè)大的模型可以很好的應(yīng)對(duì)所有的情況。
在業(yè)界如何解決這些問題呢?這里采用了自適應(yīng)模塊化算法網(wǎng)絡(luò),所謂的自適應(yīng)是指當(dāng)前傳感器感受到的一些初步的信息先做一個(gè)場(chǎng)景的判斷,可以快速的判斷出這是白天還是晚上,下雨還是起霧,然后通過場(chǎng)景的判斷之后,再到算法池里面去選擇一個(gè)合適的專門訓(xùn)練過的模型,再通過這個(gè)模型進(jìn)行計(jì)算感知。第一步做判斷并不會(huì)額外增加更多的計(jì)算量,并且用到的信息也不多。然后將這些數(shù)據(jù)送到算法池,選擇針對(duì)此工況優(yōu)化后的模型。
模塊化的設(shè)計(jì),是多個(gè)短的端到端的網(wǎng)絡(luò)有以下三個(gè)好處:易鎖定問題、不需要過一遍完整的網(wǎng)絡(luò)所以可降低訓(xùn)練成本、減小運(yùn)行時(shí)實(shí)時(shí)算例需求。
展望
從V2X的角度去想,單輛車的感知不僅對(duì)自身是有益的同時(shí)也對(duì)周圍其他車輛也是有益的,因?yàn)槲覀兛梢园崖飞闲旭偟拿恳惠v車都看作是一個(gè)個(gè)傳感器,可以把自己感知到的結(jié)構(gòu)化數(shù)據(jù)實(shí)時(shí)傳輸?shù)皆贫耍@樣能夠幫助整個(gè)智能生態(tài)化環(huán)境的構(gòu)建。
舉兩個(gè)例子,一個(gè)是相同目的地的車輛可以自然的形成一個(gè)實(shí)時(shí)的車隊(duì),只要前車做一個(gè)感知,后車做一個(gè)跟車,這樣就會(huì)很輕松的完成一個(gè)自動(dòng)駕駛車隊(duì)的情況;另外一個(gè)就是一些大城市會(huì)面對(duì)交通的早晚高峰,此前有人提出了潮汐車道來(lái)解決此問題,但是目前的做法還是不夠高效,如果能夠達(dá)到一個(gè)車聯(lián)網(wǎng)的狀態(tài)的話,未來(lái)車道未必需要標(biāo)上這樣反向性的箭頭了,因?yàn)榭梢赃m時(shí)動(dòng)態(tài)的調(diào)整車流及方向,可以增大路面的利用率。
-
傳感器
+關(guān)注
關(guān)注
2552文章
51382瀏覽量
755765 -
自動(dòng)駕駛
+關(guān)注
關(guān)注
784文章
13923瀏覽量
166812 -
深度學(xué)習(xí)
+關(guān)注
關(guān)注
73文章
5512瀏覽量
121408
原文標(biāo)題:自動(dòng)駕駛的智慧之眼——感知
文章出處:【微信號(hào):IV_Technology,微信公眾號(hào):智車科技】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論