決策算法成為競爭焦點
從技術角度講,自動駕駛由三大主要技術構成:感知、決策和控制。那現在自動駕駛技術真正的門檻在哪里?
如果你去CES參觀各家公司的自動駕駛樣車,你會發現一個趨勢:各家公司的傳感器配置越來越趨同化:前視多目攝像頭,77GHz長距/短距雷達、環視攝像頭、加上十個以上的超聲波雷達,豪華一點的再配上幾個低線束的激光雷達,這些傳感器的供應商也差不多。
在感知層面,隨著ADAS的大量部署和長時間的技術開發,已經相當成熟,可以說感知技術已經不是主要的瓶頸。而控制則是傳統車廠和Tier1非常擅長的領域,做了很多年,積累了大量的經驗。
自動駕駛在技術上的競爭,主要聚焦于決策環節。事實上,區分一個系統是ADAS還是自動駕駛,也主要是看該系統是否有決策部分。無論是谷歌,還是特斯拉,他們的核心競爭力,都還是體現在其決策算法方面。
傳統汽車界的研發是基于功能安全的設計方法學建立的,滲透到開發流程的每一個環節,并且在過去一個世紀,將汽車的安全性提高到了極高的水準。
如今,頂尖的公司已經可以確保汽車發動機能使用一百萬公里!但是面對洶涌而至的機器學習熱潮,傳統汽車界突然發現自己嚴重缺乏技術儲備,面對特斯拉和谷歌激進的策略,顯得力不從心。
這已經成為制約傳統車廠開發自動駕駛的最大短板,目前,傳統車廠或者大肆收購機器學習公司,或者與其合作,他們需要盡快補上這塊短板。
傳統車廠出身的克拉富西克顯然深知這一點,在他出任Waymo CEO之后,谷歌一改之前模棱兩可的商業策略,明確表示向車廠提供解決方案,并迅速宣布和本田合作,事實上是將自己定位在Tier 1的角色。
此前谷歌雖然在技術積累上處于領先位置,但一直沒有確定可行的商業模式,克拉富西克的到來,讓谷歌對于商業化的態度更接地氣,也更精準。在該解決方案中,硬件基本也是外購的,顯然無法成為谷歌的競爭壁壘,最有價值的,還是一整套經過驗證的軟件,尤其是其中的決策算法。可以想象的是,谷歌將會向業界提供軟件授權,就像它之前在安卓系統上所做的一樣。
理性決策是必然趨勢
決策算法面臨的最大挑戰,就是如何達到自動駕駛所需要的極高的安全性和可靠性。自動駕駛決策的結果會輸出到控制器,根據ISO26262已有的功能安全的規定,這會反過來要求決策系統也需要達到ASIL-D的標準。
目前,ISO組織對專門針對自動駕駛的功能安全標準正還在制定中,有可能會用一種新的標準進行考量,但功能安全的基本原則依然有效。
端到端的AI方法有隱患
這意味著,我們必須嚴肅地思考,如何才能滿足功能安全的要求?對于谷歌、百度以及許多初創公司,這些非傳統車廠出身的玩家來說,是一個全新的命題。
目前,很多創新公司都在使用深度學習加增強學習做端到端的訓練,也就是說,從傳感器的輸入直接導出控制器(剎車、油門、轉向等)的輸出。但深度學習的問題在于它失去了透明性,僅僅依賴于概率推理,也就是相關性,而非因果推理,而這兩者是有本質不同的。
相關并不意味著因果。舉個例子,統計發現,手指頭越黃的人,得肺癌的比例越大。但事實上,手指的顏色和得肺癌的幾率之間顯然沒有直接的因果聯系。那么為什么統計數據會顯示出相關性呢?這是因為手指黃和肺癌都是由吸煙造成的,由此造成了這兩者之間產生了虛假的相關性。
深度學習就像一個黑盒子,無法進行分析,出了事情你不知道原因到底是什么,也沒有辦法預測下一次會出什么狀況。
有一個很搞笑的例子,用深度學習訓練一個系統,來分辨哈士奇和愛斯基摩狗,初步測試效果非常好,但進一步的測試表明,這個系統其實是通過區分背景,而不是狗本身來判定其種類的,因為訓練所使用的樣本中,愛斯基摩狗幾乎總是伴隨者雪地的背景,而哈士奇則沒有,想想看,如果這樣的系統應用到自動駕駛,是多大的隱患!
深度學習的實際表現,基本上取決于訓練的樣本以及你所要求輸出的特征值,但如果你的樣本比較單一,輸出特征值又比較簡單,則很容易訓練出你并不想要的結果來。就自動駕駛而言,這是無法接受的,它需要高度的理性決策。
如今,深度學習的熱潮席卷了整個業界,很多人不再對基礎算法進行鉆研,而是瘋狂加大數據,堆機器進行訓練,以期更快地出成績,結果看上去還不錯,但這樣的非理性態度其實是給自動駕駛埋下了隱患。我們需要的是對于事實邏輯的深入分析,以及不同方法論的結合,從這個意義上講,如果用小數據可以達到好的效果,更能說明我們對機器學習技術的理解能力。
基于規則的專家系統不靈活
傳統的主機廠和Tier 1面臨的則是另外的問題。如果接觸各大Tier1的ADAS產品,無論是AEB,還是ACC,LKA,你會發現都是基于規則的專家系統。這種系統精確可分析,但專家系統的問題在于,在場景非常多變時,創建的規則就無法保證足夠的覆蓋面。
結果,當添加更多新的規則時,就必須撤消或者重寫舊的規則,這使得這個系統變得非常脆弱。并且,各個功能都有自己單獨的規則,組合到一起,其可能性就非常多,甚至還存在矛盾,這使得ADAS向自動駕駛過渡之路變得更加艱難。
我曾經跟一家主機廠在交流他們的決策系統時曾詢問過這個問題,得到的答案是:這種基于專家系統的規則經過組合,能產生一萬種可能!你甚至很難對這個系統進行完整的測試。
新的決策機制:因果推理
因此,我們需要在自動駕駛領域引入新的決策機制。自動駕駛決策技術路線的一個重大趨勢,就是從相關推理到因果推理。這樣的人工智能框架是Judea Pearl在八十年代建立的,他也因此拿到了圖靈獎。
上世紀 80 年代初,Judea Pearl為代表的學術界出現了一種新的思路:從基于規則的系統轉變為貝葉斯網絡。
貝葉斯網絡是一個概率推理系統,貝葉斯網絡在數據處理方面,針對事件發生的概率以及事件可信度分析上具有良好的分類效果。它具有兩個決定性的優勢:模塊化和透明性。
模塊化的優勢非常重要,例如,假如任務是更新汽車的變速箱,當變速箱被更換的時候,你不必重寫整個傳動系統,只需要修改為變速箱建模的子系統,其余的都可以保持不變。
因此,我們可以把深度學習的系統作為一個子模塊融入到其中,專家系統可以是另一個子模塊,也融入其中,這意味著我們有了多重的冗余路徑選擇,這種冗余構成了貝葉斯網絡的子節點,將有效強化輸出結果的可靠性,避免一些低級錯誤的發生。
透明性是貝葉斯網絡的另一個主要優勢。對于自動駕駛而言,這尤為關鍵,因為你可以對整個決策的過程進行分析,了解出錯的哪一個部分。
可以說貝葉斯網絡是理性決策的極佳實現,適合用于設計整個決策的頂層框架。
因果推理的另一個典型范例就是基于增強學習的決策框架,它把一個決策問題看作是一個決策系統跟它所處環境的一個博弈,這個系統需要連續做決策,就像開車一樣。優化的是長期總的收益,而不是眼前收益。這有點像巴菲特的價值投資,優化的目標不是明天的收益,而是明年或者十年以后的長期總收益。
谷歌把這樣的框架用在下圍棋上,取得了革命性的成功。自動駕駛的場景也非常適合應用這樣的決策系統。比如說要構建價值網絡,評估當前的駕駛環境風險,評估的是從現在時間到未來時間的整體風險;然后利用策略網絡輸出本車的控制決策,選擇最優的駕駛路徑和動力學輸出。
同時,我們還可以構建一個基于模擬路況的仿真環境,通過增強學習去做虛擬運行,獲得最優的決策模型,并且還將產生大量的模擬數據,這對決策算法的成熟至關重要。
可以說,向因果推理型決策模型轉化是自動駕駛技術邁向成熟的重大標志。
目前的硬件效能達不到實用要求
對于自動駕駛這樣的復雜任務,在設計軟件的同時,還必須考慮與之匹配的硬件效能,這里包括性能、功耗和功能安全。
為了保證自動駕駛的實時性要求,我們需要保證軟件響應的最大延遲在可接受的范圍內,對于計算資源的要求也因此變得極高,目前,自動駕駛軟件的計算量達到了10個TOPS(每秒萬億次操作)的級別,這使得我們不得不重新思考對應的計算架構。
圖靈獎獲得者Alan Kay,他有一句話是喬布斯一直信仰的:如果你嚴肅地思考你的軟件,你就必須要做你自己的硬件。
事實上,整個數字半導體和計算產業的產業驅動力,正在從手機轉向自動駕駛,后者所需要的計算量比手機要大兩個數量級。
福特第二代Fusion自動駕駛原型車后備箱中鼓鼓囊囊地塞滿了計算設備
今天,打開任何一家主機廠的無人車的后備箱,都是一堆計算設備,不但沒有地方放行李,而且還要解決它的整個系統穩定性問題。之前在烏鎮舉行的世界互聯網大會,記者在實際體驗百度的無人車時,提到非常有趣的一點:“這輛無人車平穩地行駛了起來,但位于后備箱的車載計算機噪音較大,可以聽到風扇在運行的聲音。”
為什么呢?因為它使用的是CPU+GPU+FPGA的計算平臺,計算所需要的功率非常大,GPU尤其恐怖,如果沒有強力風扇來散熱的話,夏天很容易燒壞機器。坐在這樣的車里,就別講究體驗了。
功能安全是另一個巨大的挑戰,這里面其實包含了多個方面的要求:處理器要符合至少ASIL-B等級的要求,可靠性需要能夠保證在至少十年的使用期內不出問題。
高通在手機領域有非常強的實力,而且向汽車電子進軍的努力也從未停止,但去年高通依然決定花370億美元重金收購了汽車電子老大NXP,這從另一個側面折射出汽車電子的門檻之高。
人工智能處理器與自動駕駛計算平臺
這讓我們想起計算機的發展歷史,50年代是大型機的時代,那個時候一臺大型機可以占據實驗樓的一整個樓層,需要一個龐大的團隊來操作,價格高到數百萬美元;七十年代小型機占據主導,小型機可以安裝進一個房間,價格也降到數萬美元;八十年代是PC時代,可以擺放到桌面,價格則又降低了一個數量級,如今是手機,可以裝進口袋;貫穿其中的是三個主要方面的進步:體積、功耗和成本。
人工智能所需要的處理器,從2012年開始業界已經開始廣為關注,比如從GPU到FPGA,再到TPU,業界也沿著之前計算機走過路,重構人工智能所需要的處理器。
英偉達在本屆CES上發布了最新的車載計算平臺“XAVIER”,512 個 Volta CUDA 核心可提供高達 30 TOPS的計算性能,但最引人注目的還是其30W 的功耗,大大低于之前還需要水冷的Drive PX2。這是一個很大的進步,但還不夠,要讓自動駕駛得到普及,性能、功耗、成本和體積因素,一個也不能少。
英偉達Xavier自動駕駛超級計算平臺
如今很多車廠都制定了非常激進的自動駕駛開發計劃,但其實樣車開發與其投入到量產車的日程表其實是差異非常大的。與量產車的設計理念完全不同,量產車必須考慮成本因素,不能跟今天的GPU或者其它的計算所需要的成本一樣,而這就需要業界提供新的計算平臺。
FPGA被越來越多的公司關注,其可編程特性可以滿足專有計算構架的需求,微軟、Intel等公司都在大量部署基于FPGA的系統。
FPGA在ADAS方面的出貨量也在迅速增加,去年的出貨量應該不會低于3Mu。但FPGA再往上走,計算資源的擴展會讓成本上升到很難接受的地步。半導體業界無數的歷史都表明,FPGA往往是定制化ASIC的前哨站,一旦某個應用的量足夠大,定制化ASIC就會變得更經濟。
地平線機器人則希望借助自己的研究優勢,目標是將原本智能在云端運行的人工智能,實現在高性能低功耗的大腦引擎(BPU)上。這是一個全新的計算構架IP,將充分適配深度神經網絡算法的要求,由此帶來革命性的嵌入式人工智能,預計其成本和功耗都將比現有GPU低一個數量級。這樣的IP 可以嵌入到SoC中,或者單獨作為協處理器使用。目前地平線正在推進代號為“高斯”的計算構架IP的開發,預計17年底推出。
地平線BPU戰略
軟硬件協同設計是新的趨勢
在過去,處理器都是作為標準平臺提供給業界,軟件工程師拼命優化編譯器、代碼、任務調度等來達到更高的性能表現,但現在,這已經無法滿足產品快速上市的要求了。
英偉達在AI業界攻城略地,幾乎已經成為標配,這其中有其高性能GPU的因素,但問題在于,為什么其它GPU供應商沒有贏得這場競爭?
英偉達不僅提供GPU硬件,還提供了高度優化的CUDA平臺,該平臺封裝了大量高頻使用的數學運算庫,英偉達更進一步面向自動駕駛提供了端到端的解決方案,這實際上是一種重要的產品理念:軟硬件協同設計。
這揭示了英偉達市場競爭成功的秘訣:通過軟硬件協同設計,優化軟硬件系統的性能表現,縮短客戶導入時間,贏得市場。
英偉達從云到車端對端的自動駕駛平臺解決方案
新的自動駕駛計算平臺,實際上是因應算法和軟件的需求而來的,例如,為了更好地支持深度卷積神經網絡極大規模的矩陣運算,你需要考慮如何使用二值化方法來降低對于硬件乘法器的需求,如何重新設計緩存機制以避免I/O帶寬成為整個計算系統的瓶頸等。為了滿足功能安全的需求,你需要硬件級別的虛擬化,這就要求處理器構架設計方面需要考慮多核、VMM、設備I/O請求管理等。
Intel也在加強其在人工智能算法方面的積累,對Nervana和Movidius的收購反映了這一點。通過提供至強處理器、FPGA,結合其Nervana平臺以及面向深度學習優化的數學函數庫(MKL),提供完整的AI解決方案。
能否提供同時滿足經濟性和性能要求的計算平臺,是自動駕駛能否從樣車轉向量產車的關鍵因素之一。
結語
公眾對于自動駕駛依然有深深的疑慮,但在每一次革命性的交通運輸方式出現時,類似的疑慮都曾經存在過。航空服務剛剛出現時,安全性非常低,多數人甚至都不相信金屬構造能飛起來。
美國海軍統計表明,在二戰期間,因技術原因損失的飛機達2100架,是被擊落飛機的1.5倍,但航空業依然發展了起來;高鐵同樣有類似的經歷,19世紀火車剛剛出現時,即使是最有遠見的人都無法想象時速超過300公里的列車,那時候的人們認為僅僅是氣壓的問題就足以讓乘客喪命,而后來這些都成為了現實,并且發展了體量驚人的配套基礎設施:鐵道和機場。
當技術不存在原理性的問題之后,只要有巨大的商業潛力,利益的驅動終能克服技術上的挑戰。
如果我們考察一段文明的發達程度,運輸水平可能是最直觀的指標。唐代玄奘取經,鑒真東渡,耗去的是一個人半生的時間,這里體現的是客運成本;南宋時期,從福建泉州出發的瓷器運到歐洲,增值達一百倍,體現的是貨運的價值;19世紀美國的崛起,很大程度上得益于其全國鐵路網的建立,將聯邦的各個州融合成為一個單一市場。
文明的發展過程,也必然伴隨著運輸成本的逐漸降低,以及運輸效率的持續提升,它深刻重塑了經濟的形態。Elon Musk的終極夢想是殖民火星,同樣是一個運輸能力改變文明的故事,自動駕駛就是當下發生的故事,當人的勞動力被釋放之后,成本下降就會驅動一波全新的機會。過去一年里,自動駕駛領域的進步已經超出了絕大多數人的預期,自動駕駛的未來值得期待。
地平線機器人技術主攻嵌入式人工智能方向,致力于提供面向自動駕駛的高性能、低功耗、低成本的嵌入式人工智能解決方案。2017年CES,地平線聯合英特爾推出了一款基于單目攝像頭和FPGA的ADAS產品原型系統,其優越性受到眾多國際國內知名Teri1及OEMs的認可。
文章來源:人工智能學家 智車科技
-
決策樹算法
+關注
關注
0文章
5瀏覽量
9978 -
自動駕駛
+關注
關注
784文章
13916瀏覽量
166776
發布評論請先 登錄
相關推薦
評論