商業分析人士、記者和普通大眾的多數觀點似乎是,Waymo在自動駕駛方面遙遙領先,特斯拉則遠遠落后。然而當你研究神經網絡的基本原理時,就會發現,上述觀點是沒有意義的。
決定深度神經網絡性能好壞有三個因素:訓練數據、網絡架構、優化算法。眾所周知,深度學習需要大量的數據,而大多數AI領域的工程師,也將大多數時間花在了訓練數據上,可見,訓練數據是深度學習問題中最核心的一環。一般來說,數據越多,AI越智能,表現越良好。這也是為什么一部分業內人士認為特斯拉優于Waymo的根本原因。
擁有約50萬輛汽車的特斯拉車隊,配備了特斯拉聲稱的全自動駕駛硬件,特斯拉車隊每天行駛的里程約為1500萬英里,相當于Waymo車隊成立以來行駛的總里程。根據每天1500萬英里的行駛里程,可以推算出特斯拉每年可以行駛54億英里,比Waymo公司預計的全年行駛里程高出200倍。值得注意的是,特斯拉的車隊也在以每周約5000輛的驚人速度不斷增長。
這些數據主要在以下三個關鍵領域發揮重要作用:
預測
路徑規劃/駕駛策略
計算機視覺
目標檢測是計算機視覺的一項重要任務。有些物體,比如馬,很少出現在路上。每當特斯拉的汽車遇到神經網絡認為可能是馬的東西(或者可能只是一個無法識別的物體擋住了路),攝像頭就會拍下照片,隨后通過WiFi上傳。可見,特斯拉讓車輛每年行駛數十億英里是有幫助的,因為這樣可以找到更多罕見物體的例子。據此,可以推斷,隨著時間的推移,特斯拉將比Waymo更善于識別路上的罕見物品。
預測
預測是指提前幾秒鐘預測汽車、行人或騎行者等交通參與者的運動或動作的能力。多年來一直效力Waymo頂尖工程師之一——安東尼萊萬多夫斯基(AnthonyLevandowski)最近稱:如今的軟件不足以預測未來。Anthony Levandowski稱,根據數據顯示,目前自動駕駛汽車的故障主要是因為錯誤地預測了周圍的車輛和行人的行為。
目前,特斯拉擁有約50萬輛汽車,這是一個非常優越的資源。特斯拉可以利用這50萬輛汽車,實現對“錯誤預測情況”的采集,將采集到的快照上傳并添加到特斯拉的訓練集中。特斯拉還可以上傳一個由其計算機視覺神經網絡生成抽象的場景,而不是上傳一段視頻。這種方式也將從根本上減少上傳該數據的帶寬和內存需求。
雖然用于訓練目標檢測的圖像需要人類標記,但預測神經網絡可以僅從事件的時間序列中學習過去和未來之間的相關性。
由于不需要人為數據貼上標簽,特斯拉可以將其神經網絡訓練成盡可能多的有用數據。這意味著其訓練數據集的大小將與其總里程相關。與對象檢測一樣,與Waymo相比,它的優勢不僅在于提供更多的數據來預測常見行為,還在于能夠收集在罕見情況下出現的罕見行為的數據,從而預測這些行為。
路徑規劃/駕駛策略
路徑規劃和駕駛政策是指汽車在限速時保持在車道中心、變道、超車、綠燈左轉、繞過停著的車、停車讓行人過馬路等等行為決策。要制定一套涵蓋汽車在任何情況下可能需要采取的行動的規則,本身極其困難,這也是國內外自動駕駛領域專業人士一直在探討的問題。解決這一問題的一種方法是利用神經網絡復制人類的行為。這就是所謂的模仿學習(也稱為學徒學習,或從示范學習)。
訓練過程類似于神經網絡學習如何通過繪制過去和未來之間的關聯來預測其他交通參與者的行為。在模仿學習中,神經網絡通過繪制它所看到的(通過計算機視覺神經網絡)和人類駕駛員所采取的動作之間的關聯來預測人類駕駛員會做什么。
最近,在模仿學習領域炙手可熱的明星,不得不提及DeepMind出品的AlphaStar。DeepMind使用了數百萬人類參與的《星際爭霸》游戲數據庫中的例子,來訓練神經網絡像人類一樣打游戲。網絡學會了游戲狀態和人類玩家行為之間的關聯,從而學會了預測人類在面對不同游戲狀態時采取的不同動作。僅通過這種訓練,AlphaStar便達到了DeepMind估計的水平,使其大致處于《星際爭霸》競爭力排行榜的中間位置。后來,AlphaStar通過強化學習提升到職業水平的能力。
同理,特斯拉正在將模仿學習應用到駕駛任務中,比如,如何處理高速公路上常見的立體交叉路況,或者如何在十字路口左轉。據外媒報道稱,特斯拉會將模仿學習擴展到更多的任務中,比如如何以及何時在高速公路上換車道。特斯拉人工智能總監安德烈·卡帕西(Andrej Karpathy)曾經描述了特斯拉如何使用模仿學習。
與預測結果一樣,上傳汽車周圍場景的抽象表示,而不是上傳視頻,這表示,神經網絡只需要更低的帶寬和內存需求就足以供神經網絡模仿學習。同樣,一旦數據上傳,就不需要人為標記。由于神經網絡預測人類駕駛員在給定環境狀態下會做什么,所以它只需要“給定的環境狀態”和“駕駛員動作”即可。模仿學習本質上是預測特斯拉司機的行為,而不是預測特斯拉周圍其他交通參與者的行為。與AlphaStar一樣,所有需要的信息都包含在回放中。
根據卡帕西關于預測切入(predictingcut-ins)的評論,特斯拉在未能正確預測前方車輛是否會進入特斯拉車道時觸發保存回放。類似地,當涉及路徑規劃或駕駛策略的神經網絡無法正確預測特斯拉駕駛員的行為時,特斯拉可能會捕獲回放數據。埃隆·馬斯克(Elon Musk)過去曾提到過這種功能,不過這種功能的使用情況,尚未得到證實。
其他捕捉回放的情況包括:突然剎車或急轉彎、自動緊急剎車、碰撞或碰撞警告,以及更為復雜的機器學習技術,即異常檢測和新奇檢測。如果特斯拉已經知道它想要捕捉什么,比如十字路口的左轉,它就可以設置一個觸發器,每當視覺神經網絡看到交通燈,左轉彎信號被激活,或者方向盤向左轉彎時,它就會捕捉回放。
結論
特斯拉擁有約50萬輛汽車,在以下三個關鍵領域相對于Waymo(和其他競爭對手)具有優勢:
1.計算機視覺
2.預測
3.路徑規劃/駕駛策略
商業分析人士、記者和普通大眾的多數觀點似乎是,Waymo在自動駕駛方面遙遙領先,特斯拉則遠遠落后。當你研究神經網絡的基本原理時,就會發現,上述觀點是沒有意義的。
更重要的是,AlphaStar證明了大規模模仿學習對于復雜任務的概念。有學者認為,如果對特斯拉采用方法的正確性存疑,或者認為路徑規劃/駕駛策略是一個簡單問題的話,那么可以思考一下,為什么模仿學習在《星際爭霸》中行得通,在自動駕駛中卻行不通。
基于以上分析,有學者旗幟鮮明地表示:除非Waymo在未來1-3年內擴大其車隊規模,否則,“Waymo遙遙領先、特斯拉遠遠落后的觀點”將被證實是錯誤的。人們把太多的注意力放在演示上,可惜這些演示沒有表明系統的魯棒性。人們對訓練數據的關注太少,尤其對那些Waymo沒有足夠的數據來做好基于機器學習的罕見的物體和行為關注更少。
仿真并不是Waymo的優勢,因為包含特斯拉在內的所有的自動駕駛汽車公司都在使用仿真。更為重要的是,仿真無法預測或不知道如何準確地對罕見對象和罕見行為建模。
還有一項對科技工作者的調查表明,特斯拉是舊金山灣區第二大最受歡迎的公司,僅次于谷歌。調查還發現,特斯拉在全球最受歡迎的公司中排名第四,比排名第二的谷歌落后兩名。(Shopify在全球排名第三,SpaceX排名第一。)同樣值得注意的是,機器學習領域的最新科研成果活方法經常被學術界、OpenAI以及谷歌、Facebook和DeepMind的企業實驗室公開分享。特斯拉能做什么和Waymo能做什么之間的區別可能不是那么大。
這兩家公司最大的不同在于數據。隨著特斯拉汽車數量增長到100萬輛,其月行駛里程將達到約10億英里,是Waymo約100萬英里的1000倍。對于特斯拉來說,1000倍的差異意味著優越的稀有物體檢測,優越的稀有行為預測,以及優越的路徑規劃/駕駛策略。自動駕駛的挑戰更多的是處理可能只有0.01%的罕見的邊緣情況,而不是99.99%的通用場景。
-
特斯拉
+關注
關注
66文章
6328瀏覽量
126720 -
自動駕駛
+關注
關注
784文章
13923瀏覽量
166825 -
waymo
+關注
關注
2文章
312瀏覽量
24709
原文標題:特斯拉自動駕駛強于Waymo的三大理由
文章出處:【微信號:IV_Technology,微信公眾號:智車科技】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論