在可靠性和安全性如何相互作用和相互建立方面缺乏明確的、一致的結構,正在產生可避免的沖突和潛在的錯誤傳達,這可能使自動駕駛汽車客戶面臨不必要的風險并增加過多的系統成本。
2018 年 3 月 18 日,世界上首起自動駕駛汽車致行人死亡事故在美國亞利桑那州坦佩市發生。該事件引起了巨大轟動,全球范圍內有關本次事故的文章達到了近一萬篇,其中大多數均探討了本次事故對優步(Uber)、自動駕駛汽車、公共道路自動駕駛汽車測試及更廣泛社會的影響。
然而,沒有多少文章真正探討了自動駕駛汽車的傳感器、軟件和平臺技術可以從這一悲慘事件中吸取哪些教訓。事實上,自動駕駛汽車要想真正實現經濟可行性,就必須從事故中吸取經驗教訓。
無論是為了從坦佩事故中吸取教訓,還是真正理解 ISO 26262(道路車輛功能安全標準)的價值,我們其實面臨著一個共同的基本挑戰:清楚地認識“可靠性”和“安全性”之間的互補和矛盾之處。這并不單純指字面意義:每位經理都明白,在任何一個軟件和硬件設計周期中,流程、權力和責任的劃分至關重要:誰做什么工作?向誰報告?何時進行?這些問題的處理方式不同都會導致截然不同的結果。
可靠性是什么?安全性又是什么?這兩者在企業環境中又應保持何種關系?從可靠性工程師的視角來看,安全性不過是可靠性的一部分。為什么?因為可靠性團隊關注的是故障發生的概率,而安全性團隊則關注故障發生且導致災難性后果(損失、受傷或死亡)的概率。
對于可靠性團隊而言,預防并處理這些災難性事件的概率,僅是他們工作中的一小部分而已。因此,在一個以可靠性為核心的環境中,安全工程師直接接受可靠性團隊的管理,且在完整可靠性設計(DfR)流程走完前,不會采取行動。
在車輛傳感,控制,動力,制動等方面引入冗余,無需增加成本使乘客或周圍的交通更加安全。
可靠性和安全性的相互作用
顯而易見,安全工程師并不認同這一觀點。從他們的視角來看,可靠性分析只能提供特定失效機制(可靠性物理學)或部件(經驗學)失效的概率。可靠性分析不會涉及故障發生的具體后果——這會是災難性的嗎?因此,可靠性分析只有深入到系統最下層時,才往往是最有效的。只有這時,分析人員才更能了解系統或用戶對故障的反應,從而分析每個故障可能引發的后果嚴重性。因此,可靠性工程師應當接受安全團隊的管理。
可靠性工程師的主要職責是計算故障率和基本故障模式。如果有時這些失敗率不過只是數字而已,那么可靠性工程師有什么存在的必要呢?
此外,第三種觀點是,可靠性和安全性之間的聯系并沒有人們想象的那么緊密。我們可以用這兩個學科分別“如何解決風扇性能”的問題更好地陳述這兩者之間的差別。可靠性工程師會采取可靠性物理分析(RPA)、降速或加速壽命試驗(ALT)等措施,確保將風扇在預期環境中的故障率降至目標水平之下。對比之下,安全性工程師則會首先判斷風扇故障是否會引發災難性事件(及這將給系統其他部分帶來哪些影響),然后采用“漂移”(drift)增加冗余或調整關鍵參數(如電流消耗、轉速表、噪音)等方式,降低事故的嚴重程度。
這些不同觀點恰好反映了科技公司在“如何處理可靠性和安全性之間關系”方面的猶豫。在一家正在向自動駕駛汽車轉型的大型消費者技術公司中,可靠性和安全性團隊匯報給同一位總監。另一家自動駕駛領導者公司則將安全性和可靠性團隊完全分開,不過這兩個部門主管的職位大致類似。我們了解的第三家公司,則是汽車電子領域中一家大力投入自主控制單元研發的中流砥柱。這家公司也將安全性和可靠性團隊完全分開,但安全團隊主管的職位明顯更高,相較而言可靠性團隊中職位最高的員工不過是經理或組長,這也反映了這家公司在這兩支團隊中的“偏重”。
如果無法清晰理解可靠性和安全性之間的相互作用和相互依賴,汽車行業可能會出現一些本可避免的沖突和誤解,進而將顧客置于本不必要的風險之中,或導致自動駕駛系統的成本過高,甚至兩者兼而有之。如果對可靠性過分缺乏信心,或者公司安全性團隊的權力過大,自動駕駛汽車制造商往往會在整個車輛系統中引入大量冗余(包括傳感、控制、動力、制動等)。據估算,一輛普通汽車的電子元器件成本超過 12000 美元,這些設計并不一定可以讓車內人員或整個交通環境更加安全,但卻一定會顯著增加成本。
事實上,我們還可以用另一個很好的例子探討安全性和可靠性之間的差異:那就是如何計算失敗率。從 20 世紀 50 年代到 90 年代,在一些電子硬件公司中,大多數可靠性團隊都是憑經驗來估算故障率。這些手冊只是現場故障數據的簡單匯總,按零件類型(電阻器、電容器、二極管等等)進行區分。盡管概念簡單、使用方便,但多項研究均表明這些手冊在實際產品的應用上非常不準確,整體估算結果偏向保守,也往往因此導致預測的故障率過高。
原因很簡單——這些手冊的分析并不是基于導致失敗真正發生的實際原因。進入 21 世紀之后,大多數有經驗的可靠性領域專業人員也不再僅僅依靠經驗數據來預測失敗率。故障手冊等過時的方法開始被可靠性物理分析(RPA)和加速壽命測試(ALT)等手段取代,這種趨勢在汽車行業中最為明顯。直到 ISO 26262 問世。
避免脫節
作為一項功能安全標準,ISO 26262 將根據“用一定方式計算出的故障率”以及“系統所采取的緩解措施”,預測評估車輛的安全完整性等級(SIL)。與可靠性工程師不同,安全性工程師強烈鼓勵,甚至直接要求將經驗手冊作為 SIL 計算的基礎。這種脫節的原因很明顯——安全性和可靠性分屬兩個獨立團隊,也匯報給不同的管理層,雙方缺乏最基本的溝通,溝通完全脫節,以至安全工程師仍在使用過時的方法來計算故障率。
如果兩個團隊之間不能進行合理的平衡,安全性團隊往往傾向于給出更高的失敗率,并因此要求采取更多的安全分析和安全威脅緩解措施,包括增加冗余等。此外,安全性團隊過分專注于經驗手冊,也會導致他們忽略一些關鍵故障模式,使得安全威脅緩解機制不再有效。
不過,一切仍有改進的機會。無論主營半導體元件、電子模塊還是完整的系統,所有自動駕駛技術價值鏈上的公司都必須認識到,如果一味強調安全,而缺乏一個與之匹配的可靠性流程,這相當于為災難性錯誤打開了大門。
為了避免這種情況,我們第一步可以做的就是打破可靠性和安全性團隊的物理障礙,將這兩支團隊放在同一支領導團隊之下。雙方應同意共同實施最佳做法,包括使用最先進的模擬、建模及可靠性物理學等,為適當且有效的風險識別和緩解奠定基礎。
-
傳感器
+關注
關注
2552文章
51247瀏覽量
754920 -
自動駕駛汽車
+關注
關注
4文章
376瀏覽量
40847
原文標題:可靠性與安全性 — 在自動駕駛汽車研發中如何權衡?
文章出處:【微信號:IV_Technology,微信公眾號:智車科技】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論