------ 【導(dǎo)讀】------
在一篇恐慌中給你一點(diǎn)安全感。樹(shù)莓派,我們不一樣!
過(guò)去幾天,對(duì) Meltdown 和 Spectre 安全漏洞的討論甚囂塵上。該漏洞影響了所有的現(xiàn)代英特爾處理器,Spectre 還影響了 AMD 處理器和 ARM 內(nèi)核。Spectre 漏洞使得攻擊者可以繞過(guò)軟件檢查讀取當(dāng)前地址空間中的任意位置數(shù)據(jù);Meltdown 漏洞使得攻擊者可以讀取操作系統(tǒng)核地址空間的任意位置數(shù)據(jù)(用戶程序通常不可訪問(wèn)該數(shù)據(jù))。這兩種漏洞皆通過(guò)邊信道攻擊(side-channel attack)利用很多現(xiàn)代處理器都有的性能特征(緩存和推測(cè)執(zhí)行)泄漏數(shù)據(jù)。近日,樹(shù)莓派創(chuàng)始人 Eben Upton 稱樹(shù)莓派不受這些漏洞的影響,并撰文詳解其原因。
谷歌 Project Zero 團(tuán)隊(duì)發(fā)現(xiàn)的漏洞分別被稱為「Meltdown」和「Specter」。這些漏洞允許惡意程序從其它程序的內(nèi)存中竊取信息,這意味著惡意程序可以監(jiān)聽(tīng)密碼、賬戶信息、密鑰及理論上存儲(chǔ)在進(jìn)程中的任何內(nèi)容。
其中,「Meltdown」影響英特爾處理器,它打破了用戶應(yīng)用程序和操作系統(tǒng)之間最基本的隔離。這種攻擊允許程序訪問(wèn)其它程序和操作系統(tǒng)的內(nèi)存,這可能導(dǎo)致數(shù)據(jù)泄露。而「Spectre」除了能影響英特爾處理器外,還能影響 AMD 與 ARM 架構(gòu)的大量處理器,這意味著除服務(wù)器與個(gè)人電腦以外,智能手機(jī)等終端設(shè)備也會(huì)受到影響,幾乎所有現(xiàn)代計(jì)算機(jī)處理器均無(wú)法幸免。它打破了不同應(yīng)用程序之間的隔離,這意味著,攻擊者可以使用惡意程序來(lái)獲取被隔離的私有數(shù)據(jù)。
英特爾近日表示,在未來(lái)數(shù)周內(nèi)將有軟件補(bǔ)丁發(fā)布。盡管大多數(shù) PC 用戶不會(huì)受到影響,但安全補(bǔ)丁會(huì)導(dǎo)致處理器 0-30% 的運(yùn)算速度下降。
根據(jù)Eben Upton所述,大量類似樹(shù)莓派的廉價(jià)計(jì)算設(shè)備可能同樣也不會(huì)受到兩種安全漏洞的影響,包括很多低端安卓手機(jī)。
本文介紹現(xiàn)代處理器設(shè)計(jì)的一些概念,使用簡(jiǎn)單的 Python 程序解釋這些概念,比如:
t = a+b u = c+d v = e+f w = v+g x = h+i y = j+k
盡管你的計(jì)算機(jī)處理器不會(huì)直接執(zhí)行 Python,但這里的語(yǔ)句足夠簡(jiǎn)單,大致相當(dāng)于簡(jiǎn)單的機(jī)器指令。本文不詳述過(guò)多處理器設(shè)計(jì)中的重要細(xì)節(jié)(主要是 pipelining 和寄存器重命名),它們對(duì)理解 Spectre 和 Meltdown 的工作原理不太重要。
想全面了解處理器設(shè)計(jì)和現(xiàn)代計(jì)算機(jī)架構(gòu),可參閱 Hennessy 和 Patterson 的經(jīng)典著作《Computer Architecture: A Quantitative Approach》。
什么是標(biāo)量處理器?
最簡(jiǎn)單的現(xiàn)代處理器每次循環(huán)執(zhí)行一個(gè)指令,我們稱之為標(biāo)量處理器。上述示例在標(biāo)量處理器上需要執(zhí)行六次循環(huán)。
樹(shù)莓派 1 和樹(shù)莓派 Zero 中使用的 Intel 486 和 ARM1176 都是標(biāo)量處理器。
什么是超標(biāo)量處理器?
很明顯,加速標(biāo)量處理器的方式就是提高其時(shí)鐘頻率(clock speed)。但是,我們很快就到達(dá)處理器內(nèi)部邏輯門運(yùn)行的極限;因此處理器設(shè)計(jì)人員開(kāi)始尋找一次性處理多件事情的方式。
有序超標(biāo)量處理器檢查收到的大批指令,嘗試在一個(gè) pipeline 中一次性執(zhí)行多個(gè)指令,這取決于指令之間的依賴關(guān)系。依賴關(guān)系很重要:你或許認(rèn)為雙向超標(biāo)量處理器可以將 6 個(gè)指令配對(duì)執(zhí)行,如下所示:
t, u = a+b, c+d v, w = e+f, v+g x, y = h+i, j+k
但是這沒(méi)有作用:我們必須先計(jì)算 v 再計(jì)算 w,即第三個(gè)和第四個(gè)指令無(wú)法同時(shí)執(zhí)行。雙向超標(biāo)量處理器實(shí)際上無(wú)法找到與第三個(gè)指令配對(duì)的指令,因此,該示例將執(zhí)行四個(gè)循環(huán):
t, u = a+b, c+d v = e+f # second pipe does nothing here w, x = v+g, h+i y = j+k
超標(biāo)量處理器包括 Intel Pentium 以及樹(shù)莓派 2 和樹(shù)莓派 3 分別使用的 ARM Cortex-A7 和 Cortex-A53。樹(shù)莓派 3 的時(shí)鐘頻率只比樹(shù)莓派 2 高 33%,但性能大約是后者的 2 倍:部分原因在于 Cortex-A53 超出 Cortex-A7 的對(duì)大量指令的配對(duì)執(zhí)行能力。
什么是無(wú)序處理器(out-of-order processor)?
回到我們的示例,我們可以看到即使 v 和 w 之間存在依賴關(guān)系,我們也可以找到其他獨(dú)立的指令填補(bǔ)第二次循環(huán)中空的 pipe。無(wú)序超標(biāo)量處理器能夠打亂指令的順序(同樣受限于指令之間的依賴關(guān)系)以保持每個(gè) pipeline 都處于忙碌狀態(tài)。
無(wú)序處理器可以有效交換 w 和 x 的順序:
t = a+b u = c+d v = e+f x = h+i w = v+g y = j+k
允許執(zhí)行三次循環(huán):
t, u = a+b, c+d v, x = e+f, h+i w, y = v+g, j+k
無(wú)序處理器包括 Intel Pentium 2(以及大部分后續(xù) Intel 和 AMD x86 處理器,除了一些 Atom 和 Quark 設(shè)備)和很多近期的 ARM 處理器,如 Cortex-A9、-A15、-A17、-A57。
什么是分支預(yù)測(cè)器(branch predictor)?
上述示例是直線式代碼塊。真正的程序不是這樣的:他們還包括正向分支(用于實(shí)現(xiàn)條件運(yùn)算,如 if 語(yǔ)句)、反向分支(用于實(shí)現(xiàn) loop)。分支可能是無(wú)條件的(通常被采用),也可能是有條件的(是否采用取決于計(jì)算值)。
獲取指令時(shí),處理器可能遇到依賴于計(jì)算值的條件分支(而該值目前尚未計(jì)算出)。為了避免停頓,處理器必須猜測(cè)下一個(gè)要獲取的指令:內(nèi)存順序(對(duì)應(yīng)未采用分支)或分支目標(biāo)(對(duì)應(yīng)采用分支)上的下一個(gè)指令。分支預(yù)測(cè)器通過(guò)收集某一個(gè)分支之前被采用頻率的相關(guān)統(tǒng)計(jì)數(shù)據(jù),幫助處理器猜測(cè)該分支是否被采用。
現(xiàn)在分支預(yù)測(cè)器非常復(fù)雜,可以生成非常準(zhǔn)確的預(yù)測(cè)。樹(shù)莓派 3 的額外性能部分是由于 Cortex-A7 和 Cortex-A53 之間分支預(yù)測(cè)的改進(jìn)。但是,攻擊者也可以通過(guò)執(zhí)行精心設(shè)計(jì)的一系列分支,誤訓(xùn)練分支預(yù)測(cè)器作出較差的預(yù)測(cè)。
什么是推測(cè)?
重排序順序指令(reordering sequential instruction)是一種恢復(fù)指令級(jí)別并行化的強(qiáng)大方法,但是由于處理器變得更寬(能夠一次執(zhí)行三個(gè)或四個(gè)指令),保證所有 pipeline 處于忙碌狀態(tài)變得更難了。因此,現(xiàn)代處理器提高了推測(cè)能力。推測(cè)執(zhí)行可以處理并不需要的指令:這樣就可以保證 pipeline 處于忙碌狀態(tài),如果最后該指令沒(méi)有被執(zhí)行,我們只需要放棄結(jié)果就可以了。
推測(cè)執(zhí)行不必要的指令(以及支持推測(cè)和重排序的基礎(chǔ)架構(gòu))需要耗費(fèi)大量能源,但是在很多情況下為了獲取單線程性能的提升,這種方法是值得的。分支預(yù)測(cè)器用于選擇通過(guò)程序最可能的路徑,最大化推測(cè)獲得收益的可能性。
為了展示推測(cè)的好處,我們可以看一下另一個(gè)示例:
t = a+b u = t+c v = u+d if v: w = e+f x = w+g y = x+h
現(xiàn)在,我們具備從 t 到 u 到 v、從 w 到 x 到 y 的依賴關(guān)系,那么沒(méi)有推測(cè)的雙向無(wú)序處理器無(wú)法填充第二個(gè) pipeline。它用三次循環(huán)來(lái)計(jì)算 t、u 和 v,之后處理器知道 if 語(yǔ)句的主體是否被執(zhí)行,然后用三次循環(huán)來(lái)計(jì)算 w、x 和 y。假設(shè) if(由一個(gè)分支指令實(shí)現(xiàn))使用了一次循環(huán),那么該示例可以執(zhí)行四次(v 是零)或七次循環(huán)(v 不是零)。如果分支預(yù)測(cè)器表明 if 語(yǔ)句的主體很可能被執(zhí)行,那么推測(cè)可以有效打亂程序,如下:
t = a+b u = t+c v = u+d w_ = e+f x_ = w_+g y_ = x_+h if v: w, x, y = w_, x_, y_
因此現(xiàn)在我們有了額外的指令級(jí)別的并行來(lái)保持 pipeline 繁忙:
t, w_ = a+b, e+f u, x_ = t+c, w_+g v, y_ = u+d, x_+h if v: w, x, y = w_, x_, y_
循環(huán)計(jì)數(shù)在推測(cè)性無(wú)序處理器中變得不太明確,但是 w、x 和 y 的分支和條件更新(幾乎)是空閑的,因此上述示例幾近于執(zhí)行三個(gè)循環(huán)。
什么是緩存?
在過(guò)去,處理器速度與內(nèi)存訪問(wèn)速度成正比。我的 BBC Micro(2MHz 6502),可以每 2μs(微秒)執(zhí)行一次指令,存儲(chǔ)周期為 0.25μs。在接下來(lái)的 35 年中,處理器已經(jīng)變的非常快,但是內(nèi)存幾乎沒(méi)變化:樹(shù)莓派 3 中的一個(gè) Cortex-A53 可以每 0.5ns(納秒)執(zhí)行一次指令,但是可能需要 100ns 才能訪問(wèn)主存。
a = mem[0] b = mem[1]
需要 200ns。
但在實(shí)踐中,程序傾向于以相對(duì)可預(yù)測(cè)的方式訪問(wèn)內(nèi)存,同時(shí)展示時(shí)間局部性(如果我訪問(wèn)一個(gè)定位,我很可能很快再次訪問(wèn)它)和空間局部性(如果我訪問(wèn)一個(gè)定位,我很可能很快訪問(wèn)附近的位置)。緩存利用這些屬性來(lái)降低訪問(wèn)內(nèi)存的平均成本。
緩存是一個(gè)小的片上內(nèi)存,接近于處理器,存儲(chǔ)最近使用的位置(及其近鄰)內(nèi)容的副本,以便在隨后的訪問(wèn)中可以快速獲取。借助緩存,上述示例的執(zhí)行將稍微超過(guò) 100ns:
a = mem[0] # 100ns delay, copies mem[0:15] into cache b = mem[1] # mem[1] is in the cache
從 Spectre 和 Meltdown 的角度來(lái)看,最重要的一點(diǎn)是你可以對(duì)內(nèi)存訪問(wèn)的時(shí)間進(jìn)行計(jì)時(shí),你可以知道訪問(wèn)的地址是在緩存之中(短時(shí))或者不在(長(zhǎng)時(shí))。
什么是邊信道?
來(lái)自維基百科:
「邊信道攻擊是基于從密碼系統(tǒng)的物理實(shí)現(xiàn)獲得的信息的任何攻擊,而不是算法中的蠻力或理論弱點(diǎn)(相較于密碼分析學(xué))。例如,定時(shí)信息、功耗、電磁泄漏甚至聲音都可以提供額外的信息源,這些信息可被用來(lái)破解系統(tǒng)。」
Spectre 和 Meltdown 屬于邊信道攻擊,通過(guò)定時(shí)來(lái)觀察緩存中是否有另一個(gè)可訪問(wèn)的位置,以推斷內(nèi)存位置的內(nèi)容,這些內(nèi)容通常不應(yīng)該被訪問(wèn)。
把它放在一起:
現(xiàn)在讓我們看看如何結(jié)合推測(cè)和緩存以允許類似 Meltdown 的攻擊。考慮下面這個(gè)示例,它是一個(gè)有時(shí)讀取所有非法(內(nèi)核)地址的用戶程序,并導(dǎo)致錯(cuò)誤(崩潰):
t = a+b u = t+c v = u+d if v: w = kern_mem[address] # if we get here, fault x = w&0x100 y = user_mem[x]
現(xiàn)在,假設(shè)我們可以訓(xùn)練分支預(yù)測(cè)器,使其相信 v 很可能是非零的,那么我們的無(wú)序雙向超標(biāo)量處理器就會(huì)混洗程序,像這樣:
t, w_ = a+b, kern_mem[address] u, x_ = t+c, w_&0x100 v, y_ = u+d, user_mem[x_] if v: # fault w, x, y = w_, x_, y_ # we never get here
即使處理器總是推測(cè)性地讀取內(nèi)核地址,它必須推遲產(chǎn)生的錯(cuò)誤,直到知道 v 是非零。從表面上看,這是安全的,因?yàn)椋?/p>
v 是零,所以非法讀取的結(jié)果不會(huì)被提交給 w
v 是非零,但在讀取結(jié)果被提交給 w 之前發(fā)生了錯(cuò)誤
然而,假設(shè)我們?cè)趫?zhí)行代碼之前刷新緩存,并排列 a、b、c、d 以使 v 實(shí)際上為零。現(xiàn)在第三個(gè)循環(huán)中的推測(cè)性讀取為:
v, y_ = u+d, user_mem[x_]
其將依賴非法讀取結(jié)果的第八位獲取用戶地址 0x000 或 0x100,并把地址及其近鄰加載進(jìn)緩存。由于 v 是零,推測(cè)性指令的結(jié)果將被擯棄,執(zhí)行將繼續(xù)。如果我們隨后訪問(wèn)其中一個(gè)地址,就可以決定哪個(gè)地址在緩存之中。恭喜:你剛剛從內(nèi)核地址空間讀取了一個(gè)位!
真正的 Meltdown 實(shí)際上要比這更復(fù)雜(特別是,為了避免錯(cuò)誤訓(xùn)練分支預(yù)測(cè)器,作者無(wú)條件地優(yōu)先執(zhí)行非法讀取,并處理產(chǎn)生的異常),但原理是相同的。Spectre 使用相似方法來(lái)顛覆軟件陣列邊界檢查。
結(jié)論
現(xiàn)代處理器竭盡全力保持抽象,從而成為直接訪問(wèn)內(nèi)存的有序標(biāo)量機(jī)器,而事實(shí)上,使用包括緩存、指令重排序和推測(cè)在內(nèi)的大量技術(shù)來(lái)提供比簡(jiǎn)單處理器更高的性能有望成為現(xiàn)實(shí)。Meltdown 和 Spectre 就是當(dāng)我們?cè)诔橄蟮恼Z(yǔ)境中推理安全性,然后在抽象與現(xiàn)實(shí)之間遇到細(xì)微差別時(shí)會(huì)發(fā)生的事情的實(shí)例。
樹(shù)莓派使用的 ARM1176、Cortex-A7 和 Cortex-A53 內(nèi)核中推測(cè)的缺失使我們免于此類攻擊。
-
處理器
+關(guān)注
關(guān)注
68文章
19400瀏覽量
230744 -
內(nèi)核
+關(guān)注
關(guān)注
3文章
1382瀏覽量
40371 -
漏洞
+關(guān)注
關(guān)注
0文章
204瀏覽量
15404
原文標(biāo)題:處理器高危漏洞無(wú)人幸免?樹(shù)莓派:我們不受影響
文章出處:【微信號(hào):mcuworld,微信公眾號(hào):嵌入式資訊精選】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論