在計算機領域,如果是初入行就算了,如果是多年的老碼農還不懂 CAP 定理,那就真的說不過去了。CAP可是每一名技術架構師都必須掌握的基礎原則啊。
現在只要是稍微大一點的互聯網項目都是采用 分布式 結構了,一個系統可能有多個節點組成,每個節點都可能需要維護一份數據。那么如何維護各個節點之間的狀態,如何保障各個節點之間數據的同步問題就是大家急需關注的事情了。
CAP定理是分布式系統中最基礎的原則。所以理解和掌握了CAP,對系統架構的設計至關重要。
一、什么是 CAP?
「 CAP定理 」又被稱為 布魯爾定理,它提出對于一個分布式系統而言,不能同時滿足以下三點:
Consisteny(一致性)
Availability(可用性)
Partition tolerance(分區容錯性)
也就是說CAP定理指明了,任何分布式系統只能同時滿足這三項中的兩項。
如上圖,如果是最多同時滿足兩項,那我們可以有三個組合:CA、CP、AP。在聊這三個組合之前,我們先分別看一下 Consisteny(一致性)、Availability(可用性)、Partition tolerance(分區容錯性)的含義。
假設某個系統當前有兩個節點A和B,兩個節點分別可以由Actor進行讀寫,兩個節點之間的數據會自動完成同步。
Consisteny(一致性)
一致性的要求是指,對于任何客戶端(上圖Actor)來說,每次的讀操作,都能獲得最新的數據。即,當有客戶端向A節點寫入了新數據之后,其它客戶端從B節點中進行讀操作所獲得的數據必須也是最新的,是與A節點數據保持一致的。
Availability(可用性)
可用性的要求是指,每個請求都能在合理的時間內獲得符合預期的響應(不保證獲取的結果是最新的數據)。
按照上圖來看就是,客戶端只要向A節點或B節點發起請求后,只要這兩個節點收到了請求,就必須響應給客戶端,但不需要保證響應的值是否正確。
Partition tolerance(分區容錯性)
分區容錯性是指,當節點之間的網絡出現問題之后,系統依然能正常提供服務。
講完了C、A、P的含義和要求,我們繼續來看看它們之間如何組合使用。
二、CAP 怎么應用?
先把視野回到這張圖上:
雖然我們知道有 CA、CP、AP 三種組合方式,但是在分布式系統的結構下,網絡是不可能做到100%可靠的。既然網絡不能保證絕對可靠,那 P(分區容錯性)就是一個必選項了。原因如下:
如果選擇 CA組合,放棄 P(分區容錯性)。還是以最上面的圖中A和B節點來舉例,當發生節點間網絡故障時,為了保證 C(一致性),那么就必須將系統鎖住,不允許任何寫入操作,否者就會出現節點之間數據不一致了。但是鎖住了系統,就意味著當有寫請求進來的時候,系統是不可用的,這一點又違背了 A(可用性)原則。
因此分布式系統理論上是不可能有CA組合的,所以我們只能選擇 CP 和 AP組合架構。
下面我們來詳細看一下 CP架構 和 AP架構的特點:
CP 架構
CP架構即 Consisteny(一致性)與 Partition tolerance(分區容錯性)的組合。
如上圖,由于網絡問題,節點A和節點B之前不能互相通訊。當有客戶端(上圖Actor)向節點A進行寫入請求時(準備寫入Message 2),節點A會不接收寫入操作,導致寫入失敗,這樣就保證了節點A和節點B的數據一致性,即保證了Consisteny(一致性)。
然后,如果有另一個客戶端(上圖另一個Actor)向B節點進行讀請求的時候,B請求返回的是網絡故障之前所保存的信息(Message 1),并且這個信息是與節點A一致的,是整個系統最后一次成功寫入的信息,是能正常提供服務的,即保證了Partition tolerance(分區容錯性)。
上述情況就是保障了CP架構,但放棄了Availability(可用性)的方案。
AP 架構
AP架構即 Availability(可用性)與 Partition tolerance(分區容錯性)的組合架構。
如上圖,由于網絡問題,節點A和節點B之前不能互相通訊。當有客戶端(上圖Actor)向節點A進行寫入請求時(準備寫入Message 2),節點A允許寫入,請求操作成功。但此時,由于A和B節點之前無法通訊,所以B節點的數據還是舊的(Message 1)。當有客戶端向B節點發起讀請求時候,讀到的數據是舊數據,與在A節點讀到的數據不一致。但由于系統能照常提供服務,所以滿足了Availability(可用性)要求。
因此,這種情況下,就是保障了AP架構,但其放棄了 Consisteny(一致性)。
三、CAP 注意事項?
了解了CAP定理后,對于開發者而言,當我們構建服務的時候,就需要根據業務特性作出權衡考慮,哪些點是當前系統可以取舍的,哪些是應該重點保障的。
即使是在同一個系統中,不同模塊的數據可能應用的CAP架構都是不同的。舉個例子,在某個電商系統中,屬于用戶模塊的數據(賬密、錢包余額等)對一致性的要求很高,就可以采用CP架構。而對于一些商品信息方面的數據對一致性要求沒那么高,但為了照顧用戶體驗,所以對可用性要求更高一些,那么這個模塊的數據就可以采用AP架構。
另外,雖然上面第二節講到過我們只能選擇CP和AP,無法選擇CA。但這句話成立的前提條件是在系統發生了網絡故障的情況下。然而,網絡故障的概率在系統的整個生命周期中占比是很小的,因此我們在設計的時候,雖然要考慮網絡問題下的方案,但也要考慮網絡正常情況下的方案,即在網絡正常情況下,CA是可以實現的,我們也需要去保證在絕大多數時間下的CA架構。
再者,即使我們按照CAP定理,三個中只能取其二,但不代表我們只需要保障其中的兩點,而完全的放棄第三點,我們應該為不能保障的第三點也做一些防備措施或者冗余方案,來使系統更加的完善健全。
以上,就是對CAP定理的一些思考。
-
CP
+關注
關注
3文章
35瀏覽量
25638 -
CAP平臺
+關注
關注
0文章
4瀏覽量
8331
原文標題:架構設計之「 CAP 定理 」
文章出處:【微信號:LinuxHub,微信公眾號:Linux愛好者】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論