華為云 CEO 張平安
11 月 7 日,華為全聯接大會 2022 第一天,華為云 CEO 張平安在主題演講中,專門有一頁 PPT 談到了 GaussDB 信息量很大,不僅特別強調“GaussDB 云原生交易數據庫,給世界一個更優選擇”,同時,還分享了 2 個案例和一些數據。
華為云特別強調“云原生交易數據庫”而非常規的“云原生數據庫”,多出“交易”兩字,不會是無意義的行為,這個小細節上的變化意味著什么?給世界一個更優選擇,是哪些方面更優?背后有怎樣的技術創新?這是本文要探討的重點。
強調“交易”
意味著什么
眾所周知,數據庫按應用方向的不同,主要分為 2 大場景:OLTP(交易)和 OLAP(分析)。從中國市場看,OLTP 仍然是國外廠商占據最大市場份額,是國產化替換的主要市場,反而 OLAP 中國公司有一定商業基礎。
Gartner 預測,“到 2025 年,中國分析型數據庫市場來自海外廠商將只剩下 30%,交易型數據庫市場海外廠商市場也只會剩下 50%左右。”這對國內數據庫廠商而言意味著巨大的市場機會。在這樣的背景下,張平安特別強調“交易”,難道是華為云釋放的將發力 OLTP 場景下的國產替代信號嗎?
數據庫是所有應用的核心組件。大家知道,交易型數據庫是最難的,在關鍵行業的核心應用領域,交易型數據庫基本上都是來自美國的數據庫。演講中,張平安分享了 2 個案例,這兩個案例共同點很顯然,都是交易型場景替換。
一個是華為內部實踐,華為集團流程 ITERP 系統部署 GaussDB 后,各項性能和指標超過預期,采購履行耗時從 90 分鐘下降到 15 秒;端到端訂單履行耗時從 23 分鐘下降到 9 秒;在歷史峰值 5 倍壓力下性能依然穩定不下降。
不要小看這個內部實踐案例,華為集團流程 ITERP 系統是個非常復雜的系統,該系統涉及 170 多個國家和地區,500+外圍應用、3 萬+個外圍集成點,對數據庫容量、性能以及可靠性都有極高要求。如:數據量大,單一個業務場景數據體量就高達百億,而 ERP 總共有上百個業務,且數量還在持續增長;每分鐘 30 萬次庫存查詢請求及數萬筆并發交易事務處理,區別于銀行和互聯網的交易事務,華為 ERP 關聯系統眾多,完成一筆入庫交易比完成一筆秒殺交易在場景復雜度、技術復雜度、外部依賴等方面差異很大,華為 ERP 系統萬級 TPS 比互聯網的百萬級 TPS 更難處理。據了解,該系統底層數據庫過去 20 多年一直使用的是 Oracle,因為眾所周之的原因,現在替換為 GaussDB。
另外一個是郵儲銀行案例,新一代分布式核心系統基于 GaussDB 為全行 6 億多個人客戶提供日均 20 億筆的處理能力,聯機交易處理效率提升 1 倍,批處理效率提升 33%,在 9 月底的三季度結息中,新系統僅用 23 分鐘就完成了原來 Oracle 系統 70 分鐘才能完成的操作。
張平安還提到,“GaussDB 已經在工行、招行、郵儲等大型銀行的核心業務系統上線使用,承擔越來越多的業務負載。基于 GaussDB,新意科技打造了“證券業務核心系統”,服務于興業證券、南方基金等客戶。”
顯然,在 OLTP 場景下,GaussDB 已經可以實現國外數據庫的完全替代,GaussDB 接下來將發力 OLTP 場景下的國產化替代,而金融行業肯定是重點。
如何理解
“更優選擇”
“GaussDB 云原生交易數據庫,給世界一個更優選擇”,這其中“更優選擇”指的哪些方面?華為云的論據是什么?
演講中,張平安說:“為了給全球客戶提供一個更優選擇,華為云全新打造了全球領先的云原生交易數據庫 GaussDB,更快、更穩、更可信。”
顯然,“更優選擇”包含 3 個方面:更快、更穩、更可信。
而這 3 個“更優選擇”,據老魚了解,對標的是“O”記。
更快對應性能,數據顯示,GaussDB 比廠商 O 在公有云上同規格測試快 45%。
更穩對應高可用,華為云去年首先創新推出“同城雙集群”方案,即在兩個數據中心部署兩套獨立的數據庫軟件,任何軟硬件故障完全隔離 RPO 等于 0。
更可信對應安全與自主可控,安全上,GaussDB 內核是目前唯一通過國際 CCEAL4+級認證的國產數據庫。而自主可控上,GaussDB 代碼自研率非常高,其研發歷程可以追溯到 2007 年,投入之大積累之深,國內可比肩的并不多。另外,華為還積極倡導技術開源,深度參與信創數據庫標準制定。因此,說 GaussDB 是一款完全符合國產化和信創標準的數據庫,并不為過。
“更優選擇”
背后的技術創新
為什么 GaussDB 能在性能、高可用、安全 3 個方面做到更優?背后有哪些內核級的技術創新?
高性能方面,從公開的可查詢資料中可以發現,GaussDB 有 2 個方面的關鍵創新:
其一、是存儲引擎,GaussDB 全新上線的 Ustore 存儲引擎,又名 In-placeUpdate 存儲引擎(原地更新),這個存儲引擎在以前的文章中,老魚有過介紹。這是個行存儲引擎,在以前版本的 GaussDB 內核中使用的行存儲引擎是 AppendUpdate(追加更新)模式,追加更新對于業務中的增、刪以及 HOT(HeapOnlyTuple)Update(即同一頁面內更新)有很好的表現,但對于跨數據頁面的非 HOTUPDATE 場景,垃圾回收不夠高效。Ustore 存儲將“有效數據”與“垃圾數據”分離存儲,同時采用多版本索引技術,有效提升了存儲空間的效率和性能。官方數據顯示,相比常規引擎,性能抖動降低 70%,同時,整體性能提升 10%以上。
另一個,是軟硬協同 Numa-Aware,鯤鵬服務器多 CPU-socket 架構下跨 NUMA 內存訪問延遲存在嚴重的不對稱,相比 x86 內存訪問時延高 50%、并發控制原語代價高 2-3 倍,在數據庫中以進一步惡化 OLTP 瓶頸,此外鯤鵬架構下 CPU 物理核心數相比 x86 有了大規模的提升,如何優化 NUMA 帶來的訪問時延問題,如何充分利用眾核 CPU 解決并發控制問題成為了鯤鵬上優化數據庫 OLTP 負載性能的主要挑戰。因此,軟硬協同 Numa-Aware 應運而生,通過內核線程調度 NUMA 親和、關鍵數據 NUMA 化分布、LSEARM 指令級性能優化等關鍵技術優化,GaussDB 實現了鯤鵬環境下性能 40%以上的提升。
據內部人士透露,2021 年,在 21 個金融政府大客戶(涵蓋銀行、保險、公安、大型國企等)現場 POC 測試中,GaussDB 在性能上平均領先對手 50%,在人行、郵儲等 POC 測試中,更是完勝競品。
高可靠方面,當前談的比較多的是通過一套數據庫集群拉遠,通過不斷增加數據中心的方式,來提高可用性。從同城兩中心到兩地三中心,再到三地五中心,但是實際很少有應用企業能提供類似三地五中心這么高規格的基礎設施,“中心”增加帶來的可靠性收益逐步降低。
華為云認為,不管幾個中心,只要整體一套軟件(集群),就無法做到軟硬件故障的完全隔離。數據庫軟件 bug,導致即使有同城備中心,切換也沒有用,因為備中心是同一套軟件。
去年底,GaussDB 首先創新推出了“同城雙集群”方案,這是一個重大的內核新特性。簡單的說,就是同城的兩個數據中心完全部署兩套獨立的數據庫軟件,任何軟硬件故障完全隔離,支持版本輪換升級、應用灰度升級,主中心升級時應用還可以訪問備中心正常開展業務,支持 RPO=0、RTO<60s 的同城雙集群切換,盡最大可能保障企業用戶的核心業務 7x24 小時無中斷。老魚獲悉,今年,這個方案已經在工商銀行的 5A 級核心全球信貸系統完成上線,并聯合工行向其他銀行進行規模推廣。
高安全方面,就在上月,GaussDB 成為中國首個獲得國際 CCEAL4+級別認證的數據庫產品。很多人可能不知道 CCEAL4+意味著什么?CC 認證是國際公認計算機維度的高級別安全認證,也是國際范圍內 30 多個國家官方認可的通用標準。其中,EAL4+認證難度有多大?對比目前國外常見數據庫主流版本通過的 EAL2 認證來說,EAL2 為結構測試級,開發者可遞交設計信息、測試結果進行評估,而 EAL4 作為系統設計、測試和復查級,評估程序更為嚴謹,有對評估對象模塊底層設計和實現子集的分析,更有對產品代碼的審視和對產品研發環境的站點審計等。
而 GaussDB 能拿到 CCEAL4+主要的關鍵技術有 2 個:全密態和防篡改。這方面最近披露的資料比較多,就不在這里過多贅述,需要強調的是,2022 年 GaussDB 由純軟全密態全新升級為軟硬結合全密態,據說相比競品純硬件方案性能優 20%。另外,GaussDB 還是業內首個以最高分通過信通院防篡改數據庫基礎能?評測的數據庫產品。
公開資料顯示,目前,GaussDB 已經在超過 2500 家大客戶得到了商用,遍布金融、電商、游戲、汽車、制造、能源等各行各業。尤其是金融行業,已經在工行、招行、郵儲銀行等 30 多家金融企業的核心業務系統中廣泛應用,GaussDB 通過這些案例,不論是技術本身,還是去 O 的方法論,都得到了較充分的實踐。所以,在明確對比對象和具體指標前提下,GaussDB 說自己是更優選擇,沒毛病。不得不說,華為云還是一如既往的嚴謹,用“更優選擇”而非“最優選擇”,這是相對與絕對的區別。
審核編輯:湯梓紅
-
云計算
+關注
關注
39文章
7824瀏覽量
137450 -
數據庫
+關注
關注
7文章
3807瀏覽量
64421 -
華為云
+關注
關注
3文章
2540瀏覽量
17441
發布評論請先 登錄
相關推薦
評論