今年6月,達夢數據成功在科創板上市,成為國產數據庫第一股。達夢數據庫經過幾十年的發展,始終堅持自主研發,原始創新,依托達夢一套代碼根,不斷滿足各行各業客戶對數據庫的需求,走出了一條中國數據庫自主發展之路。
數據庫選擇集中式還是分布式是一個長盛不衰的話題,一些客戶可能也會糾結該怎么選。在第15屆中國數據庫技術大會(DTCC2024)上,達夢數據產品服務中心總經理黃海明帶來《達夢集中式與分布式一體化新型集群架構的創新與應用實踐》的主題演講,分享達夢數據的思考和創新實踐,達夢數據庫集中式與分布式一體化架構,給企業更好的選擇。
達夢在關系型數據庫兩種主要架構的創新突破
黃海明認為,現在關系型數據庫重點有兩種,一種是集中式的共享存儲集群架構,一種是分布式架構,分別有各自的適用場景。現在兩種架構被炒作成了路線之爭,這是非理性的,希望大家能夠放下路線之爭,回歸理性,回歸需求,選擇合適的數據庫產品。
作為全棧數據產品和解決方案提供商,達夢依托一套代碼根(Code Base),在共享集群架構和分布式架構方面不斷創新突破。
在達夢數據共享集群(DM DSC)方面,通過在數據庫內核層面重構迭代,依托自研的共享文件系統DMASM,已支持ASM鏡像和條帶化及數據親和性的負載均衡功能。現在DM8共享存儲集群突破了8節點,結合達夢主備技術,具備金融級同城雙中心和兩地三中心的高可用解決方案,異地容災對標MAA,故障切換時間最快可以做到5秒以內。
目前,達夢數據共享集群在黨政、金融、軌道交通、能源等關鍵行業的核心系統得到深入應用,比如應用在國網調控云、某大型央企超大型ERP系統、梅州客商銀行核心系統、某千萬級人口大城市地鐵互聯網檢售票系統等領域,具備大規模商用能力。
其中,某千萬級人口大城市地鐵互聯網檢售票系統要求生產中心和災備中心對等建設,其ACC系統(清分中心)和iAFC系統(互聯網自動售檢票系統)各自采用達夢數據共享集群4節點+4節點形成同城雙中心,完成了對Oracle高端一體機的平滑替代。
在分布式數據庫(DM DPC)方面,達夢也早有布局,從MPP架構起步,逐步發展為存算分離的原生分布式架構,可有效支持HTAP混合負載,具備多副本高可靠,基于RAFT協議保證強一致,可以靈活擴縮容。其最大的特點是繼承了達夢單機庫強大的SQL能力、兼容性和成熟的優化器。優化器是數據庫的核心,達夢可以把SQL優化能力從集中式數據庫很平滑地遷移到分布式數據庫產品里,為客戶提供成熟穩定、移植和學習成本低的分布式數據庫解決方案。
黃海明重點分享了達夢分布式數據庫在福建移動大數據、某新一線城市全民醫療健康系統的應用,福建移動大數據成功替換了TeraData Aster和GreenPlum。某新一線城市全民醫療健康系統是今年上線的HTAP混合負載業務,其業務涉及面大,其中便民服務系統面向覆蓋2500多萬人口,系統數據庫查詢并發量高峰時期超過5000,日常大約2000,對數據庫提出了很高的要求,需要高并發、高可靠,且要求主要服務響應時間3秒內,需要數據庫具備海量數據復雜統計分析能力,達夢分布式數據庫提供了很好的支持。
集中式數據庫和分布式數據庫在架構上存在差異,在部署和運維方面也存在很大差異,給用戶選型增加了困難,達夢數據庫集中式分布式一體化架構讓大家不必糾結,給用戶更好的選擇。
一套“代碼根”長出的一體化新型集群架構
達夢數據認為,集中式和分布式一體化融合架構才是數據庫發展趨勢,達夢數據庫是統一內核,依托同一套代碼根,可以根據用戶的需求靈活部署成集中式或分布式。
黃海明介紹,達夢的一體化體現在以下兩個方面:
一方面,依托一套內核代碼根DM8,達夢數據實現了集中式和分布式的一體化架構。可以根據業務需求靈活部署成集中式或分布式,提供統一的語法、編程接口及運維管理,為用戶提供統一良好的體驗,不用再糾結到底該選分布式還是集中式。
另一方面,進一步在底層融合分布與集中式。集中式和分布式并不是兩個技術路線,兩種架構都是在關系型數據庫的范疇,達夢數據庫在一套代碼根中生長出來的集中式和分布式是一脈相承的,很多技術都可以復用。比如,Raft共識算法不僅用在分布式架構上,也基于Raft協議實現了主備集群。還有集中式數據分區與分布式數據分片融合。集中式和分布式優化器共用,可以處理非常復雜的SQL。高度代碼復用,也能有更好的質量控制保障。
“達夢最大底氣在于所有的代碼都是我們自己寫的,我們能最大程度上復用代碼,減少干擾。”黃海明說。
達夢數據庫集中分布式一體化架構有不少獨特之處,比如可以實現存算一體和存算分離自適應,以滿足不同業務場景需求。密集交易型的業務,需要低延遲,精確命中業務負載,可以把計算節點和存儲節點融合,業務直接連接存儲節點減少了一層網絡交互,可以有效提高性能和吞吐量。對于CPU密集型分析型應用,可以采用計算節點和存儲節點分離的模式,提高業務處理效率。對于高可用容災要求比較高的業務負載也推薦采用計算和存儲分離模式,提高可靠性。
黃海明認為,與競品相比,達夢數據庫的一體化架構差異體現在對特定業務需求的適配性、技術實現的細節以及性能優化的策略等方面。其優勢在于更高的性能表現、更強的穩定性、更便捷的運維管理,以及對國產軟硬件環境的良好支持等。
達夢數據庫集中分布式一體化架構通過數據庫內核底層對集中式、分布式的最大程度融合,提供平滑過渡能力、統一的開發和運維體驗,盡可能屏蔽掉架構的差異和復雜性,讓客戶可以根據業務場景靈活選擇合適的部署方式。目前,其一體化架構也獲得了越來越多客戶的認可。某運營商O域+B域相關系統就采用該方式部署,除容器云管理平臺采用單實例部署以外,大數據分析系統、數據集市系統均采用達夢分布式集群部署,移動辦公系統、動力網管系統采用集中式共享存儲集群部署。這種靈活的部署方式讓用戶可以更自由選擇,最高記錄1個月內就陸續上線了8套系統。
小結:自主可控的“代碼根”是創新的本錢
國產數據庫的未來在于創新,創新需要不斷“折騰”,其中難免要經歷試錯。從集中式架構共享存儲集群的突破,到原生分布式架構,再到集中式分布式一體化,達夢數據能夠根據市場需求不斷創新突破,關鍵在于有一套自主可控的“代碼根”,正如黃海明所說:“萬丈高樓平地起,打好地基是前提,要持續不斷地創新,一個可控的‘代碼根’才是‘折騰’的本錢。”
審核編輯 黃宇
-
數據庫
+關注
關注
7文章
3826瀏覽量
64507 -
分布式
+關注
關注
1文章
910瀏覽量
74559 -
代碼
+關注
關注
30文章
4802瀏覽量
68740
發布評論請先 登錄
相關推薦
評論