當前,金融等重點行業都在進行數字化轉型,而分布式數據庫作為數據承載工具,為數字化轉型提供了有力的支撐。分布式數據庫近年來發展迅猛,在產品成熟度上有了很大提升,但在行業應用和生態建設上仍有很多挑戰。本文分析了分布式數據庫發展情況、分布式數據庫應用的主要問題,從行業應用的角度給出了分布式數據庫發展的建議。
一、發展情況
過去三十年,以金融業為代表的核心信息系統架構依托 IOE(即 IBM、Oracle、EMC)技術,構建了一套集中、專用、封閉的穩態技術體系。但是,隨著互聯網及云化時代的到來,企業業務架構產生巨大變化,以銀行為代表的金融業需加速構建敏態體系,推動底層數據庫的分布式改造和互聯網金融業務創新。分布式數據庫具有滿足行業關鍵應用的高擴展性、高性能、高可用性及軟硬件解耦等特性,是金融等重點行業信息系統數字化轉型的基石。
(一)產品成熟度提升
隨著分布式數據庫在金融等重點行業的不斷應用,產品成熟度得到很大提升。一是新技術的不斷發展使得分布式數據庫在自身固有的優勢領域,如擴展性、高可用等方面進一步強化,已有多個應用在重點行業核心業務中落地。二是國產分布式數據庫的性能已經實現了與其他商業數據庫持平甚至超越,這在多個大型企業機構產品準入測試及業內國際基準測試(如在線交易場景 TPCC、在線分析場景 TPCH 等)中得到充分證明,可對行業核心業務起到重要的支撐作用。三是更多廠商開始提供對主流國產分布式數據庫的功能支持,產品的兼容性取得顯著進展。管理控制軟件、遷移工具等配套設施逐漸完善,極大地降低了數據庫的使用門檻和遷移成本。
(二)生態逐步完善
一是加快推動分布式數據庫在重點行業落地,主流分布式數據庫廠商紛紛與眾多大型銀行、企業等開展聯合創新活動,取得了許多突破性的成果。以某廠商的分布式數據庫為例,在與大型商業銀行的聯創過程中,已完成 10 個以上業務系統的分布式數據庫替換,覆蓋銀行 A 類到 C 類全場景業務。二是通過一站式的遷移解決方案,實現以較小的業務改造工作量從傳統數據庫向分布式數據庫轉型,遷移成本相對較低。而且使用分布式數據庫后,業務系統運行穩定,可靠性和擴展性有所增強,從各項指標看,已基本具備承接 Oracle 及 DB2 大機下移的能力。三是分布式數據庫相關的行業標準和評價體系逐步健全,對產品發展起到較強的規范引領作用。
(三)總體發展情況向好
當前國產分布式數據庫已經渡過了“能用”階段,正在邁向“好用、易用”階段。橫向來看,我國分布式數據庫的發展基本與國際同步,tpcc、sysbench 等性能指標和 RTO、RPO 等可靠性指標甚至具有優勢,在應用領域取得些許領先。縱向來看,以金融業為例,分布式數據庫應用取得較大進展,不管是在互聯網新核心業務,還是傳統核心業務中,分布式數據庫行業應用落地數量大幅增加,有逐步替代集中式數據庫的趨勢。
二、面臨的主要問題
(一)主體改造意愿不強,行業實踐尚不充分
一方面,原有數據庫系統改造為分布式數據庫,對用戶及應用單位提出了較高的要求。改造所面臨的成本問題,以及改造完成后分布式運維實施的復雜性,使得部分金融機構對于全面應用分布式還存在有一定的疑慮,主動改造意愿不強。另一方面,分布式數據庫在行業典型應用場景中的落地仍處于摸索階段。由于部分項目中存在一定的需求定制化,應用解決方案與產品的邊界不夠清晰,產品的規模化復制能力仍有待加強,行業最佳實踐相對缺乏。這些因素也影響了金融機構對遷移采用分布式數據庫技術的積極性。
(二)分布式數據庫的生態建設仍需加強
生態建設是當前我國基礎軟件相對薄弱的一環,特別是對基于自研的分布式數據庫廠商而言,雖然在實現技術和產品更加自主可控,但在生態建設方面仍需積極應對投入轉化慢、門檻高、市場接受程度低等挑戰。一方面,部分產品的技術體系相對封閉,用戶無法從市場快速獲取合格的開發運維人員,導致業務改造及生產運維仍嚴重依賴原廠,規模化復制效應較差。另一方面,部分產品的開放性仍有待提升,與其他平臺數據互聯互通的能力不足在客觀上造成了業務“上車容易下車難”的現實困境,增加了用戶被鎖定的風險。
(三)可持續發展的盈利模式需進一步探索
我國數據庫的發展可以追溯到 30 多年前,在這樣一個相對較長的發展周期內,技術和產品都取得了顯著進展,但在產業化方面,知識產權的保護不夠充分等諸多問題造成部分參與主體的市場化盈利能力較弱,產業整體規模難以做大。分布式數據庫雖然已取得了一定進展,但“池子深才能養大魚”,如何依托當前政策窗口,真正形成可持續發展的商業模式,還需進一步探討。
三、行業的應用建議
盡管存在一些問題,但我們堅信分布式是數據庫未來的發展趨勢。如果將分布式數據庫和單機數據庫類比為“高鐵”和“轎車”,因兩者定位不同,期望“高鐵”像“轎車”一樣簡單易用既不現實也不科學。所以應避免將分布式數據庫的應用簡單地理解為對單機或者集中式數據庫的一對一替換,而要深入考慮如何充分發揮分布式數據庫的技術優勢。遵循以上思路,我們對于分布式數據庫在金融等重點行業的應用提出以下幾點建議:
(一)通過技術創新和最佳實踐,推動行業應用不斷深入
一方面,要探索利用人工智能等新技術提升產品服務效能。人工智能技術可實現自動數據分區規劃、故障自動診斷和自愈、自動負載均衡、面向混合負載的自調優等功能。目前人工智能技術在分布式場景已經有了一些單點突破,但距離全場景落地、實現整體成本的全面降低還有很長的一段路要走,需要繼續加以積極的行業引導,推進技術交流和產業落地。另一方面,需充分發揮好示范項目效應。在金融等重點行業典型應用場景如分布式架構設計、多地多中心容災等,形成最佳解決方案,并在行業推廣落地。在此過程中,提煉出更適合分布式數據庫的開發、運維、硬件建設等相關要求,研究制定數據庫開發、運維、應用方面的標準規范,提高行業的標準化水平,引導各參與主體規范應用分布式數據庫,推進行業轉型。同時應約束不必要的定制化需求,減少無序競爭,實現技術聚焦。
(二)積極推進生態建設,發揮產業引領作用
從軟件發展歷史看,生態建設是基礎軟件產業化的重要一環。任何一款商業上真正成功的軟件產品,無一不是生態建設上獲得廣泛認可的成功案例。首先,充分發揮產業聯盟橋梁紐帶作用,推動產業發展。在行業內積極進行資源引流,逐步提升技術營運效率及影響力,搭建高端對話平臺,促進分布式數據庫應用方、應用開發方及廠商更好地交流,共同面對分布式轉型下的業務及技術挑戰,推進行業生態繁榮;加強與分布式中間件、分布式服務框架的合作與交流,通過開源、社區等形式建立廣泛的賦能體系;鼓勵應用軟件廠商全面向分布式架構轉型,建立相應的培訓體系和檢測認證體系。其次,完善技術生態,鼓勵引入第三方軟件垂直提供商。在運維管控、工具端以及解決方案層面實現更多差異化的平臺能力,加厚行業整體的技術底盤;鼓勵第三方產品服務化和上下游集成,推進各產品的互聯互通,打造良好技術生態,促進行業健康發展。再次,建立基礎軟件開放生態體系,推動開源建設。應鼓勵有研發實力的廠商基于國產開源數據庫做發行商,有運維能力的廠商基于優質的國產數據庫打造適用于自主可控要求的數據庫解決方案。數據庫廠商和合作伙伴應基于數據庫代碼開源、產品開放等形式,使數據庫產業從封閉商業生態走向產業共贏的開放生態,共同打造開放的數據庫生態體系。最后,進一步推進政產學研合作,加強人才儲備。明確人才發展戰略,梳理多層次行業人才資源地圖。加強廠商與各科研院所合作,推進高校在包括數據庫在內的基礎軟件方面專業投入,鼓勵有條件的廠商和高校開展課程共建、實踐共建,為聯合推進分布式數據庫關鍵技術在理論和實踐層面的難點問題攻關儲備智力資源。
(三)全面擁抱云,開展行業可持續發展的嘗試與探索
數據庫上云已逐步成為產業共識。發展云數據庫,不僅是對技術和產品的重要升級,更是對數據庫良性健康發展的商業模式有益探索,對于實現主體可控、支撐行業長期穩定發展具有重要的現實意義。分布式數據庫與單機數據庫不同,需要更大的集群規模才能實現資源的更有效利用。分布式數據庫與云計算是天然伴生關系,通過云化部署,能夠幫助分布式數據庫揚長避短,充分發揮分布式數據庫在擴展性、資源調度方面的靈活性和優勢,在提升資源利用效率同時,顯著降低運維成本,實現真正業務價值。一是云化基礎設施可以通過智能調度、運維系統高效管理更為豐富的應用,并通過多云及邊緣計算將應用擴展到多種場景中。二是軟硬協同可為應用提供更好的性能,提升應用隔離性等。三是云數據庫和云基礎設施結合,如利用云基礎設施本身的能力實現數據庫的跨數據中心訪問等,可使存儲具備理解、預處理數據庫語義的能力。
基于以上,一是建議擴大云數據庫在金融行業的應用規模。云數據庫已經在互聯網、電子政務等各行業得到了廣泛應用,在金融行業的應用及推廣也在穩步推進中。應引導重點用戶單位與廠商嘗試在行業落地云數據庫及云平臺,鼓勵技術共創,共同探索基于現代云平臺的分布式數據庫運維及業務開發體系。二是建議推進行業云發展以提高行業標準化程度。在滿足合規營運的前提下,應實現底層基礎設施共享,降低中小用戶對于分布式數據庫的使用門檻和人才需求,減少重復投資,實現集約化營運,充分發揮分布式數據庫的規模化優勢。厘清各參與主體運營職責與邊界,依托業內現有的成熟云平臺技術,形成一個或若干個云技術底座,鼓勵傳統非云數據庫廠商根據自身產品技術特點完成與云平臺的對接,最終形成行業的云上產品集市,逐步簡化并統一運維及交付界面,降低行業應用門檻,提高行業標準化程度。
審核編輯黃宇
-
數據庫
+關注
關注
7文章
3807瀏覽量
64420 -
數字化
+關注
關注
8文章
8754瀏覽量
61819 -
華為云
+關注
關注
3文章
2540瀏覽量
17441
發布評論請先 登錄
相關推薦
評論