1月15日,巨杉數據庫舉行SequoiaDB新特性及開源項目發布活動。本次活動回顧了巨杉數據庫深耕JSON文檔型數據庫12年的發展歷程與技術演進,全面解讀了SequoiaDB包括在高可用、安全、實時、易用性四個方向的技術特性,宣布了2024年面向技術社區的開源計劃。此次發布活動不僅是對SequoiaDB性能的全面介紹,更是對十余年來始終堅守以JSON文檔型數據庫內核為技術底座的發展歷程的深刻回顧。不忘來時路,方知向何行,巨杉數據庫也將在2024年新年伊始,迎來新的篇章,開啟新的征程!
穩健發展,行業影響力不斷提升
回顧過去,巨杉數據庫自2011年研發內核、2012年公司成立,至2013年推出SequoiaDB v1.0版本,再到如今已走過十二個春秋。歷經12年的洗禮,巨杉數據庫也取得了令人矚目的成就。目前,巨杉數據庫已經在超過100家大型銀行及金融機構的核心生產業務規模應用,覆蓋各行業的企業用戶總數超過1000家。在金融行業,其客戶群體涵蓋國有銀行、股份制銀行、省級農信、城商行、保險、證券等金融機構,同時還積極擴展政府、汽車、新能源等多個行業客戶,贏得了廣泛的市場認可。其中超過50家企業的應用時間已超過6年,最長的系統運行時間甚至達9年。自成立以來,公司實現穩健發展,行業影響力不斷提升,數據量及業務接入保持持續增長態勢。
守正創新,發展JSON文檔型內核
巨杉數據庫SequoiaDB以 JSON 文檔型數據庫內核為技術底座,通過分布式架構為眾多客戶提供了多元化的業務和全方位的支持。正是因為對技術創新的堅持以及對市場需求的洞察,巨杉數據庫始終堅守JSON文檔型內核,在持續迭代中實現創新發展。
在JSON基礎能力方面,從最初 v1版本,實現 CURD 原子性的操作以及基礎的ACID支持,到 v2 版本逐步提升對LOB大對象的存儲能力,標志著巨杉數據庫具備“多模數據”處理能力,同時支持存儲過程、聚集計算等特性。在 v3.0 版本中,進一步提供自增序列全文檢索、基于時間點的數據恢復和兼容部分 Mongo 語法??缭?.0版本,到v5.0 版本,SequoiaDB 著力提升穩定性能,對于統計信息、訪問計劃、存儲等進行了大量優化,提供死鎖檢測等功能,并進一步地兼容 Mongo 3、 Mongo 4 的語法。
在分布式管理方面,從基礎的多分區原生分布式架構,逐步提供讀寫分離、主子表、策略訪問、多中心容災、精細化容災等特性,持續增強分布式能力。
在安全性方面,涵蓋從基礎的鑒權、加密到信創的各類能力。此外,推出了SCM內容管理引擎,專注于非結構化數據和多模數據處理的統一數據生命周期管理。
在易用性方面,通過SAC運營的管理平臺,全面提升DBA運維的便捷性。
十二年來,巨杉數據庫基于JSON文檔型數據底座和分布式架構的不斷更新與迭代,為企業提供可靠的數據處理和存儲解決方案,幫助企業優化業務效率,提升客戶滿意度。
廣泛拓展,基于文檔型技術的應用場景
在中國乃至全球范圍內,“CM場景”是文檔型技術應用中重要且突出的場景?;谔幚矶嘧兊臄祿Y構和龐大的數據量的迫切需求,催生了“CM內容管理平臺”,同時極大地推動了SequoiaDB技術的創新。巨杉數據庫持續跟進客戶需求,進行技術迭代,實現從1.0 到 5.0 的跨越式發展。巨杉數據庫為金融銀行客戶提供,穩定、可靠、可持續擴展的「CM內容平臺」成為「銀行影像平臺」及「非結構化管理平臺」的數據基礎設施,目前已吸納超過100家客戶使用該場景??梢哉f,基于文檔型技術并應用于“CM內容管理平臺”場景是巨杉數據庫取得的最為顯著的成果之一,這一場景也持續為巨杉數據庫貢獻了超過85%的客戶及營收,成為業務的主打業務場景。
此外,文檔型數據庫在在線業務系統、實時數據湖、IoT領域以及AGI人工智能等領域也得到廣泛應用。JSON靈活的格式適合各種在線業務系統,尤其是面向需要快速迭代開發的各類APP的業務應用,基于文檔型數據庫的開發,可以顯著提升團隊的研發效率。在實時數據湖方面,巨杉數據庫借助JSON靈活的數據處理能力,已助力多家客戶構建全量歷史數據平臺,支持跨系統、跨業務的實時高并發數據查詢。
Vector Search基于文檔型技術,探索AGI數據應用新邊界
AGI 通用人工智能的發展,將進一步推動JSON文檔型數據類型的應用(實際上,本次發布活動中,Vector Searche部分的講解也是通過AI技術合成的)。
傳統AI應用中,需要存取及處理的是,海量的半結構化「 CM 內容管理」數據、「動態標簽」數據,以及各類非結構化對象數據。這些都正是 SequoiaDB 過去12年聚焦及取得顯著成果的領域技術,而 AGI 全新的爆發性發展,必將對 JSON 文檔型技術,帶來全新的機遇及技術挑戰。當前,業界領先的 Open AI、文心一言等大模型平臺中,JSON 已經被指定為對內,及對外,函數調用的,標準數據傳輸格式。
另外,我們可以看到 “向量數據” 在 AGI 通用人工智能發展中,得到了關鍵的應用,需要更有效的數據庫處理能力。
向量數據的存放格式,天然就可以用 JSON 結構表示,非常適合通過文檔型數據庫處理。然而,單獨使用向量數據,并不能解決業務的全景問題。在業務過程中,向量數據還必須與其他業務數據進行組合使用,才能發揮其價值。因此 SequoiaDB 也正在探索,為文檔型數據庫提供 「Vector Search 向量搜索」能力,為保存到 SequoiaDB 的向量數據,提供高效的查詢能力,這一特性將在2024年與大家見面。
要注意的是,我們并不需要發展獨立的向量數據庫產品。而是基于深耕了12年的 JSON 文檔型數據庫底座技術為基礎,進行向量查詢能力的擴展,這將可以幫助企業,驅動實體世界的更多數據,和 AGI 通用人工智能進行有效鏈接,釋放全量數據價值。
四大特性,釋放全量數據價值
巨杉數據庫基于JSON文檔型底座對SequoiaDB 進行了全面升級,此次發布活動全面解讀了SequoiaDB 的四大特性——高可用、安全、實時和易用。
高可用:文檔型數據庫處理的數據,包括了結構化的元數據、半結構化的標簽數據,以及非結構化的對象數據。對于PB級大數據或上百節點規模的大集群,在面對重大災難時的數據可靠性、數據一致性和系統可用性時都面臨著巨大挑戰。精細化容災能有效地幫助客戶實現針對這些數據的多中心容災,從而提升整體系統的高可用和數據高可靠能力。
安全:巨杉數據庫不僅在技術上通過國密算法和硬件加速來平衡安全與性能,還提供了跨國內外不同芯片、不同操作系統的混合部署能力。這意味著巨杉數據庫可以實現集群的異構部署,平滑地進行硬件資源的替換,對上層業務系統做到完全透明,保障業務連續性。
實時:巨杉數據庫憑借JSON文檔型數據結構的Schema靈活性,為企業提供了全量數據底座。DDL的實時變更、橫向擴展能力,以及高性能的并發點查能力等都顛覆了傳統ODS數據貼源層的界限,使得ODS能夠服務于實時業務,滿足對客實時數據查詢和企業內部跨業務數據實時匯總的需求。
易用:巨杉數據庫進一步增強了SAC的監控、告警和管理等功能。一站式的數據管理工具,極大地方便了DBA的管理工作,提高了問題排查的效率并簡化了對系統的監控管理,從而為業務帶來更高的穩定性和效率。
開放、開源共赴新篇章
新年伊始,巨杉數據庫也將譜寫嶄新篇章。發布會介紹,巨杉數據庫決定將在2024年Q1再次發布開源版本,不僅希望獲得社區同仁的參與和監督,讓產品未來發展更透明;同時也承擔歷史責任,希望通過開源的方式吸引更多合作伙伴,共同發展中國的分布式文檔型數據庫生態鏈,促進業務的快速迭代和開發效率的提升。近期,SequoiaDB新版本的源代碼將通過Gitee、GitCode及GitHub再次開源。
審核編輯 黃宇
-
數據庫
+關注
關注
7文章
3845瀏覽量
64584 -
開源
+關注
關注
3文章
3396瀏覽量
42638
發布評論請先 登錄
相關推薦
評論