大數據技術當中,在海量數據的存儲環節,涉及到兩個重要的概念,就是分布式數據存儲與數據庫,穩定高效安全的數據存儲,才能為后續的計算分析環節,提供穩固的支持。今天的大數據概念解析,我們來講講分布式存儲與數據庫。
進入大數據時代,數據特征發生了明顯的變化,數據規模大、非結構化/半結構化的數據多,使得大數據存儲本身也需要克服很多的問題。要實現大規模數據的計算分析加工等問題,對于企業而言,需要通過各種手段來解決相關的問題,比如說通過優化存儲基礎設施,或者搭建高性能的大數據存儲框架等等。海量數據的存儲任務,針對于不同的應用場景,往往需要因地制宜地選擇存儲方案,因此有了對象存儲、塊存儲、文件系統存儲等。
分布式文件/對象存儲系統
分布式存儲系統面向海量數據的存儲訪問與共享需求,提供基于多存儲節點的高性能,高可靠和可伸縮性的數據存儲和訪問能力,實現分布式存儲節點上多用戶的訪問共享。目前業界比較流行的分布式存儲系統包括:HDFS、OpenStack Swift、Ceph、GlusterFS、Lustre、AFS、OSS等。
分布式關系型數據庫
關系型數據庫是建立在關系模型基礎上的數據庫,借助于集合代數等數學概念和方法來處理數據庫中的數據。目前業界比較流行的分布式關系型數據庫包括:DRDS、TiDB、GreenPlum、Cobar、Aurora、Mycat等。
分析型數據庫
分析數據庫是面向分析應用的數據庫,與傳統的數據庫不同,它可以對數據進行在線統計、數據在線分析、隨即查詢等發掘信息數據價值的工作。目前業界比較流行的分析型數據庫包括:Kylin、AnalyticDB、Druid、Clickhouse、Vertica、MonetDB、InfiniDB、LucidDB等。
圖數據庫
圖數據庫的基本含義是以“圖”這種數據結構存儲和查詢數據,而不是存儲圖片的數據庫。目前業界比較流行的圖數據庫包括:Titan、Neo4J、ArangoDB、OrientDB、MapGraph、ALLEGROGRAPH等。
列存儲數據庫
列式數據庫是以列相關存儲架構進行數據存儲的數據庫,主要適合于批量數據處理和即時查詢。目前業界比較流行的列存儲數據庫包括:Phoenix、Cassandra、Hbase、Kudu、Hypertable等。
文檔數據庫
文檔型數據庫是NoSQL中非常重要的一個分支,它主要用來存儲、索引并管理面向文檔的數據或者類似的半結構化數據。目前業界比較流行的文檔型數據庫包括:MongoDb、CouchDB、OrientDB、MarkLogic等。
鍵值存儲數據庫
鍵值存儲(Key-Value)是NoSQL中,數據模型中比較簡單的一個了,主要就是用哈希表,通過對于鍵(Key)的查找來找到特定的數據。目前業界比較流行的鍵值存儲數據庫包括:Redis、Memcached、Tair等。關于大數據概念解析,分布式存儲與數據庫,以上就為大家做了一個簡單的介紹了。大數據存儲環節,涉及到分布式與數據庫,是需要重點去掌握的一部分,對于主流的技術架構也需要有相應程度的掌握。
目前業界比較流行的鍵值存儲數據庫包括:Redis、Memcached、Tair等。
關于大數據概念解析,分布式存儲與數據庫,以上就為大家做了一個簡單的介紹了。大數據存儲環節,涉及到分布式與數據庫,是需要重點去掌握的一部分,對于主流的技術架構也需要有相應程度的掌握。
責任編輯:tzh
-
存儲
+關注
關注
13文章
4347瀏覽量
86059 -
大數據
+關注
關注
64文章
8905瀏覽量
137638
發布評論請先 登錄
相關推薦
評論