色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

架構師日記-從數據庫發展歷程到數據結構設計探析

京東云 ? 來源:jf_75140285 ? 作者:jf_75140285 ? 2024-09-25 11:20 ? 次閱讀

一 數據庫發展史

起初,數據的管理方式是文件系統,數據存儲在文件中,數據管理和維護都由程序員完成。后來發展出樹形結構和網狀結構的數據庫,但都存在著難以擴展和維護的問題。直到七十年代,關系數據庫理論的提出,以表格形式組織數據,數據之間存在關聯關系,具有了良好的結構化和規范化特性,成為主流數據庫類型。

先來看一張數據庫發展史圖鑒:

wKgZombzgWmAGMNwAAEKi_BU55I455.png


隨之高并發大數據時代的來臨,數據庫按照各種應用場景進行了更細粒度的拆分和演進,數據庫細分領域的典型代表:

類型 產品代表 適用場景
層次數據庫(NDB) IMS/IDMS 以樹形結構組織數據,數據之間存在父子關系,查詢速度快,但難以擴展和維護
關系型數據庫(RDBMS) Oracle/MySQL 事務的一致性需求場景
鍵值數據庫(KVDB) Redis/Memcached 針對高性能并發讀寫場景
文檔數據庫(DDB) MongoDB/CouchDB 針對海量復雜數據訪問場景
圖數據庫(GDB) Neo4j 以點、邊為基礎存儲單元,高效存儲、查詢圖數據場景
時序數據庫(TSDB) InfluxDB/OpenTSDB 針對時序數據的持久化和多維度的聚合查詢等場景
對象數據庫(ODB) Db4O 支持完整的面向對象(OO)概念和控制機制,目前使用場景較少
索引擎(SE) ElasticSearch/Solr 適合于以搜索為主的業務場景
列數據庫(WCDB) HBase/ClickHouse 分布式存儲的海量數據存儲和查詢場景
XML數據庫(NXD) MarkLogic 支持對XML格式文檔進行存儲和查詢等操作場景
內容倉庫(CDB) Jackrabbit 大規模高性能的內容倉庫

二 數據庫名詞概念

RDBS

1970年的6月,IBM 公司的研究員埃德加·考特 (Edgar Frank Codd) 發表了那篇著名的《大型共享數據庫數據的關系模型》(A Relational Model of Data for Large Shared Data Banks)的論文,拉開了關系型數據庫(Relational DataBase Server)軟件革命的序幕(之前是層次模型和網狀模型數據庫為主)。直到現在,關系型數據庫在基礎軟件應用領域仍是最主要的數據存儲方式之一。

關系型數據庫建立在關系型數據模型的基礎上,是借助于集合代數等數學概念和方法來處理數據的數據庫。在關系型數據庫中,實體以及實體間的聯系均由單一的結構類型來表示,這種邏輯結構是一張二維表。關系型數據庫以行和列的形式存儲數據,這一系列的行和列被稱為表,一組表組成了數據庫。

NoSQL

NoSQL(Not Only SQL) 數據庫也即非關系型數據庫,它是在大數據的時代背景下產生的,它可以處理分布式、規模龐大、類型不確定、完整性沒有保證的“雜亂”數據,這是傳統的關系型數據庫遠遠不能勝任的。NoSQL數據庫并沒有一個統一的模型,是以犧牲事務機制和強一致性機制,來獲取更好的分布式部署和橫向擴展能力,使其在不同的應用場景下,對特定業務數據具有更強的處理性能。常用數據模型示例如下:

類型 產品代表 應用場景 數據模型 優缺點
鍵值數據庫 Redis/Memcached 內容緩存,如會話,配置文件等; 頻繁讀寫,擁有簡單數據模型的應用; 鍵值對,通過散列表來實現 優點: 擴展性和靈活性好,性能高; 缺點: 數據無結構化,只能通過鍵來查詢
列簇數據庫 HBase/ClickHouse 分布式數據存儲管理 以列簇存儲,將同一列存在一起 優點: 簡單,擴展性強,查詢速度快 缺點: 功能局限,不支持事務的強一致性
文檔數據庫 MongoDB/CouchDB Web應用,存儲面向文檔或半結構化數據 鍵值對,value是JSON結構文檔 優點: 數據結構靈活 缺點: 缺乏統一查詢語法
圖形數據庫 Neo4j/InfoGrid 社交網絡,應用監控,推薦系統等專注構建關系圖譜 圖結構 優點: 支持復雜的圖形算法 缺點: 復雜性高,支持數據規模有限

NewSQL

NewSQL 是一類新的關系型數據庫, 是各種新的可擴展和高性能的數據庫的簡稱。它不僅具有 NoSQL 數據庫對海量數據的存儲管理能力,同時還保留了傳統數據庫支持的 ACID 和 SQL 特性,典型代表有TiDB和OceanBase。

OLTP

聯機事務處理過程(On-Line Transaction Processing):也稱為面向交易的處理過程,其基本特征是前臺接收的用戶數據可以立即傳送到計算中心進行處理,并在很短的時間內給出處理結果,是對用戶操作快速響應的方式之一。

OLAP

聯機分析處理(On-Line Analytical Processing)是一種面向數據分析的處理過程,它使分析人員能夠迅速、一致、交互地從各個方面觀察信息,以達到深入理解數據的目的。它具有FASMI(Fast Analysis of Shared Multidimensional Information),即共享多維信息的快速分析的特征。

關于OLTP和OLAP的區別,借用一張表格對比如下:

wKgaombzgWyAJH29AAgOeEz2uC8350.png

HTAP

HTAP (Hybrid Transactional/Analytical Processing) 混合型數據庫基于新的計算存儲框架,能夠同時支撐OLTP和OLAP場景,避免傳統架構中大量數據交互造成的資源浪費和沖突。

三 領域數據庫

列式數據庫

傳統的以行形式保存的數據主要滿足OLTP應用,列形式保存的數據主要滿足以查詢為主的OLAP應用。在列式數據庫中,數據按列存儲,而每個列中的數據類型相同。這種存儲方式使列式數據庫能夠更高效地處理大量的數據,特別是需要進行大規模的數據分析和處理時(如金融、醫療、電信、能源、物流等行業)。

兩種存儲結構的區別如下圖:

wKgZombzgW-ATGBSAACjp-vegrw467.png


列式數據庫的主要優點:

?更高的壓縮比率:由于每個列中的數據類型相同,列式數據庫可以使用更高效的壓縮算法來壓縮數據(壓縮比可達到5~20倍),從而減少存儲空間的使用。

?更快的查詢速度:列式數據庫可以只讀取需要的列,而不需要讀取整行數據,從而加快查詢速度。

?更好的擴展性:列式數據庫可以更容易地進行水平擴展,即增加更多的節點和服務器來處理更大規模的數據。

?更好的數據分析支持:由于列式數據庫可以處理大規模的數據,它可以支持更復雜的數據分析和處理操作,例如數據挖掘、機器學習等。

列式數據庫的主要缺點:

?更慢的寫入速度:由于數據是按列存儲,每次寫入都需要寫入整個列,而不是單個行,因此寫入速度可能較慢。

?更復雜的數據模型:由于數據是按列存儲,數據模型可能比行式數據庫更復雜,需要更多的設計和開發工作。

列式數據庫的應用場景:

?金融:金融行業的交易數據和市場數據,例如股票價格、外匯匯率、利率等。列式數據庫可以更快速地處理這些數據,并且支持更復雜的數據分析和處理操作,例如風險管理、投資分析等。

?醫療:醫療行業的病歷數據、醫療圖像和實驗數據等。列式數據庫可以更高效地存儲和處理這些數據,并且支持更復雜的醫學研究和分析操作。

?電信:電信行業的用戶數據和通信數據,例如電話記錄、短信記錄、網絡流量等。列式數據庫可以更快速地處理這些數據,并且支持更復雜的用戶行為分析和網絡優化操作。

?能源:能源行業的傳感器數據、監測數據和生產數據等。列式數據庫可以更高效地存儲和處理這些數據,并且支持更復雜的能源管理和控制操作。

?物流:物流行業的運輸數據、庫存數據和訂單數據等。列式數據庫可以更快速地處理這些數據,并且支持更復雜的物流管理和優化操作。

總之,列式數據庫是一種高效處理大規模數據的數據庫管理系統,但需要權衡寫入速度、數據模型復雜度和成本等因素。 隨著傳統關系型數據庫與新興的分布式數據庫不斷的發展,列式存儲與行式存儲會不斷融合,數據庫系統呈現雙模式數據存放方式。

時序數據庫

時序數據庫全稱為時間序列數據庫 ( Time Series Database),用于存儲和管理時間序列數據的專業化數據庫,是優化用于攝取、處理和存儲時間戳數據的數據庫。其跟常規的關系數據庫SQL相比,最大的區別在于:時序數據庫是以時間為索引的規律性時間間隔記錄的數據庫。

時序數據庫在物聯網和互聯網應用程序監控(APM)等場景應用比較多,以監控數據采集來舉例,如果數據監控數據采集時間間隔是1s,那一個監控項每天會產生86400個數據點,若有10000個監控項,則一天就會產生864000000個數據點。在物聯網場景下,這個數字會更大,整個數據的規模,是TB甚至是PB級的。

時序數據庫發展史:

wKgaombzgXCATS6iAAEi8IHIR6s504.png


當下最常見的Kubernetes容器管理系統中,通常會搭配普羅米修斯(Prometheus)進行監控,Prometheus就是一套開源的監控&報警&時間序列數據庫的組合。

圖數據庫

圖數據庫(Graph Database)是基于圖論實現的一種新型NoSQL數據庫。它的數據存儲結構和數據的查詢方式都是以圖論為基礎的。圖論中圖的基本元素為節點和邊,在圖數據庫中對應的就是節點和關系。

圖數據庫在反欺詐多維關聯分析場景,社交網絡圖譜,企業關系圖譜等場景中可以做一些非常復雜的關系查詢。這是由于圖數據結構表現的是實體聯系本身,它表現了現實世界中事物聯系的本質,它的聯系在節點創建時就已經建立,所以在查詢中能以快捷的路徑返回關聯數據,從而表現出非常高效的查詢性能。

目前市面上較為流行的圖數據庫產品有以下幾種:

wKgZombzgXGAeA3cAAPTliqtr4I460.png


與傳統的關系數據庫相比,圖數據庫具有以下優點:

1.更快的查詢速度:圖數據庫可以快速遍歷圖數據,找到節點之間的關聯和路徑,因此查詢速度更快。

2.更好的擴展性:圖數據庫可以輕松地擴展到大規模的數據集,因為它們可以分布式存儲和處理數據。

3.更好的數據可視化:圖數據庫可以將數據可視化為圖形,使用戶更容易理解和分析數據。

4.更好的數據一致性:圖數據庫可以確保數據的一致性,因為它們可以在節點和邊之間建立強制性的關系。

四 數據結構設計

前面簡單介紹了數據庫相關的基礎知識,下面再介紹幾種我們常見的數據結構設計相關的應用實踐:拉鏈表,位運算和環形隊列。

4.1 拉鏈表

拉鏈表是一種數據倉庫中常用的數據模型,用于記錄維度數據的變化歷史。我們以一個人員變動的場景舉例,假設有一個員工信息表,其中包含了員工的姓名、工號、職位、部門、入職時間等信息。如果需要記錄員工的變動情況,就可以使用拉鏈表來實現。

首先,在員工信息表的基礎上新增兩個字段:生效時間和失效時間。當員工信息發生變動時,不再新增一條記錄,而是修改原有記錄的失效時間,同時新增一條新的記錄。如下表所示:

姓名 工號 職位 部門 入職時間 生效時間 失效時間
張三 001 經理 技術 2010-01-01 2010-01-01 2012-12-31
張三 001 總監 技術 2013-01-01 2013-01-01 2015-12-31
張三 001 總經理 技術 2016-01-01 2016-01-01 9999-12-31

這里的生效時間指的是該記錄生效的時間,失效時間指的是該記錄失效的時間。例如,張三最初是技術部經理,生效時間為入職時間,失效時間為2012年底,之后晉升為技術部總監,生效時間為2013年初,失效時間為2015年底,最后又晉升為技術部總經理,生效時間為2016年初,失效時間為9999年底。

通過這種方式,可以記錄員工變動的歷史信息,并能夠方便地查詢某個時間點的員工信息。例如,如果需要查詢張三在2014年的職位和部門信息,只需查詢生效時間小于2014年且失效時間大于2014年的記錄即可。

拉鏈表通常包括以下幾個字段:

1.主鍵:唯一標識每個記錄的字段,通常是一個或多個列的組合。 2.生效時間:記錄的生效時間,即該記錄開始生效的時間。 3.失效時間:記錄的失效時間,即該記錄失效的時間。 4.版本號:記錄的版本號,用于標識該記錄的版本。 5.其他維度屬性:記錄的其他維度屬性,如客戶名、產品名、員工名等。

當一個記錄的維度屬性發生變化時,不再新增一條記錄,而是修改原有記錄的失效時間,同時新增一條新的記錄。新記錄的生效時間為變化的時間,失效時間為9999年底。這樣就能夠記錄每個維度屬性的歷史變化信息,同時保證查詢時能夠正確獲取某個時間點的維度屬性信息。

拉鏈表與傳統的流水表相比,它們的主要區別在于:

1.數據結構不同:流水表是一張只有新增和更新操作的表,每次更新都會新增一條記錄,記錄中包含了所有的歷史信息。而拉鏈表則是一張有新增、更新和刪除操作的表,每個記錄都有一個生效時間段和失效時間段,記錄的歷史信息通過時間段的變化來體現。

2.查詢方式不同:流水表的查詢方式是基于時間點的查詢,即查詢某個時間點的記錄信息。而拉鏈表的查詢方式是基于時間段的查詢,即查詢某個時間段內的記錄信息。

3.存儲空間不同:由于流水表需要記錄所有歷史信息,所以存儲空間相對較大。而拉鏈表只記錄生效時間段和失效時間段,所以存儲空間相對較小。

4.數據更新方式不同:流水表只有新增和更新操作,每次更新都會新增一條記錄,不會對原有記錄進行修改。而拉鏈表有新增、更新和刪除操作,每次更新會修改原有記錄的失效時間,同時新增一條新的記錄。

4.2 巧用位運算

借助于計算機位運算的特性,可以巧妙的解決某些特定問題,使實現更加優雅,節省存儲空間的同時,也可以提高運行效率,典型應用場景:壓縮存儲、位圖索引、數據加密、圖形處理和狀態判斷等,下面介紹幾個典型案例。

4.2.1 位運算

?使用位運算實現開關和多選項疊加(資源權限)等應用場景。一個int類型有32個位,理論上可以表示32個開關狀態或業務選項;以用戶每個月的簽到場景舉例:用一個int字段來表示用戶一個月的簽到情況,0表示未簽到,1表示簽到。想知道某一天是否簽到,則只需要判斷對應的比特位上是否為1。計算一個月累計簽到了多少次,只需要統計有多少個比特位為1就可以了。這種設計巧妙的數據存儲結構在后面的位圖(BitMap)中,還會進行更為詳細的介紹。

wKgaombzgXKAeh5_AABxEi1PHo8738.png


?使用位運算實現業務優先級計算:

public abstract class PriorityManager { // 定義業務優先級常量 public static final int PRIORITY_LOW = 1; // 二進制:001 public static final int PRIORITY_NORMAL = 2; // 二進制:010 public static final int PRIORITY_HIGH = 4; // 二進制:100 // 定義用戶權限常量 public static final int PERMISSION_READ = 1; // 二進制:001 public static final int PERMISSION_WRITE = 2; // 二進制:010 public static final int PERMISSION_DELETE = 4;// 二進制:100 // 定義用戶權限和業務優先級的組合值 public static final int PERMISSION_LOW_PRIORITY = PRIORITY_LOW | PERMISSION_READ; // 二進制:001 | 001 = 001 public static final int PERMISSION_NORMAL_PRIORITY = PRIORITY_NORMAL | PERMISSION_READ | PERMISSION_WRITE; // 二進制:010 | 001 | 010 = 011 public static final int PERMISSION_HIGH_PRIORITY = PRIORITY_HIGH | PERMISSION_READ | PERMISSION_WRITE | PERMISSION_DELETE; // 二進制:100 | 001 | 010 | 100 = 111 // 判斷用戶權限是否滿足業務優先級要求 public static boolean checkPermission(int permission, int priority) { return (permission & priority) == priority; } }

?其它使用位運算的典型場景:HashMap中的隊列長度的設計和線程池ThreadPoolExcutor中使用AtomicInteger字段ctl,存儲當前線程池狀態和線程數量(高3位表示當前線程的狀態,低29位表示線程的數量)。

4.2.2 BitMap

位圖(BitMap)是一種常用的數據結構,在索引,數據壓縮等方面有廣泛應用。基本思想就是用一個bit位來標記某個元素對應的Value,而Key即是該元素。由于采用了Bit為單位來存儲數據,因此可以大大節省存儲空間,是少有的既能保證存儲空間又能保證查找速度的數據結構(而不必空間換時間)。

舉個例子,假設有這樣一個需求:在20億個隨機整數中找出某個數m是否存在其中,并假設32位操作系統4G內存,在Java中,int占4字節,1字節=8位(1 byte = 8 bit)。

?如果每個數字用int存儲,那就是20億個int,因而占用的空間約為 (2000000000*4/1024/1024/1024)≈7.45G

?如果按位存儲就不一樣了,20億個數就是20億位,占用空間約為 (2000000000/8/1024/1024/1024)≈0.233G

存儲空間可以壓縮節省31倍!那么它是如何通過二進制位實現數字標記的呢? 其原理是用每個二進制位(下標)表示一個真實數字,0表示不存在,1表示存在,這樣我們可以很容易表示{1,2,4,6}這幾個數:

wKgZombzgXOAQytfAACIntPSF1Y344.png


計算機內存分配的最小單位是字節,也就是8位,那如果要表示{12,13,15}怎么辦呢?可以另申請一個字節b[1]:

wKgaombzgXSAE9hYAAFUD-n8WvA923.png


通過一個二維數組來實現位數疊加,1個int占32位,那么我們只需要申請一個int數組長度為 int index[1+N/32] 即可存儲,其中N表示要存儲的這些數中的最大值:

index[0]:可以表示0~31

index[1]:可以表示32~63

index[2]:可以表示64~95

以此類推...如此一來,給定任意整數M,那么M/32就得到下標,M%32就知道它在此下標的哪個位置。

BitMap數據結構通常用于以下場景:

1.壓縮存儲大量布爾值:BitMap可以有效地壓縮大量的布爾值,從而減少內存的使用;

2.快速判斷一個元素是否存在:BitMap可以快速地判斷一個元素是否存在,只需要查找對應的位即可;

3.去重:BitMap可以用于去重操作,將元素作為索引,將對應的位設置為1,重復元素只會對應同一個位,從而實現去重;

4.排序:BitMap可以用于排序,將元素作為索引,將對應的位設置為1,然后按照索引順序遍歷位數組,即可得到有序的元素序列;

5.ElasticSearch和Solr等搜索引擎中,在設計搜索剪枝時,需要保存已經搜索過的歷史信息,可以使用位圖減小歷史信息數據所占空間;

4.2.3 布隆過濾器

位圖(Bitmap)這種數據存儲結構,如果數據量大到一定程度,比如64bit類型的數據,簡單算一下存儲空間就知道,海量硬件資源要求,已經不太現實了:

wKgZombzgXaAWHqYAAAhJgzDFV0545.png


所以另一個著名的工業實現 -布隆過濾器(Bloom Filter)出現了。如果說BitMap對于每一個可能的整型值,通過直接尋址的方式進行映射,相當于使用了一個哈希函數,那布隆過濾器就是引入了k ( k > 1 )個相互獨立的哈希函數,保證在給定的空間和誤判率情況下,完成元素判重的過程。下圖中是k = 3 時的布隆過濾器:

wKgaombzgXeAKiJ4AAFUuAG3Be8804.png


布隆過濾器的內部依賴于哈希算法,當檢測某一條數據是否見過時,有一定概率出現假陽性(False Positive),但一定不會出現假陰性(False Negative)。也就是說,當 布隆過濾器認為一條數據出現過,那么該條數據很可能出現過;但如果布隆過濾器認為一條數據沒出現過,那么該條數據一定沒出現過。布隆過濾器通過引入一定錯誤率,使得海量數據判重在可以接受的內存代價中得以實現。

上圖中,x,y,z經由哈希函數映射將各自在Bitmap中的3個位置置為1,當w出現時,僅當3個標志位都為1時,才表示w在集合中。圖中所示的情況,布隆過濾器將判定w不在集合中。

常見實現

?Java中Guava工具包中實現;

?Redis 4.0開始以插件形式提供布隆過濾器功能;

適用場景

?網頁爬蟲對URL的去重,避免爬去相同的URL地址,比如Chrome瀏覽器就是使用了一個布隆過濾器識別惡意鏈接;

?垃圾郵件過濾,從數十億個垃圾郵件列表中判斷某郵箱是否是殺垃圾郵箱;

?解決數據庫緩存擊穿,黑客攻擊服務器時,會構建大量不存在于緩存中的key向服務器發起請求,在數據量足夠大的時候,頻繁的數據庫查詢會導致掛機;

?谷歌Bigtable、Apache HBase、Apache Cassandra和PostgreSQL使用布隆過濾器來減少對不存在的行或列的磁盤查找;

?秒殺系統,查看用戶是否重復購買;

4.2.4 小結

?位運算有著執行速度快,占用空間小,代碼實現簡潔等優點,往往能起到四兩撥千斤的效果。同樣也有著代碼可讀性差,使用范圍和可維護性受限等不足;

?在BitMap中,占用空間大小還與實際應用場景有關,這種結構無法容忍誤判,只能判斷一個元素是否存在,如果數據離散度過高,空間利用率反而更低;

?布隆過濾器則有著空間利用率高,可以容忍一定的誤判率的優點。與BitMap相比,也存在著無法刪除元素,誤判率無法達到0等不足;

4.3 環形隊列

環形隊列是一種用于表示一個固定尺寸、頭尾相連的數據結構,很適合緩存數據流。在通信開發(Socket,TCP/IP,RPC開發),在內核的進程間通信(IPC),視頻音頻播放等各種場景中,都有其身影。日常開發過程中使用的Dubbo、Netty、Akka、Quartz、ZooKeeper 、Kafka等各種中間件,也都有環形隊列的思想。下面介紹兩種常用的環形數據結構:Hash環和時間輪。

4.3.1 一致性Hash環

先來看一下,典型Hash算法結構如下:

wKgZombzgXqABbo5AABV91C96Us090.png


以上圖Hash策略為例,當節點數N發生變化的時候 之前所有的 hash映射幾乎全部失效,如果集群是無狀態的服務,倒是沒什么事情,但是如果是分布式緩存這種場景,就會導致比較嚴重的問題。比如 Key1原本是路由到Node1上,命中緩存的Value1數據。但是當N節點變化后,Key1可能就路由到了Node2節點,這就產生了緩存數據無法命中的問題。而無論是機器故障還是緩存擴容,都會導致節點數的變化。

如何解決上面場景的問題呢?就是接下來介紹的一致性Hash算法。

一致性哈希將整個哈希值空間組織成一個虛擬的圓環,假設某哈希函數H的值空間為0-2^32-1(即哈希值是一個32位無符號整型),所有的輸入值都被映射到 0-2^32-1 之間,組成一個圓環。整個哈希空間環如下:

wKgaombzgXuAYnTRAAD_8hIxZTE834.png


路由數據的過程如下:將數據key使用相同的函數Hash計算出哈希值,并確定此數據在環上的位置,從此位置沿環順時針“行走”,遇到的第一個節點就是其應該定位到的服務器。如果某個節點的服務器故障,其影響范圍也不再是所有集群,而是限定在故障節點與其上游節點的部分區域。

當某個節點宕機后,原本屬于它的請求都會被重新hash映射到下游節點,會突然造成下游節點壓力過大有可能也會造成下游節點宕機,從而容易形成雪崩,為此引入了虛擬節點來解決這個問題。

根據Node節點生成很多的虛擬節點分布在圓環上,,一個真實節點映射對應多個虛擬節點。這樣當某個節點掛了后原本屬于它的請求,會被均衡的分布到其他節點上降低了產生雪崩的情況,也解決了物理節點數少,導致請求分布不均的問題。

帶有虛擬節點的Hash環:

wKgZombzgXyAMsilAAFWxAL3tjE244.png

一致性Hash算法由于均衡性,持久性的映射特點被廣泛應用于負載均衡領域,比如nginx、dubbo等內部都有一致性hash的實現。

4.3.2 時間輪分片

時間輪(TimeWheel)是一種實現延遲功能(定時器)的精妙的算法,可以實現高效的延時隊列。以Kafka中的時間輪實現方案為例,它是一個存儲定時任務的環形隊列,底層采用數組實現,數組中的每個元素可以存放一個定時任務列表(TimerTaskList)。TimerTaskList是一個環形的雙向鏈表,鏈表中的每一項表示的都是定時任務項(TimerTaskEntry),其中封裝了真正的定時任務TimerTask。

wKgaombzgX2ACWH5AAFCJl9Tzn4295.png


通過上圖可以發現,時間輪算法不再任務隊列作為數據結構,輪詢線程不再負責遍歷所有任務,而是僅僅遍歷時間刻度。時間輪算法好比指針不斷在時鐘上旋轉、遍歷,如果一個發現某一時刻上有任務(任務隊列),那么就會將任務隊列上的所有任務都執行一遍。

假設相鄰bucket到期時間的間隔為bucket=1s,從0s開始計時,1s后到期的定時任務掛在bucket=1下,2s后到期的定時任務掛在bucket=2下,當檢查到時間過去了1s時,bucket=1下所有節點執行超時動作,當時間到了2s時,bucket=2下所有節點執行超時動作。時間輪使用一個表盤指針(pointer),用來表示時間輪當前指針跳動的次數,可以用tickDuration * (pointer + 1)來表示下一次到期的任務,需要處理此bucket所對應的 TimeWheel中的所有任務。

時間輪的優點

1.任務的添加與移除,都是O(1)級的復雜度;

2.只需要有一個線程去推進時間輪,不會占用大量的資源;

3.與其他任務調度模式相比,CPU的負載和資源浪費減少;

適用場景

時間輪是為解決高效調度任務而產生的調度模型。在周期性定時任務,延時任務,通知任務等場景都可以發揮效用。

五 總結

本文針對數據存儲相關名詞概念進行了解釋,重點介紹了數據庫技術的發展史。為了豐富文章的可讀性以及實用性,又從數據結構設計層面進行了部分技術實戰能力的外延擴展,闡述了拉鏈表,位運算,環形隊列等相關數據結構在軟件開發領域的應用,希望本文給你帶來收獲。

注:本文個別圖片來自互聯網

審核編輯 黃宇

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 數據庫
    +關注

    關注

    7

    文章

    3816

    瀏覽量

    64465
  • 數據結構
    +關注

    關注

    3

    文章

    573

    瀏覽量

    40148
  • 架構師
    +關注

    關注

    0

    文章

    47

    瀏覽量

    4638
收藏 人收藏

    評論

    相關推薦

    kintex產品架構設計文檔(成為架構師也是電子人不錯的選...

    kintex產品架構設計文檔(成為架構師也是電子人不錯的選擇) ROCE(儒仕),用心為每一位電子人!Xilinx7系列普及講座,架構師設計方案模板,交流學習 內容請下載附件pdf,更多內容請登錄ww..rocetech..co
    發表于 04-30 16:41

    數據庫系統是什么?數據庫系統概念之數據庫設計資料免費下載

      什么是概念結構設計1.將需求分析得到的用戶需求抽象為信息結構即概念模型的過程就是概念結構設計2.概念結構是各種數據模型的共同基礎,它比
    發表于 09-07 14:34 ?1次下載
    <b class='flag-5'>數據庫</b>系統是什么?<b class='flag-5'>數據庫</b>系統概念之<b class='flag-5'>數據庫</b>設計資料免費下載

    如何進行數據庫設計?數據庫設計介紹和需求分析及結構設計資料概述

    數據庫設計的任務是指根據需求研制數據庫結構并應用 數據庫的過程。數據庫設計內容包括數據庫
    發表于 09-13 17:05 ?0次下載
    如何進行<b class='flag-5'>數據庫</b>設計?<b class='flag-5'>數據庫</b>設計介紹和需求分析及<b class='flag-5'>結構設計</b>資料概述

    如何使用PowerDesigner進行數據庫靜態結構設計?詳細資料概述

    把用戶需求抽象為概念模型即為概念結構設計。 概念模型除了要求能反映客觀世界并且易于理解外,還要求其易于向數據模型(如關系模型)轉化。 概念模型獨立于具體的數據庫系統,是整個數據庫
    發表于 09-13 17:05 ?0次下載
    如何使用PowerDesigner進行<b class='flag-5'>數據庫</b>靜態<b class='flag-5'>結構設計</b>?詳細資料概述

    數據庫靜態結構如何設計?詳細資料任務和方法說明

    任務:實現數據庫設計新奧爾良方法中概念結構設計和邏輯結構設計
    發表于 09-27 15:32 ?1次下載
    <b class='flag-5'>數據庫</b>靜態<b class='flag-5'>結構</b>如何設計?詳細資料任務和方法說明

    數據庫教程之如何進行數據庫設計

    本文檔的主要內容詳細介紹的是數據庫教程之如何進行數據庫設計內容包括了:1 數據庫設計概述 ,2 數據庫需求分析 ,3 數據庫
    發表于 10-19 10:41 ?21次下載
    <b class='flag-5'>數據庫</b>教程之如何進行<b class='flag-5'>數據庫</b>設計

    數據庫設計的七大知識點總結詳細資料免費下載

    本文檔的主要內容詳細介紹的是數據庫設計的七大知識點總結包括了:1 數據庫設計概述2 需求分析3 概念結構設計4 邏輯結構設計5 數據庫的物理
    發表于 10-19 10:41 ?0次下載
    <b class='flag-5'>數據庫</b>設計的七大知識點總結詳細資料免費下載

    數據庫學習入門資料之數據庫的概念結構詳細資料概述

    什么是概念結構設計 將需求分析得到的用戶需求抽象為信息結構即概念模型的過程就是概念結構設計 概念結構是各種數據模型的共同基礎,它比
    發表于 10-25 16:29 ?0次下載
    <b class='flag-5'>數據庫</b>學習入門資料之<b class='flag-5'>數據庫</b>的概念<b class='flag-5'>結構</b>詳細資料概述

    數據庫概念結構是如何設計的概念結構設計資料概述

    本文檔的主要內容詳細介紹的是數據庫概念結構是如何設計的概念結構設計資料概述主要內容包括了:1 概念結構2 概念結構設計的方法與步驟3
    發表于 10-26 11:49 ?22次下載
    <b class='flag-5'>數據庫</b>概念<b class='flag-5'>結構</b>是如何設計的概念<b class='flag-5'>結構設計</b>資料概述

    數據庫的設計概念總結

    本文檔的主要內容詳細介紹的是數據庫的設計概念總結主要內容包括了:1.數據庫設計概述,2.需求分析,3.概念結構設計,4.邏輯結構設計,5.數據庫
    發表于 01-09 17:29 ?13次下載
    <b class='flag-5'>數據庫</b>的設計概念總結

    數據庫設計開發案例教程之數據庫設計的資料介紹

    本文檔的主要內容詳細介紹的是數據庫設計開發案例教程之數據庫設計的資料介紹主要內容包括了:1 數據庫設計概述,2 需求分析,3 概念結構設計,4 邏輯
    發表于 01-11 11:20 ?17次下載
    <b class='flag-5'>數據庫</b>設計開發案例教程之<b class='flag-5'>數據庫</b>設計的資料介紹

    數據架構師的職責有哪些

    架構師按照專注領域不同,可分為企業架構師、基礎結構架構師、特定技術架構和解決方案架構師等,專職架構師
    的頭像 發表于 04-04 16:24 ?3849次閱讀

    數據庫教程之數據庫系統設計課件的資料免費下載

    結構特性設計通常是指數據庫模式或數據庫結構設計,它應該具有最小冗余的、能滿足不同用戶數據需求的、能實現
    發表于 01-17 17:11 ?17次下載

    干貨:20個MySQL開源數據庫架構設計原則

    干貨:20個MySQL開源數據庫架構設計原則
    的頭像 發表于 08-28 10:57 ?3399次閱讀

    原華為云高斯數據庫首席架構師出任易鯨捷CEO

    近日,貴州易鯨捷信息技術有限公司宣布,原華為云高斯數據庫首席架構師、華為IT產品線數據平臺部CTO,曾任南大通用CTO、CEO,中國數據庫領軍人物之一的武新博士正式加盟易鯨捷并出任CE
    發表于 06-30 09:52 ?628次閱讀
    主站蜘蛛池模板: 免费成年人在线视频| 私人玩物在线观看| 亚洲日本天堂在线| 久久九九精品国产自在现线拍| 伊人久久青草| 殴美黄色网| 国产免费人成在线视频视频| 尤物yw193can入口| 日本久久中文字幕| 黄色三级视频在线| 99欧美精品| 午夜天堂AV久久久噜噜噜| 久久精品天天爽夜夜爽| 扒开粉嫩的小缝末成年小美女| 午夜国产精品免费观看| 麻豆一二三四区乱码| 国产激情一级毛片久久久| 在线免费中文字幕| 色百度网址大全| 久久五月综合婷婷中文云霸高清| 超碰人人草在线视频| 亚洲中文字幕日本在线观看| 青娱乐国产精品视频| 精品国产乱码久久久久久上海公司 | 性按摩AAAAAAA片| 美女gif趴跪式动态图| 国产精品99re6热在线播放| 中文字幕在线观看网址| 午夜深情在线观看免费| 欧美123区| 九九电影伦理片| 国产成人在线免费观看| 综合色就爱涩涩涩综合婷婷| 午夜福利08550| 青青娱乐网| 美女pk精子2小游戏| 娇小萝被两个黑人用半米长| 国产成人无码WWW免费视频在线| 99热6精品视频6| 2019天天射干网站| 亚洲欧美中文日韩v在线|