分布式數據庫,什么是分布式數據庫
分布式數據庫,什么是分布式數據庫
分布式數據庫系統是在集中式數據庫系統成熟技術的基礎上發展起來的,但不是簡單地把集中式數據庫分散地實現,它具有自己的性質和特征。集中式數據庫系統的許多概念和技術,如數據獨立性、數據共享和減少冗余度、并發控制、完整性、安全性和恢復等在分布式數據庫系統中都有了不同的、更加豐富的內容。
現狀與需求
???
???????? 有些公司擁有多個分支公司,而各地的分支公司都有自己的數據庫,總公司需要實現和各個分支公司的互聯互通,能夠調用各個分支公司的數據庫。這就是一種分布式數據庫應用系統的調用。
???
??? 解決方案
???
??? 東顯科技充分考慮了企業的這種實際的需求,為信息化建設投資的企業度身定制了DLAN互聯解決方案,低成本、高安全性、高可靠性的實際效果,滿足企業的以上需求,實現了真正意義的網絡辦公及無紙化辦公,協同運作、統一管理。
??? 在具有數據庫的分公司安裝DLAN SERVER端(MDLAN),沒有數據庫的分支公司采用DLAN VPN的分支端(SDLAN),移動用戶采用PDLAN,這樣就可以實時完成全網的數據訪問。
???
??? 應用效果
???
??? 1.實現總公司的應用系統能夠實時性的訪問總部的數據庫。
??? 2.實現了總部與各分支機構的局域網遠程互聯,實現了真正意義的網絡辦公及無紙化辦公,協同運作、統一管理,為企業更進一步的發展打下基礎;
??? 3.實現了工程師遠程管理各分公司電腦,大大降低了全公司的維護成本,實現真正意義上的移動辦公,公司領導及出差人員只需以任意方式接入Internet,安裝了DLAN VPN軟件的筆記本電腦即可同樣安全的接入公司總部網絡,共享信息和應用系統,實現無處不在的移動辦公;
??? 4. 足夠的保證了數據隧道的安全、數據的加密和分支接入的安全;
??? 5. 同時VPN線路支持語音傳輸,為企業的內部語音(VOIP)互聯和視頻通訊打下基礎;
(1)數據獨立性。數據獨立性是數據庫方法追求的主要目標之一。在集中式數據庫中,數據獨立性包括兩方面:數據的邏輯獨立性和物理獨立性。其意義在于程序和數據的邏輯結構和數據的存儲結構無關。在分布式系統中,數據庫獨立性除了上面所說之外,還有數據分布獨立性亦稱分布透明性,即用戶不必關心數據的邏輯分片,不必關心數據的物理位置分布的細節,也不必關心重復副本(冗余數據)的一致性問題。有了分布透明性,用戶的應用程序書寫起來就如同數據沒有分布一樣。在集中式數據庫中,數據的獨立性是通過系統的三級模式和它們之間的二級映象得到的。分布式數據庫,分布透明性是由于引入新的模式和模式之間的映象得到的。
(2)集中與自治相結合的控制結構。數據庫是供用戶共享的,在集中式數據庫中,為保證數據的安全性和完整性,對數據庫的控制是集中的。由數據庫管理員(DBA)負責監督和維護系統的正常運行。
在分布式數據庫中,數據的共享有兩個層次:一是局部共享,即在局部場地上存儲局部用戶的共享數據。二是全局共享,即在分布式數據庫的各個場地也存儲可供網絡中其他場地的用戶共享的數據,支持全局引用。因此,相應的控制結構也具有兩個層次:集中和自治。各局部的DBMS可以獨立地管理局部數據庫,具有自治的功能。同時,系統又設有集中控制機制,協調各局部DBMS的工作,執行全局應用。
(3)適當增加數據冗余度。在集中式數據庫中,盡量減少冗余度是系統目標之一。其原因是,冗余數據浪費存儲空間,而且容易造成個副本之間的不一致性。減少冗余度的目標是用數據共享來達到的。而在分布式系統中卻希望增加冗余數據,在不同的場地存儲同一數據的多個副本。其原因是提高系統的可靠性和性能,當某一場地出現故障,系統可以對另一場地上的相同副本進行操作,不會造成系統的癱瘓。系統可以根據距離選擇離用戶最近的數據副本進行操作,減少通信代價。但是增加冗余會碰到集中式數據庫同樣的問題,即不利于更新,增加了系統維護代價,需要在這些方面作出權衡。
(4)全局的一致性、可串行性和可恢復性。分布式數據庫中各局部數據庫應滿足集中式數據庫的一致性、可串行性和可恢復性。除此以外,還要保證數據庫的全局一致性、可串行性和可恢復性。例如,在前面提到的銀行轉帳事務中,包括兩個節點上的更新操作,當其中一個節點出現故障,應使全局事務回滾,在一個節點撤銷已經執行的操作等。
分布式數據庫系統的目標
研制分布式數據庫系統的動機、目的,主要包括技術和組織兩方面的目標。
(1)降低費用。使用數據庫的單位在組織上往往是分布的(部門、科室),在地理上也是分布的。分布式數據庫系統的結構符合這種分布的要求。允許用戶在自己的本地錄用、查詢、維護等操作,實行局部控制,降低通信代價,提高響應速度。
(2)提高系統可靠性。將數據分布于多個場地,并增加適當的冗余度可以提供更好的可靠性。在一些可靠性要求高的系統中,這一點尤其重要。避免了因為某個場地的故障而造成全部癱瘓的后果。
(3)保護投資。當在一個企業中已經建成了若干個數據庫之后,為了相互利用資源,為了開發全局應用,就要研制分布式數據庫系統。否則,就要把現有的數據庫集中起來重建一個更大的集中式數據庫,將是困難和不經濟的。所以,利用分布式數據庫充分利用現有數據庫資源,提高利用率。
(4)易于擴展處理能力和系統規模。當一個企業增加了新的部門時,分布式數據庫系統的結構可以很容易地擴展系統,甚至是唯一的途徑:在分布式數據庫中增加一個新的節點,不影響現有系統的正常運行。這樣比擴大集中式系統要靈活經濟。在集中式系統中擴大系統和系統升級,由于有硬件不兼容和軟件改變困難等缺點,升級的代價常常是昂貴和不可行的。
現狀與前景
盡管在過去的時間里,分布式數據庫已經取得了很顯著的研究成果,但是,成功地進入商品化運行的軟件卻仍為數不多。
集中系統的數據庫設計是比較復雜的,而分布式數據庫的設計就更為復雜了。它除了集中式數據庫設計的所有復雜性,還有數據分布的決策、更新同步以及查詢分解等的復雜性。另外,還有設計通信系統的問題。
大多數的數據庫管理系統也許走一條從集中到分布的道路。首先是跨越數個節點定義數據庫,避免不同節點數據的更新同步問題,許可局部和遠程查詢,回避了復雜的查詢處理問題。進一步的工作是增加有限的重復,如果最新的數據并不是最重要的情況下,這樣提高了檢索的性能。最后,就是完全的分布式數據庫管理。系統的功能能夠處理復雜的查詢,有較好的并發控制機制和保證數據的更新同步。
對分布數據管理的研究有兩個方面。一是單項的研究。比如數據的分布問題,通信問題等。在研究一個問題時,假定其他因素是不變的,得出研究成果。此處還要研究的是要將各種因素綜合起來,研究它們的相互作用和結果。數據庫設計和更新同步之間就有密切的聯系,對于更新要求,依據不同的更新同步方案,對通信系統的要求也隨著不同。因此,就要對這些因素綜合地考慮。
分布式數據庫系統的研究領域還包括對計算機網絡的研究。計算機網絡技術的迅速發展,已經很大程度地影響到了數據庫和分布數據庫的領域。不管是在遠程網絡還是局域網領域,都發生了很多的變比。局域網和遠程網之間的處理差別,必然會導致處理數據庫和分布數據庫問題的顯然不同的一些原則和方法。
非常好我支持^.^
(18) 14.8%
不好我反對
(104) 85.2%
相關閱讀:
- [編程語言及工具] 常用于緩存處理的機制總結 如何避免緩存雪崩問題? 2023-10-24
- [電子說] 觸發器的基本原理、應用場景及優缺點 2023-10-23
- [存儲技術] AI大模型對數據存儲技術的發展趨勢 2023-10-23
- [電子說] 訪問控制中PIP的典型流程和關鍵點思考 2023-10-23
- [電子說] 物證管理系統|智物證DW-S404是一套成熟系統 2023-10-23
- [電子說] Python 梯度計算模塊如何實現一個邏輯回歸模型 2023-10-21
- [電子說] TinyDB :一個純Python編寫的輕量級數據庫 2023-10-21
- [電子說] mysql經典面試題及答案 2023-10-20
( 發表人:admin )