數據存儲產業服務平臺

淺談分布式數據庫的數據存儲優勢和問題

一 分布式數據庫系統概述

分布式數據庫系統是在集中式數據庫系統的基礎上發展起來的,是計算機技術和網絡技術結合的產物。分布式數據庫系統適合于單位分散的部門,允許各個部門將其常用的數據存儲在本地,實施就地存放本地使用,從而提高響應速度,降低通信費用?;诰W絡基礎上的分布式數據庫系統經常對數據庫進行數據分片。從數據意義上講,數據分布的合理與否不僅影響著訪問的局部性,而且也制約著數據查詢及事務處理的效率。

在分布式數據庫中,數據存儲包括數據分片和數據分配兩個部分。數據分片和分布是分布式數據庫中兩個重要慨念,分布式數據庫大部分問題均與數據分片和分布有關,它們對整個系統的可用性、可靠性、及效率都有極大的影響,同時也與分布式數據庫系統的其他方面密切相關,尤其是分布式查詢處理問題。以關系數據庫為例,在關系型分布式數據庫系統(RDDB)中,數據分片是從邏輯上將全局關系劃分為邏輯片斷即子關系,而數據分配就是再以一定的冗余度將子關系分配到多個結點上,數據存儲即數據分片與數據分配的總和。數據分片是一種對關系的劃分,在集中式數據庫中可以將所有的表視為一個總全局表的邏輯子表,而總全局表是這些子表的并集,其屬性包括這些子表的所有屬性,元組包括這些子表的所有元組,對應的在這個總全局表上元組的非空值呈塊狀區域分布。數據分配則是將這些子表以不同的冗余度存放在一個或多個場地或節點,這兩者間的區別在于集中式數據庫不存在數據復制的問題,不需要存在多副本,但也會出現表名不同。但表屬性和屬性值完全相同。

二 分布式數據庫的設計

如何在不同的計算機上分布文獻資料的數據和程序才能提高系統效率,增加系統的可靠性和可用性。這是我們面臨的重要問題。為了增加系統的可靠性。系統就必須使數據重復,也就是系統應保持幾個相同的副本,每個副本放在不同的結點內形成數據重復,數據重復不但可以增加系統的堅定性,還可以提高系統的并行性。借助于多個副本,幾個結點可以并行地處理有關查詢。然而,系統存在著多副本就必須要保證全部副本的一致性結果會增加系統的總開銷。因此,我們必須認真考慮文獻資料數據資源共享的合理分布。

而在分布式數據庫中,由于數據的分布和冗余,使得查詢處理中需要考慮站點間傳輸數據的通信費用,所以除了考慮CPU代價和IO代價之外。還應該包括數據在網絡上的傳輸代價。即總代價=CPU代價+IO代價+通信代價。因此,分布式數據庫進行分布式設計時,一個重要原則是使數據和應用程序實現最大程度的本地性,這樣就可以使應用數據盡可能地本地化,以減少通信開支。對于建立在各場所的分布式數據庫,不需要過分進行限制,但也必須要有規范的設計要求。

(1)硬件規范,必須支持局域網乃至Internet的包括聲音,文字,圖像的交流,支持IE或Netscape瀏覽web界面,支持開放性數據源的建立。

(2)數據庫形式規范,原則上Access、Paradox,甚至文本文件都可以進行數據傳輸,但必須保證自己有開放式數據源的特征及關系繼承的特征。

(3)域的統一和分類、分科的統一,數據庫在各個分布場所必須有統一的域結構,以確保給用戶提供完整統一的視圖,科目分類的命名必須要求規范,以確保查詢和統計工作的準確性,在方便工作的條件下,可以不要求唯一確定的主關鍵字。

三 傳統數據庫存在的問題

隨著計算機技術的發展和應用的深入,分布式技術在構建企業級應用程序中更為廣泛流行。是因為分布式數據庫存儲方式給企業帶來了很多的方便以及好處。在沒興起分布式浪潮之前,由于傳統的數據存儲方式過于簡單化,過于集中管理而造成了大量數據的堆積。這樣一來一個公司或企業要使用大量的數據就需要大量的存儲數據的介質,而導致服務器的回應下降乃至崩潰,這樣一來就會有大量數據會隨著服務器的崩潰而丟失,而數據對于大型企業來說數據量會很大,數據的丟失,沒有了數據的對照會使企業的業績虧損,更嚴重的說也可能導致企業倒閉。這種方式存儲還不能解決的問題就是異地的存儲,有的企業會有很多的分公司,這樣一來就傳統的數據存儲就會帶來大量人力、資金的浪費。這些問題的存在也促進了分布式數據庫的發展。

四 剖析分布式數據庫存儲的優勢

分布式數據庫顧名思義,具有分布數據的功能,實際上它的數據存儲方式是物理上是分布的,邏輯上是集中的。也就是說分布式數據就是指數據和程序可以不位于一個服務器上,而是分散到多個服務器,以網絡上分散分布的地理信息數據及受其影響的數據庫操作為研究對象的一種理論計算模型。而分布式數據庫數據存儲是在不同地域或者不同網絡之間的存儲,進而達到數據共享,數據交換的目的。分布式數據存儲是先經過一個“鈍化”,然后“序列化”成文件從內存中的一端傳到網絡的另一端,到另一端后在激活的一系列過程,詳細的說數據流在加工過程中產生的臨時文件或加工過程中需要查找的信息。數據以某種格式記錄在計算機內部或外部存儲介質上。數據存儲要命名,這種命名要反映信息特征的組成含義。數據流反映了系統中流動的數據,表現出動態數據的特征;數據存儲反映系統中靜止的數據,表現出靜態數據的特征。這就是它的存儲過程。

五 總結分布式數據庫存儲的優勢

分布式數據的優勢也正體現在這“分布”這兩個字,讓操作終端的人感覺不到數據庫的分散,當然這也需要好的網絡的努持。使使用者感覺是在本地數據庫操作一樣。這樣既方便又快捷,使維護起來不用操作大量的數據。它綜合了計算機(Computer)、通訊(Communication)、顯示(CRT)和控制(Control)等4項技術,其基本思想是分散控制,集中操作、分級管理、配置靈活、高可靠性,易于維護等基本特點,從而實現了異地存儲的實現。

未經允許不得轉載:存儲在線-存儲專業媒體 » 淺談分布式數據庫的數據存儲優勢和問題
精品国产午夜肉伦伦影院,双性老师灌满浓jing上课h,天天做天天爱夜夜爽,攵女乱h边做边走