I n t e r n e t訂閱服務也會產生類似的結果, I n t e r n e t訂閱服務發送各種更新的信息,從股票價格、新聞到天氣預報,無所不包。信息驅動的結果之一是當人們希望某條信息時,他們就訂閱它。訂閱服務系統每天都給辦公室工作人員發送許多則消息,這些消息都是他們認為有用的、重要常困難。

軟件發布是另一個數據流的源。熟悉I n t e r n e t軟件發布的用戶經常訂閱各種軟件服務,這些軟件服務包括更新、發布軟件信息、預先發布軟件的測試版,甚至更嚴重的情況,這樣,一個軟件很快就有4、5個拷貝保存在磁盤上,大大消耗網絡服務器的存儲空間,同時,在這種環境下,計劃適合的存儲需求也十分困難。

2. 流體數據目標的識別

一旦數據進入一個機構,接下來的問題是:數據應該存放在那里?結構數據很容易跟蹤,因為它已經編入了最初存放的地方。然而,事件驅動的應用能夠對數據的內容做出反應,并起動一個新的動作將數據傳到其他的系統。例如,特許零售商的銷售報告先通過電子的形式傳到總部,經過正常的處理后,最后再把它傳到另一個系統,以計算在銷售戰中所獲得的成果。

E R P系統的設計目的是把分散的全局數據集成為單一的邏輯系統,它的主要思想是以電子的方式連接所有的商業過程,這樣就能在整個組織范圍內做出更好的決策。依照這種方法,一個部門中的活動可能成為同一公司中另一部門決策的部分信息。舉一個簡單的例子,假如一個部門庫存過剩,則可以把過剩的庫存送到另一部門去,以減輕該部門庫存壓力。

然而,結構數據流的實際目的地不是它所發送的系統,而是連接到這個系統的存儲設備。為了真正地了解這些系統的性能,理解從發送機器的設備到目的機器的設備的數據流是很重要的。盡管通常存儲成分理所當然地存在,但正如我們在本書大部分章節中所探討的那樣,情況并不是這樣。非結構數據流一般有許多種類各異的目標, e – m a i l消息及附件最終散布在各種不同的文件夾、本地磁盤和網絡服務器中。圖1 – 3顯示了一個e – m a i l被同時放在三個不同位置的例子。

出于自我保護的本能,許多用戶都堅持把一些文件的多余拷貝保存起來,以備將來萬一能用上。但是,當對某一案件作判決時, e – m a i l消息卻經常被理解為與政治有牽連,而招致麻煩。這些“可憐人”之所以采用如此的災難保護辦法,是因為過去曾經丟失過大量有價值的資料,因此被弄得焦頭爛額,苦不堪言。保存e – m a i l也可能引起麻煩,注意到這一點是饒有趣味的。例如,在1 9 8 7年,由于e – m a i l的摘錄,導致了對I r a n – C o n t r a一案審判受到影響。在最近的司法部反托拉斯訴訟案中,內部的e – m a i l信息給微軟招致了很大的麻煩。

當然,一旦某個信息被人堅持放入個人歸檔文件中時,刪除它的可能性是很小的。當e – m a i l系統的存儲空間太緊張時,系統管理員可能發送e – m a i l給該系統的用戶,要求他們刪除不必要的信息,也可以通過限制每個用戶的存儲配額的辦法,迫使用戶刪除不必要的文件。這雖然減輕了e – m a i l系統的存儲壓力,但用戶可能把這些過期的e -m a i l轉存到其他地方,以便在必要的時候使用。事實上,差不多沒有人有時間重讀那些過時的e – m a i l,有些人甚至都來不及閱讀當前的e -m a i l。是否保存過期的e – m a i l是一個人對緊缺資源的自律態度問題?,F在由于每G B硬盤容量價格的下降,用戶并不為節省存儲資源而感到煩惱。

I n t e r n e t文件與e – m a i l稍微有點不同,因為當某人認為某We b頁面有用或令人感興趣時,他才去獲得并瀏覽該頁面。從這個意義上說, I n t e r n e t文件是政治中性的,與e – m a i l相比,它的保存價值更小。但是它的吸引力在于它是純粹用來提供知識的,它能使人獲得更多的知識、更快的決策、發現問題和識別機會,總之,是能為人類帶來榮譽的知識。

I n t e r n e t的訂閱服務帶來相當特殊的問題。在同一單位里可能有若干個人訂閱同一服務內容的、導致存儲同樣數據的多份拷貝。圖1 – 4顯示了由e – m a i l和I n t e r n e t等引起的相同信息的多份拷貝問題,這使得對數據的管理變得相當困難。

3. 結構數據流和非結構數據流的區別

除了結構數據流定義了源和目標以外,它還在多個方面不同于非結構數據,如表1 – 3所示。

4. 管理流體數據

知道結構數據流的源、目標及其支撐的網絡技術后,則可以對數據流實施監控,并可以在問題發生之前預測它們。例如,知道平均的數據傳輸量、它的增長率及網絡連接的性能,就可以確定在所有其他因素不變的情況下,現存的網絡能維持運行多長時間。

管理非結構數據是一個更困難的任務。不知道數據的源和目標,可資利用的資源又不多。雖然網絡的瀏覽傳輸能夠用一些工具加以過濾和監控,但是用戶認為侵犯了他們的隱私,阻礙他們的工作效率。最好的辦法大概是建立一個I n t e r n e t內容存儲策略,并使人們明白,為了確保有足夠的可用資源,這樣的責任機制有時是必須的。

如何將企業的數據組織成為I n t e r n e t內容?一個簡單的辦法是為那些內容建立部門或功能目錄,如圖1 – 5所示。在這樣的策略下,用戶可以養成把下載來的文件存儲在他們各自的目錄中的習慣。放在功能目錄中的文件甚至可以連接到企業We b頁面上,以供其他感興趣的人享用。用戶可以通過e – m a i l連接到共享的文檔上來交換文件,而不必發送這些文檔的整個拷貝。

未經允許不得轉載:存儲在線-存儲專業媒體 » 1.1.2 大量的流體數據
分享到

liukai

相關推薦

精品国产午夜肉伦伦影院,双性老师灌满浓jing上课h,天天做天天爱夜夜爽,攵女乱h边做边走