數據存儲無處不在:CD, DVD, DAT, DCC, HDD, MiniDisc, SSD, SD, Sim, 軟盤,超級磁盤,磁條,條形碼

二進制的媒介并不在乎所呈現的數據是什么。一旦我們可以放心記錄二進制數據,我們就會把音頻,視頻,圖片,文本,CAD文件和電腦程序放到相同的媒介上,然后完整復制。

這些數據類型之間的唯一差別是其中的一些數據需要在一個特定時間內重復生成。

時機,可靠性,持續時長及成本

不同的存儲媒介有不同的特點,沒有哪種介質盡善盡美。硬盤在讀取密集型應用上存儲性能最佳,但是硬盤不能從驅動中移除。盡管硬盤的數據記錄密度一直比光盤的大,但是你花個幾秒鐘就可以置換出光盤。而且,光盤的貼標成本也很低,所以適合大規模發行。

閃存可提供快速訪問,而且體積很小,不過它的可持續寫入周期存在局限。盡管閃存替代了以前的軟磁盤,但是軟磁盤技術并沒消失。它還存在于航空公司,火車票,信用卡和酒店門房鑰匙的磁條中。條形碼就是個很好的例子。

在閃存中,存儲密度是由單個電荷井的精細構造程度來決定。但是光盤技術的發展不僅可以保存越來越多的信息,而且可解析的數據也越來越小。

U盤中的芯片:沒有活動部件,可直接使用

在旋轉內存中,無論是磁盤還是光盤的,都存在兩個問題:我們要盡可能收集多一點軌道,同時要盡可能多地把數據放到軌道中。

這些軌道極其狹窄,需要主動跟蹤伺服系統使磁頭可以持續被記錄下來,而不受耐受力和溫度改變的影響。為了減少磨損,用于收集的磁頭和磁盤之間是不接觸的。

光盤會盯著軌道,雖然是從微觀角度,但卻是由磁力驅動,磁頭掠過磁盤上方幾納米處的氣膜。自相矛盾的是,它是閃存,沒有會帶來磨損的活動部件。

編碼

磁盤會掃描自己的軌道,然后按順序收集數據。我們不能只是在磁盤軌道上寫入原始數據,因為如果這些數據包含了相同的比特,那么就無法區分這些比特,讀取器的同一性也會丟失。相反,數據是通過一個名為信道編碼的進程來修改。信道編碼的功能之一就是保障信號中的時鐘內容,而不考慮真正的數據樣式。

在光盤中,追蹤和聚焦是過濾數據后,通過收集光圈查看數據追蹤的對稱性來執行。信道編碼的第二個功能是去除數據追蹤的DC和低頻內容,使過濾更有效。圓形光點很難分辨軌道上距離太近的數據。

大眾媒體

第一款量產的糾錯應用存在于壓縮盤中,1982年上市,這是在Reed和Solomon的論文發表22年之后。CD的光學技術是早期的鐳射影碟,那么它的不足在哪里呢?

首先,數字音頻光盤要實時播放。播放器不會把錯誤視為電腦本身的功能,所以必須得將其糾正。再者,如果CD使用的系統比Reed-Solomon編碼更簡單,那么這個系統將會更大–因此,將影響到便攜式和汽車播放器市場。第三,Reed-Solomon糾錯系統是復雜的,在LSI芯片上部署比較經濟。

早在十年前,用于制作壓縮光碟的所有技術早已出現,但是直到LSI Logic 公司的芯片性能跨過某個特定門檻,其性能才突然變得經濟實用。

同理,之后也是在LSI技術可以用消費者可接受的價格執行實時MPEG解碼時,我們才看到了DVD的流行。

綜合

所有光盤用來客服這些問題的技術都被稱為分組編碼。比如,如果所有可能的14比特的結合體都被排序,且以波形描繪出來,就可以選擇出最容易記錄的。

分組編碼如何限制記錄的頻率呢?在a) 表示的最高頻率點,轉換間隔了三個信道位。這樣信道位的記錄密度就成了三倍。注意h)是無效編碼。最長的信道位運行于g),而i) 無效編碼。

上圖顯示出,我們排除了改變太緊密的模式,因此記錄的最高頻率被減少了三分之一。

我們還排除了1和0之間存在較大差異的模式,因為那樣帶來的是我們不想要的直流偏移。267保留了我們許可的模式,比起要記錄八個比特的256模式要好,剩下可同時使用的模式少之又少。

EFM

Kees Immink的數據編碼技巧使用14個信道位的模式來記錄八比特–因此,其名稱就是EFM(eight to fourteen modulation)。三種合并的比特被放在各組之間,防止邊界出現混亂,所以17信道位被用于每個數據的記錄。這樣是違背直覺的,直到你意識到編碼規則將信道位的記錄密度提升三倍。所以,我們以3 x 8/17勝出,密度比率為1.41。

是信道編碼機制本身增加了41%的播放時間。筆者認為在30年前能做到如此是非常不錯的。

壓縮光碟和MiniDisc使用的EFM技術借助了波長為780納米的激光。DVD使用的是其變體,EFM+,激光波長減為了650納米。

藍光格式也使用分組編碼,但不是EFM。而是信道模擬,稱為信道調制,也稱1.7PP調制。它的密度比率要稍遜一些,但由于使用了波長為405納米的激光,所以存儲密度有所增加。這種激光其實并不是藍色的。

磁帶記錄器的磁頭有兩極,就好像微型馬蹄鐵,當磁頭掃描軌道時,兩極之間的有限距離會產生孔徑效應。

下圖顯示出頻率響應就像一個梳子狀的過濾器,帶有周期性的暗碼。傳統的磁帶記錄被限制在下面第一個暗碼的波段部分,但是在第一和第二個暗碼之間,則由部分響應技術來掌控,這樣就把數據容量翻了一番。

所有磁性記錄器都存在磁頭間隙導致的回放信號a) 的暗碼問題。在b) 顯示的部分響應中,磁頭感知不到奇數位的數據,于是會回放偶數位的數據。一個比特之后,兩個偶數位數據就會被恢復。

如果數據太小,以至于其中一個數據(奇數位置)其實就在磁頭間隙處,那么磁頭的兩極卻只能識別兩邊偶數位置的數據,然后輸出。這兩種數據相加就成了第三級信號。磁頭會交替重復生成交叉存取的奇數和偶數數據流。

使用兩股數據流的合適信道編碼,那么給定數據流的外部層級就可以輪流使用,這樣就更具可預測性,而讀取器也可以掌握這種預見性使數據更為可靠。這就是現如今讓硬盤容量超乎想象之大的PRML編碼。

糾錯

在真實世界中,熱活力或無線電干擾都是影響我們記錄的因素。顯然,用二進制記錄是最難被干擾的。如果有一比特的數據被干擾,那么會引起整個數據的改變,因為1會變成0或者0會變成1。如此明顯的改變會被糾錯系統檢測出來。在二進制中,如果有一個比特是錯誤的,那么只需把它設置為相反的那個數就可以了。因此,二進制的糾錯是比較容易的,真正的難點在于找出有錯的那個比特。

使用二進制以及具備有效糾錯/數據整合系統的存儲設備可以再次生成所記錄的相同數據。換言之,數據的質量從本質上是透明的,因為從媒介質量那里,它就已經實現了去耦。

有了糾錯系統,我們還能在任意類型的介質上做記錄,包括沒有經過優化的介質,如火車票。以條形碼為例,只有當印有條形碼的產品靠近讀取器時,糾錯系統才會執行任務:要確認已經發現條形碼。

市場存在減少數據存儲成本的壓力,這就意味著要把更多數據放入給定空間內。

沒有哪種介質是完美的,所有介質都存在物理缺陷。由于數據越來越小,這些缺陷就顯得越來越大,所以缺陷導致數據出錯的幾率也在增加。

糾錯需要在真實數據中加入檢測數據,所以讓人感覺記錄效率會被降低,因為執行這些檢測也要占用空間。事實上,少數額外的檢測任務會讓記錄密度翻倍,所以這是存儲容量的凈增加。

一旦了解到這一點,就會明白糾錯是很重要的一項技術。

第一個實用型的糾錯代碼是Richard Hamming 1950年開發的。Reed-Solomon編碼則是1960年發布。糾錯代碼的發展史其實只有十年。

糾錯要向真實信息添加檢測數據,要優先于記錄,從這些信息中進行計算。這些信息和檢測數據一起形成了一種代碼字,這表示它具備了一些可測試的特性,如通過特定的數學表達式來區分。播放器會對這些特性進行測試,如果發現數據有錯,就不能獲取可測試的特性。余數不會是零,而是被稱為綜合癥的一種模式。通過分析這種綜合癥可以糾錯。

在特定有限域上的Reed-Solomon 多項式代碼

在Reed-Solomon代碼中,有若干對不同的數學表達式,它們被用來計算校驗符。一個錯誤會導致兩種綜合癥。解出兩個方程,就可能發現錯誤的位置以及導致綜合癥出現的錯誤模式。

錯誤被呈現并被糾正

如果沒有可靠性和存儲密度,那么我們現在所使用的這一切將不復存在。我們的數碼照相機所拍的照片會被光點破壞,那樣我們會更喜歡使用傳統膠卷。

如果沒有Reed-Solomon糾錯系統,那么壓縮光盤怎么會出現呢?

借助糾錯系統,記錄密度會持續增長,直到極限。每個比特使用一個電子的閃存;一個磁化分子代表一個比特的磁盤;使用超短波長的光盤?;蛟S它會被冠以別的什么名稱。在達到極值前,存儲容量會呈平穩態勢。

力臻完美

最先由Claude Shannon依照科學原理總結出的信息理論決定了糾錯系統的理論局限性,就好像熱動力學原理對熱引擎效率的局限一樣。

但,在真實世界里,沒有機器會達到理論效率極值。Reed-Solomon糾錯代碼就是以信息理論設定的理論極值來操作。所以不會再有更強大的代碼了。

糾錯系統的糾錯能力是顯而易見的。筆者之所以對此表示懷疑,是因為糾錯理論專業且神秘,以至于不懂的人根本不敢涉足,因而只能留給懂這些東西的人來處理。

盡管,糾錯系統編碼的局限性已經出現,但并不意味著不會再有新突破。糾錯和信道編碼都需要對信息進行編碼和解碼,而這就遵循摩爾定律。

因此,編碼系統的成本和規模都會隨著時間的發展而減小,或者其復雜性會增加,使得新應用成為可能。盡管如此,如果未來出現新的二進制數據存儲設備,使用的是我們聞所未聞的介質,糾錯系統將仍然是基于Reed-Solomon編碼。

未經允許不得轉載:存儲在線-存儲專業媒體 » 為什么說數據存儲技術已經比較完美?
分享到

dostor

相關推薦

精品国产午夜肉伦伦影院,双性老师灌满浓jing上课h,天天做天天爱夜夜爽,攵女乱h边做边走