說說PCIe閃存卡“丟數據”那些事兒
[導讀] 造成PCIe 閃存卡應用數據丟失的原因有很多,有產品質量問題,也有應用方法的問題。
我的電腦用的是SSD,感覺也沒有多快,但當我有時候需要用一下舊電腦,或者接觸同時的非SSD電腦時,我就難以忍受這些電腦的速度。同樣的,對于企業OLTP的應用來說,在PCIe插槽上,安裝上一塊SSD閃存卡,8TB的容量,70萬~80萬的IOPS性能,讓人愛不釋手。如此表現,應該秒殺磁盤甚至全閃存陣列,但這樣的景象并沒有發生,很重要的原因在于PCIe閃存卡也有短板,會有數據丟失的現象,而這是用戶最怕踩到的“坑”。
從“跳蚤”藥說起
造成PCIe 閃存卡應用數據丟失的原因有很多,有產品質量問題,也有應用方法的問題。
首先質量的問題。SSD畢竟是新技術,應用經驗積累一個需要長期的沉淀過程。例如于ECC引擎,不同設計就會有影響(詳見:PCIe閃存卡揭秘:請問你用了多少ECC引擎);再例如浴盆曲線和雙曲線、控制供電和溫度、磨損均衡策略等,都會對PCIe閃存的可靠性、穩定性帶來影響(詳見:告訴你:影響PCIe SSD閃存卡使用的幾個關鍵點 )??傊?,影響可靠性的因素有很多,市場發展初期難免良莠不齊,劣幣驅逐良幣也是有的。
其次就是使用的方法。這讓我想到一個笑話:說是一個人買了不見效雙倍賠償殺跳蚤的藥,使用之后仍然被咬的渾身是包,找店家賠償。店家問是怎么用的。這個人說,就撒在床褥下面,店家說:“這是用藥的方法不對,我們用藥的方法,是抓到跳蚤,把藥放到跳蚤嘴里,如果跳蚤不死,我們就雙倍賠償。”“可是如果我能夠抓到跳蚤,捏死不就完了嗎?為什么還要這么費事。”“這個嗎……,這就是方法的不同了。”在這個笑話中,店家顯然是狡辯。但PCIe閃存卡的確有一個使用方法的問題。
PCIe卡的使用方法
在SanDisk閃迪,閃迪中國區銷售工程師經理艾昆介紹了Fusion IO PCIe閃存卡的一些案例,從中也可以看到一些不同的使用方法。
這是一個基于Oracle數據庫加速的案例。在這個案例中,我們可以看得存儲部分,用使用了兩臺Dell PowerEdge R720 Intel E5 x86服務器,各配有2塊IO Drive2 容量3.0TB MLC PCIe閃存卡,彼此之間,通過FC交換機連接,借助ION Accelerator高可用軟件構建高可用解決方案。該系統每分鐘可以處理96萬個新訂單和250萬次交易,100萬IOPS讀取,時延0.5秒。我想這樣的一個方案,應該可以確保高可用性,不會出現數據丟失的問題。當然,這樣的系統成本會有些高。
這個案例應該更加常見,估計多數用戶是這樣使用的。好處在于方案簡單,性價比也比較高。對于這樣的應用,艾昆的建議是用戶可以借助分布式系統應用,從應用的層面解決數據丟失的問題。
艾昆指出,針對不同的應用需求,會有不用的選擇。針對閃存業內關于Host Based和Device Based,不同PCIe閃存卡實現方式的爭論(詳見:未來屬于NVMe 也許只是未來)。艾昆的觀點是各有利弊,如Host Based設計會占用部分主機CPU的資源,但Host Based能耗低;與之相反,Device Based能耗會高一些。目前二者性能相當。艾昆表示:SanDisk 并不排斥Device Based設備,也不會排斥NVMe。關鍵在于時機和選擇。他指出,SanDisk PCIe閃存卡生態已經比較成熟,這是閃迪的優勢。
全閃存存儲系統
除了PCIe閃存卡之外,超大規模閃存系統應用,這也是另外一個適用的場景。對此,閃迪推出了InfiniFlash全閃存存儲系統。
所謂全閃存存儲系統強調大容量,通過SAS/SATA擴展卡,InfiniFlash在3U空間內繼承了 64個8TB的PCIe閃存卡,系統總的存儲容量可以達到512TB,IOPS性能達到了78萬。其中,每個閃存卡的讀IOPS為2萬,隨機寫性能為1.2萬IOPS。(關于SAS擴展卡,詳見:常換常新 PMC SAS/SATA HBA 不輸“烏鎮”)。
據閃迪的官方數據顯示,與傳統的硬盤驅動(HDD)陣列相比,InfiniFlash其存儲密度可達5倍,性能達到50倍,可靠性達到4倍,而功耗則可減少80%。無需壓縮或去重技術,其全閃存系統的最低起價不足1美元/GB。借助可提供數據縮減方案的軟件棧,每GB的實際成本甚至可大幅下降至前所未有的水平。
這樣的一個產品設計可以用于大規模對象數據存儲,也可以適用于數據庫快存儲;即可以用大數據應用,也可以用于數據庫應用。
小結
不同于消費類市場的產品化,企業級應用市場表現出更多的差異化,并不存在一款產品通吃的現象。因此對于用戶來說,就需要根據應用的實際需要選擇好產品。
一方面,用戶需要一定的鑒別能力,要防止濫竽充數帶來的問題;另外一方面,也需要根據可靠性、穩定性的需要,選擇合理的方案??梢灶A見,隨著產品設計和用戶應用水平的提升,類似“丟數據”這樣的“坑爹”會逐步減少。所謂挑戰機遇并存!因此對于用戶來說不要因噎廢食,同時也需要小心謹防,拿捏好分寸和尺度。