PCIe交換聽起來確實是個老生常談的話題,但它實際上已經成為技術變革當中的關鍵性組成部分,并將最終影響到服務器及存儲陣列間邊界的進一步模糊以及由此帶來的數據訪問速度提升。

位于溫哥華的PMC-Sierra公司已經推出了自己的Switchtec交換機方案,而我們則與該公司產品營銷經理Ray Jang探討了為何此類技術目前再次受到高度關注。

記者:PCIe交換產品有著怎樣的存在背景?

Ray Jang:PCIe標準最初建立的初衷并非面向相對較為嚴苛的企業級存儲、服務器以及數據中心設備要求。舉例來說,在數據中心環境之內,預期之外的卡、驅動器乃至其它周邊設備插入與拔出絕對不能引發CPU以及/或者系統的崩潰,這已經成為體系運作當中的關鍵性前提。標準PCIe交換機并不能順利應對這些每天經常出現的意外狀況,而這也成為PCIe機制在企業系統當中全面推廣的一大障礙。

各類重大技術創新需要與SAS等傳統互連技術所提供的穩定性及可擴展成本效益水平相匹配。PMC公司將來自我們SAS連接產品的相關專業知識、高級SERDES功能以及源自IDT的PCIe交換IP加以結合,打造出一套面向市場需求的PCIe存儲交換機。這類產品使得基于PCIe-SSD的系統成為可能,并保證其具備彈性、可編程性以及大規模部署所必需的高級診斷能力。

記者:第一,為什么您的客戶需要上述能力?其次,這一切會給最終用戶帶來怎樣的收益?

Ray Jang:系統設計師們需要一套可靠的PCIe交換解決方案來將處于單一機柜內的高性能PCIe驅動器池同各類關鍵性功能對接起來,具體包括高級診斷與調試工具,同時亦需要利用深層編程能力來解決可靠性以及互操作性方面的挑戰。

我們的客戶還能夠從集成化可編程處理器當中受益,也就是允許他們對PCIe交換功能進行強化并利用我們提供的SDK處理相關錯誤。此外,集成化Enclosure Management解決方案則能夠顯著簡化開發工作、從而更快地將產品交付市場。

利用Switchtec PSX所構建的系統在能耗方面只相當于使用其它PCIe交換機方案的40%,這相當于在每臺機架當中節約近1000瓦功率。此類系統還能夠將以往交換機對典型閃存陣列的尋求降低75%,從而使得系統設計師能夠進一步提升閃存存儲密度、降低原材料使用成本并改進平均正常運行時間以獲得更為理想的可靠性表現。

"最終用戶則能夠充分享受PCIe存儲所固有的高性能水平及低延遲效果。"

記者:那么采用PCIe交換機制又會給服務器帶來哪些收益?

Ray Jang:與前面提到的收益相同–PCIe彈性、可擴展性、可編程性以及高級診斷功能–這些也同樣能夠由PCIe交換機制提供給服務器應用。最終用戶則能夠充分享受PCIe存儲所固有的高性能水平及低延遲效果。

記者:PCIe交換與NVMe之間又存在著怎樣的聯系?

Ray Jang :PCIe標準指定了一條高速串行傳輸通道利用1到32通道端口與終端進行互連。在多通道端口當中,數據包會以跨通道形式傳輸,這就使得數據吞吐能力完全取決于端口的整體傳輸帶寬。PCIe SSD等目標設備一般會采用1個、2個或者4個端口來與CPU直接對接。

這種直接而速度極快的CPU連接機制使得PCIe相較于串行連接SCSI(簡稱SAS)以及SATA SSD擁有著顯著的性能提升–因為后兩者要求使用獨立的控制器在PCIe與SAS/SATA協議之間進行翻譯。

NVMe規范則利用PCIe總線進行SSD訪問。為了提升CPU利用率并獲得更高的數據吞吐能力并降低延遲水平,NVMe標準在初始設計當中就充分發揮了PCIe SSD方案的并行優勢與低延遲特性。在配合每通道每秒8 Gb傳統(即GT/s)的傳輸能力下–也就是PCIe 3.1標準規范–NVMe能夠在隨機與連續性能兩方面帶來顯著的性能提升。

由此帶來的結果就是更高的數據訪問速度以及進一步改進驅動器利用率。這些收益促使業界利用PCIe與NVMe打造出最新一代SSD產品。新架構目前仍在不斷演變,旨在利用PCIe存儲交換機來構建下一代企業存儲系統設計方案,從而最大程度發揮NVMe SSD的性能優勢。

PCIe交換與NVMe Fabric

記者:PCIe交換與NVMe Fabric之間的關系又如何?

Ray Jang:PCIe交換將成為NVMe Over Fabric當中的重要組成部分,因為它將在Fabric后端提供必需的高性能連接。NVMe Over Fabric將被用于提升NVMe標準的適用范圍與可擴展能力,并以此為起點允許客戶接入到更為龐大的NVMe SSD當中。這些驅動器池需要彼此連接在一起,而后接入Fabric網卡,而PCIe交換機制也將在這里發揮作用。

記者:為什么不使用InfiniBand作為替代方案呢?

Ray Jang:使用InfiniBand(或者iWARP,或RoCE)對于單一NVMe SSD來說成本太高,而且在大多數部署場景下亦會占用太多功耗。InfiniBand以及其它RDMA型Fabric方案確實能夠提供出色的可擴展能力以及可管理性,但卻會占用過于高昂的投入以及功耗。對于很多應用程序來說,最為合理的方案應該是利用RDMA與NVMe SSD資源池相對接,而后利用PCIe交換機制在該資源池內部實現各驅動器的彼此互連。

記者:那么為什么不使用10 Gb以太網或者40 Gb以太網來代替PCIe交換機制呢?抑或是100 Gb以太網?

Ray Jang:使用基礎的以太網連接進行NVMe SSD接入并不是個好主意,因為以太網幀與NVMe命令之間存在著協議翻譯過程。如果我們使用基本的以太網網卡,那么這項翻譯任務就需要著落在CPU身上。這會增加CPU負載、提高延遲水平,而且有可能在我們嘗試進行性能擴展時導致問題–因為CPU將成為擴展后體系中的瓶頸所在。

在NVMe Over Fabric當中,我們需要使用RDMA來實現在硬件當中處理協議翻譯,并借此改進性能同時降低CPU負載。再次強調,對于單一驅動器而言這樣的Fabric方案并不合適,而PCIe交換機制則能夠在這樣的情況下扮演重要的角色。

"NVMe SSD一切以性能與延遲為考量"

記者:關于PMC PCIe交換技術及其產品,還有哪些情況值得我們關注并了解?

Ray Jang:NVMe SSD一切以性能與延遲為考量。此類設備能夠在利用PCIe交換機制實現本地連接、RDMA實現長距離連接時發揮出最佳性能。PCIe交換機制允許我們將大量NVMe驅動器對接在一起,而且無需處理任何協議翻譯工作,而這也將成為性能優化工作中的核心所在。

除此之外,PMC Switchtec產品還擁有一系列獨特的功能,可以保證此類驅動器資源池的管理工作變得成本更低廉、功耗更小且難度更低。PMC Switchtec存儲交換機與Flashtec SSD控制器相結合則能夠實現下一代高性能存儲解決方案,其在與RDMA技術匹配后即可輕松搞定距離與擴展這兩大難題。

記者:我們堅信面向SSD以及PCIe卡等其它形式閃存模塊的NVMe連接目前已經成為客觀層面的業界標準。而Fabric擴展則使得服務器群組以及各類存儲記憶體配置之間的共享式閃存存儲成為可能。這一切將為我們帶來服務器DRAM與共享式閃存存儲之間更為出色的內存級傳輸速度,并徹底取代以往數據傳輸速度較慢的服務器內基于磁盤的IO堆棧。

速度,這一切都是為了速度;降低數據訪問延遲將成為存儲行業永恒的主題。

未經允許不得轉載:存儲在線-存儲專業媒體 » 就PCIe存儲交換機技術發展與制造商展開對話
分享到

崔歡歡

相關推薦

精品国产午夜肉伦伦影院,双性老师灌满浓jing上课h,天天做天天爱夜夜爽,攵女乱h边做边走