數據存儲產業服務平臺

EMC Hadoop策略:以MapR技術改善HDFS

DOSTOR存儲在線 5月27日國際報道:位于加州San Jose的存儲初始公司MapR為Hadoop分布式文件系統提供高性能存儲。該公司將為EMC將推出的Greenplum HD企業版Hadoop提供存儲組件。這兩家公司的聯合有助于EMC區別于其他Hadoop廠商,并為MapR的技術增加可信度和一個強有力的分銷渠道。

這兩家公司今天的授權許可新聞發布證實了我的猜測。EMC在本月初發布了它的Hadoop計劃,當時MapR首席執行官John Schroeder參加了EMC大會,并且EMC描述的一系列企業版本功能非常相似于MapR所提供的功能。

Hadoop是一個Apache軟件基金會項目,包含一系列用于存儲和處理大量非結構化數據的工具集。其中兩個核心組件是用于存儲數據的Hadoop Distributed File System(Hadoop分布式文件系統)和用于寫入并行處理任務的Hadoop MapReduce.

EMC的Hadoop策略實際上非常獨特。EMC采用MapR的存儲有力地證明了這一點。在進入Hadoop領域的時候,EMC深知現有版本HDFS的缺點,因此EMC希望有一個存儲層能夠在性能、可用性和使用的便利性上提升HDFS.EMC本來可以加強它的Isilon集群式文件系統或發動它龐大的工程師資源來改善HDFS,不過EMC最后還是看中了MapR的存儲。

EMC Hadoop的另一個獨特之處在于它沒有采用官方版本的Apache代碼,而是采用Facebook的Hadoop代碼,后者在可擴展性和多站點部署上進行了優化。

商業Hadoop的先驅Cloudera也不甘示弱,于昨天發布了自己的HDFS合作伙伴計劃。Cloudera Hadoop的用戶現在可以使用RainStor的數據保留系統來改善HDFS,獲得數據壓縮、重復數據刪除和合規功能。RainStor聲稱它可以將HDFS卷的大小減少97%并同時提供“內置安全性、審計追蹤、高粒度的保留和過期策略來管理所存儲數據的生命周期”.此外,客戶還可以通過標準接口(比如SQL)來訪問RainStor所存儲的數據。

EMC和Cloudera在以各自不同的方式來改善用戶對HDFS的體驗。不過EMC沒有參與Apache Hadoop項目,因此EMC可以利用MapR的高可用性、高性能和先進功能(比如鏡像和復制)來滿足企業級需求。另一方面,Cloudera是Apache Hadoop項目的主要參與者之一,因此只能將Apache官方采用的功能加入到HDFS.不過,Cloudera可以通過各種合作伙伴關系,比如和RainStor的合作,在改善HDFS體驗的同時又不影響它在開源Apache Hadoop代碼上的改進。

有人說Cloudera方式的主要好處是它是開源的,也就是說愿意等待HDFS改進的客戶不必為這種改進花錢。EMC的Greenplum HD企業版本Hadoop采用MapR技術,則會向客戶收錢。

隨著各大主流公司對Hadoop的興趣與日俱增,Hadoop廠商之間的爭奪將更加激烈。無論是像Cloudera那樣主要依賴Apache Hadoop代碼的方式還是像EMC這樣不依賴Apache Hadoop代碼的方式,廠商們都需要向潛在客戶顯示他們滿足現實世界需求的能力?,F在的Hadoop產品還花不了多少錢,不過所有跡象都顯示這種情況持續不了多久,到時我們就能知道哪種方式最給力了。

未經允許不得轉載:存儲在線-存儲專業媒體 » EMC Hadoop策略:以MapR技術改善HDFS
精品国产午夜肉伦伦影院,双性老师灌满浓jing上课h,天天做天天爱夜夜爽,攵女乱h边做边走