數據存儲產業服務平臺

EMC在Isilon上整合Hadoop大數據產品

DOSTOR存儲在線 2月1日國際報道:EMC在大數據分析上下了大賭注。該公司將Hadoop文件系統整合到它的Isilon向外擴展產品,并讓Greenplum分析產品可以使用Hadoop數據。

Hadoop是一個對象類型的分布式可擴展開源文件系統(HDFS),可以被實施在一個集群的數據節點和單個命名節點上,在更大的集群上用一個二級命名節點來快照主命名節點的數據結構并用作主命名節點故障時的重建來源。命名節點包含了存儲在數據節點上的文件的元數據。

HDFS如今在大學中很流行,尤其是在生命科學系,同時在一些Web 2.0應用程序上也很流行。EMC認為命名節點是故障發生的單點并且沒有高可用性因而限制了HDFS在企業數據中心中的使用。該公司認為如果HDFS可以在企業意義上使用并由普通存儲管理員來管理的話,那么向企業數據中心提供針對大數據分析的Hadoop系統是一個很好的機會。這就是為什么EMC現在為Greenplum HD分析前端提供整合的Isilon-HDFS存儲后端的緣故。

隨著Isilon OneFS v6.5的發布,EMC已經在提供一站式Apache Hadoop解決方案以及它認為在Hadoop領域中缺乏的一些要素:

共享的而不是專用的存儲架構;

命名節點的高可用性;

通過快照(SnapshotIQ)、復制(SyncIQ)和備份(NDMP、備份)所提供的保護功能;

改善的存儲效率,從30%多的基本HDFS數據鏡像到80%的水平;

分別擴展計算和容量的能力;

通過NDS、CIFS(通用互聯網文件系統)、FTP和HTTP實現的自動的數據導入/導出;

Isilon的產品管理總監Nick Kirsch說到命名節點的實施:“這是獨一無二的。命名節點現在是我們的分布式元數據的一部分。每個節點現在都是一個命名節點。”

Greenplum已經認證了Apache Hadoop,提供了平臺管理和控制以及Greenplum數據庫的并行分析訪問。EMC同時還提供設計和培訓服務,全球24×7服務以及一個開發路線圖。

EMC的方法與Oracle和NetApp的不同。EMC表示,Oracle和NetApp都不能在它們的存儲陣列上整合Hadoop;不能提供命名節點的高可用性,同樣水平的存儲效率,多協議訪問以及企業水平的保護功能。

Purdue大學已經在它的統計系嘗試使用Isilon和Hadoop的組合并且對它贊不絕口,表示現在沒有必要實施單獨的Hadoop數據孤島,同時它的用戶現在“有了一個單一的共享的數據計算和分析存儲資源”。它的統計分析師們可以進行更多的統計工作,花更少的時間在Hadoop架構管理上。

EMC表示這些新增的功能將使Hadoop更易于為企業所使用,同時企業Hadoop用戶將會尋找更多的數據科學家來統計分析它們的大數據集以便獲取有意義的有價值的信息。畢竟,在茫茫數據中找到有價值的信息就是大數據的意義所在。

用戶現在就可以通過EMC及其它的渠道合作伙伴獲得Isilon上的EMC Greenplum HD。

未經允許不得轉載:存儲在線-存儲專業媒體 » EMC在Isilon上整合Hadoop大數據產品
精品国产午夜肉伦伦影院,双性老师灌满浓jing上课h,天天做天天爱夜夜爽,攵女乱h边做边走