數據存儲產業服務平臺

微軟SQL Server引入Hadoop大數據處理能力

運行SQL Server的微軟客戶將通過Hadoop的引入獲得真正的大數據處理能力。

微軟已經發布了早期代碼,讓客戶可以將這個Java架構接入到SQL Server 2008 R2、SQL Server Parallel Data Warehouse以及下一代微軟數據庫。

Doug Cutting受到Google MapReduce的啟發而發明了開源Hadoop,現在它已經在某種程度上成為了在集群服務器上處理大量數據的行業標準,包括Amazon、Facebook和Twitter等網絡巨頭也都采用了Hadoop.

業內人士認為,Hadoop可以用來了解數以百萬計用戶的喜好和更新狀態等細枝末節以改變服務響應。Hadoop的目標是,更有力地滲透到主流IT中。

微軟研究部門從2006年起就一直致力于某種非常類似于Hadoop的項目,被稱為“Dryad”.今年年初,該計劃通過與SQL Server和Windows Azure云的集成實現了Dryad的產品化。雖然現在微軟還沒有更新,但看上去Dryad似乎將成為在SQL Server平臺上影響大數據愛好者的有力競爭者。

微軟目前已經開始提供Hadoop Connector for SQL Server Parallel Data Warehouse和Hadoop Connector for SQL Server社區技術預覽版本的連接器。

該連接器是雙向的,你可以在Hadoop和微軟數據庫服務器之間向前或者向后遷移數據。

微軟表示,這個連接器可以讓客戶在Hadoop中分析非結構化數據,然后接回到SQL Server環境中進行分析。

這兩個連接器采用SQL to Hadoop (SQOOP)在Hadoop File System (HDFS)和微軟關系數據庫之間有效地傳輸數據。Parallel Data Warehouse采用PDW Bulk Load/Extract工具以進行數據的快速導入或者導出。

SQL Server PDW客戶可以從微軟那里獲得這個Hadoop連接器,普通的SQL Server 2008 R2客戶則可以獲得Hadoop Connector for SQL Server代碼。

未經允許不得轉載:存儲在線-存儲專業媒體 » 微軟SQL Server引入Hadoop大數據處理能力
精品国产午夜肉伦伦影院,双性老师灌满浓jing上课h,天天做天天爱夜夜爽,攵女乱h边做边走