6月29日,風投公司投資創建了獨立的私人公司Hortonworks,來引導Hadoop社區,并推廣開源產品。曾經是其母公司的雅虎,現在是它的客戶之一。

2、Hadoop不再是科學項目了

 Hadoop的昨天與今天

雅虎將Hadoop從創始人Doug Cutting的科學項目中變成一個世界級平臺,僅用了五年的時間。貢獻了超過70%的代碼,使其成為IT產業里優秀的大數據平臺。

3、Hadoop是IBM沃森的關鍵部分

Hadoop的昨天與今天 

Hadoop的分析和數據發現能力是IBM Watson計算機能夠在《危險邊緣》比賽中戰勝另外兩位人類前冠軍的重要原因。

4、最大的部署:每天200PB的數據

Hadoop的昨天與今天 

在技術領域最大的部署環境(例如雅虎),每天Hadoop于分析超過200PB的數據,讓雅虎變得更人性化,更貼近用戶和客戶。它與雅虎IT系統的方方面面進行協作,包括包括搜索、廣告、用戶體驗和欺詐發現。

5、給力的系統 應對大數據

Hadoop的昨天與今天 

雅虎的Hadoop系統包括超過4萬2千臺的服務器,以及由4000臺設備組成的集群,每個月能夠處理超過500萬份工作。每天都會有1400萬份新文件進入Hadoop系統,這一切根本就是小菜一碟。

6、Hadoop或圍繞平臺出售服務

Hadoop的昨天與今天 

Hadoop軟件是作為一個開源項目可免費獲得的,未來將推出一系列高級服務針對那些需要更高級別服務的企業。

7、抗擊垃圾郵件立大功  個人頁面自由定制

 Hadoop的昨天與今天

Hadoop讓2.89億個雅虎郵箱免受垃圾郵件侵擾。另外,Hadoop還在1300萬個按個人使用習慣定制的web界面中扮演了關鍵的角色。

8、不僅僅是應對網絡流量

Hadoop的昨天與今天 

Hadoop已經演進到不僅僅局限于應對網絡流量和科學研究(圖為歐洲核子研究中心超級對撞機)?,F在它還用于搜索引擎、廣告優化、機器學習和內容 力改進和內容提供。它每天能夠向研究集群中載入10TB的數據。

9、Hadoop新型公司快速成長

Hadoop的昨天與今天 

MapR、Zettaset、Cloudera、HStreaming、Hadapt、DataStax、Datameer這些與Hadoop相關的新公司已經獲得投資,為人們所熟知,為各種市場帶來最新技術。

10、Hadoop仍需改進

 Hadoop的昨天與今天

雅虎和Hortonworks的高層已承認Hadoop仍然需要時間去發展,以便更加容易的使用,尤其是用戶交互界面需要更加的完善,不過兩家公司的團隊都相信他們將在數月內解決這個問題。

未經允許不得轉載:存儲在線-存儲專業媒體 » 分布式系統盤點 Hadoop的昨天與今天
分享到

zhuyu

相關推薦

精品国产午夜肉伦伦影院,双性老师灌满浓jing上课h,天天做天天爱夜夜爽,攵女乱h边做边走