Mike Curtis

然而,他補充說,要搞清楚如何為每一個用戶的搜索排名在算法上是一個甚為困難的問題。 我們沒有更深入到談到細節,但問題似乎很清楚。要對一個群體的搜索結果或是對地域性的搜索結果排序是很容易的,但要弄清楚如何準確地考慮一個用戶的各種因素,如喜好、社會關系、租賃歷史、評論和其他數據點,其復雜度會上升到另一個層次。(再加上Airbnb的數據來自特定的城市、訪客和主人的地域以及其他元數據也是要考慮的因素。)

推特的個性化搜索引擎用到數據科學,因為需要考慮眾多因素以確定相關性,實現起來有相當的難度,是一個很好的例子 。

Curtis說,Airbnb進行大量數字計算,意圖能幫助公寓主人找到最佳的租金率。

在公司內部,Airbnb希望叫板Curits的前雇主Facebook。Facebook在利用Hadoop建造工具方面小有名氣,現在Facebook公司幾乎每一個人都直接或間接地用到Hadoop。 Curtis說,Facebook“真正地讓員工深入接觸數據及找出關鍵的問題。……在Airbnb打造產品的過程中,我也想這樣做。”

Mesos種種

Airbnb兜里的一個重要戰略性工具之一是一個開源集群管理項目,名為Mesos。Airbnb用Mesos實現自己的數據之夢。 Mesos用到的技術,源自加州大學伯克利分校的AMPLab,可以讓用戶在一個單一的資源集里運行多種類型的計算框架(也有可能只是幾個不同的Hadoop集群)。Mesos在網絡上的名氣要拜推特所賜,Mesos項目上個星期一躍而成頂級Apache項目。

Facebook前工程總監:數據驅動初創公司前途讓人驚嘆

Mesos結構

對Airbnb而言,Mesos的關鍵是讓公司里的工程師在利用Hadoop范疇以外,最大限度地利用基于Amazon Web Services的基礎設施。 Curtis解釋說,Airbnb在很多地方都用到Hadoop,但是Airbnb想在流處理(stream processing)方面用Storm做實驗,Airbnb希望用Spark(也是AMPLab出的東西)來處理Hive查詢,會比Hadoop允許的速度快些。

實際上,Spark在搜索排名、定價和檢測服務的“不良行為”方面有可能特別有用,Curtis說,“這些東西很多都涉及到機器學習模型,”與Hadoop比,Spark的性能優勢意味著它可以在較短時間內一遍又一遍運行這些模型。

Chronos是Airbnb打造的一個分布式作業調度程序,用于云環境之中。Chronos也是在Mesos上運行的。

Airbnb用Mesos的一個很大的原因肯定是資源管理和效率,不過Curtis說,Mesos也可以幫助Airbnb在綜合工程戰略方面更進一步,可以有助于建立小團隊快步前進。 Airbnb自動資源配置做得越好,工程師做其他事情的時間就越多。他說,“理想的情況下,基本思想是利用Mesos的自動化讓極少數的幾個工程師可以產生較大的影響。”

云:哇噻!Elastic MapReduce:無所謂?

雖然Airbnb仍在用AWS云,Airbnb的Mesos卻在考慮從流行Elastic MapReduce的Hadoop服務里遷移出來。 據Curtis說,走這一步棋有幾個原因,但最主要的原因是要用Mesos管理所有Airbnb需運行的框架,從而對Airbnb的Hadoop環境有更精細的控制。他說,Elastic MapReduce在很大程度上來說是亞馬遜自己的分布式Hadoop,也就是說,用戶打補丁或完成類似的東西時必須依賴AWS,Elastic MapReduce也僅僅是做了Hadoop的事。

另一個工程師Brenden Matthews在上周在推特總部做了個演講,講Airbnb從Elastic MapReduce遷移到Mesos。他的幻燈片列出了更多轉換的原因,他還列出了有關在云里運行Hadoop的常見挑戰。

Facebook前工程總監:數據驅動初創公司前途讓人驚嘆

Curtis說,盡管如此,AWS總的來說還是很可靠的,而且還有云的靈活性——與Mesos的組合一起——意味著Airbnb可以想干什么就干什么,想什么時候干叫什么時候干。Airbnb的臨時分析查詢不會干擾Airbnb的長時間運行的批量工作流,反過來也一樣。

Curtis說,“運行群集作業的速度完全處決于資源配置。我們在池里放多少資源呢?”

Curtis 90年代后期出道于AltaVista,后來在AOL、Yahoo和Facebook待過。他講起資源時笑遂顏開,一般來說,像Airbnb這樣的初創公司,一開始購置和管理服務器這么少的投資,云計算提供了很大的潛力發展空間。他說,“想想今時今日,所有的所有都是抽象的……真的是如此的美好和讓人驚嘆。”

未經允許不得轉載:存儲在線-存儲專業媒體 » Facebook表示:數據驅動初創公司發展無限
分享到

aming

相關推薦

精品国产午夜肉伦伦影院,双性老师灌满浓jing上课h,天天做天天爱夜夜爽,攵女乱h边做边走