數據存儲產業服務平臺

大數據影響眾多行業發展

“大數據”正在改變我們觀察許多問題的方式。Julian Assange的Wikileaks網站所發布的文件正是來自各種各樣的分類資源。該網站負責這些突然公開信息的編程人員現在已經從7.7萬個涉及阿富汗戰爭的事件報告中剝離出了日期和地址,編織了一幅暴力地圖。這個項目用了一個晚上,而讓人驚訝的是,只是根據一個模型,研究人員就可以在很高的準確度下預測出接踵而至的軍事事件。

這個方法被用于分析2010年的事件,結果甚至在相對平靜的阿富汗北部省份也顯示出相當的準確性,盡管那里的數據點比較少。我們所看到的就好像是科幻小說家Isaac Asimov在《基地》中所描述的“心理歷史”。這個“心理歷史”就是通過對歷史、社會學和統計數據的組合的分析來預測未來事件。大數據有能力前所未有地存儲更多的信息,而且計算機的計算能力在提高。結果就是:我們可以處理那些一直以來看起來在我們的統計和量化分析范圍之外的問題,甚至這正在發生在我們的個人電腦上。

一個早期的開拓者就是谷歌。該公司已經為1800年至2000年所有印刷出來的書籍中的4%編制了索引,并且在這個圖書庫中發布了包含每一個詞的數據庫。對我們來說,“電視”這個詞在電視機發明以前不應該出現,但是在谷歌的數據庫中,我們可以看到這個詞早在1900年以前就出現過幾次了,而且從20世紀20年代早期開始便持續出現。仔細觀察這個網站,你會發現很多意思的事情。你可以插入幾個單詞,然后繪制出它們相對于其他單詞的使用情況。

商業機會

在你尋找商業機會的時候,應該好好看看大數據趨勢。一個確定會發生的情況就是智能手機的存儲不斷提高,相機技術更加普及。許多未來學家已經在展望所謂的“生活日志”。它們是下一代設備——我們將在未來幾年內一直攜帶的那種東西——的結果,也就是說,這些設備將不僅記錄我們在哪里,還將記錄我們所看到的和聽到的。你可以想象,你可以用這種技術來持續跟蹤你自己的習慣,標識出你最經常消費的地方,幫助你回憶出你可能已經忘記的地方和名字。

現在,大數據正在用于帶來各種好奇的和未決的結果。斯坦福大學教授Jure Leskovec跟蹤網絡行為的數據,使用像Facebook這樣的社交網絡,他不是用于跟蹤朋友和家庭的信息,而是挖掘其中的統計信息。Leskovec發現正確的方法可以預測哪個聯系用戶將會添加為“好友”——在他所研究的一半的案例中,這個方法顯示出相當的準確性。他研究了MSN的信息,發現了用戶之間的距離,同時他也研究了如何在任意兩臺計算機之間創造最短的路徑,這樣可以為互聯網提高效率。

終極解決方案

但是如果你想讓這股趨勢朝向真正有用的地方,你可以考慮其他斯坦福研究者的成果。他們開發出了針對整個生物組織的首個軟件模擬。目前它還只是一個單細胞細菌,但是模型中已經涉及525個基因以及28類分子的互動,使得我們可以觀察和分析細胞的最基本構建單位。計算機生物學將大數據引入了計算機化實驗,可以建模并測試那些針對生命最糟糕問題的解決方案:比如像癌癥和阿爾茨海默病。

我們還只是處于這股潮流的開端。當人們開始自愿提供他們自己的數據的時候——想想社交網絡——他們將幫助從執法到人力資源的每個人構建出統計模型以方便預測未來行為。下次你發送一條Tweet信息的后,要記住你是在為數據倉庫增加數據量(康奈爾大學的科學家已經在研究Twitter使用情況)然后想想公司企業將如何在未來利用這些大數據。

未經允許不得轉載:存儲在線-存儲專業媒體 » 大數據影響眾多行業發展
精品国产午夜肉伦伦影院,双性老师灌满浓jing上课h,天天做天天爱夜夜爽,攵女乱h边做边走