數據存儲產業服務平臺

有利即有弊 如何看待大數據前景

美國知名征信所Equifax正利用大數據,結合全球的8000億條企業和消費者記錄,開發新的分析產品。大數據挖掘前景不言而喻。

作為美國三大征信所之一,Equifax公司存儲著所有美國成年人以及另外16個國家公民的財務數據,其中包括全球5億個消費者和8100萬家企業。這些信息可謂是五花八門:哪些人在共享同一電話號碼或地址、牙齒治療貸款的申請、雜志訂閱、租賃歷史記錄、房地產資產、投資理財、購買零售商品、納稅申報單類型、婚姻狀況、就業狀況、水電費繳付、有線電視賬戶、犯罪記錄、債務收入比、地址更改、機動車檔案、郵政信箱、推斷某人能否支付賬單、預測某人的支付意向,與過去和潛在的欺詐犯罪有無關系等。

這些看起來雜亂無章的海量信息,經過交叉分析和索引處理后,變成26 PB的數據。這個數字已經超過了美國聯邦調查局的調查數據倉庫(據說是聯邦調查局最龐大的數據存儲庫)的10億份不重復文檔。難怪Equifax CIO Dave Webb說:“我們對每個人的了解遠遠超乎他們自己的想象。”

Webb的話暗示了數據信息的力量,他主張利用Equifax存儲的海量數據開發利潤更豐厚的產品和服務。

Equifax在過去幾年中,相繼推出了大批基于大數據的新產品,這些產品旨在實現兩個目標:為4.6萬家企業客戶降低風險,以及促進營銷。

用創新賺錢

目前,三大征信所中其他兩家,益百利(Experian)和美國環聯(TransUnion),也在向數據分析轉型。三者在競爭中不斷推出以大量消費者信息為賣點的新產品,并宣稱自己的數據更廣泛、獨特。Webb說:“這是對手快速跟隨的行業,速度和創新是兩大決定性的競爭優勢。”

2010年,Webb從硅谷銀行金融集團轉投Equifax。Equifax給他的任務是,運用他在運營和IT方面的背景,結合金融行業的專長,為 Equifax發掘新的收入來源。“剛來的時候,讓我吃驚的是,公司很少在數據挖掘方面發現機會。”Webb對此既興奮又疑惑。

此后,Equifax接連推出了69個新產品,涉及風險管理、身份驗證、欺詐檢測、決策分析和市場營銷等領域。

Equifax綜合數據解決方案部門高級副總裁David Brooks表示,其中一款新產品可以幫助企業應用分析技術避免不良客戶。據了解,Equifax的開發人員在這款產品中結合消費者個人信用評分和水電費支付歷史記錄而建立新的分析模型。分析結果將幫銀行決定,是否值得花時間去爭取那個信用卡支付曾到期未付的客戶。

Equifax還有一款新產品可以用來實時監測信用報告查詢的系統,以及時發現犯罪苗頭。Equifax綜合數據解決方案部門副總裁Keith Manthey說:“騙子發現有效的行騙手段后,就會迅速共享和使用。該系統可以對查詢速度及其他因素進行評分來判斷這項申請是否為騙子所為。”

打破IT傳統

Webb一直在加大力度開發Equifax的數據分析和協作功能,他帶領1000人規模的IT小組對大數據進行了大膽研究:“如果數據的使用壽命是 2至15年,我們必須充分利用這段時間,而從現在IT小組取得的成績來看,Equifax無疑已經通過技術創新獲得了市場競爭優勢。”

2011年,Equifax收購了一家商業智能工具公司和工作流軟件開發商。事實上,在過去的5年中,Equifax共斥資17億美元收購了多家數據收集和技術公司。這與Equifax在成立之初50年,一直采用紙張分類賬的做法大相逕庭。

對海量數據的分析挖掘工作需要付出大量的IT成本。以往,擁有大量數據的公司需要建立大型數據倉庫,并在大規模并行處理系統上運行。Brooks表 示,建立大型數據倉庫所需硬件成本太高,另外關系型數據庫的架構也阻礙了對非結構化數據的查詢。因此,Equifax存儲和檢索數據的方式一反傳統,它并 沒有將這項工作視做處理查詢,而是將它視做交付內容,將數據分布在低成本服務器集群上,由IT部門開發專有的分布式檢索技術來查找信息。

Brooks說:“由于我們對數據量、交易查詢量和響應時間的要求都很高,因此,我們一直小心謹慎,以免盲目跟隨行業標準的做法。業內的傳統做法需要建設龐大而復雜的基礎設施,但如果換個角度考慮,其實這些基礎設施建設就變得沒有必要。”

目前,Equifax的數據專家要花時間對從公共和私人來源整合而來的數據進行重復數據刪除和清潔處理,但他們不會一味地要求一個消費者只有惟一的一份信息。“上下文更重要。”他說,“實際上,他們是對的?,F在,我們更多地考慮觀察結果,而不是所謂的事實。”

人成為挖掘的對象

挖掘寶貴信息的一個常用方法是,對數據集進行混合搭配,尋找其中關系。例如,單身女性的百貨商店簽賬卡的信用額度是否表明了她們有租賃汽車的意向?這種看似不著邊際的嘗試也許為營銷人員帶來非常有用的結果。

益百利最近發現,使用社交媒體的成年人比其他互聯網用戶更愿意逛星巴克。因此,星巴克或與之競爭的咖啡店可能希望在Facebook上加大廣告投放力度。

在Equifax看來,寶貴信息有時還來自高管的靈光乍現。2011年春,CNN報道了一則關于涉案價值達50萬美元的信用卡欺詐的新聞。新聞稱, 兩兄弟與貝弗利山一家牙科診所的雇員密謀,捏造了數百名的病人信息。他們偽造病人姓名、社會保障號碼及其他個人數據,然后由診所雇員向假病人發放牙齒治療 貸款。之后,該雇員再將貸款和虛假支付記錄上報給益百利,以Garnik Dumanov和Grisha Stpanov之類的姓名建立了信用歷史記錄。

這起案件激發了Webb的想象力,Equifax能不能識破這樣的騙局?

Brooks、Manthey及其他同事進一步詳細了解了這起欺詐案件,從Equifax的眾多記錄中調閱相關數據(不僅僅是信用報告)。然后,他們開始測試分析信息的新方法,以期獲得他們已經知道屬實的結果:比如,Stpanov之流不可能真有其人。

Brooks說:“正常人會在許多方面留下痕跡,但虛構的人不會。”擁有有效身份信息的人即便沒有信用記錄,通常也會因繳付話費或訂閱雜志等原因出 現在其他一些文件中。而虛構的人則會在申領到信貸額度后會“人間蒸發”。最終,這種逆向分析促成了新的欺詐檢測工具,Equifax的安全團隊可以與客戶 一起使用該檢測工具。

一年多來,三大征信所接到了來自美國銀行、富國銀行及另外19家銀行關于采用諸如此類虛假身份申請信用卡的查詢請求,銀行看到良好的信用評分后才予以審批。另外,移動運營商和汽車經銷商在辦理新手機賬戶和提交客戶購車貸款前也都要先查詢這三大征信所的消費者信用數據。

財務報告之外

在Webb看來,抵押貸款領域的新法規給Equifax帶來了另一個機會。

2010年出臺的《多德-弗蘭克華爾街改革和消費者保護法案》要求金融機構對不良貸款負更大的責任。Webb表示,金融專家們評估抵押貸款風險時意識到,簡單的信用評分無法為銀行決定該不該批準為大額貸款提供足夠信息。

Equifax迅速推出了未公開債務監測(Undisclosed Debt Monitoring)服務,這項服務用來監測借款人從抵押貸款獲審批到截止日期這段時間內的主要支出情況。例如,借款人可能因在抵押貸款獲批后辦理汽車貸款,從而改變借款人的還款風險評估狀況,這將超出銀行為其抵押貸款交易而設定的條件。

此外,Equifax還將這種技術融入到了創收產品中,以適應完全不同的情況。比如,實時的身份驗證有助于電信公司避免遭到欺詐。Equifax可 以為電信公司證實用戶是否確有其人,此前是否一直按時繳納手機賬單。經過這樣的身份驗證,電信公司就可以放心地將手機賣給用戶。

電信公司還可以向Equifax購買市場營銷服務。Equifax可以告訴電信公司,相應指定用戶的財富評分是否夠高,在夏季是否有開支很大的習 慣,在使用社交媒體方面是否很積極。電信公司依此情況,可以采用向上銷售手段,向用戶推銷售價更高的手機,如果用戶隨后又介紹了兩個社交媒體朋友與電信公 司簽約,用戶的數據服務方案還可以打折。

“當客戶與商家接觸時,這種向上銷售的效果最好。”Webb介紹道,“但商家在幾星期后給客戶郵寄小冊子,甚至幾天后發電子郵件,銷售效果都要差很多。”趁客戶還在,實時的身份驗證和“決策”服務可以讓零售商、電信公司及其他商家成交更多、價值更高的單子。

現在Equifax的涉獵范圍已經遠遠超出了金融領域,身份也絕不局限于一家征信所。如果病人和醫務人員需要在網上向醫院提交身份證明,可以使用該 公司的身份驗證技術,這項技術會提出一些問題,只有答題者本人知道答案。2011年,Equifax開始幫助美國國土安全部和美國公民及移民服務局核查移民的就業資格。

大數據應用的未來

雖然Equifax在大數據挖掘的路上大步前進,但Webb仍對此心有疑慮:“道德問題是另一個探討的話題。但我們擁有數據挖掘技術,如果挖掘數據合法,我們會一路走下去。”

現在的問題是,對于消費者和企業海量信息的應用,其盡頭在哪里?一些保護隱私倡導者擔心,美國公司可能為了企業利潤,獲取過多的公民隱私信息。皮尤研究中心互聯網和美國生活項目主管Lee Rainie表示,就算美國國會通過了更嚴格的法律,隱私之爭也不會消失。這是由于個人隱私數據的界定“完全視情形而定”,一些消費者以自身得到好處的多寡來界定其被披露的數據是否為隱私數據,這種做法讓隱私數據的界定難上加難。

“為了保持競爭力,公司除了要保持大數據挖掘技術的先進性,還要遵守內部的道德規范。”Mason說,“高管們不僅要熟悉法律法規,還要擺明使用信息方面必須遵守道德規范的立場。”

信用顧問John Ulzheimer補充說:“任何征信所面臨的挑戰是,如何既發掘創收潛力,又提供完全合法、不侵犯消費者隱私的服務和數據。”他表示,到目前為止,征信所做出的都是對消費者有利的選擇,比如不會永久報告負面的信用事件(如個人破產)。

“我們在數據使用方面實行了非常嚴格的治理和控制。”Webb強調Equifax在進行數據挖掘中嚴格遵守使用信息方面的法律法規,“我們是值得信任的數據監管者,并且有責任來保護這些數據。”

面對數據挖掘的大好前景,Equifax公司仍不得不擔心來自用戶隱私和IT技術快速革新的壓力。

未經允許不得轉載:存儲在線-存儲專業媒體 » 有利即有弊 如何看待大數據前景
精品国产午夜肉伦伦影院,双性老师灌满浓jing上课h,天天做天天爱夜夜爽,攵女乱h边做边走