數據存儲產業服務平臺

大數據的障礙:數據質量和舊觀念成見

利用大數據和分析法將會對企業未來業績產生重大影響,重整整個行業并孕育新的產業。然而,還面臨著很多挑戰。它們從眾所周知的缺乏數據科學人員來處理大數據,到更加棘手且很少提及的根源于人性的問題。

后者之一是人類聚積數據的傾向。另一個是人類仍然固守先入為主的傾向,即使數據結果明顯不同。最近舉辦的麻省理工斯隆學院CIO研討會就大數據和分析法發言的數據專家們取得了共識。發現地雷?希望落空?那些已經取得進展的企業已經知道,大數據和分析法沒有最終真理。迭代就是全部,專家們也同意。

不僅如此,除了迭代的價值, CIO們可以將最佳實踐拋于腦后。正在興起的未來實踐才是深入研究大數據的公司最可以依靠的,在舊金山工作的計算機科學家Michael Chui說。他是麥肯錫全球研究院高級研究員,該研究院是位于紐約的麥肯錫咨詢公司的研究機構。

“我們知道這不可行:等到5年后完美的數據倉庫出現。”Chui說,他是去年重大麥肯錫大數據價值報告的作者。

相對地看待數據質量

Chui說,事實上,沉迷于數據質量是很多公司需要克服的第一個障礙,如果他們希望有效的使用大數據。數據的精確性對銀行財務報告是至關重要的。然而,不精確的數據包含了模式可以突出業務問題或者提供可以產生重要價值的洞察力,比如另一個研討會專家小組的相關新聞報道的,“抓住大數據和分析法,否則將落伍,MIT專家小組稱”

專門小組成員Shvetank Shah說,相對那些快馬加鞭以取得最佳質量數據的組織,那些“了解數據質量”的組織,即使使用元標簽或顏色編碼來標識數據質量-,對大數據的進展更快。他是華盛頓特區的咨詢公司(CEB)的執行董事,一家位于。

Shah提醒道,然而大數據結構的混亂性使得商業才智至關重要:重視經理了解何時值得去追求這些數據的能力。他說:“你雇傭經理的原因就是:去分析,去聯系和迭代。”

在科學研究中,理解每一個變量的所有情況是不可能的,所以“迭代很重要”James Noga說。他是波士頓的醫療保健非營利性組織Partners HealthCare System的CIO. 他說,那些擅長大數據處理的人必須能夠挑選出有代表性的關鍵點,并且“在當時作出最好的推測”.

不管怎樣這一點可以被推而廣之,不僅是在關注數據質量的公司,而且那些習慣于結構化IT流程的IT公司中也可以推廣。

消除舊觀念和成見不易

專家組成員說,那些擁有模式識別技能、好奇心,并理解實驗價值的人是有效使用大數據和分析法的關鍵。然而,CEB的Shah發現,使科學方法成為公 司文化的一部分極其困難。“你可以讓所有聰明的數據分析專家聚集在企業核心,做出很多聰明的決定。但是如果做不到這樣的話,客服代表、經理們以及其它外圍 人員做出的決定就更加重要。”因為大多數公司沒辦法雇傭足夠的數據科學人員去研究大數據,另一個挑戰是尋找培訓人才。

CEB發現很少公司能夠使用大數據和分析法法去驅動業務決策。最新對近500家企業的研究發現,20%的調查對象使用直覺做決定;49%想要更多數 據,另有38%被CEB稱為“知情的懷疑論者”,也就是那些可以進行模糊數據,并推動業務向前發展。不僅如此,Shah說,人們傾向于堅持成見,“技術數 據顯示的恰恰相反”.“消除成見非常困難。”

聚積數據是另一個開發大數據的障礙。麥肯錫研究的一個發現是金融服務(其收集和分析數據的歷史悠久)在使用大數據上滯后。Chui說:“我們發現很多西方銀行的業務豎井的界限已經變得如此之大,以至于分享數據的想法非常,非常之弱。”

未經允許不得轉載:存儲在線-存儲專業媒體 » 大數據的障礙:數據質量和舊觀念成見
精品国产午夜肉伦伦影院,双性老师灌满浓jing上课h,天天做天天爱夜夜爽,攵女乱h边做边走