簡單看一下亞馬遜云科技的智能湖倉架構,從數據湖到數據倉庫,從大數據處理、日志分析到、關系數據庫、非關系數據庫,再到機器學習,大大小小40多種軟件工具和服務,不要說使用,先把Amazon Glue、Amazon Athena、Amazon EMR、Amazon Aurora、Amazon DynamoDB、Amazon SageMaker、Amazon Redshift、Amazon ElasticSerach分別是什么搞清楚就不容易了!這還僅僅是一個開始,要想用好更是難上加難,對嗎?
既然如此,為什么我們不換個認識問題的方法。很多時候,我們并不了解、掌握使用工具,但我們應該知道,使用這些工具能夠給我們帶來什么?
我們可以看一些典型案例。
在這個案例中,我們可以看到用智能湖倉解決了“數據孤島問題”,接下來解決了報表的問題。
報表就是智能數倉架構的價值嗎?
關于報表,這是數據倉庫重點解決的問題。但數據庫很大,以及跨數據庫、復雜查詢的時候,我們往往依靠數據倉庫來解決問題。但這是狹義上的概念。
智能數倉不僅僅解決狹義上的報表,更進一步要解決包括非結構化數據的查詢問題。以上TCL案例的背景是產品國際化的問題,TCL產品種類眾多,消費者眾多,如何透過消費者為中心的角度,對不同國家和地區用戶的消費行為進行分析,這不僅需要業務系統數據的支撐,更重要的是需要依靠IoT數據的分析,很多消費者需求就隱藏在IoT數據的背后,這個報表就是廣義上的,這也是智慧湖倉的意義所在。
智能湖倉更加強調從數據倉庫到非結構化、半結構化數據分析,如大數據、Elasticsearch等應用場景之間,數據的自由流動,反之亦然。簡單說,人盡其才、物盡其用,針對不同應用場景以及數據場景,靈活采用適合的方案,方案之間彼此打通數據,數據的自由流動。
結合5G、IoT應用的趨勢,以智能數倉為基礎,會帶來怎樣的業務變化和創新,未來值得期待,這就是智能數倉的意義,只有40多種數據產品和服務,完全可以交給專業技術人員操控和掌握!
擁抱智能數倉架構,這需要每一個企業的戰略決策!