從圖中可以看到,無論是數據庫,還是數據分析,在AWS,我們都有很多的產品選擇。

以數據庫為例,有Aurora、RDS、RDS on VMware,有DynamoDB、ElastiCache和Neptune等,與數據分析相關,有Redshift、EMR、Athena、Elasticsearch Service和Kinesis Data Analytics。

不要說我,一個區區的記者,我想即使對于專業技術人員,恐怕也難面面俱到,把這些技術都搞清楚。

不就是數據庫、數據分析嗎?為什么要搞的這樣復雜?

其實道理也很簡單。

不同的應用場景,有其適合產品,張冠李戴是不行的。

以前,計算能力有限且昂貴,好鋼需要刀刃上。那個時候,數據庫和數據分析應用以關系型數據為主,其數據量的占比是10%~15%,但數據價值高達85%;其余85%的數據并不被存儲、分析。

但是隨著計算能力的提升,特別是Intel x86服務器的廣泛應用,計算成本不再是稀缺的資源;與此同時,用戶行為等大數據應用備受重視。在這種情況下,各種數據存儲和分析工具應運而生,開源技術發展,也發揮了推波助瀾的作用。

同樣是數據分析,數據類型不同,使用的手段和工具也不盡相同。如數據倉庫可以用Redshift,Hadoop+Spark應用可以使用EMR,交互式數據分析使用Athena,實時數據分析使用Kinesis Data Analytics,運營數據分析使用Elasticsearch Service。

數據庫也是如此,有關系型數據庫,如Aurora、RDS,有鍵值文檔數據庫DynamoDB,有圖形數據庫Neptune,以及ElastiCache等。

互聯網用戶如Epic Games,這是一家游戲公司,全球都非常知名的“吃雞”游戲,就是所說《堡壘之夜》就是這家公司的杰作,非常流行的。Epic會把所有用戶在線玩游戲中的數據導入到S3中,并利用各種定制化工具,分析用戶在游戲中的行為。

可以說,新工具的廣泛應用讓互聯網、網游企業占據了先發的優勢,對于傳統企業級客戶而言,也需要以數據湖為基礎,更好地分析數據。

相比于傳統的數據庫、數據倉庫,新的開源軟件以及互聯網SaaS服務,在性能、成本上都占據優勢。

以Redshift為例。傳統數據倉庫只能夠處理GB級、TB級的數據,還沒有達到PB級,TB級數據處理就需要大約1萬~5萬美元。有數據表明,傳統數據倉庫僅能夠處理企業10%左右的數據。為獲得更加深遠的洞見,企業用戶希望能夠分析處理100%的數據。依靠傳統數據倉庫產品,這是不可能的事情。

Redshift的出現彌補了傳統應用的不足,它能夠處理PB、EB級的數據,處理性能是傳統數據倉庫的10倍。同樣TB級數據處理,所需要的成本僅為1000美元,是傳統方法的1/10。

因此,新技術的出現,為企業級用戶提供了新的選擇。

不同于傳統交鑰匙的方案,新時期,需要用戶有更加廣闊的視野,需要具備DIY的能力。在開源、SaaS云服務的世界中,新的技術、功能,無時不刻涌現,將這些技術不斷運用到業務創新中,這個是新事情用戶必須具備的能力。

“一慢、二看、三通過”已經不符合時代的步伐。

到了需要改變的時候了!加油!

未經允許不得轉載:存儲在線-存儲專業媒體 » 一張圖幫你搞懂Redshift、Aurora!
分享到

songjy

相關推薦

精品国产午夜肉伦伦影院,双性老师灌满浓jing上课h,天天做天天爱夜夜爽,攵女乱h边做边走