數據存儲產業服務平臺

如何防范數據在“云”中化為烏有?

我們越來越習慣于依賴Web服務,并將這視為理所當然的事情。這其中的關鍵在于,我們很多人都理所當然地認為,我們上傳的數據,比如今天拍攝的圖片存放在某個網站上,或是我們寫的博客文章等,明天依然會在網絡上。這種假設在很大程度上是因為我們假設這些服務明天依然會存在。

這些網站今天能夠正常訪問,但是明天就有可能消失得無影無蹤了。在過去幾年里,我們看到了許許多多這樣的例子。比如,老牌社交網站Friendster和GeoCities。前者在今年五月份為了重新設計網站刪除了用戶數據,而后者在2009年就關張了。

換句話說,沒有任何事物是永恒的。我們托管數據的Web服務也會消失。在出現這種情況時,你需要有一個防范計劃。在下面,我們將看一些案例,這些案例包括用戶數據在哪個環節被遺失或有遺失風險,企業(和他們的用戶)如何應對這種情況,以及采取什么措施來保護信息安全。

最終關閉的Web服務

很遺憾,我們已經看到了許多關于Web服務被關閉、出售或遺失數據的案例。

MySpace

MySpace曾經一度是人氣值頗高的社交網絡,但是在Facebook崛起的沖擊下變得黯然失色。MySpace的緩慢死去和不成功的重生,提出了一些關于現有用戶數據將怎么處理,是否應該找出一個簡單的辦法導出這些信息的問題。

2008年,MySpace推出了一種被稱為“數據遷移創新”的功能。但是這一功能并不是為了將數據從MySpace中導出,也無法自動導入其他網站,讓用戶繼續使用聯系人信息。更糟糕的是,在MySpace的服務條款中,開發者明令禁止創建可將用戶信息導出并用于其他服務的應用。但是這并沒能阻止人們創建專挖MySpace墻角的工具,如Make Data Make Sense的博客導出工具。

Google視頻

在谷歌于2006年收購了YouTube這后,Google視頻就變得多余了。2009年,谷歌關閉了Google視頻的上傳新視頻功能,但用戶的強烈抗議使得谷歌最終沒有徹底關閉所有服務,Google視頻上的所有視頻仍然能夠手動歸檔。那些付費使用、下載并擁有/租用所查找到的項目的用戶仍然能夠訪問他們以前購買的內容,那些在系統中還擁有大量資費的用戶可以將他們的費用轉到Google Checkout服務上(后來,谷歌宣布他們還將提供信用卡退款服務。2011年4月,谷歌宣布Google視頻上的內容可以無限期保留,直至所有的剩余視頻全部轉移到YouTube上)。與其他被關閉的Web服務一樣,問題不僅僅是上面的內容,同時還涉及到用戶對該網站的投入。

Sidekick

2009年10月,由于存儲著用戶電子郵件、聯系人信息等個人數據的服務器故障,導致大約80萬名擁有Sidekick手機的T-Mobile用戶的數據全部丟失。最初的報道稱,這些數據被永遠地丟失了,但是后來大部分數據還是被恢復了。這并不代表T-Mobile和微軟(負責管理儲存著Sidekick數據的服務器)受到的影響就小一些。更糟糕的是,除了與電腦同步的數據外,用戶短期內根本無法恢復他們的數據。

Sidekick的數據服務一直中斷到了2011年5月31日。微軟在一份聲明中稱,T-Mobile在myT-Mobile.com上發布了一款增強型Web工具,可以輕松地將他們的個人數據,包括聯系人、照片、日程表、備注、日歷和瀏覽器書簽等從危險的服務中導出至新設備、電腦或指定的電子郵件賬戶上。如果他們在數據中斷的早期提供了一些如此方便的工具,或是作為一種例行方式,允許Sidekick用戶存儲他們全部數據,那么上面那一幕悲劇可能就不會發生。

博客和Web托管服務。由于博客和免費網站如今已經成為了用后即扔的服務,那么這些服務大批死亡就一點也不驚奇了。 GeoCities曾經是Web早期商業活動中的佼佼者,該服務在2009年被關閉讓大量網民感到非常遺憾。雖然雅虎基本上沒有采取什么措施以維持這一網站,但是大量第三方卻在努力挽救GeoCities上的數據。與此同時,Windows Live Spaces也在2011年3月關閉了服務,不過用戶可以選擇將他們的數據遷移至WordPress上。今年5月24日,雅虎的MyBlogLog也被關閉。這次提供了一個如何將數據遷出MyBlogLog的教程。

Lala.com

對于Lala.com 的用戶來說,他們面對的問題非常復雜。Lala.com在線音樂服務讓用戶可以較低的價格購買流媒體音樂,其在2009年12月被蘋果收購。用戶在 Lala.com里的資金可以轉到iTunes,但是他們以前所購買的流媒體音樂將永遠消失。也就是說,目前沒有任何規定允許將購買的流媒體音樂進行合法的MP3下載。

Lala.com的命運帶來了一個問題。那就是有多少媒體服務提供的是“租借”而不是“購買”模式,用戶在什么情況下才能感覺到這些數據是他們自己的?用戶又在多大程度上愿意花錢訪問那些只能持續一晚上的東西?

這些問題已經有了答案,已不再是問題了,因為它們涉及到用戶消費性服務特征的概念性改變,并且深受公司名聲的影響。比如,幾乎沒有人認為亞馬遜會停止服務,因此在購買Kindle電子書時就和購買年輕的歌星出的流媒體音樂一樣不需要猶豫。

數據能否遷移至關重要

如果你正在決定是否使用特殊的Web服務,那么它們可以幫助你搞清楚數據是如何被處理的,以及這一服務能夠提供一些挽救數據或是將信息轉移至線下的辦法。以下特征需要關注。

數據應使用便于下載的開放格式。網站或服務用心保護用戶數據的一個最佳證據是用戶能夠通過服務備份他們的數據。如果沒有用于下載數據備份的末端工具,那么你可能被迫要手動下載這些數據了,因此任何可以避免讓你遇到這種麻煩的東西都值得關注。比如類似維基百科的Wikia.com允許你保存整個維基或個別頁面為純文本文件,用于歸檔或下線編輯。

有意思的是,谷歌正在向這一領域大舉進軍,他們最近開始測試他們的Google+社交網絡。其增加的功能允許通過谷歌Checkout導出(聯系人、圈內朋友等)個人數據。實際測試結果是在將數據轉移至其他服務時這一功能非常有用。

由服務或第三方提供的數據工具。如果不能通過服務的Web界面直接訪問數據,那么就要有能夠通過服務的API為你提供數據的應用。你可能必須要獨立地做一些程序設計以利用這些API。不過在做這些之前,可以先四處找一找,說不定其他人已經做好了這些工作,這些結果都可以免費使用。

Forrester首席分析師Andrew Reichman稱,用戶應當審視所使用的任何服務,即使服務提供商已經公布了他們的退出策略。換句話說,對于任何數據遷移性的聲明都要持謹慎態度。他說:“即便在數據交換標準下,你依然會受到代表管理員或公司運營設備策略的支配?!?/p>

服務條款。如今幾乎所有的服務都有服務條款,基本上涵蓋了所有可以想到的服務功能。Reichman稱:“仔細閱讀服務等級協議、合同,以及違約時的處罰措施非常關鍵。在選擇服務提供商前,最重要的一個步驟是制訂退出策略,或是討論一下萬一用戶希望退訂服務或是提供商取消服務后應當如何處理?!痹诜諚l款中越是很少詳細提及,你就越應當謹慎。

Yankee集團分析師George Hamilton非常認同這一觀點。他說:“在這里要提醒買方的是,要清楚服務提供商是如何保護存儲的數據或使用中的數據,以及知道這些數據是如何備份的?!?/p>

服務之間要能夠展開競爭:要讓用戶更為自由地遷移他們的數據,即便用戶的判斷錯了也要讓用戶能夠將他們的數據遷移走。Hamilton稱:“提供商在出售他們的服務時不應當通過技術手段將用戶‘套牢’在他們的服務中?!彼麖娬{行業的大趨勢是朝著可以讓數據相互遷移的開放標準發展。

關注各種危險苗頭

如果一個服務正在被關閉,服務商可能會通知用戶嗎?很多時候提前發現一些事件的苗頭的最佳地方并不在服務商本身。

ArchiveTeam網站列出了一份有關閉風險或正在死亡的網站名單。如果你正在使用名單中的某個網站,那么你最好考慮一個將你的數據轉移到別處,至少要將這些數據在其他可靠的地方進行備份的方案。

Reichman建議關注一下服務提供商公布的一系列數據。他說:“你無法發現潛在的提供商是否有財務問題,但是你可以通過調查提供商公布的一系列財務數據發現一些問題。如果可能的話還要找一下有關這家提供商的歷史資料和相關的新聞報道。即將被收購或被剝離、裁員或是進行戰略調整的傳言都是可能陷入麻煩的苗頭?!?/p>

Reichman和Hamilton均表示,找到預警信息的機率并不大,即便是財務方面的預警信息也是一樣。 Hamilton稱:“遇到財務麻煩的公司通常都不會提前透露這種麻煩。你需要有前瞻性。如果他們是一家上市公司,你可以查看他們的財報。如果不是,那么你應當關注他們是否有什么新聞。如果你對他們的生存能力表示懷疑,那就首先不要選他們?!?/p>

如果工作需要或是壓力迫使你進行選擇,那么你很難對一個特殊的服務說不,尤其是在沒有選擇時。比如,雖然Facebook缺乏數據遷移性并且存在隱私問題,但是在一段時期內,我們很難放棄 Facebook——每個人都在使用它。如今,Facebook的統治地位可能會被Google+的出現和LinkedIn的成功所打破。

其他的預警信息還有:

服務質量下降。對于一個正在緩慢崩潰的服務來說,其服務中斷和性能問題會越來越多,Hamilton認為,這是一個非常明顯的信號。他稱:“一種服務一般不會對投訴電話和電子郵件做出回應?!?/p>

第三方支持減少。擁有API的網站通常都會發展出一種第三方應用文化——如圖片托管網站的圖像上傳應用,或是直接與服務整合在一起的應用。如果這類應用研發數量出現下降,那么這表明或者該服務商正在想方設法拓展用戶基礎。而如果發展速度放緩并不是因為市場飽和,而是因為優秀程序員的出走,那這絕對不是一個壞兆頭。

服務條款出現調整或武斷行為。許多用戶放棄某一個Web服務的背后原因并不是因為這一服務面臨生存威脅,而是因為服務商所做的一些事情。一個最常見的原因就是更改服務條款,這一舉動會引起許多用戶的不滿。這一舉動毫無意義,因為服務條款本身就充斥著許多費話。除非詳細解釋,否則任何改動的含義都不明確。如DropBox條款中寫到,如果政府提出要求,他們會把存儲的文件交給政府——這迫使公司增加了對后果的解釋,“你的數據仍然歸你所有,他們不會打亂這些數據,除非他們別無選擇?!?換句話說就是“除了運營服務所需要的有限權力外,這些條款不授予我們任何有關你的數據或知識財產的權力”)

不同的人對于相同的事物容忍度不盡相同。因此那些激怒你的鄰居的事情可能并不會激怒你。但是如果你聽說你所使用的服務發生了這種事情,那就要留意了。此外,任何時候被要求重新確認服務條款,請仔細閱讀其中被修改過的地方。

閱讀服務條款

服務條款是任何服務中的一部分,你不應忽視它。因為它準確地描述出了能夠用你的數據做什么,不能做什么。服務條款過于晦澀,將關鍵點隱藏在多個條款中沒有任何益處。以下是經常出現在網站服務條款中的幾個重要條款,它們會影響到我們的數據遷移。

關于第三方程序的規定。許多網站明令禁止使用未經認證的、用于下載或收集網站數據的應用,違者將中止服務。如果你離開其服務,這種威脅沒有什么意義,但是如果你只是想通過這種程序定期備份一下你的數據,那么這一條款將會帶來麻煩。這些規定常常代表著服務商對于數據遷移性的立場。他們可能不會出面阻止你從服務中導出數據,但是他們可能會增加這種條款為數據遷移制造障礙。

許多這方面的規定都含糊不清。如雅虎服務條款第6段J項規定,禁止 “在連接至雅虎服務時不遵守要求、程序、政策或網絡規定,包括使用任何設備、軟件或程序繞開我們的排除列表,”這讓人很自然地認為包括了Web下載或其他類似應用。在大多數時間里,他們很難判別是否在使用這種應用,除非許多人開始使用這種應用,個人用戶賬戶內的大量信息被下載時,服務商會試圖探測這類工具并采取措施封殺它們。

忽視服務條款中關于第三方應用規定的用戶將使自己置于風險之中。Hamilton稱:“從法律角度上說,你正在違反服務條款或是違反版權法。如果網絡下載工具經常在一個網站上使用,它們將會導致一些性能問題,或變成拒絕服務攻擊?!?/p>

重新使用你的內容。一些網站的服務條款允許將你貼在自己賬戶內的東西可以在其他內容中重新顯示。如果你看到這種條款不要驚慌,請仔細閱讀它們。該條款的存在主要是為了讓你貼的東西出現在宣傳資料上,比如在網站首頁上被循環展示或是僅僅是為了進行內部管理。

比如,谷歌的服務條款在第11.1條中規定:“您保有在服務上或透過服務提交、張貼或展示的內容中已持有的著作權及任何其他權利。通過提交、張貼或展示內容,您給予谷歌一項永久性的、不可撤銷的、世界各地的、免交使用費的及非排他性的許可,以復制、改編、修改、翻譯、發布、公開實施、公開展示及分發您在服務上或通過服務提交、張貼或展示的任何內容。此項許可僅以使谷歌可以展示、分發及宣傳服務為目的,并可按某些服務的附加條款就該等服務撤銷此項許可?!?許多服務中都保留了相似的條款。

現實/現有。這也一個包羅萬象的條款,它的實際意思是,服務沒有特定義務提供連續的運行時間,以保護你的數據的完整性或是讓服務處于激活狀態。

隨意中止。最后,一些服務條款中還有一個允許他們能夠隨意中止你的賬戶的條款。如果你看到了這種條款請不要感到吃驚,這是指他們踢走那些不守規定或是消耗了大量服務資源的用戶的擋箭牌。在大多數時間,你不需要擔心有這種情況,但是如果你使用了非認證的工具擷取數據或為你的數據建立鏡像,那么他們可能會根據這一條款將你踢走。谷歌在其服務條款第4.3條中寫入了這一條,雅虎則在其服務條款的第15節中寫入了這一條。在這兩個案例中,這一條款還可讓服務提供商根本不需要給出任何理由就關閉他們的服務。

制訂退出策略

如果你對所使用的服務并未感到不安,但仍然想制訂一個退出策略的話,那么以下一些要點將對你所幫助。

將所有的東西在本地留下備份十分關鍵。完全值得信任的存儲是你自己的物理存儲,因此確保所有的重要東西在本地都有備份。如果你總是很放心地將所有的東西都放在網站上,那么現在就要改掉這個習慣。Web服務應當被視為復制器,而不是儲藏室。

例如,不要因為信任遠程服務而將你的照片放在其中,因為服務的數據保留規定可能并不符合你的利益。最流行的圖片托管服務Flickr不允許你訪問上傳照片的原始拷貝,除非你是付費賬戶。雖然Flump或FlickrEdit等工具可能無法幫助你挽救那些不允許公眾訪問的照片,但是它們可以幫助你從流媒體中提取照片。

另一方面,許多Gmail用戶對他們將全部郵件存儲在谷歌服務器上的行為并沒有什么不安。由于Gmail可以通過POP3 和 IMAP方式連接,因此很容易將郵件保存在本地。用戶很容易養成信任Gmail,將郵件存儲在上面的習慣——這一習慣至少會持續到下一次網絡大癱瘓或谷歌云計算故障時。

將服務商的數據備份在本地。如果網站允許你將你的數據備份在本地,那一定要這么做。按步驟將數據備份在本地,看一下整個過程的復雜性——如操作中要涉及多少個步驟,以及是否需要第三方工具等。

需要注意的是,操作過程可能會在事先沒有提示的情況下發生變化,所以你應當經常性的或是在得知服務操作發生變化時充分檢查一下操作程序。

關注引入或去除了哪些第三方應用。如果你依靠第三方應用來幫助你備份數據,那么你應當注意這些應用變動很頻繁。你六個月前下載的應用就有可能已經被服務提供商所封殺,或是被替代,或是出現了新的或更高級的替代品。換句話說就是要經常關注更新并檢查你的備份機制,確保它們能夠正常工作。

最終的底線

大多數人對于Web服務與生俱來的最終關閉似乎并沒有太多的考慮,僅僅是因為它們提供了豐厚的回報。最終關閉目前已經成為越來越不確定的問題因素,而這又是這類服務所共同面對的問題。

Web服務的經歷告訴我們,任何網站都會消失,只要時間跨度夠長。即便有這樣的問題,大多數Web服務幾乎都沒有提供可以讓用戶輕松導出數據以離開該服務的工具。既然留住這些用戶可以讓服務商獲得更大的既得利益,那么為什么不設置障礙呢?讓用戶能夠輕松切換至其他競爭者那里,將會損害他們的利益。

另一方面,那些提供了數據導出工具的服務商將會獲得其他方面的優勢:那就是用戶對他們的信任,這是其他競爭者所沒有的。信任是Web世界中的貨幣,其價值就如同美元一樣。任何Web服務要想獲得長期利潤就應當提供這類工具。

未經允許不得轉載:存儲在線-存儲專業媒體 » 如何防范數據在“云”中化為烏有?
精品国产午夜肉伦伦影院,双性老师灌满浓jing上课h,天天做天天爱夜夜爽,攵女乱h边做边走