盤點十大云計算服務中斷事故
為了幫助企業(yè)避免在云服務中出現(xiàn)故障,美國《NetworkWorld》專門列出了全球眾多網(wǎng)站曾經(jīng)歷過的十個最嚴重的云服務中斷故障以及我們能夠從中吸取的教訓。
嚴重的云中斷1:亞馬遜Web服務中斷。
免除乏味的網(wǎng)絡維護工作是在云中做生意的主要賣點。但這種服務的缺點是:當云廠商例行性改變配置讓你的業(yè)務中斷的時候,用戶會束手無策。
這是許多亞馬遜Web服務用戶在今年4月經(jīng)歷的事情。當時,亞馬遜北弗吉尼亞州的數(shù)據(jù)中心出現(xiàn)故障,完全無法使用。
這個故障是在網(wǎng)絡升級期間發(fā)生的。當時,信息尋找可用的設備把自己作為備份嵌入到這些設備中時,一個錯誤路線的通訊移動把一連串的亞馬遜EBS(彈性塊存儲)通訊量發(fā)送到一個重新鏡像的風暴。這是一種反常的現(xiàn)象。這引起了一系列事件,最終導致亞馬遜在美國東部地區(qū)的許多服務中斷。
這個故障持續(xù)了大約四天時間。但是,在許多企業(yè)陷入困境之中的同時,Netflix等其它公司的排除了故障。生存的關(guān)鍵是什么?設計系統(tǒng)的時候就要考慮到這種類型的故障。
Netflix工程師在題為“Netflix從亞馬遜Web服務中斷故障中吸取的教學”的博客中稱,我們的架構(gòu)避免使用EBS作為我們的主要數(shù)據(jù)存儲服務。我們依靠的SimpleDB、S3和Cassandra服務從而沒有受到這次中斷事故的影響。無國家的服務和可用地區(qū)的數(shù)據(jù)的多個冗余熱拷貝是避免亞馬遜Web服務云故障的關(guān)鍵。
考慮一下你必須是Netflix規(guī)模的企業(yè)才能保證安全嗎?再考慮一下。幫助開發(fā)人員把通訊與其Web應用程序集成在一起的Twilio公司利用亞馬遜的EC2服務托管其核心的基礎設施。盡管如此,4月份的中斷故障對它的穩(wěn)定性幾乎沒有影響。
Twilio共同創(chuàng)始人和首席技術(shù)官EvanCooke稱,建立云的前提是假設這個網(wǎng)絡將出現(xiàn)故障。我們圍繞著主機能夠并且將發(fā)生故障這個思路建立了一個基礎設施。因此,我們不依賴于核心架構(gòu)本身的任何一臺機器或者一個組件。
嚴重的云中斷2:Sidekick關(guān)閉。
智能手機讓你很容易在移動中訪問自己的數(shù)據(jù)。但是,某些東西并不能因為名字中有“智能”二字而不會傻。例證:大約在2009年秋季發(fā)生的T-MobileSidekick中斷故障。
還記得這次大慘敗嗎?微軟擁有的Sidekick遭受了將近一個星期的服務中斷,使用戶不能訪問電子郵件、日歷信息和其它個人數(shù)據(jù)。后來,微軟承認它完全失去了云存儲的數(shù)據(jù)并且也許不能回復這些數(shù)據(jù)。微軟的人員顯然忘記了做備份。
這個技術(shù)從那以后也許已經(jīng)發(fā)展了。但是,教訓是相同的:當涉及到重要數(shù)據(jù)的時候,永遠不要假設其他人將自動保護你。要保證你理解你的云提供商的災難恢復設置。最好是制定獨立地備份你的重要數(shù)據(jù)的計劃。
AlertSite公司負責監(jiān)視產(chǎn)品的副總裁KenGodskind稱,同樣的運營規(guī)則甚至適用于云。使用云的機構(gòu)不能僅僅假設因為它是在云中,業(yè)務持續(xù)性計劃的全部責任已經(jīng)交給了提供商。
嚴重的云中斷3:Gmail故障。
在所有的云服務中,谷歌Gmail是對微軟在企業(yè)中內(nèi)部安裝的郵件服務堡壘的最大威脅之一。使用Postini支持的便宜的獨立的電子郵件服務取代你的維護成本高的Exchange服務器。有什么不一樣?
許多令人討厭的中斷。最近的中斷故障讓15萬Gmail用戶在登錄自己的賬戶之后只看到一個空白頁,沒有郵件和文件夾,沒有任何東西表明他們實際上在看自己的收件箱。值得贊揚的是,谷歌提供了定期的更新并且承諾迅速修復故障。但是,對于某些受影響的用戶來說,谷歌修復這個故障用了4天時間。
谷歌負責工程的副總裁BenTreynor當時在博客中稱,如果有你的數(shù)據(jù)的多個副本,怎么會發(fā)生這樣的事情?在很少出現(xiàn)的情況下,軟件瑕疵能夠影響幾份數(shù)據(jù)。那就是這里發(fā)生的事情。
谷歌最后不得不改用物理磁帶備份以便恢復數(shù)據(jù)。最終,谷歌的多層數(shù)據(jù)保護確實發(fā)揮了作用,但是,還是讓數(shù)千用戶在幾天時間里無法訪問其電子郵件。
故障是不使用云連接的東西的一個理由嗎?也許不是。但是,這是在緊迫的需求出現(xiàn)之前,認證檢查你自己的數(shù)據(jù)保護和考慮建立備份或者離線訪問解決方案的一個理由。
AlertSite公司的KenGodskind稱,當你查看廣泛的平均狀況時,云的運行成功率遠遠高于你個人的運行成功率。這只是當你進入到Web規(guī)模時,故障的影響以更大的方式放大了。
嚴重的云中斷4:Hotmail一團糟。
當然,微軟也為大力推廣其云服務提供最好的廣告。微軟Hotmail在2010年年底出現(xiàn)了數(shù)據(jù)庫錯誤,導致數(shù)萬個收件箱在轉(zhuǎn)換到新的一年的時候都被清空。
微軟稱,這個故障是一個腳本錯誤造成的。這是為自動測試創(chuàng)建的一個刪除虛賬戶的腳本。這個腳本錯誤地刪除了1.7萬個真正的賬戶。
微軟用了三天時間恢復了大多數(shù)用戶的賬戶。大約8%的運氣不佳的用戶必須再等待三天時間才能恢復自己的數(shù)據(jù)。
嚴重的云中斷5:Intuit兩次中斷。
Intuit去年遭遇一次嚴重故障。它的基于云連接的服務,包括TurboTax、Quicken和QuickBooks等流行的平臺在一個月內(nèi)發(fā)生兩次斷網(wǎng)事故。最最糟糕的一次是去年6月的一次36小時斷網(wǎng)事故。一次電源故障顯然導致主要設備使用備用電源,該公司主要的和備份的系統(tǒng)完全斷網(wǎng)。
更糟糕的是,幾個星期之后,又發(fā)生了一次明顯的電源故障。此外,第二次中斷顯然引起了人們的大罵。
一個用戶當時在微博中稱,25小時的斷網(wǎng)是很難忍受的。Intuit的被動的、不透明的和無法接受的溝通沒有幫助。
惠普安全優(yōu)勢計劃主要戰(zhàn)略家ChrisWhitener稱,事實是,如果你需要絕對的可用性,有比一個云更好的解決方案。你沒有必要備份一切,但是,你在那里采取一個額外的步驟(也許僅依靠自己備份重要的數(shù)據(jù))就會產(chǎn)生完全不同的結(jié)果。
嚴重的云中斷6:微軟BPOS(商務辦公在線套件)故障。
當你的基于云的辦公套件出現(xiàn)故障時,那是很難有辦公效率的。那是幾個星期前依賴微軟商務云服務的機構(gòu)發(fā)生的事情。在5月10日左右,微軟BPOS服務開始出現(xiàn)斷斷續(xù)續(xù)地工作的情況。一些用戶的電子郵件因此延遲了9個小時才收到。
兩天后,就在BPOS好像排除了故障的時候,延遲的現(xiàn)象又發(fā)生了,向外發(fā)出的信息也阻塞了。如果這個事故還不夠的話,微軟還經(jīng)歷了另一個故障,阻止用戶登錄基于Web的Outlook門戶網(wǎng)站。(責任編輯:admin)
- “掃一掃”關(guān)注融合網(wǎng)微信號
免責聲明:我方僅為合法的第三方企業(yè)注冊用戶所發(fā)布的內(nèi)容提供存儲空間,融合網(wǎng)不對其發(fā)布的內(nèi)容提供任何形式的保證:不保證內(nèi)容滿足您的要求,不保證融合網(wǎng)的服務不會中斷。因網(wǎng)絡狀況、通訊線路、第三方網(wǎng)站或管理部門的要求等任何原因而導致您不能正常使用融合網(wǎng),融合網(wǎng)不承擔任何法律責任。
第三方企業(yè)注冊用戶在融合網(wǎng)發(fā)布的內(nèi)容(包含但不限于融合網(wǎng)目前各產(chǎn)品功能里的內(nèi)容)僅表明其第三方企業(yè)注冊用戶的立場和觀點,并不代表融合網(wǎng)的立場或觀點。相關(guān)各方及作者發(fā)布此信息的目的在于傳播、分享更多信息,并不代表本網(wǎng)站的觀點和立場,更與本站立場無關(guān)。相關(guān)各方及作者在我方平臺上發(fā)表、發(fā)布的所有資料、言論等僅代表其作者個人觀點,與本網(wǎng)站立場無關(guān),不對您構(gòu)成任何投資、交易等方面的建議。用戶應基于自己的獨立判斷,自行決定并承擔相應風險。
根據(jù)相關(guān)協(xié)議內(nèi)容,第三方企業(yè)注冊用戶已知悉自身作為內(nèi)容的發(fā)布者,需自行對所發(fā)表內(nèi)容(如,字體、圖片、文章內(nèi)容等)負責,因所發(fā)表內(nèi)容(如,字體、圖片、文章內(nèi)容等)等所引發(fā)的一切糾紛均由該內(nèi)容的發(fā)布者(即,第三方企業(yè)注冊用戶)承擔全部法律及連帶責任。融合網(wǎng)不承擔任何法律及連帶責任。
第三方企業(yè)注冊用戶在融合網(wǎng)相關(guān)欄目上所發(fā)布的涉嫌侵犯他人知識產(chǎn)權(quán)或其他合法權(quán)益的內(nèi)容(如,字體、圖片、文章內(nèi)容等),經(jīng)相關(guān)版權(quán)方、權(quán)利方等提供初步證據(jù),融合網(wǎng)有權(quán)先行予以刪除,并保留移交司法機關(guān)查處的權(quán)利。參照相應司法機關(guān)的查處結(jié)果,融合網(wǎng)對于第三方企業(yè)用戶所發(fā)布內(nèi)容的處置具有最終決定權(quán)。
個人或單位如認為第三方企業(yè)注冊用戶在融合網(wǎng)上發(fā)布的內(nèi)容(如,字體、圖片、文章內(nèi)容等)存在侵犯自身合法權(quán)益的,應準備好具有法律效應的證明材料,及時與融合網(wǎng)取得聯(lián)系,以便融合網(wǎng)及時協(xié)調(diào)第三方企業(yè)注冊用戶并迅速做出相應處理工作。
融合網(wǎng)聯(lián)系方式:(一)、電話:(010)57722280;(二)、電子郵箱:2029555353@qq.com dwrh@dwrh.net
對免責聲明的解釋、修改及更新權(quán)均屬于融合網(wǎng)所有。