別のアベイラビリティゾーンだったので助かりましたが他人事じゃないですよねぇ。
ITMedia にAWS、東京リージョン23日午後の大規模障害について詳細を報告。冷却システムにバグ、フェイルセーフに失敗、手動操作に切り替えるも反応せずという記事が。
23 日は、aws が落ちてるっていうニュースを良く見ましたが、
記事を読むと相当な状態だったようですね。
問題発生で冷却が最大になるはずがならない。
自ずと熱でサーバ自動停止になる。って流れですね。
しかも何やっても受け付けないっていうのは、オペレーター皆さんは呆然って感じだったかも。
私の仕事で使っているクラウドも、aws EC2 東京リージョンを使ってたりしますが、
別のアベイラビリティゾーンに配置されていたので、
事なきを得ましたが、マネージコンソールのレスポンスは結構低下してました。
クラウドサービス選ぶ時に、
事例が多いのと、大規模停止が少ないって事で、
aws を選んだのはありますが、
一つのリージョンだけで稼働させるのはやっぱりリスク有りますね。
コストとの兼ね合いにもなりますが、
リージョン越えて連携する設計にしないと。って思いを新たにしました。
ITMedia にAWS、東京リージョン23日午後の大規模障害について詳細を報告。冷却システムにバグ、フェイルセーフに失敗、手動操作に切り替えるも反応せずという記事が。
23 日は、aws が落ちてるっていうニュースを良く見ましたが、
記事を読むと相当な状態だったようですね。
問題発生で冷却が最大になるはずがならない。
自ずと熱でサーバ自動停止になる。って流れですね。
しかも何やっても受け付けないっていうのは、オペレーター皆さんは呆然って感じだったかも。
私の仕事で使っているクラウドも、aws EC2 東京リージョンを使ってたりしますが、
別のアベイラビリティゾーンに配置されていたので、
事なきを得ましたが、マネージコンソールのレスポンスは結構低下してました。
クラウドサービス選ぶ時に、
事例が多いのと、大規模停止が少ないって事で、
aws を選んだのはありますが、
一つのリージョンだけで稼働させるのはやっぱりリスク有りますね。
コストとの兼ね合いにもなりますが、
リージョン越えて連携する設計にしないと。って思いを新たにしました。
コメント