IT周りにも冗長性は必要だという話

Googleでえげつない障害が起きていていろんなものが使えない状態になっているのだけれど、内心ちょっと火事場のお祭り騒ぎ的な非日常テンションになっている部分もある。真面目な顔をして言うなら、特定のプラットフォームに強く依存することの問題を改めて突きつけられているとでもまとめればいいのだろうか。

見た感じだとOAuthあたりの認証まわりが死んでいるっぽく、すると必然的にDrive File Streamなんかも強制ログアウトされるのでGSuite契約してる組織なんかはかなり痛手になっているんじゃないか。下手したら仕事にならないのではないか。情シス部門は今頃大変だろうな。どっかでは営業さんから電話で怒鳴られたりしてんのかな。夜でよかったね。

僕も普段の研究活動はGoogle Drive + Colaboratoryで作業しつつYouTubeのオフライン動画を耳だけで聴くスタイルなのでほぼ全部Googleに環境を依存しているわけだが、今回は本当にたまたまローカルのAnacondaで作業していたので助かった(新しく組んだNeural Networkを回すのにColabだとあまりにも非力だったからっていうだけなんだけど)。

オンプレかパブリッククラウドかっていう二元論で語る人はすごく多いし、普段はあまりにも多くの観点からパブリッククラウドで運用する方が絶対にいいんだけど、年に何回かある”こういう日”のような有事に備えて一応オンプレを持っておくというのは(それだけのためにしては維持コストがあまりにもかかるという気持ちもわかるけれども)間違った選択肢ではないと思う。別に「だからハイブリッドクラウド最強!」とも言うつもりはなくて、情報システムまわりもちゃんとコストをかけて冗長性を持たせないとダメだって話ですね。最近はAWSが落ちたこともあったし、ITにも絶対はないんですよ。

復旧までカップヌードルでも食べようかな。障害対応お疲れさまです。