OFFICE風太郎

日本のエンジニア、風太郎です。問題解決が飯のタネです。仕事や生活で問題解決を活用したり、問題解決の基礎となる統計とかデータ分析の話をしていきます

AWS障害に見る 実現した未来 (止まらないコンピュータ)

コンピュータ停止の恐怖

 大昔では、電子機器やコンピュータが津々浦々で活用された近未来が予測されました。 そられと同時に故障やバグにより人間に害を与える想像もめぐらされました。 あまりにも昔過ぎてあまり覚えていませんが、

ja.wikipedia.org

の小説版は電子機器のショートが原因で多くの犠牲者が出るストーリと記憶しています。

一方現実としては

ja.wikipedia.org

という会社がありました。
また、各社は自社の基盤システムの脆弱性対策を行っていたようです。
 銀行のオンラインシステムはかなり昔からあり、1980年代にはキャッシュカードでお金を引き出せるようになり、その恩恵が一般ユーザーでも受けられました。
 有名なトヨタ生産方式でも、その生産指示システムが非常に重要だという講演をされた先生もお見えになります。  このように社会基盤や大企業の基盤にかかわるようなものでも、マスコミに載るような障害はあまり見受けられませんでした。

AWS障害と状況

 風太郎が論ずるよりこちらの記事が詳しいです。AWSで障害が発生し、いろいろな問題があったようです。

piyolog.hatenadiary.jp

soudai.hatenablog.com

問題解決の視点から

ここで、ITに関しては趣味レベルの風太郎から見るといろいろ参考になる話が書かれていました。また、問題解決、未然防止、品質工学的な見方でも面白いところがあります。
障害が多く報告されていますが、「生命」に関するところは全く見当たりません。また、「金融系」についてもほあまり見受けられません。また、金融と分けることに異議があるかもしれませんが、決済系も少なくなっています。
多いのは上記以外のところです。
 ユーザーとしては当然、サービスが止まることは嫌なわけですが、かといってコストを負担する気にもなれません。そういう意味で各社はその停止した場合の損失に対して、うまく資金を割り振っていると考えられるでしょう。  ゲームは止まると嫌ですが、2倍や数倍のコストを負担しろと言われたら多くの人は嫌がるでしょう。風太郎的には年に一回障害があっても我慢するから、イラストと声優のセリフ増に資金を振り分けてと言いたくなります。

 このような現象とコストをよく考えているのは品質工学の損失関数です。今回のことを品質工学の損失関数から論じてくれる人はいないか?と考えます。