昨日の東証のシステム障害について

【この記事の所要時間 : 約 3 分

担当は、F社だったらしい。
担当者のことを考えると、ご愁傷様と思う。
実際のところどうなのかはよくわからないが、あれほどの大規模システムなら基本的には、保守担当は設計や開発をした人とは別だろう。
大変だと思う。自分が作ったものでないものの保守は。本当に。
この事件が起こってから大学時代に受けたある講義を思い出した。
それは、「河川について」の講義だった。
現在の多くの河川は3面張りにコンクリートでガチガチに固められて、洪水が起こらないように制御しているが、それによって河川のまわりで生きていた動物や植物がいなくなってしまって生態系が崩れ始めていると。
そして、それは正しい姿ではないのではないか?と。
できるだけ生態系を崩さずに、洪水からの被害を防ぐためには、コンクリートで固めるのではなく、洪水は洪水として川があふれることを容認しつつ、遊水地などを設けて、川が溢れても家が浸水したりしないようにするべきではないか?と。
システムについても似たような感じではないだろうか?
システム障害を100%起こさないようにするという方向ではなく、システム障害が起こったときにいかに被害を少なくするか?という方向である程度の障害はリスクとして容認するべきではないだろうか?
はてなとmixiのイー・マーキュリーで行った共同勉強会の資料が公開されているが、
http://www.hatena.ne.jp/info/tech
ここでも、
最小限の冗長化として
 ・ホットスタンバイとかイラネ
 ・バックアップは定期的なdump + レプリケーション
 ・障害があったときにいかに速くリカバリするか
という方針が書かれていて、我が意を得たりと感じた。
人命にかかわるようなものや原子力発電所など絶対に障害を起こせないものはあるが、それでもシステム障害は起きる。
東証のシステムが落ちたところで死ぬ人はいない。
今回、いろいろなところからF社は責められると思うが、
「障害を起こしたこと」を責められるべきではないと思う。
責められるべきは「障害を速くリカバリできなかったこと」。
そのあたり間違われないようにと強く思った。

システムはなぜダウンするのか
大和田 尚孝
日経BP社
売り上げランキング: 45,802
スポンサーリンク
レクタングル(大)広告
  • このエントリーをはてなブックマークに追加
スポンサーリンク
レクタングル(大)広告

コメント

  1. satoshis より:

    トラックバックありがとうございます。
    一粒の麦について書いた記事にトラックバックしていただきましたが、黒さそりについて書いている記事もあります。
    http://satoshis-sake.seesaa.net/article/6182228.html
    そろそろ酒切れなので、来週末あたり酒を買ってきて新しい記事を書くかもしれません。

  2. little-gray より:

    TBありがとうございます。
    私自身はあまり麦焼酎は飲まないのですが、「釈云麦」や「兼八」は結構好きです(麦の香ばしさがとてもよいです)。
    黒さそりが好きというのであれば、これらの焼酎も美味しく飲めるかもしれません。

コメントをどうぞ

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

このサイトはスパムを低減するために Akismet を使っています。コメントデータの処理方法の詳細はこちらをご覧ください