システムはなぜダウンするのか

◎ システムはなぜダウンするのか 知っておきたいシステム障害、信頼性の基礎知識


目次

第1章 システムが止まった…
   ――「ダウン」とは何か
1.1 停止=ダウンは誤解
1.2 ダウンは原因から4種類に分けられる
第2章 きちんとテストしたはずなのに…
   ――アプリケーション・ソフトの不具合
2.1 突然に目を覚ます20世紀のバグ
2.2 忘れたころにやってくる「日付問題」
2.3 データベースのデッドロックが連発
COLUMN こちらシステム・ダウン相談所 システム・ダウンが「3K」の一因?
第3章 アプリケーションだけではない…
   ――OS、ミドルウエアの不具合
3.1 停止を検知できない
3.2 組み合わせを変えたら動かない
3.3 メモリーをつかんだまま解放しない
第4章 アクセス殺到に耐え切れず…
   ――性能・容量不足
4.1 ハードウエアの性能を生かしきれない
4.2 メモリー、CPUが足りない
4.3 通信データの増加がダウンをまねく
4.4 データベースが満杯に
4.5 夜が明けてもバッチ処理が終わらない
COLUMN こちらシステム・ダウン相談所    運用担当者は叱られ役?
第5章 気づかなかったは許されない…
   ――環境設定・変更ミス
5.1 つい見逃すパラメータ変更
5.2 システム環境の変更ミス
5.3 パッチ・ファイルの適用忘れ
5.4 カレンダーの設定ミス
第6章 その「うっかり」が致命傷…
   ――運用・操作ミス
6.1 運用コマンドを間違える
6.2 データの移行・入力ミス
6.3 待機系への切り替えに失敗
6.4 混乱が「2次災害」を生み被害拡大
第7章 まさか、こんなことが起こるとは…
   ――ハード故障、不慮の事故
7.1 サーバーが壊れた
7.2 通信ネットワークが不通に
7.3 コンピュータ、電気なければただの箱
7.4 震災でデータセンターが破壊・焼失
COLUMN こちらシステム・ダウン相談所
    ダウンが減りすぎて困る?
第8章 障害対応は時間との闘い…
   ――ダウンに学ぶ
8.1 原因究明よりも復旧を優先



目次を見ると判るが、システムダウンの原因を

  • ソフトウェアの不具合
  • 性能・容量不足
  • 設定・操作ミス
    • システム環境の設定・変更ミス
    • 運用・操作のミス
  • 不慮の事故

に分類し、それぞれの解説、システムダウン実例での説明をしている。


さすが永らく動かないコンピューターの記事を続けてきた日経コンピューターで
判り易く、実例でのダウンの恐ろしさが身近に感じる。


IT業界の運用担当者、マネージメントなどは読むべき本だ。
力作です。


巻末の参考文献で元記事も判るようだ。
特にITproのサイトが便利そう。
「システムの計画停止は適切な判断だった」、東証の西室会長兼社長 http://itpro.nikkeibp.co.jp/article/NEWS/20060118/227513/
日本郵政、一部システムで処理遅延が起きるも初日は大きな混乱なし http://itpro.nikkeibp.co.jp/article/NEWS/20071001/283452/
【続報】ゆうちょ銀障害は性能設計の甘さが原因、開発ベンダーはNTTデータ http://itpro.nikkeibp.co.jp/article/NEWS/20071009/284061/
ゆうちょ銀行で振り込み遅延が発生、一部年金の受け取りに影響
http://itpro.nikkeibp.co.jp/article/NEWS/20071015/284608/
ゆうちょ銀の年金振り込み障害、原因は合計金額の上限オーバー
http://itpro.nikkeibp.co.jp/article/NEWS/20071016/284630/
【続報】ゆうちょ銀の年金振り込み障害、根本原因は民営化に伴うシステム変更漏れ
http://itpro.nikkeibp.co.jp/article/NEWS/20071016/284745/
【スクープ】「後納郵便」料金請求でトラブルの恐れ、郵便社員のITリテラシに問題が
http://itpro.nikkeibp.co.jp/article/NEWS/20071022/285087/
かんぽ生命でもデータ処理ミス、保険料の払い込み証明書の発送が遅延
http://itpro.nikkeibp.co.jp/article/NEWS/20071121/287752/
日本郵便の「後納郵便」で料金請求ミス、またしてもデータ入力の誤りが発生
http://itpro.nikkeibp.co.jp/article/NEWS/20071116/287390/