書籍概要

【改訂新版】システム障害対応の教科書

著者
発売日
更新日

概要

本書は,ITシステム障害対応の現場で必要なさまざまな知識とノウハウ(基本動作,ツール,必要ドキュメントなど)を体系化し,個人・組織のシステム障害対応力を向上させることを目的とした解説書です。障害対応を指揮する「インシデントコマンダー」や,実際に作業にあたる作業担当者が知っておくべき知識を解説するとともに,高い障害対応力を備えた組織作りについても紹介します。改訂新版では,チームメンバーの教育と育成,障害対応訓練実施のポイント,事故を防ぐ手順書の作り方,エンドユーザ向け情報発信についての章を新設しました。また,生成AI技術のシステム運用への応用についても紹介しています。

こんな方におすすめ

  • ITサービスに関わるすべての人
  • ITシステムの障害対応に携わる人
  • システム障害時の対応について体系的な知識を知りたい人

サンプル

samplesamplesamplesamplesample

目次

第1章◆システム障害対応を学ぶ意義

  • 1.1 なぜシステム障害対応は暗黙知だったのか
  • 1.2 上昇し続けるシステム障害対応の難易度
  • 1.3 システム障害対応時に起こり得るさまざまな問題

第2章◆システム障害の定義

  • 2.1 システム障害とは何か
  • 2.2 システム障害対応の目的と定義

第3章◆システム障害対応の登場人物と役割

  • 3.1 システム障害対応の登場人物の概要と体制
  • 3.2 インシデントコマンダーの役割と基本動作
  • 3.3 作業担当
  • 3.4 ユーザ担当
  • 3.5 CIO

第4章◆各プロセスの基本動作~発生から終息まで

  • 4.1 検知・事象の確認
  • 4.2 業務影響調査
  • 4.3 原因調査
  • 4.4 復旧対応
  • 4.5 イベントの確認/事後対応

第5章◆障害対応に必要なドキュメント

  • 5.1 障害対応フロー図
  • 5.2 オンコールシフト表と連絡先管理表
  • 5.3 障害レベル管理表
  • 5.4 障害状況ボード
  • 5.5 作業タイムチャートシフト表

第6章◆システム障害対応力を高めるツールと環境

  • 6.1 大規模システム障害のコントロール
  • 6.2 システム監視ダッシュボード
  • 6.3 War Roomダッシュボード
  • 6.4 War Room
  • 6.5 構成管理データベース(CMDB)
  • 6.6 システム運用におけるAIの活用

第7章◆組織の障害対応レベル向上と体制作り

  • 7.1 障害対応レベルの維持・向上
  • 7.2 障害対応を担う組織や体制

第8章◆システム障害対応力の改善と教育

  • 8.1 組織の障害対応力の継続的な改善
  • 8.2 教育と訓練

第9章◆教育と育成の手引き

  • 9.1 作業担当とインシデントコマンダーに必要な能力
  • 9.2 障害対応チームの育成の流れ
  • 9.3 障害対応力スキルチェックシート

第10章◆障害対応訓練の実施

  • 10.1 訓練手法の種類と適切な選択
  • 10.2 訓練の実施要領

第11章◆事故を防ぐ手順書の作り方

  • 11.1 ヒューマンエラーとは
  • 11.2 ヒューマンエラーを防ぐ手順書の作成

第12章◆エンドユーザ向けの情報発信

  • 12.1 エンドユーザ向けの情報発信の目的と内容
  • 12.2 エンドユーザ向けの情報発信の方法

Appendix◆難易度の高いシステム障害ケース

  • ケース1 ビジネスロジックアプリケーション障害と「誤データの波及」
  • ケース2 インフラ障害における機器の「半死」
  • ケース3 大規模インフラ障害と「伝言ゲーム」
  • ケース4 キャパシティ障害
  • ケース5 災害時のコントロール~3.11のふりかえり

サポート

ダウンロード

サンプルファイル,参考資料のダウンロード

(2024年3月26日更新)

本書内で紹介しているサンプルファイル,参考資料をダウンロード可能です。

障害対応力スキルチェックシート サンプル

本書の274ページで紹介している「障害対応力スキルチェックシート」のサンプル(Excelデータ)をダウンロード可能です。ダウンロードには,本書の14ページに記載されているパスワードの入力が必要です。

なお,本Excelファイルには保護を掛けてあります(変更不可)。ご利用の際は,新規にExcelファイルを作成していただき,シートの内容をコピー&ペーストしてから,環境に合わせてご活用ください。

障害対応力スキルチェックシート.xlsx(16KB)

インシデントコマンダー育成ゲーム「Sランカー」資料

本書の279ページ「システム障害対応をゲーミフィケーションで学ぶ」で紹介しているインシデントコマンダー育成ゲーム,「Sランカー」の資料をダウンロードできます。

資料はzip形式でまとめられています。ファイルを展開し,中に含まれる「コメント.txt」を最初にご覧ください。また,ファシリテーター以外の人は,ルールブック(1_システム障害対応の教科書_Sランカー_ルールブック_参加者にくばる.pdf)以外を見ないよう注意してください。

ダウンロード
S_rakner.zip

商品一覧