【改訂新版】システム障害対応の教科書
2024年4月15日紙版発売
2024年4月15日電子版発売
木村誠明 著
A5判/336ページ
定価3,080円(本体2,800円+税10%)
ISBN 978-4-297-14012-0
書籍の概要
この本の概要
本書は,ITシステム障害対応の現場で必要なさまざまな知識とノウハウ(基本動作,ツール,必要ドキュメントなど)を体系化し,個人・組織のシステム障害対応力を向上させることを目的とした解説書です。障害対応を指揮する「インシデントコマンダー」や,実際に作業にあたる作業担当者が知っておくべき知識を解説するとともに,高い障害対応力を備えた組織作りについても紹介します。改訂新版では,チームメンバーの教育と育成,障害対応訓練実施のポイント,事故を防ぐ手順書の作り方,エンドユーザ向け情報発信についての章を新設しました。また,生成AI技術のシステム運用への応用についても紹介しています。
こんな方におすすめ
- ITサービスに関わるすべての人
- ITシステムの障害対応に携わる人
- システム障害時の対応について体系的な知識を知りたい人
本書のサンプル
本書の紙面イメージは次のとおりです。画像をクリックすることで拡大して確認することができます。
目次
第1章◆システム障害対応を学ぶ意義
- 1.1 なぜシステム障害対応は暗黙知だったのか
- 1.2 上昇し続けるシステム障害対応の難易度
- 1.3 システム障害対応時に起こり得るさまざまな問題
第2章◆システム障害の定義
- 2.1 システム障害とは何か
- 2.2 システム障害対応の目的と定義
第3章◆システム障害対応の登場人物と役割
- 3.1 システム障害対応の登場人物の概要と体制
- 3.2 インシデントコマンダーの役割と基本動作
- 3.3 作業担当
- 3.4 ユーザ担当
- 3.5 CIO
第4章◆各プロセスの基本動作~発生から終息まで
- 4.1 検知・事象の確認
- 4.2 業務影響調査
- 4.3 原因調査
- 4.4 復旧対応
- 4.5 イベントの確認/事後対応
第5章◆障害対応に必要なドキュメント
- 5.1 障害対応フロー図
- 5.2 オンコールシフト表と連絡先管理表
- 5.3 障害レベル管理表
- 5.4 障害状況ボード
- 5.5 作業タイムチャートシフト表
第6章◆システム障害対応力を高めるツールと環境
- 6.1 大規模システム障害のコントロール
- 6.2 システム監視ダッシュボード
- 6.3 War Roomダッシュボード
- 6.4 War Room
- 6.5 構成管理データベース(CMDB)
- 6.6 システム運用におけるAIの活用
第7章◆組織の障害対応レベル向上と体制作り
- 7.1 障害対応レベルの維持・向上
- 7.2 障害対応を担う組織や体制
第8章◆システム障害対応力の改善と教育
- 8.1 組織の障害対応力の継続的な改善
- 8.2 教育と訓練
第9章◆教育と育成の手引き
- 9.1 作業担当とインシデントコマンダーに必要な能力
- 9.2 障害対応チームの育成の流れ
- 9.3 障害対応力スキルチェックシート
第10章◆障害対応訓練の実施
- 10.1 訓練手法の種類と適切な選択
- 10.2 訓練の実施要領
第11章◆事故を防ぐ手順書の作り方
- 11.1 ヒューマンエラーとは
- 11.2 ヒューマンエラーを防ぐ手順書の作成
第12章◆エンドユーザ向けの情報発信
- 12.1 エンドユーザ向けの情報発信の目的と内容
- 12.2 エンドユーザ向けの情報発信の方法
Appendix◆難易度の高いシステム障害ケース
- ケース1 ビジネスロジックアプリケーション障害と「誤データの波及」
- ケース2 インフラ障害における機器の「半死」
- ケース3 大規模インフラ障害と「伝言ゲーム」
- ケース4 キャパシティ障害
- ケース5 災害時のコントロール~3.11のふりかえり
この本に関連する書籍
-
運用設計の教科書【改訂新版】 ~現場でもっと困らないITサービスマネジメントの実践ノウハウ
好評の『運用設計の教科書』の増補改訂版です。近年,ますます定着してきたクラウドサービスやアジャイル開発への対応を強化し,利用者の種類による運用設計の考え方の...
-
運用改善の教科書 ~クラウド時代にも困らない、変化に迅速に対応するためのシステム運用ノウハウ
システム運用はいま,転換期を迎えています。DX(デジタルトランスフォーメーション)の推進やクラウドサービスの普及により,運用に求められる考え方は急速に変化しま...
-
[改訂3版]Zabbix統合監視実践入門 ―障害通知,傾向分析,可視化による省力運用
統合監視ツールZabbixの使い方を,基礎から実際の運用ノウハウまで解説した書籍です。よく使われる監視例はもちろん,大規模なシステム監視についても設定例を挙げなが...