目次
第1章 監視の目的
- 1.1 はじめに.
- 1.2 障害とは何か
- 1.3 なぜ障害の有無を監視するのか
- 1.4 監視をしないことによる問題
- 1.5 おわりに
第2章 設計の流れ
- 2.1 はじめに
- 2.2 5 つのレイヤー
- 2.2.1 どのようなレイヤーか
- 2.2.2 「外形」レイヤー
- 2.2.3 「アプリケーション」レイヤー
- 2.2.4 「デーモン(ミドルウェア)」レイヤー.
- 2.2.5 「リソース」レイヤー
- 2.2.6 「サーバ」レイヤー
- 2.2.7 レイヤーに分ければ分類もはかどる
- 2.3 作業項目と目的
- 2.3.1 項目の確認
- 2.3.2 現状分析
- 2.3.3 判断基準の設計
- 2.3.4 監視サーバの選択と経路の設計. 9
- 2.3.5 監視業務運営の設計
- 2.3.6 段階を踏んでいこう
- 2.4 おわりに
第3章 現状分析
- 3.1 はじめに
- 3.2 情報源を確保する
- 3.2.1 情報源の種類を知ろう
- 3.2.2 設計資料
- 3.2.3 説明書
- 3.2.4 設定情報
- 3.2.5 稼働中のサーバ
- 3.2.6 サーバの物理的な設置状況
- 3.2.7 ソースコード
- 3.2.8 人
- 3.3 分析しよう
- 3.3.1 システム全体・ネットワーク構成の分析
- 3.3.2 アプリケーションの分析
- 3.3.3 ミドルウェアの分析
- 3.3.4 サーバ構成の分析
- 3.4 おわりに
第4章 判断基準の設計
- 4.1 はじめに
- 4.2 監視閾値の決め方
- 4.3 外形の基準
- 4.3.1 項目の種類を確認しよう
- 4.3.2 疎通の監視
- 4.4 アプリケーションの基準
- 4.5 ミドルウェアの基準
- 4.5.1 広く活用可能な監視項目
- 4.5.2 Apacheの監視
- 4.5.3 Tomcatの監視
- 4.5.4 MySQLの監視
- 4.6 サーバの基準
- 4.6.1 監視項目の洗い出し方
- 4.6.2 ハードウェアの監視
- 4.6.3 OSの監視
- 4.6.4 OSが標準で導入する機能の監視
- 4.6.5 ネットワーク機器の監視
- 4.7 重要度の指針
- 4.8 おわりに
第5章 監視サーバの選択と経路の設計
- 5.1 はじめに
- 5.2 監視システムの選択方法.
- 5.2.1 オンプレミス
- 5.2.2 SaaS
- 5.3 監視サーバの設置場所
- 5.4 監視データの送受信方法
- 5.5 監視の通信経路
- 5.5.1 ローカルネットワーク
- 5.5.2 パブリックネットワーク
- 5.5.3 VPN
- 5.5.4 専用線
- 5.6 監視システムからの通知方法
- 5.7 おわりに
第6章 監視業務運営の設計
- 6.1 はじめに
- 6.2 組織内の連絡体制
- 6.2.1 現状の組織の把握
- 6.2.2 緊急連絡網の作成
- 6.3 ユーザとの連絡体制
- 6.4 サービス事業者との連絡体制
- 6.5 休日・夜間対応の備え方
- 6.5.1 絶対に無理はしない
- 6.5.2 休日・夜間の時間帯の定義
- 6.5.3 誰が対応するのか
- 6.5.4 対応開始までどの程度の時間を見込むか
- 6.6 おわりに
第7章 構築
- 7.1 はじめに
- 7.2 モデルケース紹介
- 7.3 セットアップの流れ
- 7.4 監視エージェントのインストール
- 7.5 メトリック・監視プラグインの設定
- 7.5.1 流れの説明.
- 7.5.2 プロセスのリストアップ
- 7.5.3 Apacheの監視設定の準備
- 7.5.4 MariaDB(MySQL)の監視設定の準備.
- 7.5.5 死活・疎通確認のプラグインの選定
- 7.5.6 共通するプラグインの選定
- 7.5.7 Mackerelエージェントの設定変更.
- 7.6 閾値の設定
- 7.7 通知先の設定
- 7.8 外形監視の設定.
- 7.9 おわりに
第8章 運用に入ったあとの問題への対処
- 8.1 はじめに
- 8.2 障害対応
- 8.2.1 障害は突然発生する.
- 8.2.2 まずは落ち着いて行動.
- 8.2.3 外形のチェック
- 8.2.4 第一報の連絡
- 8.2.5 障害対応を始める際の前提確認
- 8.2.6 切り分け
- 8.2.7 障害復旧作業
- 8.2.8 障害復旧後の対応.
- 8.2.9 障害対応に慣れるために.
- 8.3 日々の運用
- 8.3.1 日々の業務の内訳.
- 8.3.2 通知内容の精査
- 8.3.3 メトリックの推移の確認.
- 8.4 障害を未然に防ぐための事務作業
- 8.5 おわりに
第9章 自動化を見据えて
- 9.1 はじめに
- 9.2 自動化の意義
- 9.3 自動化の範囲と優先度の評価
- 9.4 設定の標準化とロールの定義
- 9.5 設定の配布と適用
- 9.6 おわりに