Hosting Department:ホスティングを活用するための基礎知識

第17回サーバ運用監視のノウハウ(その1)

コーポレートサイトやキャンペーンサイトなど、多くのサイトがホスティングサービスによって運用されています。そこで今回から3回に分けて、ホスティングサービスを利用したサイト運用およびサーバ監視のノウハウを紹介します。第1回は、サーバ監視の基礎について解説します。

サーバ監視とは

サーバと一言でいってもさまざまな用途を持つサーバがあり、企業の業務やサービスは、複数のサーバが有機的に連携して支えています。ホームページを表示するためのWebサーバを筆頭に、DBサーバ、メールサーバ、ファイルサーバ、プリントサーバなど、サーバの種類と役割は数え上げたらきりがありません。

これらのサーバは、企業が円滑に業務を遂行したり、ユーザに対して継続的に安定したサービスを提供したりするためには欠かせないものであり、サーバの停止は業務の継続や企業の信用獲得に大きな影響をもたらします。例えば、オンラインショッピングを利用しようとしたお客様がショッピングサイトにアクセスした際、目的のページが表示されなかったり、購入ボタンを押しても反応が返って来なかったりすると、お客様は離れていくばかりか、2度と利用しなくなってしまうでしょう。コーポレートサイトで情報を収集し、商談のためにコンタクトを取りたいと思った時、ページが表示されなければ商機をみすみす逃すことになります。また、企業間の取引や連絡でメールの利用が当たり前となった現在、メールサーバの停止は業務を停滞させるばかりか、取引先からの信用を失うことにつながりかねません。

このように、サービスを安定的に供給し「当たり前のことが当たり前にできること」を維持するためには、サーバの監視が必要不可欠です。サーバをつねに監視することで、障害発生の際に速やかに復旧作業を行えます。バックアップシステムとして予備サーバを用意しておけば、障害時に予備サーバに切り替えることでサービスが途切れることはありません。また、ハードウェアの異常やサービスレベルの低下を検知することで、トラブルを事前に回避することも可能です。しかし、サーバの稼働には休みがないため、24時間365日監視を続ける体制が必要となります。そのうえ、監視やトラブル対策にはサーバの知識を持つ技術者の存在が欠かせません。自前で監視するとなると、専用のサーバ監視ツールを導入して設定を行ったり、監視サービスを導入したりする必要があります。

ホスティングサービスにおけるサーバ監視

ホスティングサービスは主に、共用サーバ、専用サーバ、仮想専用サーバ(VPS)の3タイプに分かれます。

共用サーバは自由度で劣る反面、ユーザはサーバを監視する必要がありません。共用サーバはホスティング事業者がサーバを監視し、トラブルが発生した際は速やかに対処します。ただし、復旧作業は事業者任せとなるため、復旧までに要する時間などは事前に確認する必要があります。

一方、専用サーバと仮想専用サーバは、ユーザに管理者権限が与えられ、自由に設定できるメリットがありますが、サーバの監視は契約者自身で行わなければなりません。中小企業の場合、サーバに詳しい専任担当者がいないことがほとんどなので、サーバ監視スタッフを新たに雇用する必要があります。24時間365日監視することを想定するなら、シフトを組むために複数の人員を要するでしょう。しかし中小企業がサーバ監視のためにスタッフを複数雇用することは現実的ではありません。大企業の場合でも、サーバの監視に限られたリソースを割くことは、コスト的にも業務効率的にも得策ではありません。

サーバの管理と運用の手間を軽減したいなら、アウトソーシングする方法があります。ほとんどのホスティングサービスは、サーバ監視、障害発生時の一次対応といったサポートをオプションとして提供しています。サーバが問題なく稼働しているかどうか、過剰負荷で処理速度が低下していないかどうかといった状況をネットワーク経由で監視し、その応答内容によっては契約者に通知したり、サーバの状況を詳細に診断したりします。突発的なアクセス増を監視し、状況によってはサーバの増強を提案してくれるサービスもあります。一次対応サービスでは、ネットワークやサーバを監視して何らかの問題が発生した場合、事前に取り決めた手順でプロセスやサーバを再起動します。

オプションは、サービスを個別に選定しますが、運用管理や保守に関する作業を丸ごとホスティング事業者に委託できるマネージドサーバなら、専門知識を持つプロの技術者がサーバの監視から障害対応まですべてを代行します。24時間365日サーバを監視し、急激な負荷増に対しては、障害が発生する前の段階で適切な対処を実施するとともに、障害発生時は契約者に通知し、復旧プロセスを速やかに実行します。

監視すべきポイント

サーバ管理の対象範囲は幅広く、監視要素は多岐にわたります。ここでは代表的な監視ポイントについて説明しておきましょう。

ハードウェア

サーバのハードウェアは、CPU、メモリ、ハードディスクなど、さまざまな要素で構成されています。サーバを長期間使い続けると、CPUの温度が上昇して熱暴走を起こしたり、ハードディスクが異常回転によって停止したり、冷却ファンが停止したりといった障害発生の危険性が高まります。そこで、ハードウェアそのものを常に監視し続ける必要があります。しかし、サーバのCPUやハードディスク、内部に配置した温度センサや冷却ファンの位置などは、サーバメーカによって異なります。そこで、サーバ本体には個別の監視ツールが付属し、ハードウェア上のトラブルを常に監視しています。

Webサーバ、DBサーバ

リソース監視

サーバの応答スピードが急激に遅くなるといった原因は、CPUの負荷上昇、サーバのメモリ不足やハードディスクの空き容量不足といった原因が考えられます。そこで、サーバのメモリやハードディスクの容量をつねに監視していれば、障害発生時の原因究明に役立ちます。CPUの負荷容量、メモリの使用率、ハードディスクの空き容量の許容範囲をあらかじめしきい値として設定しておき、定期巡回時に設定値を超えた場合や、応答がない場合に障害通知メールを送信します。

サービス監視

外部の監視サーバからインターネット経由で通信を行い、HTTP、HTTPS、DNS、FTPといった基本的なサービスが正常に動作しているかどうかを監視します。具体的には、監視対象となるポートにコマンドを送り、サービスの応答状況を監視するもので、一定期間ごとに監視サーバが対象となるサーバを巡回し、異常な応答が返ってきたり、応答がまったくなかったりした場合は障害と判断し、障害通知メールなどを送信します。

プロセス監視

MySQL、MSSQLServer、Oracleなど、データベースのプロセスや、事前に設定したアプリケーションのプロセスがある場合、定期巡回時に個々のプロセスの起動数や稼働状況を監視し、異常を検知した際は障害と判断して障害通知メールなどを送信します。

その他

監視対象となるサーバに、pingコマンドを送信してサーバが動作しているかを確認する「死活監視⁠⁠、サービスを行うために必要なポートに接続できるかを確認する「ポート監視⁠⁠、指定したWebページにアクセスしてコンテンツが正しく表示されるかを確認する「URL監視⁠⁠、ネットワークを流れるパケット量やエラーパケットを監視し、しきい値を超えた場合に通知する「トラフィック監視」などがあります。

緊急時の対応の仕方

ホスティングサービスでは、24時間365日体制でサーバ監視を行い、障害が発生すると担当者に知らせる障害通知メールを送ってくれるので、緊急トラブルが発生しても速やかに対処することが可能です。

さらに、障害に対する一次対応としてあらかじめ決められた手順に応じてサーバを再起動したり、ログを解析したりするなどして障害の原因を特定します。中には、保守会社へのエスカレーション対応から復旧支援まで対応しているサービスもあります。

ホスティング事業者によっては、障害を通知するだけで対応はユーザ自身で行うサービス、ベンダコントロールから復旧作業まですべて対応するサービス、定期的にレポートを提供するサービスまで幅広くあるので、用途に合わせて選ぶとよいでしょう。

おすすめ記事

記事・ニュース一覧