Hosting Department:ホスティングを活用するための基礎知識

第19回サーバ運用監視のノウハウ(その3)

ケーススタディ(1)サイト公開直後の膨大なトラフィックが発生したときの対応と防御策

オンラインショップやキャンペーンサイトなどを立ち上げる際、注意しなければならないのは、サイト公開直後のトラフィックです。サービス提供者は、少しでも多くの人にサイトを利用して欲しいこともあり、公開の直前・直後に大量のダイレクトメールを配信したり、ホームページで告知したりして集客に努めます。利用者も新しいサービスには関心を持ちやすいことから、公開直後はアクセスが集中し、膨大なトラフィックが発生するのが一般的です。しかし、トラフィックが急激に増えるとサーバに負荷がかかってサイトへアクセスができない状態が続いたり、Webの反応速度が低下したりすることがあります。ユーザは安定したサービスが提供されることを「当然」と認識しているので、つながるまで悠長に待ってはくれません。つながらないサイトからはすぐに離れ、2度と戻っては来ないでしょう。サーバの障害や反応速度の低下は、サイトにとって命取りになります。

これらのトラブルを回避するためには、サーバの稼働状況やネットワークのトラフィック量などを監視し、応答が遅延していたり、つながりにくくなったりしている場合は迅速に処置を施す必要があります。サーバに高負荷がかかっている場合なら、サーバ再起動やプログラム修正などで、応急的な処置を行います。それでも状態が改善されないなら、物理的にWebサーバやDBサーバを増設する必要があるでしょう。また、ネットワークに問題があるなら、広帯域の高速回線に切り替えたり、回線容量を増強したり、高負荷に対応したロードバランサに切り替えたりといった対応を取ります。

サイト公開直後のトラフィック増加に対応するためには、適切なスケールでのサーバ構築はもちろんのこと、サーバ監視、ネットワーク監視は欠かせません。目視によるチェックや、統合運用管理ツールを使って負荷状況をリアルタイムに把握する必要があります。事前にしきい値を設定しておき、危険水域に達したら、適切な処置を施すことでトラブルを回避できる可能性は飛躍的に高まるでしょう。とはいえ、自社で監視から障害検知、原因解析、復旧作業まで行うと、手間と内部コストがかかって仕方ありません。このような場合は、ホスティングサービスの監視オプションや、フルマネージドサービス、外部事業者の監視サービスを利用すれば、24時間365日の監視体制でトラブルに対応してもらえるほか、サーバ構築に対して適切なアドバイスを受けることができます。

ケーススタディ(2)セキュリティ面での対応と防御策

2009年10月ごろから、⁠ガンブラー(Gumblar⁠⁠」と呼ばれる不正攻撃によるウイルス感染の被害が相次いでいます。2009年12月以降、大手の鉄道会社や自動車メーカ、食品メーカなどのサイトが次々と改ざんされ、世間の注目を集めたことから、一般の人にも知られるようになりました。ガンブラーの勢いは、現在も衰えることなく続いているようです。ガンブラーとはウイルスの名称ではなく、Webサイトを改ざんし、訪れたユーザを不正なサイトに誘導してウイルスに感染させる「一連の攻撃」を指します。ガンブラーによって感染させられるウイルスを総称して「ガンブラーウイルス」と呼ぶのが一般的です。

ガンブラーの場合、悪意を持ったクラッカーは、企業などのWebサイトに侵入し、FTPサーバにアクセスするためのIDとパスワードを盗み出します。次にこのIDとパスワードを元にサイトを改ざんし、ウイルスなどが置かれた攻撃サイトに誘導するリンクを埋め込みます。サイトを訪れたユーザは、自動的に不正サイトに誘導され、セキュリティホールを突かれてウイルスに感染させられてしまうのです。サイトには巧にワナが仕掛けられているので、一見しただけで改ざんに気が付きません。企業や組織は、Webサイトが改ざんされてダメージを負うばかりでなく、サイト利用者に被害を与えたことによる信用の失墜も避けられません。また、サーバへの不正侵入を許し、機密データやお客様の個人情報などが盗まれる恐れがあります。一般ユーザの場合は、利用しているWebサービスのIDやパスワードを盗まれることで、金銭的な被害に会ったり、パソコンが不正攻撃や迷惑メールの踏み台に利用されたりする可能性があります。

新種のウイルスや不正攻撃は留まることなく次から次へと襲ってきます。このようなトラブルに対処するためには、サーバのセキュリティアップデートを欠かさず実行し、つねに最新のセキュリティ環境を維持する必要があります。また、サーバを24時間365日監視し、不正攻撃の踏み台にされる際に発生する急激なトラフィックの増加や、パフォーマンスの低下などをいち早くキャッチし、速やかに対応策を取ることも求められるでしょう。ガンブラーの場合なら、FTPのアクセスを制限したり、FTP以外の接続方法に切り替えてIDとパスワードの流出を防いだり、サーバにアクセスするIPアドレスを制限したりする必要があります。

しかし、自社でサーバの運用・監視を行いながらセキュリティ環境を維持するには限界があります。完璧にこなすためには、社内に高度なサーバ運用技術やセキュリティ関連の知識を持つ人材を複数確保し、24時間365日交代で監視業務を行わなければなりません。自社での対応ができない場合、ホスティングサービスの監視オプションや、フルマネージドサービス、外部事業者の監視サービスを利用すれば、セキュリティ対策はもちろん、ガンブラーなどの新種の攻撃からサーバを守ることができます。

ケーススタディ(3)アップデート時のメンテナンスと対応策

サーバの安全を維持したいなら、セキュリティにぜい弱性があるプログラムを最新版にアップデートする必要があります。しかし、今まで安定稼働していたサーバのプログラムを不用意にアップデートしてしまうと、正常に動いていたサーバが動作しなくなる可能性があるのも確かです。サーバのOSやアプリケーションは、Java、PHP、Perlなどのプログラム言語で記述されています。これらの言語には、さまざまなバージョンがあり、組み合わせによっては動作しない場合があるからです。不用意にプログラムをアップデートしてしまうと、コードにエラーが発生したり、サーバが正常に動作しなかったりすることも考えられます。サーバプログラムのエラーは、原因の把握が困難になる傾向が強く、復旧に長時間要するケースも多々あります。サーバダウンによってWebサービスや社内システムが止まってしまうと、サービス利用者に迷惑をかけるばかりか、社内業務そのものが停滞し、甚大な被害を受けることにもなりかねません。サーバアップデート時のメンテナンスは重要な作業であり、事前に慎重にテストを実行しておく必要があります。

自社でアップデートを実行する場合、稼働している本番サーバとは別に、本番と同じ環境を再現したテストサーバ用意するのが一般的です。そして、テストサーバ上でアップデートを実行し、トラブルがなければ改めて本番用サーバでアップデートを実行する段取りを取ることになります。しかし、低予算でサーバ運用している企業の場合、本番と同じ環境のテストサーバを構築することはコスト高となり、現実的ではありません。このようなケースでも、ホスティングサービスやマネージドサーバを利用すれば、事前にアップデートテストを実施した上で、サーバOSのセキュリティパッチやアップデートパッチのインストールを実行してもらうことができるので安心です。

このように、サーバの安定稼働を確認する運用監視は、システムダウンのリスクを抑え、信頼性や可用性を向上することができます。さらにセキュリティにおいても、情報漏洩や不正アクセスを未然に防ぎ、管理負担を効率的に軽減できます。

システムの大規模化や複雑化、さらにクラウドや仮想化など、時代のニーズに応えるためにもシステムの安定稼働は不可欠です。これまで紹介してきたように、監視ツールを利用するなど効率的な運用体系を確立する一方、運用管理の信頼性や可用性にかかわる部分をホスティングサービスに任せるなど、アウトソーシングを活用することも安定稼働を続ける重要なポイントです。特にホスティングは、運用監視、管理サービスが充実しており、高度な知識やスキルを持ったスタッフがネットワークやサーバの安定運用をサポートしてくれるため、自社で運用管理を行うよりも的確かつ迅速に対処することが可能です。

おすすめ記事

記事・ニュース一覧