アンケートご協力のお願いgihyo.jpでは,2010年度に向けて豪華プレゼントが当たる読者属性アンケートを実施しております。ご協力ください。

gihyo.jp » DEVELOPER STAGE » 連載 » なぜPHPアプリにセキュリティホールが多いのか? » 補講 » 【スクリプトインジェクション対策05】文字エンコーディングは必ずHTTPヘッダで指定する

なぜPHPアプリにセキュリティホールが多いのか?

【スクリプトインジェクション対策05】文字エンコーディングは必ずHTTPヘッダで指定する

クロスサイトスクリプティングの危険性を解説した「CERT Advisory CA-2000-02 Malicious HTML Tags Embedded in Client Web Requests」(2000年2月)には,クロスサイトスクリプティングを防止する対策として文字エンコーディングを明示的に指定すべきある,と明確に記載されています。

In addition, web pages should explicitly set a character set to an appropriate value in all dynamically generated pages.
加えて,動的に生成されたすべてのWebページは適切な文字コードセットを明示的に設定されなければならない

としています。

<meta>タグを利用すると
<meta http-equiv="content-type" content="text/html; charset=iso-2022-jp">

などと文字エンコーディングをページ中に記載可能ですが,文字エンコーディングを指定するmetaタグ以前にユーザ入力を出力していると,UTF-7エンコーディングを利用したり,ブラウザの文字エンコーディング自動認識機能により,文字エンコーディング指定を解除される可能性があります。このような問題は以前から知られていた問題であり,RFCではこの問題を回避するための規定があります。

RFC2616のセクション3.4.1 Missing Charsetでは

HTTP/1.1 recipients MUST respect the charset label provided by the sender; and those user agents that have a provision to "guess" a charset MUST use the charset from the content-type field if they support that charset, rather than the recipient's preference, when initially displaying a document.

と,HTTP/1.1クライアントはContent-Typeヘッダのcharset設定に“必ず”従うこと,と記載されています。

また,セクション 3.7.1には

When no explicit charset parameter is provided by the sender, media subtypes of the "text" type are defined to have a default charset value of "ISO-8859-1" when received via HTTP. Data in character sets other than "ISO-8859-1" or its subsets MUST be labeled with an appropriate charset value.

と,テキストの文字エンコーディングがcharsetで指定されない場合はISO-8859-1として取り扱い,ISO-8859-1以外の場合は“必ず”適切な文字エンコーディングを指定するようにと記載されています。

インターネットで利用されるプログラムがRFCに準拠していないことは珍しくありませんが,ブラウザも上記の仕様に準拠していません。RFCに規定されていない文字エンコーディングの自動認識機能のため,スクリプトインジェクションが可能になっています(※1)。

ブラウザがRFCに準拠していないとしても,リスクを減らすために必ずHTTPヘッダで文字エンコーディングを指定すべきです。文字エンコーディングを指定しないと,より安全にインターネットを利用するために文字エンコーディングの自動認識機能を無効にしているブラウザでは文字化けが発生してしまいます。PHPの場合,php.ini設定のdefault_charsetに文字エンコーディングを指定します。ここに文字エンコーディング名を次のように指定すると

ini_set('default_charset', 'Shift_JIS');

以下のようなContent-Typeヘッダが送信されます。

Content-Type: text/html;charset=Shift_JIS

しかし,PHPのデフォルト設定は空文字列で,文字エンコーディング指定なしとなり,以下のContent-Typeヘッダが送信されます。

Content-Type: text/html

default_charsetはini_set関数でPHPスクリプトからも変更できますが,上記のようにcharsetが設定されない状況を防ぐためにphp.iniでデフォルト文字エンコーディングを設定するほうが好ましいです。

対策のまとめ

  • プログラム中から必ずdefault_charset設定を利用してHTTPヘッダで文字エンコーディングを指定する
  • プログラムで設定漏れがあった場合にそなえ,php.iniなどの設定ファイルでもdefault_charsetを指定する
  • HTTPヘッダで指定した文字エンコーディングとコンテンツの文字エンコーディングには同じものを使用する
  • ユーザが送信したデータなどが原因で複数の文字エンコーディングの文字列が同一ページ上に表示されないように注意する
※1
Firefoxの場合,文字エンコーディングの自動認識の有効/無効は「表示」-「文字エンコーディング」-「自動識別」で設定可能です。「自動識別」は無効にしてブラウズするほうが安全です。

著者プロフィール

大垣靖男(おおがきやすお)

University of Denver卒。同校にてコンピュータサイエンスとビジネスを学ぶ。株式会社シーエーシーを経て,エレクトロニック・サービス・イニシアチブ有限会社を設立。
オープンソース製品は比較的古くから利用し,Linuxは0.9xのころから利用している。オープンソースシステム開発への参加はエレクトロニック・サービス・イニシアチブ設立後から。PHPプロジェクトでは,PostgreSQLモジュールのメンテナンスを担当している。

URLhttp://blog.ohgaki.net/

著書

  • Webアプリセキュリティ対策入門〜あなたのサイトは大丈夫?

    Webアプリセキュリティ対策入門〜あなたのサイトは大丈夫?

  • [改訂版]PHPポケットリファレンス

    [改訂版]PHPポケットリファレンス

コメント

コメントの記入

パスサポ

多数の情報処理技術者試験対策書籍の発行実績を誇る技術評論社がお届けする,資格試験合格サイト「めざせ! 情報処理試験 パスサポ」が開設されました。

ピックアップ

サクセスストーリーに続く,快適サーバー運用管理のヒント!

データの増大,煩雑な管理,システムダウン,セキュリティなど,迫りくる課題からシステム管理者の負担を軽くするポイントを解説します。

gihyo.jp インフラエンジニア情報局

ネットワークやITにかかわるあらゆる業種で必要とされるインフラエンジニアに向けた技術情報や心構え,その魅力について多角的に紹介。

テストエンジニア ステーション

いま,ITに関わるあらゆる開発業務で注目されつつあるテスト系エンジニアをターゲットにしたコンテンツサイトを展開します。

一行クイックアンケート

gihyo.jpで取り上げてほしいネタは?

※検索はページ右上の検索ボックスをご利用ください。

その他の連載

読むウェブ ~本とインタラクション

ディスプレイで読む活字とそのインタラクション(interaction:相互作用)について,最新Webを紹介しながら読み解いていく。

いま,見ておきたいウェブサイト

この連載では,国内外の最新のウェブサイトを隔週更新で取り上げ,これら最新サイトの特徴や素晴らしい部分を,さまざまな角度から解説していきます。

Windows phoneアプリケーション開発入門

Windows Marcketplace for Mobileがサービス開始され,作成したアプリケーションを個人でも世界をターゲットに公開できる環境が整ってきました。これを機にWindows phoneアプリケーションの開発をしてみませんか?

ここは知っておくべき!Windows Server 2008技術TIPS

5年ぶりのサーバOSとなったWindows Server 2008が出荷されて早2年。2009年にはR2が出荷され,再び注目を集めています。発売前から実施したトレーニングによって感じた,インフラエンジニアの方々に知っておいていただきたい機能を中心にご紹介します。

キーパーソンが見るWeb業界

本連載はWeb Site Expert/gihyo.jpとの連動企画です。阿部淳也, 長谷川敦士, 森田雄のお三方による,Web業界をテーマにした座談会です。

きたみりゅうじの聞かせて珍プレー

ソフトウェア開発の現場で体験したトホホな失敗,思わずうなる珍プレーをきたみりゅうじ氏が四コママンガで紹介。みなさんからの投稿もお待ちしてます!

ActionScript 3.0で始めるオブジェクト指向スクリプティング

野中文雄氏が,簡単なスクリプトは書いたことがあるという初級者を対象に,ActionScript 3.0の基本からクラス定義までを解説します。

まだ間に合う「ITパスポート」受験対策 原山先生の短期合格塾

この連載では,4月18日のITパスポート試験の受験に向けて,短い期間で効率良く受験対策を行う方法や,確実に得点するための裏ワザなどを伝授していきます。

連載一覧

gihyo.jp

  • DEVELOPER STAGE
  • ADMINISTRATOR STAGE
  • WEB+DESIGN STAGE
  • LIFESTYLE STAGE
  • SCIENCE STAGE
  • NEWS & REPORT

書籍案内

  • 新刊書籍
  • 書籍ジャンル一覧
  • 書籍シリーズ一覧
  • 新刊ピックアップ
  • ロングセラー
  • 電脳会議

定期刊行物一覧

  • Software Design
  • WEB+DB PRESS
  • Web Site Expert
  • 組込みプレス