gihyo.jp » DEVELOPER STAGE » 連載 » なぜPHPアプリにセキュリティホールが多いのか? » 補講 » 【スクリプトインジェクション対策06】入力文字列の文字エンコーディングを検証する

なぜPHPアプリにセキュリティホールが多いのか?

【スクリプトインジェクション対策06】入力文字列の文字エンコーディングを検証する

筆者はここ数年,ブラウザからの入力は指定された通りの正しい文字エンコーディングでエンコードされているか検証しなければならない,と解説しています。手前味噌ですが2006年3月に出版した「Webアプリセキュリティ対策入門」(技術評論社)でも,入力文字列のエンコーディングが妥当であるか検証しなければならない,と解説しています。

残念なことに最近になっても不正な文字エンコーディングが入力される可能性を考慮していないことによる脆弱性が,PHP本体自体やPHPも利用しているライブラリlibxml2に発見されました。不正な文字エンコーディングはデータが正しくないだけでなく,スクリプトインジェクションやSQLインジェクション,DoS攻撃等を可能にします。

マルチバイト文字エンコーディングは最初または前方に配置されたバイトで1文字が何バイトで構成されるか決まります。この性質を利用してマルチバイト文字列の開始バイトでエスケープ文字を無効化することが可能な場合があります。

Shift JIS等のマルチバイト文字に含まれる特殊文字(\)を利用し,余計なエスケープ文字を追加させ,文字列の終端を誤摩化す攻撃も可能になります。Shift JISやBIG5文字エンコーディングには\がマルチバイト文字列の中に現れます。このため,次の例のような文字エンコーディングを考慮しない文字列置換を行うと不必要なエスケープが発生します。

例:

addslashes('表'); // SJIS文字エンコーディング

「表」は0x95, 0x5Cです。0x5CはASCIIの\です。addslashes関数でエスケープ処理すると0x95, 0x5C, 0x5Cとなります。これはSJISでは「表\」となり余計な\が追加されます。\がエスケープ文字のシステム(JavaScriptやMySQL)の場合,文字列が意図通りに終了せず意図しないコードの実行を許す場合があります。

SJISエンコーディングでは0x95はマルチバイト文字の開始バイトと解釈されるので,

"SJISの0x95"

"SJISの0x95+0x22

と解釈してしまい,文字列が終了しないプログラムもあります。

PHPには文字エンコーディングが正しいか確認するmb_check_encoding()関数が用意されています。残念ながらmb_check_encoding関数を定義しているmbstringモジュールはデフォルトで組み込まれるモジュールでないため,海外で開発されたPHPアプリケーションのほぼすべてが文字エンコーディングが正しいかチェックしていません。

$_FILES以外の$_POST, $_GET, $_COOKIEに保存されたデータはすべて文字として扱えるデータである,とおおむね仮定できるので,ほぼ機械的に文字エンコーディングをチェックできます。しかし,アプリケーションによっては$_POST, $_GET, $_COOKIEに保存されたデータがバイナリである場合もあります。例えば,バイナリデータをURLエンコードでエンコードしている場合,PHPは自動的にデコードするので$_GETに保存された時点ではバイナリデータになっています。このような場合,文字列として文字エンコーディングチェックを行うとエラーが発生するので注意が必要です。このような場合,除外リストを作成して除外するとよいでしょう。

例: 入力文字エンコーディングのチェック

// 入力文字列のエンコーディングを設定
define('INPUT_ENCODING', 'UTF-8');

function input_encoding_check_cb($k, $v) {
  // input_encoding_checkのコールバック関数
  if (!mb_check_encoding($k, INPUT_ENCODING) || !mb_check_encoding($v, INPUT_ENCODING)) {
    trigger_error('不正な文字エンコーディングを検出しました');
    die('System detected some errors');
  }
}
  
function input_encoding_check($v) {
  array_walk_recursive($v, 'input_encoding_check_cb');
}

input_encoding_check($_GET);
input_encoding_check($_POST);
input_encoding_check($_COOKIE);

対策のまとめ

  • 入力文字列は必ず文字エンコーディングが正しいか確認する
  • 可能な限り文字エンコーディングは統一する
  • SJIS,EUC-JP,ISO-2022-JPを取り扱う場合,特に注意する
  • 正しい文字エンコーディングのみ保存可能な仕組み利用する(データベースなどのバイナリ型を利用して不正な文字エンコーディングの文字列を保存しない)

著者プロフィール

大垣靖男(おおがきやすお)

University of Denver卒。同校にてコンピュータサイエンスとビジネスを学ぶ。株式会社シーエーシーを経て,エレクトロニック・サービス・イニシアチブ有限会社を設立。
オープンソース製品は比較的古くから利用し,Linuxは0.9xのころから利用している。オープンソースシステム開発への参加はエレクトロニック・サービス・イニシアチブ設立後から。PHPプロジェクトでは,PostgreSQLモジュールのメンテナンスを担当している。

URLhttp://blog.ohgaki.net/

著書

  • Webアプリセキュリティ対策入門〜あなたのサイトは大丈夫?

    Webアプリセキュリティ対策入門〜あなたのサイトは大丈夫?

  • [改訂版]PHPポケットリファレンス

    [改訂版]PHPポケットリファレンス

コメント

コメントの記入

パスサポ

多数の情報処理技術者試験対策書籍の発行実績を誇る技術評論社がお届けする,資格試験合格サイト「めざせ! 情報処理試験 パスサポ」が開設されました。

ピックアップ

サクセスストーリーに続く,快適サーバー運用管理のヒント!

データの増大,煩雑な管理,システムダウン,セキュリティなど,迫りくる課題からシステム管理者の負担を軽くするポイントを解説します。

gihyo.jp インフラエンジニア情報局

ネットワークやITにかかわるあらゆる業種で必要とされるインフラエンジニアに向けた技術情報や心構え,その魅力について多角的に紹介。

テストエンジニア ステーション

いま,ITに関わるあらゆる開発業務で注目されつつあるテスト系エンジニアをターゲットにしたコンテンツサイトを展開します。

一行クイックアンケート

gihyo.jpで取り上げてほしいネタは?

※検索はページ右上の検索ボックスをご利用ください。

その他の連載

2010年版SEO体得講座

本連載では,いまや企業サイトの戦略の1つとして欠かすことのできないSEOについて,最新トレンドからすぐに使えるTipsまでを紹介します。

小型Linuxサーバの最高峰 OpenBlockS 600活用指南

搭載メモリの増加,CPUクロックの向上など,あらゆる面が強化された期待の新モデルOpenBlockS 600。この記事ではOpenBlockS 600の紹介から,活用するためのさまざまなノウハウを紹介していきます。

はじめMath! Javaでコンピュータ数学

プログラミング言語入門者向けに,知っていると役立つ数学的トピックスを紹介します。簡単な演習問題と解説で,即活用できる知識を目指します。

教科書には載っていない ネットワークエンジニアの実践技術

ネットワークエンジニア,インフラエンジニアのトラブル対応には,時には「教科書通りにいかない」テクニックが必要となります。資格試験では得られないこうした実践的な技術について,実例を元に紹介します。

Googleケータイ,世に現る

2008年9月,Googleが中心となって開発されている「Android」を採用した携帯電話「T-Mobile G1」が発表されました。本連載ではT-Mobile G1を中心にGoogleケータイに迫ります。

モバゲーオープンプラットフォームに挑戦!――面白法人カヤック流モバゲーオープンプラットフォーム企画と開発のイロハ

2010年1月にリリースとなったモバゲーオープンプラットフォーム。その制作企業であるカヤックが,アイデアを企画に落とし込み,開発までのノウハウを紹介します。

プロトタイピングツールSketchFlowを用いた,Silverlightアプリ開発

SketchFlowプロトタイプ作成からアプリケーション開発までをExpression Blend 3を使って実践的に解説します。

Ubuntu Weekly Recipe

Ubuntuの強力なデスクトップ機能を活用するための,いろいろなレシピをお届けします。

連載一覧

gihyo.jp

  • DEVELOPER STAGE
  • ADMINISTRATOR STAGE
  • WEB+DESIGN STAGE
  • LIFESTYLE STAGE
  • SCIENCE STAGE
  • NEWS & REPORT

書籍案内

  • 新刊書籍
  • 書籍ジャンル一覧
  • 書籍シリーズ一覧
  • 新刊ピックアップ
  • ロングセラー
  • 電脳会議

定期刊行物一覧

  • Software Design
  • WEB+DB PRESS
  • Web Site Expert
  • 組込みプレス

最近のコメント