アンケートご協力のお願いgihyo.jpでは,2010年度に向けて豪華プレゼントが当たる読者属性アンケートを実施しております。ご協力ください。

gihyo.jp » DEVELOPER STAGE » 連載 » なぜPHPアプリにセキュリティホールが多いのか? » 第21回 文字エンコーディングとセキュリティ(3)

なぜPHPアプリにセキュリティホールが多いのか?

第21回 文字エンコーディングとセキュリティ(3)

前回に引き続き,今回も文字エンコーディングとセキュリティをテーマに解説します。前回は壊れた文字エンコーディングを利用した攻撃,文字エンコーディングを誤認識させる攻撃を紹介しました。今回はSJIS特定の問題を簡単に紹介します。

文字エンコーディングのエスケープ方式を利用する方法

ほとんどの文字エンコーディングは,マルチバイト文字の中に“\”などの特殊文字を含みません。しかし,例外があります。Shift_JISでは“\”がマルチバイト文字に含まれるので,これが原因で脆弱性が発生する場合あります。

SJISの“表”

<?php echo rawurlencode(mb_convert_encoding('表', 'SJIS', 'UTF-8')); ?>

出力

%95%5C

“%5C”は“\”です。“\”は文字列のエスケープなどに利用される特殊文字です。addslashes関数は,マルチバイト文字列の処理を考慮していないので,マルチバイト文字中の“\”は\でエスケープされます。その結果,“表”は“表\”となってしまいます。

PHPユーザの場合,php.iniでmagic_quotes_gpc=on(すべての入力にaddslashesを適用するオプション)と設定されているシステムも多いので,SJISエンコーディングを使っている場合に不必要な“\”が現れて困った方も少なくないと思います。これは,マルチバイト文字の中に“\”が含まれていることが原因で発生している問題です。

一見この動作は無害のように思えるかもしれませんが,PHPやJavascriptなど,“\”がエスケープ文字になっているシステムでは重大な問題となります。

alert("<?php echo addslashes($name) ?>" + "さんは" + "<?php echo addslashes($age) ?>" + "歳ですね?");

のようなコードで,$name,$ageがユーザ入力値である場合,正しくバリデーションされていないと

alert("1234表\" + "さんは" + "悪意のあるデータ ……

※下線部がそれぞれ$name,$ageの値

のような攻撃が可能になり,不正なJavaScriptやHTMLを埋め込まれてしまいます。

MySQLや古いPostgreSQLの場合も同様の攻撃が可能でした。MySQLは現在でも文字列のエスケープに“\”が利用可能です。PostgreSQL 8.X以降では文字列のエスケープ文字は“'”(シングルクオート)になっています。文字列中の“'”(シングルクオート)は,シングルクオートでエスケープして“''”とします(※1)。

※1

PostgreSQL 8.1.4以降からエスケープAPIは文字エンコーディングを考慮したエスケープを行っています。

対策:
文字列をエスケープする場合,マルチバイト文字列と文字エンコーディングを考慮したエスケープ関数を利用する。

ereg関数,addslashes関数,mysql_escape_string関数はマルチバイト文字列や文字エンコーディングを考慮していません。通常の文字列関数もマルチバイト文字例を処理できません。

現在は対策済みですが,古いライブラリ(2005年春頃より古いライブラリ)を利用しているmysql_real_escape_string関数やpg_escape_string関数もマルチバイト文字列と文字エンコーディングを正しく考慮したエスケープ処理をしていません。古いシステムでは脆弱性が残ったままである場合も少なくないので注意が必要です。

SJISに対する攻撃

SJISに対しては今まで紹介した脆弱性と異なる脆弱性が発生する場合があります。アプリエーションが不正な文字エンコーディングをチェックせず,不適切なエスケープ処理を行っていると,文字列の出力先のシステムが不正な文字エンコーディングをチェックしていてもまったく役に立たなくなります。

最近のPostgreSQLやMySQLは,文字エンコーディングを利用した攻撃への対策が施され,文字列型データの場合,文字エンコーディングが正しくないとエラーとなります。しかし,SJISを利用している場合,文字エンコーディングのバリデーション不足と不適切なエスケープ処理が重なると,生成されたSQL文に不正な文字エンコーディングが含まれないため,攻撃をまったく検出できません。

また“表”を使った例を紹介します。“表”はURLエンコードすると“%95%5C”ですが,攻撃者は“%95%27”を利用します。“%27”はASCIIの“'”(シングルクオート)です。

“%95%27”をaddslashes関数やmysql_escape_string関数でエスケープすると“%95%5C%27”となり,SJISでは“表'”となります。つまり,%95%27の後に攻撃用の文字列を挿入でき,不正な文字エンコーディングも無いため,サーバ側で正規のクエリなのか,不正なクエリなのかまったく判別できません。

MySQLサーバへの攻撃例

SELECT * FROM tbl WEHRE fld = '\'悪意のある文字列が続く ……

最近では中国語もサポートしたアプリケーションを作る方も少なくないと思いますが,BIG5などSJISと同様の仕組みを持つアジアの文字エンコーディングでは同様の脆弱性が発生する可能性があります。

この攻撃には不正な文字エンコーディングが必要であるため,既に解説済みの「すべての文字列の文字エンコーディングが正しい文字エンコーディングであるか確認する」対策を取っていれば防御できます。しかし,マルチバイト文字を考慮しないエスケープ関数で余分な文字が追加されると問題が発生します。余分な“\”が追加されると,入力も処理結果も正しい文字エンコーディング,出力結果も正しい文字エンコーディング,となっても攻撃が可能となることもあります。

問題を防ぐには,マルチバイト文字の処理にはマルチバイト文字に対応した関数を必ず利用しなければなりません。

まとめ

SJISを利用していると,壊れた文字エンコーディングを利用しなくても,不適切なエスケープ処理が行われていると攻撃されてしまうことを理解頂けたと思います。SJISだけが危険な文字エンコーディングとは言えませんが,別のリスクがあることは理解していたほうがよいでしょう。

著者プロフィール

大垣靖男(おおがきやすお)

University of Denver卒。同校にてコンピュータサイエンスとビジネスを学ぶ。株式会社シーエーシーを経て,エレクトロニック・サービス・イニシアチブ有限会社を設立。
オープンソース製品は比較的古くから利用し,Linuxは0.9xのころから利用している。オープンソースシステム開発への参加はエレクトロニック・サービス・イニシアチブ設立後から。PHPプロジェクトでは,PostgreSQLモジュールのメンテナンスを担当している。

URLhttp://blog.ohgaki.net/

著書

  • Webアプリセキュリティ対策入門〜あなたのサイトは大丈夫?

    Webアプリセキュリティ対策入門〜あなたのサイトは大丈夫?

  • [改訂版]PHPポケットリファレンス

    [改訂版]PHPポケットリファレンス

トラックバック

  • 「なぜPHPアプリにセキュリティホールが多いのか?」のセキュリティホール

    大垣靖男さんの連載から なぜPHPアプリにセキュリティホールが多いのか?:第21回 文字エンコーディングとセキュリティ(3)|gihyo.jp … 技術評論社 一見この動作は無害のように思えるかもしれませんが,ブラウザなど,“¥”がエスケープ文字になっているシステムでは重大

    Tracked : #1  ockeghem(徳丸浩)の日記 (2009/01/16, 17:12)

コメント

コメントの記入

パスサポ

多数の情報処理技術者試験対策書籍の発行実績を誇る技術評論社がお届けする,資格試験合格サイト「めざせ! 情報処理試験 パスサポ」が開設されました。

ピックアップ

サクセスストーリーに続く,快適サーバー運用管理のヒント!

データの増大,煩雑な管理,システムダウン,セキュリティなど,迫りくる課題からシステム管理者の負担を軽くするポイントを解説します。

gihyo.jp インフラエンジニア情報局

ネットワークやITにかかわるあらゆる業種で必要とされるインフラエンジニアに向けた技術情報や心構え,その魅力について多角的に紹介。

テストエンジニア ステーション

いま,ITに関わるあらゆる開発業務で注目されつつあるテスト系エンジニアをターゲットにしたコンテンツサイトを展開します。

一行クイックアンケート

gihyo.jpで取り上げてほしいネタは?

※検索はページ右上の検索ボックスをご利用ください。

その他の連載

キーパーソンが見るWeb業界

本連載はWeb Site Expert/gihyo.jpとの連動企画です。阿部淳也, 長谷川敦士, 森田雄のお三方による,Web業界をテーマにした座談会です。

きたみりゅうじの聞かせて珍プレー

ソフトウェア開発の現場で体験したトホホな失敗,思わずうなる珍プレーをきたみりゅうじ氏が四コママンガで紹介。みなさんからの投稿もお待ちしてます!

ActionScript 3.0で始めるオブジェクト指向スクリプティング

野中文雄氏が,簡単なスクリプトは書いたことがあるという初級者を対象に,ActionScript 3.0の基本からクラス定義までを解説します。

まだ間に合う「ITパスポート」受験対策 原山先生の短期合格塾

この連載では,4月18日のITパスポート試験の受験に向けて,短い期間で効率良く受験対策を行う方法や,確実に得点するための裏ワザなどを伝授していきます。

Ubuntu Weekly Recipe

Ubuntuの強力なデスクトップ機能を活用するための,いろいろなレシピをお届けします。

C/C++プログラマのためのDTrace入門

よくカーネルのチューニングや解析で活用されるDTraceですが,実はユーザプログラムの開発においても非常に有用です。連載ではC/C++プログラマやテストに関わる方向けにDTraceの使い方を解説します。

Blogopolisから学ぶ計算幾何

計算幾何学は,図形に関するアルゴリズムを研究するコンピュータサイエンスの一分野です。本連載では,ビジュアルブログ検索エンジン「Blogopolis」で採用されている計算幾何のアプローチを例に取り上げながら,計算幾何の初歩を実践的に学習します。

検索エンジンはいかにして動くのか?

本連載では, 今や誰もが利用している検索エンジンの中身を,全体の仕組みやデータ構造,アルゴリズムから分散インデックスまで,最近の研究事例も交えて紹介します。

連載一覧

gihyo.jp

  • DEVELOPER STAGE
  • ADMINISTRATOR STAGE
  • WEB+DESIGN STAGE
  • LIFESTYLE STAGE
  • SCIENCE STAGE
  • NEWS & REPORT

書籍案内

  • 新刊書籍
  • 書籍ジャンル一覧
  • 書籍シリーズ一覧
  • 新刊ピックアップ
  • ロングセラー
  • 電脳会議

定期刊行物一覧

  • Software Design
  • WEB+DB PRESS
  • Web Site Expert
  • 組込みプレス