アンケートご協力のお願いgihyo.jpでは,2010年度に向けて豪華プレゼントが当たる読者属性アンケートを実施しております。ご協力ください。

gihyo.jp » DEVELOPER STAGE » 連載 » なぜPHPアプリにセキュリティホールが多いのか? » 第22回 文字エンコーディングとセキュリティ(4)

なぜPHPアプリにセキュリティホールが多いのか?

第22回 文字エンコーディングとセキュリティ(4)

今回で文字エンコーディングとセキュリティをテーマとした解説は終了です。前回はSJIS文字エンコーディング特有の問題を解説しました。今回は文字エンコーディングとちょっと違ってはいても,文字エンコーディングに関連したセキュリティ上の問題を簡単に紹介します。

文字列の正規化を利用した攻撃

日本語の文字エンコーディングの場合,同じ文字でも違う文字コードが割り当てられています。最も分かりやすい例は半角カナと全角カナです。同じ文字であっても,違う文字コードが割り当てられています。人間が文章を読むには半角カナでも全角カナでも同じように読めますが,コンピュータはそうはいきません。

同じ意味の文字であれば統一した文字コードに置き換える操作を「文字列の正規化」と呼びます。文字列を正規化することにより,文字コードの違いを無視して,文字の意味で文字列を利用できるようになります。好ましいことですが,これが問題となる場合があります。

例えば,正規化を行うと“\”(半角バックスラッシュ)と“\”(全角バックスラッシュ)が同じ“\”(半角バックスラッシュ)になったりします。現在のPHPでは文字列を自動的に正規化して処理するような機能が標準として用意されていません。私の知る限りでは,文字列の正規化を利用した攻撃が可能になったアプリケーションはまだありません。しかし,Java系やASP.NET系のアプリケーションでは,ディレクトリ遷移攻撃などが度々発見されました。

対策:
正規化やデコード等,すべての変換処理が終わってから,バリデーション処理する。

文字エンコーディングや文字列の正規化に限ったことではありませんが,デコードや正規化などの変換が必要なデータの場合,すべてのデコード,正規化などの変換処理が終わってからデータをバリデーションしなければなりません。

今回の記事では詳しく解説しませんが,不必要なエンコードとデコードは脆弱性の原因になります。デコード済みのデータを不必要に再デコードしたために脆弱性が発生した実例もいくつもあります。デコードを複数回行うと,デコードのたびにバリデーション処理が必要になりますが,バリデーションを行わないとそのために脆弱性が発生します。こう書くとデコードのたびにバリデーションをすればよい,思われるかも知れませんが,デコード処理は本来一回だけ実行されるべきです。

文字列の正規化は,本稿の範囲外です。詳しくは,Unicode関連の仕様を参考にしてください。

その他のエンコーディングを利用した攻撃

エンコーディングと名前が付くデータ形式すべてに,なんからの攻撃手法が潜んでいる,と考えたほうが安全です。Webアプリケーションでは,バイナリデータやバイナリに近いデータ(マルチバイト文字など)を取り扱う場合,ASCIIコードでデータが表現できるよう,URLエンコーディング(%00,%20など)を利用します。“"”(ダブルクオート)や“/”(スラッシュ)やヌル文字などを,“%”を使ってエンコードします。

URLエンコーディングを利用して,通常のテキストには挿入されないヌル文字,改行文字などを挿入して攻撃されることがあります。最近のフレームワークや関数は,ヌル文字攻撃,改行文字の挿入によるヘッダ分割攻撃などが行えないようになっている場合が多いです。しかし,アプリケーション開発者も文字列中に不正な制御文字,特殊文字が含まれていないか,チェックをしなければなりません。文字のエンティティ化もよく知られた攻撃方法です。エンティティ化もエンコーディングを利用した攻撃の一種と考えてよいでしょう。

Data形式URIを利用した攻撃もエンコーディングを利用した攻撃と言えます。Data形式URIはバイナリデータをHTMLページに埋め込めるため便利な場合があります。Data形式URIはBASE64エンコードされたテキストデータです。JavaScriptが埋め込まれていても,テキストとしてチェックしているだけでは,攻撃を防げません。

Data形式URIを用いた攻撃のサンプル

<META HTTP-EQUIV="refresh" CONTENT="0;url=data:text/html;base64,PHNjcmlwdD5hbGVydCgnWFNTJyk8L3NjcmlwdD4K">

出典:XSS Cheat Sheet

Data形式URIを利用したJavaScriptインジェクション等の手法は,よく知られた攻撃方法です。この種類の攻撃を防ぐには,ホワイトリスト方式で文字列をチェックし,Data形式URIを利用できないように制限します。

文字エンコーディングを利用した攻撃への対策のまとめ

文字エンコーディングが正しいかチェックするのは,アプリケーションプログラマの責任だと考えてください。フレームワークやライブラリ側,サーバ側だけでは対処しきれないからです。

もう一度,文字エンコーディング等を利用した攻撃を防ぐための対策を記載します。

文字エンコーディング取り扱いの原則
文字エンコーディングは厳格に取り扱い,不正な文字エンコーディングを検出した場合,致命的なエラーとして処理しなければならない
文字エンコーディングを利用した攻撃に対する対策
  • 入力時のバリデーション処理で,すべての文字列に対してエンコーディングが正しいかチェックする。
  • 明示的に文字エンコーディングを指定する。例えば,HTTPヘッダのcharset属性でアプリケーションが利用する文字エンコーディングを指定する。
  • 文字列をエスケープする場合,マルチバイト文字列と文字エンコーディングを考慮したエスケープ関数を利用する。
  • 正規化やデコード等,すべての変換処理が終わってから,バリデーション処理する。

これらの点に注意すれば,文字エンコーディングを利用した攻撃に脆弱なアプリケーションを作っていまう可能性が低下します。データベース等で文字エンコーディングを指定できる場合,必ず利用している文字エンコーディングを指定するようにします。

最後になりますが,文字エンコーディングはできる限り統一したほうが,文字エンコーディングに関連した問題が発生し辛くなります。SJISにはほかの文字エンコーディングにないリスクがあります。UTF-8エンコーディングが特別に安全とは言えませんが,多くの言語に対応しているので,Webアプリケーションを作る場合,特に理由がなければUTF-8エンコーディングに統一するとよいでしょう。

著者プロフィール

大垣靖男(おおがきやすお)

University of Denver卒。同校にてコンピュータサイエンスとビジネスを学ぶ。株式会社シーエーシーを経て,エレクトロニック・サービス・イニシアチブ有限会社を設立。
オープンソース製品は比較的古くから利用し,Linuxは0.9xのころから利用している。オープンソースシステム開発への参加はエレクトロニック・サービス・イニシアチブ設立後から。PHPプロジェクトでは,PostgreSQLモジュールのメンテナンスを担当している。

URLhttp://blog.ohgaki.net/

著書

  • Webアプリセキュリティ対策入門〜あなたのサイトは大丈夫?

    Webアプリセキュリティ対策入門〜あなたのサイトは大丈夫?

  • [改訂版]PHPポケットリファレンス

    [改訂版]PHPポケットリファレンス

コメント

コメントの記入

パスサポ

多数の情報処理技術者試験対策書籍の発行実績を誇る技術評論社がお届けする,資格試験合格サイト「めざせ! 情報処理試験 パスサポ」が開設されました。

ピックアップ

サクセスストーリーに続く,快適サーバー運用管理のヒント!

データの増大,煩雑な管理,システムダウン,セキュリティなど,迫りくる課題からシステム管理者の負担を軽くするポイントを解説します。

gihyo.jp インフラエンジニア情報局

ネットワークやITにかかわるあらゆる業種で必要とされるインフラエンジニアに向けた技術情報や心構え,その魅力について多角的に紹介。

テストエンジニア ステーション

いま,ITに関わるあらゆる開発業務で注目されつつあるテスト系エンジニアをターゲットにしたコンテンツサイトを展開します。

一行クイックアンケート

gihyo.jpで取り上げてほしいネタは?

※検索はページ右上の検索ボックスをご利用ください。

その他の連載

読むウェブ ~本とインタラクション

ディスプレイで読む活字とそのインタラクション(interaction:相互作用)について,最新Webを紹介しながら読み解いていく。

いま,見ておきたいウェブサイト

この連載では,国内外の最新のウェブサイトを隔週更新で取り上げ,これら最新サイトの特徴や素晴らしい部分を,さまざまな角度から解説していきます。

Windows phoneアプリケーション開発入門

Windows Marcketplace for Mobileがサービス開始され,作成したアプリケーションを個人でも世界をターゲットに公開できる環境が整ってきました。これを機にWindows phoneアプリケーションの開発をしてみませんか?

ここは知っておくべき!Windows Server 2008技術TIPS

5年ぶりのサーバOSとなったWindows Server 2008が出荷されて早2年。2009年にはR2が出荷され,再び注目を集めています。発売前から実施したトレーニングによって感じた,インフラエンジニアの方々に知っておいていただきたい機能を中心にご紹介します。

キーパーソンが見るWeb業界

本連載はWeb Site Expert/gihyo.jpとの連動企画です。阿部淳也, 長谷川敦士, 森田雄のお三方による,Web業界をテーマにした座談会です。

きたみりゅうじの聞かせて珍プレー

ソフトウェア開発の現場で体験したトホホな失敗,思わずうなる珍プレーをきたみりゅうじ氏が四コママンガで紹介。みなさんからの投稿もお待ちしてます!

ActionScript 3.0で始めるオブジェクト指向スクリプティング

野中文雄氏が,簡単なスクリプトは書いたことがあるという初級者を対象に,ActionScript 3.0の基本からクラス定義までを解説します。

まだ間に合う「ITパスポート」受験対策 原山先生の短期合格塾

この連載では,4月18日のITパスポート試験の受験に向けて,短い期間で効率良く受験対策を行う方法や,確実に得点するための裏ワザなどを伝授していきます。

連載一覧

gihyo.jp

  • DEVELOPER STAGE
  • ADMINISTRATOR STAGE
  • WEB+DESIGN STAGE
  • LIFESTYLE STAGE
  • SCIENCE STAGE
  • NEWS & REPORT

書籍案内

  • 新刊書籍
  • 書籍ジャンル一覧
  • 書籍シリーズ一覧
  • 新刊ピックアップ
  • ロングセラー
  • 電脳会議

定期刊行物一覧

  • Software Design
  • WEB+DB PRESS
  • Web Site Expert
  • 組込みプレス