アンケートご協力のお願いgihyo.jpでは,2010年度に向けて豪華プレゼントが当たる読者属性アンケートを実施しております。ご協力ください。

gihyo.jp » DEVELOPER STAGE » 連載 » なぜPHPアプリにセキュリティホールが多いのか? » 第16回 XPathインジェクション(その1)

なぜPHPアプリにセキュリティホールが多いのか?

第16回 XPathインジェクション(その1)

新しいシステムや規格が登場した場合,そのシステムや規格の仕様を理解してから使わないとセキュリティ上の問題が発生します。何も考えないで「動くだけ」のコードを書いても問題ない場合もありますが,多くの場合,規格や仕様を理解していないとセキュリティ上の問題が発生します。

XMLデータベースも一般的に利用されるようになり,XPathも一般的に利用されるようになってきました。次回以降にXPathのセキュリティ問題を解説するため,簡単にXPathについて解説します。より詳しいXPath入門は書籍や仕様書などを参照してください。今回はXPathの基本を紹介するのみとなります。

XPath入門 ─ XPathとは

XPathとは,XML文書から必要な情報を取得するための規格です。W3Cで規格が策定されています。

XPath 1.0は1999年にリリースされ,XPath 2.0は2007年にリリースされた規格です。XPath 2.0は比較的新しい規格でXPath 1.0のスーパーセット(XPath 1.0を包含する規格)として開発され,XPath 1.0互換モードも定義されています。XPath 1.0とXPath 2.0では表現の記述方法が異なります。

XPathとほかのXML規格

XPathはXSLT,XQuery,XLink,XPointer規格にも含まれています。

図1 XQueryとXPath

図1 XQueryとXPath

出典:XQeury+XMLデータベース入門(日経BP出版センター)

XQueryは文書やデータベース,WebページなどXMLデータソースを統合するクエリ言語です。図からも解るようにXPath 2.0はXQueryの基礎となる規格となっています。

PostgreSQL8.3とXPath

PostgreSQL 8.3からXPathを利用してXMLテキストから情報を取得可能になりました。PostgreSQL 8.3にはXML型のデータ型とXML型のデータを取り扱うXML関数が追加されました。XPathを利用してXML文書を検索するためにデータベースは必要ありませんが,XPathを実効する環境としてPostgreSQL 8.3を紹介します。

PostgreSQL 8.3のXML型

PostgreSQLはXML文書をテキストのまま保存せず,パースした状態のデータをXML型として保存します。XML型コラムにそのままXML文書は保存できないのでxmlparse関数を利用して変換します。

XMLPARSE ( { DOCUMENT | CONTENT } value)

XML文書の場合

XMLPARSE (DOCUMENT '<?xml version="1.0"?><book><title>Manual</title><chapter>...</chapter></book>')

XMLコンテンツの場合

XMLPARSE (CONTENT 'abc<foo>bar</foo><bar>foo</bar>')

このほかにも::xmlを利用してテキストをXML型にキャストすることも可能です。詳しくは

を参照してください。

XPath関数

PostgreSQL 8.3にはXML型コラムやXMLテキストにXPath1.0のクエリを実行するxpath関数が追加されています。

xpath(xpath, xml [, nsarray])

XMLサポートを有効にしたPostgreSQLサーバにpsqlを利用して接続すると,XPathクエリが行えることが解ります。

yohgaki@[local] ~=# create table xml_test (id int, data xml);
yohgaki@[local] ~=# insert into xml_test(id, data) values (1, xmlparse(content  'abc<foo>bar</foo><bar>foo</bar>'));
yohgaki@[local] ~=# insert into xml_test(id, data) values (2, xmlparse(content  'abc<foo>bar2</foo><bar>foo2</bar>'));
yohgaki@[local] ~=# select xpath('/foo//text()', data) from xml_test ;
 xpath
--------
 {bar}
 {bar2}
(2 rows)

Time: 0.391 ms

PostgreSQLをご存知の方なら“{bar}”,“{bar2}”と結果が配列型で返ってきていることが解ります。XMLでは同じ要素名の要素が複数あっても構わないので,PostgreSQLは配列型を返します。

著者プロフィール

大垣靖男(おおがきやすお)

University of Denver卒。同校にてコンピュータサイエンスとビジネスを学ぶ。株式会社シーエーシーを経て,エレクトロニック・サービス・イニシアチブ有限会社を設立。
オープンソース製品は比較的古くから利用し,Linuxは0.9xのころから利用している。オープンソースシステム開発への参加はエレクトロニック・サービス・イニシアチブ設立後から。PHPプロジェクトでは,PostgreSQLモジュールのメンテナンスを担当している。

URLhttp://blog.ohgaki.net/

著書

  • Webアプリセキュリティ対策入門〜あなたのサイトは大丈夫?

    Webアプリセキュリティ対策入門〜あなたのサイトは大丈夫?

  • [改訂版]PHPポケットリファレンス

    [改訂版]PHPポケットリファレンス

コメント

コメントの記入

パスサポ

多数の情報処理技術者試験対策書籍の発行実績を誇る技術評論社がお届けする,資格試験合格サイト「めざせ! 情報処理試験 パスサポ」が開設されました。

ピックアップ

サクセスストーリーに続く,快適サーバー運用管理のヒント!

データの増大,煩雑な管理,システムダウン,セキュリティなど,迫りくる課題からシステム管理者の負担を軽くするポイントを解説します。

gihyo.jp インフラエンジニア情報局

ネットワークやITにかかわるあらゆる業種で必要とされるインフラエンジニアに向けた技術情報や心構え,その魅力について多角的に紹介。

テストエンジニア ステーション

いま,ITに関わるあらゆる開発業務で注目されつつあるテスト系エンジニアをターゲットにしたコンテンツサイトを展開します。

一行クイックアンケート

gihyo.jpで取り上げてほしいネタは?

※検索はページ右上の検索ボックスをご利用ください。

その他の連載

キーパーソンが見るWeb業界

本連載はWeb Site Expert/gihyo.jpとの連動企画です。阿部淳也, 長谷川敦士, 森田雄のお三方による,Web業界をテーマにした座談会です。

きたみりゅうじの聞かせて珍プレー

ソフトウェア開発の現場で体験したトホホな失敗,思わずうなる珍プレーをきたみりゅうじ氏が四コママンガで紹介。みなさんからの投稿もお待ちしてます!

ActionScript 3.0で始めるオブジェクト指向スクリプティング

野中文雄氏が,簡単なスクリプトは書いたことがあるという初級者を対象に,ActionScript 3.0の基本からクラス定義までを解説します。

まだ間に合う「ITパスポート」受験対策 原山先生の短期合格塾

この連載では,4月18日のITパスポート試験の受験に向けて,短い期間で効率良く受験対策を行う方法や,確実に得点するための裏ワザなどを伝授していきます。

Ubuntu Weekly Recipe

Ubuntuの強力なデスクトップ機能を活用するための,いろいろなレシピをお届けします。

C/C++プログラマのためのDTrace入門

よくカーネルのチューニングや解析で活用されるDTraceですが,実はユーザプログラムの開発においても非常に有用です。連載ではC/C++プログラマやテストに関わる方向けにDTraceの使い方を解説します。

Blogopolisから学ぶ計算幾何

計算幾何学は,図形に関するアルゴリズムを研究するコンピュータサイエンスの一分野です。本連載では,ビジュアルブログ検索エンジン「Blogopolis」で採用されている計算幾何のアプローチを例に取り上げながら,計算幾何の初歩を実践的に学習します。

検索エンジンはいかにして動くのか?

本連載では, 今や誰もが利用している検索エンジンの中身を,全体の仕組みやデータ構造,アルゴリズムから分散インデックスまで,最近の研究事例も交えて紹介します。

連載一覧

gihyo.jp

  • DEVELOPER STAGE
  • ADMINISTRATOR STAGE
  • WEB+DESIGN STAGE
  • LIFESTYLE STAGE
  • SCIENCE STAGE
  • NEWS & REPORT

書籍案内

  • 新刊書籍
  • 書籍ジャンル一覧
  • 書籍シリーズ一覧
  • 新刊ピックアップ
  • ロングセラー
  • 電脳会議

定期刊行物一覧

  • Software Design
  • WEB+DB PRESS
  • Web Site Expert
  • 組込みプレス