なぜPHPアプリにセキュリティホールが多いのか?

第16回 XPathインジェクション(その1)

この記事を読むのに必要な時間:およそ 2 分

XPathの基本

本記事の目的はXPathインジェクション対策が目的ですから,すべての構文は解説しませんが,次回はもう少し詳しくXPath言語を解説します。先ほどの例

select xpath('/foo/text()', data) from xml_test ;

'/foo//text()'

がXPathの表現です。言葉に訳すと

“/⁠(ルート)以下にある⁠foo⁠要素の⁠text⁠を取得せよ

となります。先の例の場合,2つのレコードがあるので2つの結果が返ってきています。

yohgaki@[local] ~=# select xpath('/foo//text()', data) from xml_test ;
 xpath
--------
 {bar}
 {bar2}
(2 rows)

“/⁠以下の要素全てを取り出すには

yohgaki@[local] ~=# select xpath('/*', data) from xml_test ;
               xpath
-----------------------------------
 {<foo>bar</foo>,<bar>foo</bar>}
 {<foo>bar2</foo>,<bar>foo2</bar>}
(2 rows)

Time: 0.373 ms

余計な⁠abc⁠がなくなっていますが,普通にSELECTするとデータ全体が保存されていることが分かります。

yohgaki@[local] ~=# select * from xml_test ;
 id |               data
----+-----------------------------------
  1 | abc<foo>bar</foo><bar>foo</bar>
  2 | abc<foo>bar2</foo><bar>foo2</bar>
(2 rows)

Time: 0.246 ms

まとめ

XPathを利用すると,とても簡単にXML文書からデータを取り出せることが解ります。PostgreSQLはXQeuryはサポートしていませんが,XPath 1.0をサポートしているので基本的な操作は可能になっています。XQeuryをサポートするシステムであればFLOWR(フラワー)構文を利用してさらに高度なクエリが可能です。本連載ではXQeuryの解説は行いません。興味をお持ちの方は書籍などを参考にしてください。

次回はPHP本体に付属しているDOMモジュールのXPath関数を利用し,より複雑なXPath表現を紹介します。

著者プロフィール

大垣靖男(おおがきやすお)

University of Denver卒。同校にてコンピュータサイエンスとビジネスを学ぶ。株式会社シーエーシーを経て,エレクトロニック・サービス・イニシアチブ有限会社を設立。
オープンソース製品は比較的古くから利用し,Linuxは0.9xのころから利用している。オープンソースシステム開発への参加はエレクトロニック・サービス・イニシアチブ設立後から。PHPプロジェクトでは,PostgreSQLモジュールのメンテナンスを担当している。

URLhttp://blog.ohgaki.net/

著書