新春特別企画

コンピュータ・ビジョンの業界動向

この記事を読むのに必要な時間:およそ 4 分

Adobe

AdobeはPhotoshop CS5において,SIGGRAPH 2009で発表されたPatchMatchという技術を実装する予定だそうです。PatchMatchがどういう技術かは,以下の動画を見ていただくのが早いと思います。

学会で発表されてから,これほどすぐに製品に反映される予定とは思いませんでした。それだけ実用に耐えうる,自信のある技術ということなのでしょう。

Google

Googleは昨年,多くのビジョンに関する話題を提供しました。簡単にまとめると以下の通りです。

  1. Picasaデスクトップ版への顔認識機能実装
  2. CVPR 2009でランドマーク検索技術を発表
  3. 類似画像検索機能がラボから卒業
  4. Google Gogglesの発表

中でも注目はGoogle Gogglesでしょう。これはAndroid向けのアプリケーションで,携帯電話のカメラから撮影した画像を検索に使うサービスです。

ここで使用されている技術は,文字認識(OCR)⁠特定物体認識,そしてGPS及び電子コンパスの位置計測です。また今回は実装しませんでしたが,将来的には顔認識を入れる予定とのことです。

特定物体認識とは,クエリーとなる画像から「特徴点」と呼ばれる,画像上のエッジや端点のような際立った特徴を持つ点とその点周辺の情報を取得し,その特徴点とどれだけマッチングするかを元にDB内の画像のどれが近いのかを特定する技術です。

特定物体認識

画像

このような携帯カメラによる特定物体認識を用いた検索自体は,特に真新しいものではありません。日本でもオリンパスゼータブリッジEveryxの技術が広告キャンペーンなどに利用されてきました(最近であれば,サントリーのFF13エリクサーのキャンペーンなど)⁠

ただ,これを巨人Googleが本気で取り組んでいるということが,画像による検索を生業としている各企業にとっては大きな脅威であると言えます。Googleの強みは優秀な技術者をたくさん抱えているということもありますが,それだけでなくインターネット上の大量のデータにアクセスし,かつ膨大な計算のためのリソースを利用できるという点があげられます。これにより検索技術自体を向上させたり,検索結果に豊富な情報を提供することができます。

今回,Gogglesは重畳表示こそしていませんが,ARを提供しようとしている各企業もうかうかしていられないのではないでしょうか。

余談ですが上のGoogle Gogglesのビデオに登場しているHartmutという人物は,数年前にGoogleが買収したNeven Visionの創設者(かつ私の元雇い主)です。そのため,Google Gogglesの特定物体認識技術にはNeven Visionのものが使われていると推察されます。またGogglesの中のランドマーク検索にはCVPR 2009で発表したランドマーク画像検索が利用されているのではないかとも予想できます。

大企業でありながら,買収した企業の技術をしっかりと活かして,自分たちのサービスとして組み上げたことは,さすがとしか言いようがありません。

これからもこれらの企業から目が離せません。

著者プロフィール

皆川卓也(みながわたくや)

慶応大学の博士課程でコンピュータビジョンを研究する学生兼フリーエンジニア。画像認識とIT技術を融合して新しいソリューションを開発することを生業とする自称テクニカル・ソリューション・アーキテクト。

URL慶応大学 斎藤英雄研究室
URL著者ホームページ

コメント

コメントの記入