アンケートご協力のお願いgihyo.jpでは,2010年度に向けて豪華プレゼントが当たる読者属性アンケートを実施しております。ご協力ください。

gihyo.jp » DEVELOPER STAGE » 特集 » OpenCVで学ぶ画像認識 » 第4回 オブジェクト検出器の作成方法

OpenCVで学ぶ画像認識

第4回 オブジェクト検出器の作成方法

お久しぶりです。私事でなかなか執筆の時間がとれず,前回の掲載から長く時間が空いてしまい申し訳ありませんでした。皆さんから寄せられたコメントには非常に励まされました。

というわけで,今回はいよいよ最終回です。前回はオブジェクト検出器を使って顔を検出するところまで行いました。今回は,オリジナルオブジェクト検出器を作成してみます。

今回作成するプログラムのソースコードは,こちらから一括してダウンロードすることができます。

学習の流れと仕組み

学習の流れ

前回のおさらいになりますが,オブジェクト検出器は機械学習という方法を通して作成されます。つまり,コンピュータプログラムに検出したいオブジェクトの画像(正解画像)とそうでない画像(非正解画像)を与えることで,オブジェクトが含まれている画像の傾向というのをコンピュータに覚えさせていきます。

学習の流れを簡単にまとめると以下の通りです。

  1. 正解サンプル画像と非正解サンプル画像を用意する
  2. サンプル画像のリストファイルをそれぞれ作成する
  3. 正解サンプル画像を元に,学習用正解ファイルを生成する
  4. 学習用正解ファイルと非正解リストファイルを元に,学習を行う

ここで解説する学習方法の詳細については,インストールディレクトリ下の"apps/HaarTraining/doc/haartraining.htm"を参照して下さい。

今回は,画像の中から下図のような技術評論社のロゴを抽出するプログラムを作成します。

図1 技術評論社ロゴ

図1 技術評論社ロゴ

学習の仕組み

第3回で解説したとおり,OpenCVのオブジェクト検出はAdaBoostで学習させた強識別器を複数連結(カスケード)したものになっています。

図2 Attentional Cascade

図2 Attentional Cascade

検出器の学習は,この1番目の強識別器から順番に進めていきます。

各ステージ(強識別器の学習)には,目標とする認識率(正解画像を正解と判断した率)及び許容できる誤認識率(非正解画像を正解と誤って判断した率)があり,それを達成するまで繰り返し矩形特徴(弱識別器)を追加しながらAdaBoostによる学習を行っていきます。

全体が目標とする認識率,及び誤認識率を達成した時点で学習は終了です。

このように,学習は多くの繰り返し処理を必要とするため,非常に時間がかかります(早くて数時間,長いと数日から数週間)。

学習時間は,全学習ステージ数(標準で14),目標とする認識率,学習データの数などによって左右されますので,必要に応じて調整してください。

オブジェクト検出器の学習

画像の収集

まず,正解画像と非正解画像をそれぞれ収集します。

OpenCVのドキュメントによると,学習に用いる上で効率的なサンプル数は,正解画像7000枚,非正解画像3000枚とのことですが,ここでは正解画像4000枚,非正解画像1700枚程度で行います。

それだけ大量の画像をどこから集めるかですが,インターネット上には様々な画像素材提供サイトがあるので,そこから探すというのも一つの手です。またコンピュータ・ビジョンの研究分野では,実験用に顔画像やオブジェクト画像を提供している研究室がたくさんあるので,そういったデータを利用するのも良いかもしれません。

いくつか例としては,

MITの顔画像データ
カリフォルニア工科大学のオブジェクト画像データ

などがあります。

なお,正解画像を集める方法には2通りあります。一つは頑張って例えば自分でデジカメで撮影したり,インターネットから学習画像を集めること。もう一つは,1枚の画像に対して回転や変形などを加えることで,学習画像を増やす方法です。前者は顔や自動車など,個人差(車種)や表情などで形が変形するものに対して有効な方法で,後者はロゴなど形が一定のものを見つけたい時に適用します。

ここでは,後者の方法を用いて技術評論社のロゴを検出するプログラムを作成する予定ですが,前者についても解説します。

画像を収集したら,それを記述するリストファイルを作成します。

著者プロフィール

皆川卓也(みながわたくや)

ジェイマジック株式会社のラボに所属する傍ら,慶応義塾大学の博士課程でコンピュータビジョンを研究する社会人ドクター。画像認識とIT技術を融合して新しいソリューションを開発することを生業とする自称テクニカル・ソリューション・アーキテクト。ジェイマジックでは、「顔ちぇき!~誰に似てる?~™」や「SAYL™」のシステムの立ち上げに携わる。

ジェイマジック
URLhttp://www.j-magic.co.jp/
慶応大学 斎藤英雄研究室
URLhttp://www.hvrl.ics.keio.ac.jp/

コメント

コメントの記入

パスサポ

多数の情報処理技術者試験対策書籍の発行実績を誇る技術評論社がお届けする,資格試験合格サイト「めざせ! 情報処理試験 パスサポ」が開設されました。

ピックアップ

サクセスストーリーに続く,快適サーバー運用管理のヒント!

データの増大,煩雑な管理,システムダウン,セキュリティなど,迫りくる課題からシステム管理者の負担を軽くするポイントを解説します。

gihyo.jp インフラエンジニア情報局

ネットワークやITにかかわるあらゆる業種で必要とされるインフラエンジニアに向けた技術情報や心構え,その魅力について多角的に紹介。

テストエンジニア ステーション

いま,ITに関わるあらゆる開発業務で注目されつつあるテスト系エンジニアをターゲットにしたコンテンツサイトを展開します。

一行クイックアンケート

gihyo.jpで取り上げてほしいネタは?

※検索はページ右上の検索ボックスをご利用ください。

その他の連載

読むウェブ ~本とインタラクション

ディスプレイで読む活字とそのインタラクション(interaction:相互作用)について,最新Webを紹介しながら読み解いていく。

いま,見ておきたいウェブサイト

この連載では,国内外の最新のウェブサイトを隔週更新で取り上げ,これら最新サイトの特徴や素晴らしい部分を,さまざまな角度から解説していきます。

Windows phoneアプリケーション開発入門

Windows Marcketplace for Mobileがサービス開始され,作成したアプリケーションを個人でも世界をターゲットに公開できる環境が整ってきました。これを機にWindows phoneアプリケーションの開発をしてみませんか?

ここは知っておくべき!Windows Server 2008技術TIPS

5年ぶりのサーバOSとなったWindows Server 2008が出荷されて早2年。2009年にはR2が出荷され,再び注目を集めています。発売前から実施したトレーニングによって感じた,インフラエンジニアの方々に知っておいていただきたい機能を中心にご紹介します。

キーパーソンが見るWeb業界

本連載はWeb Site Expert/gihyo.jpとの連動企画です。阿部淳也, 長谷川敦士, 森田雄のお三方による,Web業界をテーマにした座談会です。

きたみりゅうじの聞かせて珍プレー

ソフトウェア開発の現場で体験したトホホな失敗,思わずうなる珍プレーをきたみりゅうじ氏が四コママンガで紹介。みなさんからの投稿もお待ちしてます!

ActionScript 3.0で始めるオブジェクト指向スクリプティング

野中文雄氏が,簡単なスクリプトは書いたことがあるという初級者を対象に,ActionScript 3.0の基本からクラス定義までを解説します。

まだ間に合う「ITパスポート」受験対策 原山先生の短期合格塾

この連載では,4月18日のITパスポート試験の受験に向けて,短い期間で効率良く受験対策を行う方法や,確実に得点するための裏ワザなどを伝授していきます。

連載一覧

gihyo.jp

  • DEVELOPER STAGE
  • ADMINISTRATOR STAGE
  • WEB+DESIGN STAGE
  • LIFESTYLE STAGE
  • SCIENCE STAGE
  • NEWS & REPORT

書籍案内

  • 新刊書籍
  • 書籍ジャンル一覧
  • 書籍シリーズ一覧
  • 新刊ピックアップ
  • ロングセラー
  • 電脳会議

定期刊行物一覧

  • Software Design
  • WEB+DB PRESS
  • Web Site Expert
  • 組込みプレス