アンケートご協力のお願いgihyo.jpでは,2010年度に向けて豪華プレゼントが当たる読者属性アンケートを実施しております。ご協力ください。

gihyo.jp » DEVELOPER STAGE » 特集 » OpenCVで学ぶ画像認識 » 第2回 OpenCVを使ってみよう

OpenCVで学ぶ画像認識

第2回 OpenCVを使ってみよう

第1回では,画像認識の概要や基本原理,実例などを紹介しました。第2回の今回は,これから皆さんが画像認識のプログラムを組んでいく上で必要なOpenCVというツールについて紹介します。

OpenCVとは?

OpenCVは正式名称を"Intel Open Source Computer Vision Library"と言い,その名のとおりインテル社が開発したオープンソースのC/C++ライブラリ集で,コンピュータ・ビジョンに必要な各種機能がパッケージされています。

具体的には,だいたい以下の処理を行う関数群が用意されています。

  • 線形代数や統計処理など,コンピュータビジョンに必要な各種数学関数
  • 直線や曲線,テキストなど画像への描画関数
  • OpenCVで使用したデータを読み込み/保存するための関数
  • エッジ等の特徴抽出や画像の幾何変換,カラー処理等々の画像処理関数
  • 物体追跡や動き推定などの動画像処理用関数
  • 物体検出などのパターン認識関数
  • 三次元復元のためのカメラ位置や姿勢の検出などのカメラキャリブレーション関数
  • コンピュータにパターンを学習させるための機械学習関数
  • 画像の読み込みや保存,表示,ビデオ入出力などインターフェース用関数

このように,OpenCVはどちらかというとビジョンの研究者や開発者の仕事を楽にするためのツールです。 OpenCVがなかった頃は,ビジョン関係の開発者は,画像フォーマットを解析して画像を読みこむプログラムやGUI上に表示するプログラム,画像をぼかしたり特徴のあるピクセルを強調するような「フィルタリング」と呼ばれる処理を,全て一から書かなくてはいけませんでした。しかし,OpenCVのお陰でそれらの処理を一から書かなくても済むようになり,開発が大変楽になりました。

もちろん,コンピュータ・ビジョンの専門知識がない人でも,例えばエッジを抽出したり,ぼかしたりといった画像処理プログラムを,このライブラリを使うことで簡単に組むことができます。

ただし,これらのライブラリ群を使ったとしても,例えば画像認識や画像理解(三次元復元)のようなプログラムを一から書こうとすると,専門知識なしに開発するのは難しいかもしれません。というのは,これらのライブラリの関数群はあくまで画像認識や画像理解などで共通して使用する処理をまとめたものであって,これらをどう組み合わせて,例えば顔を検出するプログラムを作るかは,結局開発者に委ねられているからです。

ただし,これには例外があります。実はOpenCVには,画像の中から物体を検出してくれる画像認識のプログラムが既に用意されているのです。この連載では,皆さんにこのプログラムを使いこなすことで,自分で物体検出アプリケーションを開発できるようになってもらうことを目指します。

開発環境の構築

この連載では,以下のような開発環境をベースに解説を行っていきます。

  • バージョン:OpenCV 1.0
  • OS:Winodows XP
  • IDE:Microsoft Visual C++ 2005

ただしOpenCVはLinuxやMac OS Xもサポートされてますし,もちろん他のIDE(例えばEclipse CDT)などでもコーディング可能です。以降の説明は,皆さんの開発環境にあわせて内容を解釈しながら読み進めてください。

ダウンロードとインストール

OpenCVはsourceforgeからダウンロード可能です。

入手先
URLhttp://www.sourceforge.net/projects/opencvlibrary

2008年5月現在の最新版はバージョン1.0です。こちらのサイトからWindows用のOpenCV_1.0.exeというファイルをダウンロードします。chopencv-2.5.0-win-binary.zipというファイルは今回使用しません。こちらはChと呼ばれるインタープリタ型C/C++言語プラットフォーム用のものです。

図1 ダウンロード

図1 ダウンロード

ダウンロードしたら,OpenCV_1.0.exeを実行してインストールを開始してください。指示に従えば簡単にインストールできると思います。

著者プロフィール

皆川卓也(みながわたくや)

ジェイマジック株式会社のラボに所属する傍ら,慶応義塾大学の博士課程でコンピュータビジョンを研究する社会人ドクター。画像認識とIT技術を融合して新しいソリューションを開発することを生業とする自称テクニカル・ソリューション・アーキテクト。ジェイマジックでは、「顔ちぇき!~誰に似てる?~™」や「SAYL™」のシステムの立ち上げに携わる。

ジェイマジック
URLhttp://www.j-magic.co.jp/
慶応大学 斎藤英雄研究室
URLhttp://www.hvrl.ics.keio.ac.jp/

コメント

コメントの記入

パスサポ

多数の情報処理技術者試験対策書籍の発行実績を誇る技術評論社がお届けする,資格試験合格サイト「めざせ! 情報処理試験 パスサポ」が開設されました。

ピックアップ

サクセスストーリーに続く,快適サーバー運用管理のヒント!

データの増大,煩雑な管理,システムダウン,セキュリティなど,迫りくる課題からシステム管理者の負担を軽くするポイントを解説します。

gihyo.jp インフラエンジニア情報局

ネットワークやITにかかわるあらゆる業種で必要とされるインフラエンジニアに向けた技術情報や心構え,その魅力について多角的に紹介。

テストエンジニア ステーション

いま,ITに関わるあらゆる開発業務で注目されつつあるテスト系エンジニアをターゲットにしたコンテンツサイトを展開します。

一行クイックアンケート

gihyo.jpで取り上げてほしいネタは?

※検索はページ右上の検索ボックスをご利用ください。

その他の連載

読むウェブ ~本とインタラクション

ディスプレイで読む活字とそのインタラクション(interaction:相互作用)について,最新Webを紹介しながら読み解いていく。

いま,見ておきたいウェブサイト

この連載では,国内外の最新のウェブサイトを隔週更新で取り上げ,これら最新サイトの特徴や素晴らしい部分を,さまざまな角度から解説していきます。

Windows phoneアプリケーション開発入門

Windows Marcketplace for Mobileがサービス開始され,作成したアプリケーションを個人でも世界をターゲットに公開できる環境が整ってきました。これを機にWindows phoneアプリケーションの開発をしてみませんか?

ここは知っておくべき!Windows Server 2008技術TIPS

5年ぶりのサーバOSとなったWindows Server 2008が出荷されて早2年。2009年にはR2が出荷され,再び注目を集めています。発売前から実施したトレーニングによって感じた,インフラエンジニアの方々に知っておいていただきたい機能を中心にご紹介します。

キーパーソンが見るWeb業界

本連載はWeb Site Expert/gihyo.jpとの連動企画です。阿部淳也, 長谷川敦士, 森田雄のお三方による,Web業界をテーマにした座談会です。

きたみりゅうじの聞かせて珍プレー

ソフトウェア開発の現場で体験したトホホな失敗,思わずうなる珍プレーをきたみりゅうじ氏が四コママンガで紹介。みなさんからの投稿もお待ちしてます!

ActionScript 3.0で始めるオブジェクト指向スクリプティング

野中文雄氏が,簡単なスクリプトは書いたことがあるという初級者を対象に,ActionScript 3.0の基本からクラス定義までを解説します。

まだ間に合う「ITパスポート」受験対策 原山先生の短期合格塾

この連載では,4月18日のITパスポート試験の受験に向けて,短い期間で効率良く受験対策を行う方法や,確実に得点するための裏ワザなどを伝授していきます。

連載一覧

gihyo.jp

  • DEVELOPER STAGE
  • ADMINISTRATOR STAGE
  • WEB+DESIGN STAGE
  • LIFESTYLE STAGE
  • SCIENCE STAGE
  • NEWS & REPORT

書籍案内

  • 新刊書籍
  • 書籍ジャンル一覧
  • 書籍シリーズ一覧
  • 新刊ピックアップ
  • ロングセラー
  • 電脳会議

定期刊行物一覧

  • Software Design
  • WEB+DB PRESS
  • Web Site Expert
  • 組込みプレス