具体例で学ぶ!情報可視化のテクニック

第1回 情報可視化の概要

この記事を読むのに必要な時間:およそ 2 分

情報可視化とインタラクティブ性

コンピュータ時代の情報可視化は,単に静的な絵を出力するだけでは終わりません。グラフィックにユーザーインターフェイスを付加することで,利用者のデータの理解をさらに促進することが可能です。つまり,ユーザーの入力に反応してグラフィックを動的に変更することで,可視化に対話性を持たせるのです。

OverDiskに見るインタラクション

ここで,ハードディスク分析ツールのOverDiskを紹介しましょう。OverDiskは,円弧状の図形の積み重ねによって,ハードディスクの使用量をフォルダ毎に可視化してくれるソフトウェアです。OverDiskを使うと,どのフォルダがディスク容量を圧迫しているのか,簡単に特定することができます。

OverDisk の可視化イメージでは,最も内側の円周がディスクのルートフォルダ階層を示しており,フォルダ階層が深くなるごとに,円周が外側に移動していきます図8⁠。ただし,階層のレベルが増えるとフォルダ数も指数関数的に増えるので,1つ1つの円弧が小さくなり,視認が難しくなってきます。

図8

図8 overdisk1

このようなとき,特定の円弧をクリックすると,その円弧に対応するフォルダを起点として可視化イメージが再構成されます。その結果,今まで良く見えなかった深いフォルダ階層が拡大され,より詳細な分析を行うことができるようになります図9⁠。これは,情報可視化とインタラクションが融合した好例です。

図9

図9 overdisk2

HatenarMapsも,グラフィックのリアルタイム生成こそしないものの,一定の対話性を備えています。HatenarMapsでは,Google Mapsと同等のズームコントロールによって,全体図から詳細レベルまで,視点を段階的に切り替えることが可能です。ズームインすることで個別のブログ名や記事タイトルを確認できる一方,ズームアウトすることで,地域の全体的な分布の様子が俯瞰できるようになっています。

Web上の集合知を可視化する

近年のインターネットの進化に伴い,⁠集合知」というキーワードが注目されています。集合知とは,多くの人々の振る舞いを集めることによって生まれる知見のことです。はてなブックマークやflickrなどのソーシャル系サービスは,集合知を良く体現していると言われます。筆者は,この集合知こそ,情報可視化の格好の題材ではないかと考えています。

統計学的観点と視覚的観点

集合知は,ユーザーの膨大な行動記録を基にするため,そのデータ量もまた膨大になります。さらに,データの次元数も大きくなる傾向があります。このように巨大で複雑なデータを,そのままの形で理解することは非常に困難です。

この問題を解決するためには,2つのアプローチが考えられます。1つは,統計学の観点からのアプローチです。すなわち,クラスタリングのようなアルゴリズムを使用して,データの中から顕著な特徴を取り出す方法です。そしてもう1つが,今回の記事で紹介したような,視覚的観点からのアプローチです。先に挙げたような視覚要素を組み合わせてデータの表示方法を工夫し,理解しやすい形式で画面上にマッピングできるようにします。

実際に集合知を可視化する際には,この両方の考え方を上手に組み合わせることが必須となるでしょう。次回以降,簡単なサンプルプログラムを使って,これらのアプローチを実践していく予定です。ご期待ください。

著者プロフィール

浜本階生(はまもとかいせい)

1981年生まれ。栃木県出身。東京工業大学情報工学科卒業。技術やアイデアの組み合わせから面白いソフトウェアを生み出したいと日々考えている。現在,ブログの解析および視覚化の試みとして「TopHatenar」「Blogopolis」を開発,運用中。

URLhttp://d.hatena.ne.jp/kaiseh/