具体例で学ぶ!情報可視化のテクニック 第1回 情報可視化の概要 Twitterリスト 2008年9月4日 浜本階生 この記事を読むのに必要な時間:およそ 2 分 1 2 3 情報可視化の応用例 - HatenarMaps ここで,筆者が開発したHatenarMaps(図5)を見てみましょう。HatenarMapsは,ブログサービスのはてなダイアリーを「勢力地図」として可視化したWebサイトです。 図5 HatenarMapsでは,はてなダイアリーで人気が高い上位1000個のブログに,それぞれ一定の領土が割り当てられています。各領土の大きさは,ブログがこれまでに獲得した「はてなブックマーク」の数に比例しています。また,領土はブックマークに付与されたタグに基づき,地域別に分類されています。例えば,映画批評のブログは「映画地方」に,Java言語がテーマの技術ブログは「Java地方」に,といった具合です。 同じデータでも見せ方次第でここまで変わる さて,領土が複雑に絡み合って見えるHatenarMapsですが,その骨組みを良く観察すると,実は非常にシンプルな木構造になっていることが分かります。 図6は,HatenarMapsから1区画を切り出したものです。この図から,HatenarMapsの構造をトップダウンで見ていきましょう。 図6 まず初めに,ブックマークタグに基づく地域の分類が存在します("mysql", "java", "perl"など)。これらの地域の形状を注意深く眺めると,図形に親子関係があることが分かります。例えば,"mysql"と"java"は1つの四角形に含まれ,その四角形がさらに,"perl"と"vim"を含む大きな多角形に含まれています。 各地域の中には,個々のブログが配置されています。そして最後に,各ブログの領土の中に個別記事が存在するという構成になっています。 以上の構造を,一般的なツリー記法にしたがって書き下したものが図7です。図7と図6を比較すると,視覚的な印象が全く違うことに驚かれるのではないでしょうか。同一のデータであっても,それを表現する方法次第で,見る人に与える印象は大きく変わってきます。これこそが,情報可視化の持つ絶大な力なのです。 図7 1 2 3 著者プロフィール 浜本階生(はまもとかいせい) 1981年生まれ。栃木県出身。東京工業大学情報工学科卒業。技術やアイデアの組み合わせから面白いソフトウェアを生み出したいと日々考えている。現在,ブログの解析および視覚化の試みとして「TopHatenar」「Blogopolis」を開発,運用中。 URL:http://d.hatena.ne.jp/kaiseh/ バックナンバー 具体例で学ぶ!情報可視化のテクニック 第6回 はてなブックマークの可視化(後編) 第5回 はてなブックマークの可視化(前編) 第4回 ツリーマップによる木構造の可視化(後編) 第3回 ツリーマップによる木構造の可視化(前編) 第2回 階層的クラスタリングによる特徴抽出 第1回 情報可視化の概要