具体例で学ぶ!情報可視化のテクニック

第6回 はてなブックマークの可視化(後編)

この記事を読むのに必要な時間:およそ 5 分

可視化の実行と結果の分析

それではいよいよ,Demoクラスを実行してみましょう。プログラムを実行すると,その時点における,はてなブックマークの最新の人気エントリーの内容が可視化され,画像ファイルとして保存されます。筆者が2008年10月7日に実験を行ったところ,図3の画像が出力されました。

図3

図3

この可視化イメージから,どのような特徴を読み取ることができるでしょうか。いくつか例を挙げてみることにします図4⁠。

図4

図4

  • イメージの左下部分には,⁠地球温暖化」⁠ノーベル物理学賞」⁠神舟7号」と,環境・サイエンス系統の話題が集まっています。
  • イメージの右の部分には,いわゆる「ネタ系統」のエントリーが集まっています。この付近には赤っぽい領域が多いことから,エントリーへのコメント率が高く,⁠議論系ブックマーク」の傾向が強いことが分かります。
  • 「ネタ系統」の領域は,さらに「2ちゃんねる系統」「新聞系統」に大別されている様子が分かります。
  • 「ネタ系統」は,1つ1つの末端領域の面積が比較的小さいことから,1エントリー当たりのブックマーク数が少ない傾向が分かります。

いかがでしょうか。こういったブックマークの特徴は,ブックマーク情報を単にテキストで羅列しただけでは,把握することが困難なものばかりです。階層的クラスタリングとツリーマップという情報可視化手法によって,これまで良く見えなかったデータの全体像が,くっきりと浮き上がってきたのです。

現実の集合知データである,はてなブックマークの人気エントリーを材料とした今回の試みによって,情報可視化の有用性を改めて実感していただけたのではないでしょうか。

最後に

これまで6回にわたり,情報可視化の基礎から実践までを学んできました。本連載では特に,情報可視化手法の具体例として階層的クラスタリングとツリーマップを取り上げ,詳しく解説を行いました。しかし,もちろんこれらは,多彩な情報可視化のテクニックのうちのほんの一部に過ぎません。

本連載では多く触れるに至らなかった「GUIとの融合」のテーマを含め,情報可視化には大きな可能性が広がっています。皆さんもぜひ,データから新たな価値を引き出すことができる,独創的な情報可視化にチャレンジしてみてください。この連載が,その何らかのヒントになれば幸いです。

著者プロフィール

浜本階生(はまもとかいせい)

1981年生まれ。栃木県出身。東京工業大学情報工学科卒業。技術やアイデアの組み合わせから面白いソフトウェアを生み出したいと日々考えている。現在,ブログの解析および視覚化の試みとして「TopHatenar」「Blogopolis」を開発,運用中。

URLhttp://d.hatena.ne.jp/kaiseh/