Lifelog~毎日保存したログから見えてくる個性

第34回自動化新聞ビューアー

紙とデジタルとのはざまで

紙の魅力はデジタル時代でも健在です。 紙の新聞や辞書や書籍は、めくるのが容易で一覧性が高く解像度が高くて電源を必要とせずに軽くて柔軟です。新聞は毎朝届くのも魅力です。わざわざ探すのではなくて、見たいものがそこにあるのです。これは紙のよいところです。

紙らしさをもった新聞の読み方
紙らしさをもった新聞の読み方
朝日新聞は毎日1面をWebで画像として公開しているので、それを毎日見ています。記事のタイトルを自動で埋め込んで検索できるようにしています。Webページを見るよりも、新聞っぽい感じです。これを見ると、1面に広告を出すか、2面以降に広告を出すかは、決定的な差があることがわかります。ある種の読者にとっては2面以降に出すのは、出さないのと同じだということです。

紙には魅力があります。すべてのものの長所が短所と表裏一体であるように、紙にはデメリットもあります。物質性はデメリットにもなります。

身近な例は、新聞の物理的な「量」です。毎日新聞が届くのは、よいことばかりとはいえません。読み終えた新聞は1カ月で段ボール箱1箱分程度の量になり、回収と表裏一体のサービスでないと、管理しきれないためです。回収日に出すのを忘れて、何ヶ月分とかたまってしまうと、古新聞の臭いもするし、部屋も狭くなるし、ぜんぜんだめだめじゃん、って感じがしてきます。

懐かしき紙の時代の切り抜き
懐かしき紙の時代の切り抜き
讀賣新聞1986年10月16日木曜日夕刊。こういうのがちゃんと残るところに紙のよさはあると思います。この色あせたセピア色も紙ならではで、大好きなんです。臭いはちょっと苦手です。
懐かしき紙の時代の切り抜き
懐かしき紙の時代の切り抜き
讀賣新聞1986年10月16日木曜日夕刊。

そんなこんなで、じつは筆者は紙の新聞をとらなくなって、早5年ほどにもなります。インターネットで読むようになって久しいのです。

新聞はもっぱらインターネットで見ています
新聞はもっぱらインターネットで見ています
たとえばこんな記事のクリップも、インターネットなら簡単ですし、探すのも容易です。キャプチャーには、CapturePileという、キャプチャーした範囲内のテキスト内容をJPEG/Exifに埋め込むことのできるキャプチャーソフトを使っています。記事の全文が入っているので、検索できるわけです。

新聞をとるのをやめてから、ちり紙交換に出す悪習から逃れたことは生活の観点から見て大きなメリットでした。

デジタル化した資料は場所をとらず必要に応じて検索でき、ある種の自動化となじみやすいと考えます。デジタル資料のもつ軽快さ、自由さを体験すると、規模の点で月に一度ちり紙交換に出さなければ破綻するように紙のもつ物質性は、扱える情報の量を自ら制限 していると疎ましく感じられてきます。

紙のもつ「量」と場所ふさぎの問題をのぞけば、紙のもつ操作性や一覧性は、デジタルにはない魅力として、がぜん光って見えてきます。紙に回帰したい願望があるわけです。紙への気持ちはアンビバレンツです。紙は好きでも紙のもつ物質性のうちの一部は好きでないのです。

そんなわけで、デジタル化した資料に、新聞のもつ「手にとるような自由さ」や、⁠自動的に配達されてくるところ」を再現したいと考えてきました。

1日100個

どういう単位で数えるかはむずかしいので、便宜的に情報=ファイルとして見ると、デジタル化したあとの1日に扱える情報量は、平均して100~150ファイル前後でした。

100という数にはなじみがあります。1日に100枚写真を撮るときの写真の単位を1ミサキというのだそうです。平均すると、1日のフォルダにあるファイル数は、ほぼその程度なのです。もうすこし厳密に、コマンドラインとgawkを使って次の方法でファイル数をカウントしてみます。

dir 200906 > list06.txt
dir 200907 > list07.txt
gawk "/ディレクトリ/ || /個のファイル/" list0*.txt | gawk "!/個のディレクトリ/" 
> listhistory.txt

これで見ると、6月の1か月間のファイル数は合計で3,429個。1日平均は114.3個、最小は2009年06月14日(日)の12ファイル、最大は2009年06月20日(土)の172ファイルです。

7月に入っても状況はほぼ同じで、7月20日までの20日間の合計は2,179個。平均は108.95個。最大は142ファイルでした。

大まかな数は冒頭に述べたとおりですね。1日のファイルの平均は100~150程度です。日々の印象は間違っていなかったわけです。

この中には、メモや写真、日誌、ログ、Webの気になるデータのクリップなどが含まれています。筆者は自宅を仕事場にしているため、だいたい一日平均8~10時間くらいコンピュータの前にいます。それで考えると、1時間あたりで10個のファイルを作っているということになります。いろいろな資料を読んだり見たりしていることからいうと、まあこれは妥当な範疇でしょう。

1日100ファイルというこの分量は、この数年あまり変化していないので、筆者の場合の手作業の限界、情報処理量の限界は、1日100前後にあると考えられます。

メールの未読を600通溜めちゃう忙しい先生も知人にいるので、どの程度をたくさんと思うかは人それぞれです。あくまで筆者の場合です。

リンクをクリックするインターフェースの限界

インターネットで新聞を見るようになってから、あまりの効率の悪さに辟易することが多くなりました。Webページを開いて、見出しをスクロールして見て、気になったらリンクをたどって中を見る。これは、1995年ごろにインターネットが広がってから、ほとんど進歩していないインターフェースです。紙の新聞が「めくれ」ばよいだけであるのとは、大違いです。

手作業の限界とは、じつはこのインターフェースの限界のことであり、ほんとうの人間の情報処理能力は、もっと数が多いのではないか、と長いこと考えてきました。

これもどう数えるのかは異論があると思いますが、たとえば新聞は、1ページあたりでざっと12くらいの情報(記事や広告)が集まっています。新聞は30ページくらいありますから、全ページをざっとめくると、12×30=360くらいの情報に接していることになります。インターネットを使って新聞にアクセスすると、クリックやスクロールのインターフェースに疎外されて、これだけの情報にはそもそも触れていない可能性があります。

そこで、まずはこの規模の情報に触れることをめざして、新聞の自動表示システムを構築しました。

あらかじめ用意したキーワードを使って処理するもので、キーワードは人名地名固有名詞など約450を用意してあります。

自動表示システムなので、キーワードにしたがって、自動収集したあと、ファイルとして保存し、自動的に画面に表示し、ある程度の時間でタイムアウトして次の記事を表示します。

この新聞自動表示システムの運用を開始した7月21日以降8日間でファイルの総数は1,738個。1日平均で約217個に増加しました。従来比でいうと約50%アップです。

目標とする360にはまだ届きませんし、自動的に取得するキーワードに漏れがあるとも考えられますが、それでも従来よりは広範な記事に目を通している感じです。紙の新聞や辞書、雑誌などの大きな特徴がザッピングの容易さで、目的としなかった記事にも目を向けるチャンスが広がることがメリットとして考えられていますが、従来比50%アップということは、間違いなくザッピング効果はあるといっていいでしょう。

おおむね、テレビで報道するニュースの記事は、ほぼ網羅している状態です。もっとも、テレビで報道するニュースは数からいうとごく限られたものですから、その程度が網羅できているのは当然といえば当然かもしれません。

時間軸

表示方法にはいくつか案があります。ひとつは『PileDesktop』や渡邊恵太氏の『Memorium』のように、画面内を小さく区切って情報を表示する方法です。次にWebブラウザのように、それなりのサイズをとって表示する方法。さらにはWebブラウザ+リンクのように、大きな画面にメニューのようにリンクを表示し、対話的に表示する方法、重ねる方法などです。

PileDesktop
PileDesktop
画面上に小さなカードを作り、そこに情報を表示しています。メモ的な情報の表示には向いているのですが、新聞のようなひとまとまりの比較的分量の多めな文章には不向きです。
PictureViewer
PictureViewer
主として写真や新聞の1面、天気図などの大きなものを表示するために、画像専用のビューアーを作りました。
PileDesktop、新聞ビューアー、アドレス帳
PileDesktop、新聞ビューアー、アドレス帳
紙らしさを活かした写真、メモ、アドレス、新聞のそれぞれの表示方法、読み方を追求しています。
右が1面ビューアー、左が記事ビューアーです
右が1面ビューアー、左が記事ビューアーです
記事はキーワードにしたがって自動的にダウンロードして、ビューアー用に整形して表示しています。いまはビューアーはありもののノート風ビューアーを使っていますが、将来的には新聞用に特化したチープな感じの縦書きビューアーを作成する予定です。左のノート風ビューアーは、時間が来ると自動的に閉じて、次の記事を表示します。

今回採用したのは、時間軸を使って一度にひとつの記事を大きなウィンドウでできるだけ全文表示し、スクロールとクリックをしないで読むことを満たす方法です。時間軸を使うことは、インタラクションの観点からは即時性に欠けるデメリットがありますが、一度に20ページ程度を表示してぱらぱらめくって選択して読もうとしたところ、メモリ不足で極端に動作が遅くなったため、暫定的にこの方式となりました。

自動表示システムは、適当なタイミングで新聞サイトにアクセスし、キーワードによって記事を抜き出し、適当なタイミングで画面上に表示します。1記事あたりの表示時間はだいたい5分ほどで、サブディスプレイに表示しているので気が向いたら見ている、という感じです。すべての記事に目を通しているわけではないです。50の記事を見るのにざっと5分×50=4時間程度かけていることになります。かなりゆったりしたペースです。感覚としては、ふと手を止めたときに新しい記事が出ている状態です。

このブラウジングの間に、ユーザーがする作業は0です。クリックする必要もなく、スクロールもありません。記事に目を通せばよいだけです。ユーザーへの負担がないために、継続しやすいと考えています。

前回の『吹き出しTwitter』もユーザーの作業を必要としないブラウザ環境でした。この新聞ブラウザも、ビューアーに撤した環境を作ることで、より効率的な情報取得を可能にしました。

この作業を定期的にすることで、より多くの話題に触れられるようになるなどのメリットがでるかどうかは、今後のライフログの研究に大きく関係してきそうです。

ただし、紙の自由さを再現できたかという点では充分ではありません。上記のように、一度に20ページ程度を表示してぱらぱらめくれば紙の感覚に近いと考えたのですが、メモリや画面サイズの点で問題が起きたためです。画面サイズを改善するには、マルチディスプレイ化を推進することになります。その他、ハードウェア的な改善も必要そうなので、すこし中長期的な実験になります。

今後のテーマは、キーワードのバランスの設定と、blogなど新聞以外のページへの自動ビューアーの応用です。筆者は、検索よりも「すでに見えている」ことの方にシンパシーを感じており、新聞以外のページにも、同様のブラウザ環境を広げることを検討しています。

おすすめ記事

記事・ニュース一覧