コマンドラインとgawkを使って次の方法でファイル数をカウントしてみます。
これで見ると、6月の1か月間のファイル数は合計で3,429個。1日平均は114.3個、最小は2009年06月14日(日)の12ファイル、最大は2009年06月20日(土)の172ファイルです。
7月に入っても状況はほぼ同じで、7月20日までの20日間の合計は2,179個。平均は108.95個。最大は142ファイルでした。
大まかな数は冒頭に述べたとおりですね。1日のファイルの平均は100~150程度です。日々の印象は間違っていなかったわけです。
この中には、メモや写真、日誌、ログ、Webの気になるデータのクリップなどが含まれています。筆者は自宅を仕事場にしているため、だいたい一日平均8~10時間くらいコンピュータの前にいます。それで考えると、1時間あたりで10個のファイルを作っているということになります。いろいろな資料を読んだり見たりしていることからいうと、まあこれは妥当な範疇でしょう。
1日100ファイルというこの分量は、この数年あまり変化していないので、筆者の場合の手作業の限界、情報処理量の限界は、1日100前後にあると考えられます。
メールの未読を600通溜めちゃう忙しい先生も知人にいるので、どの程度をたくさんと思うかは人それぞれです。あくまで筆者の場合です。
リンクをクリックするインターフェースの限界
インターネットで新聞を見るようになってから、あまりの効率の悪さに辟易することが多くなりました。Webページを開いて、見出しをスクロールして見て、気になったらリンクをたどって中を見る。これは、1995年ごろにインターネットが広がってから、ほとんど進歩していないインターフェースです。紙の新聞が「めくれ」ばよいだけであるのとは、大違いです。
手作業の限界とは、じつはこのインターフェースの限界のことであり、ほんとうの人間の情報処理能力は、もっと数が多いのではないか、と長いこと考えてきました。
これもどう数えるのかは異論があると思いますが、たとえば新聞は、1ページあたりでざっと12くらいの情報(記事や広告)が集まっています。新聞は30ページくらいありますから、全ページをざっとめくると、12×30=360くらいの情報に接していることになります。インターネットを使って新聞にアクセスすると、クリックやスクロールのインターフェースに疎外されて、これだけの情報にはそもそも触れていない可能性があります。
そこで、まずはこの規模の情報に触れることをめざして、新聞の自動表示システムを構築しました。
あらかじめ用意したキーワードを使って処理するもので、キーワードは人名地名固有名詞など約450を用意してあります。
自動表示システムなので、キーワードにしたがって、自動収集したあと、ファイルとして保存し、自動的に画面に表示し、ある程度の時間でタイムアウトして次の記事を表示します。
この新聞自動表示システムの運用を開始した7月21日以降8日間でファイルの総数は1,738個。1日平均で約217個に増加しました。従来比でいうと約50%アップです。
目標とする360にはまだ届きませんし、自動的に取得するキーワードに漏れがあるとも考えられますが、それでも従来よりは広範な記事に目を通している感じです。紙の新聞や辞書、雑誌などの大きな特徴がザッピングの容易さで、目的としなかった記事にも目を向けるチャンスが広がることがメリットとして考えられていますが、従来比50%アップということは、間違いなくザッピング効果はあるといっていいでしょう。
おおむね、テレビで報道するニュースの記事は、ほぼ網羅している状態です。もっとも、テレビで報道するニュースは数からいうとごく限られたものですから、その程度が網羅できているのは当然といえば当然かもしれません。
時間軸
表示方法にはいくつか案があります。ひとつは『PileDesktop』や渡邊恵太氏の『Memorium』のように、画面内を小さく区切って情報を表示する方法です。次にWebブラウザのように、それなりのサイズをとって表示する方法。さらにはWebブラウザ+リンクのように、大きな画面にメニューのようにリンクを表示し、対話的に表示する方法、重ねる方法などです。
今回採用したのは、時間軸を使って一度にひとつの記事を大きなウィンドウでできるだけ全文表示し、スクロールとクリックをしないで読むことを満たす方法です。時間軸を使うことは、インタラクションの観点からは即時性に欠けるデメリットがありますが、一度に20ページ程度を表示してぱらぱらめくって選択して読もうとしたところ、メモリ不足で極端に動作が遅くなったため、暫定的にこの方式となりました。
自動表示システムは、適当なタイミングで新聞サイトにアクセスし、キーワードによって記事を抜き出し、適当なタイミングで画面上に表示します。1記事あたりの表示時間はだいたい5分ほどで、サブディスプレイに表示しているので気が向いたら見ている、という感じです。すべての記事に目を通しているわけではないです。50の記事を見るのにざっと5分×50=4時間程度かけていることになります。かなりゆったりしたペースです。感覚としては、ふと手を止めたときに新しい記事が出ている状態です。
このブラウジングの間に、ユーザーがする作業は0です。クリックする必要もなく、スクロールもありません。記事に目を通せばよいだけです。ユーザーへの負担がないために、継続しやすいと考えています。
前回の『吹き出しTwitter』もユーザーの作業を必要としないブラウザ環境でした。この新聞ブラウザも、ビューアーに撤した環境を作ることで、より効率的な情報取得を可能にしました。
この作業を定期的にすることで、より多くの話題に触れられるようになるなどのメリットがでるかどうかは、今後のライフログの研究に大きく関係してきそうです。
ただし、紙の自由さを再現できたかという点では充分ではありません。上記のように、一度に20ページ程度を表示してぱらぱらめくれば紙の感覚に近いと考えたのですが、メモリや画面サイズの点で問題が起きたためです。画面サイズを改善するには、マルチディスプレイ化を推進することになります。その他、ハードウェア的な改善も必要そうなので、すこし中長期的な実験になります。
今後のテーマは、キーワードのバランスの設定と、blogなど新聞以外のページへの自動ビューアーの応用です。筆者は、検索よりも「すでに見えている」ことの方にシンパシーを感じており、新聞以外のページにも、同様のブラウザ環境を広げることを検討しています。