Lifelog~毎日保存したログから見えてくる個性

第3回紙をデジタル化する

紙をデジタル化しアナログに回帰する

紙をどうするか、ということは、筆者に限らず、紙の時代からコンピュータ(あるいはデータ)へと転換する過渡期にある現在の、大きなテーマです。

筆者は、紙をなくして情報として活用する、というラディカルなライフスタイルをとることを決意し、それが『記憶する住宅』として結実したわけです。

もちろんここであらためて言えば、⁠記憶する住宅』は情報をデジタルで扱うことを強調するために誇張した表現です。作ったPileDesktopをご覧いただいたとおりで、じっさいには筆者は、相当アナログ人間であります。机のまわりを見ていただければおわかりいただけるとおり、紙をなくしたとかいいながら、紙だらけでもあります。

机の横の書棚には未読の本だけを置いているのですが、これだけでも約90冊。活字中毒のみなさまには見慣れた風景であると思いますけど、まあ本というのは減りませんね。増殖しつづけるきらいがある。

アナログ感覚を再現したPileDesktop
アナログ感覚を再現したPileDesktop
すっかりおなじみ(?)のPileDesktopで、氷室冴子『海がきこえる』⁠海がきこえるIIアイがあるから』⁠徳間書店)の近藤勝也のイラストを一覧したところです。アナログ感覚にあふれると思います。
アナログ感覚を再現したPileDesktopをアナログで再現
アナログ感覚を再現したPileDesktopをアナログで再現
イラストを一覧したところを紙で再現しました。このように、特別なページは廃棄せずに、紙のまま残してもいます。

初見は紙で、二度目はデジタルで

初見/初読は紙で行っています。最初からデジタルでということはほぼないです。デジタル書籍も出ていますが、ちゃんと読むには、表示やフォントのクオリティが足りないと思っているのです。たとえば「逢う」という漢字を点がふたつついたしんにょうで読みたいとか、⁠躯」という文字を「身+區」で読みたいとか、⁠掴む」という文字をてへんに旧 字の國で読みたいとか、そういうこだわりです。

逆に、二度目以降は、デジタルのほうがよいと考えています。検索性が高いからです。紙で残した本には、紙で残す理由があります。紙のもつ質感、重み、匂い、手触りなどです。

紙としてとっておく本
紙としてとっておく本
どうしてもデジタルになじまない本もあります。特装限定版、私家版、署名本、初恋の女の子からプレゼントにもらった本などです。そういう本は、本の「モノ」としての価値が高いので、紙のままアナログで、大切に保管してあります。

背表紙は見たい

筆者の本棚は、本もちにしては、まだまあきれいなほうというか、いちおう書棚はなんとかほぼ2段にはしておらず、背表紙が見える状態をぎりぎりで保っています。本は背表紙が見えなくなると死にますから、それだけはなんとか死守したいと。

蔵書家はどのくらいの本をもっているのか、と蔵書家の基準を考えてみました。まあ1万冊くらいが入門の分水嶺でしょうか。そこはクリアしているだろうなと思います。

2008年の今年になって目を通した本は、いまのところ49+37+10+17=113冊です(2008年4月23日現在⁠⁠。まあざっと1日1冊ずつ増えてます。このペースで概算すると、これまでに目を通した本は、ざっと(42歳-15歳)×365冊で、1万冊くらいですね。

書籍に埋もれないためのデジタル化

『書物の宇宙誌 澁澤龍彥の蔵書目録』をふと見ると、蔵書一万余冊とあります。1万冊を蔵書家と呼ぶ根拠のひとつといってもよいかもしれません。

澁澤龍彥の自宅と筆者の書斎とがいちばん違うのは、書棚の占有率です。筆者の場合1万冊あってもなお床が見えるところでしょうか。床には(作業中のものをのぞけば)モノはおかないことにしています。床はロボットのためにとってあるのです。床にモノをおかない、あるいは書棚に置くのは未読本と紙でなければだめな本に限るための切り札が、デジタル化です。

デジタル化の結果、情報は多いのだけど、モノは少ないわけです。モノに囲まれているような、囲まれていないようなところが、デジタル化の恩恵であろうと考えています。ぜんぶ紙でもっていたら、と思うと、ちょっとぞっとします。

デジタル化しない限り、書棚がどんなにあってもだめで、なんとかしないといけないのです。かなり大規模に、紙の本をデジタル化しています。

紙のデジタル化は、のちのちたっぷり語っちゃうと思いますが、ほんとに本気で取り組んでます。あまりに本気でやっているあまり、ほとんど仕事をしていないくらいです。

『書物の宇宙誌』⁠国書刊行会)
『書物の宇宙誌』(国書刊行会)
帯に蔵書一万余冊とあります。

仕事がないから本を書き写してみたり

筆者は、書籍や紙資料のデジタル化を1997年ごろから断続的にスタートし、2002年ごろからは継続的につづけています。

デジタル化にはいろいろな方法があります。スキャナを用いて画像として蓄積する、という方法がポピュラーかと思います。高解像度のデジタルカメラを使う方法とか、スキャンしたあとにOCRを用いて文字化するなど、いろいろなバリエーションがあり、それぞれ、さまざまなこだわりのポイントはありますしノウハウや機材の蓄積もあります。

連載がつづけば、筆者の個人的な方法以外でない部分についても、触れていきたいとは思います。

大規模なスキャン
大規模なスキャン。
いちおう一日のノルマを10cmと決めて、定期的にデジタル化を行っています。というか、ほとんどデジタル化作業しかしていないかも、という気もします。どうなんでしょうね、そういう人生。

AmazonやGoogleの大規模デジタル化

デジタル化でもっともホットなのは、Amazon.comやGoogleの行っている大規模なデジタル化でしょう。この規模は、とうてい個人の行っているものとは比較になりませんが、逆に、筆者がどうしてもいますぐほしい資料は、Amazon.comやGoogleから手にはいらないこともあります。そこで、ある意味補完的に、個人的にデジタル化をする必要があるわけです。

Amazon.co.jpのデジタル化
Amazon.co.jpのデジタル化
「なか見! 検索」というサービス名で、本の一部を立ち読み感覚で閲覧することができます。
Googleのデジタル化
Googleのデジタル化
 Googleは強力な検索機能を背景に、主として英米圏の図書館の蔵書を中心に、かなり大規模に書籍のデジタル化を勧めています。
Googleのデジタル化
でも当然、⁠ない」ものもあります。

OCRの99%

OCRは、校正があまりにも煩雑であるため、使用していません。大規模な書籍のデジタル化において、⁠検索程度の利用であれば、OCRの未校正テキストでも充分だ」という立場もありますが、筆者はこちらには与しません。というか、検索程度ではないところに踏み込んだ利用をするので、OCRの精度では意味がないのです。OCRをかけて校正するくらいなら、キーボードからタイピングしたほうが、筆者にとっては、精度が高いということです。

検索でないところに踏み込んだ利用とは、たとえば分析や引用です。引用をするときの最重要点のひとつは、引用する文章を間違いなく引用することです。OCR程度の精度では、これすら怪しくなると考えています。

キーボードからタイピングしても、誤入力や誤変換はありますが、キーボードからの誤入力/誤変換とOCRした文章とでは、校正のときのポイントが違っていて、OCRの文章は校正しにくいのです。マンガの場合には、そもそもOCRすることさえ困難でしょう。

キーボードから文字をタイピングする

では具体的にどうしているかというと、どちらかといえば「青空文庫」のスタンスに近いのかもしれません。必要な書類はすべてキーボードから入力してテキスト化しているのです。時間も手間もかかりますが、手間をかけることで引用物を吟味することができますし、そもそも引用するのには引用した文章が主従関係で従でなければならないわけですから、量的な問題は差ほど大きくはありません。第一、全文が間然するところがないテキストであるほど重要な本というのは、残念なことに筆者の人生の中でわずかに30冊ほどしかないのです。

1万冊読んで30冊かよと、内心忸怩たるものがないでもないですが、実際にそうなので、事実から逃れるわけにもいきません。そのうちの5冊は、全文をデジタル化してあります。一部をデジタル化したものも5冊程度あります。

かなり地道な作業なので、継続するモチベーションはなかなか持続しません。幸い(?)それほど仕事がないので、趣味をかねてつづけています。

文字としてのデジタルテキスト
文字としてのデジタルテキスト
名作・古典などは、⁠青空文庫」のテキストを有効利用させていただいています。

おすすめ記事

記事・ニュース一覧