Lifelog~毎日保存したログから見えてくる個性

第53回赤線を引いて本を読む

コレクター的読書(?)

本を読むときに、どんなスタイルで読みますか?

わたしは、もともとはコレクター気質が強いので、好きな本だと保存用、閲覧用と2冊買ったりします。特に好きな本に限っては、何冊もっているかわからないくらいです。盲目的に買っています。

図1 革装3方金ステンドグラス箱入りの私家版本
図1 革装3方金ステンドグラス箱入りの私家版本
「紙派」です。

先日、本をスキャンしているのは合理的だと松浦晋也さんに評されました。しかし、そうでしょうか。ぜんぜん合理的だとは思っていないのです。

図2 非合理的な紙の書棚
図2 非合理的な紙の書棚
版違い、翻訳版など、バリエーションはさまざま。コレクターですから。

安価な本に限らず、⁠観用少女』の愛蔵版は上下5冊ずつもっていますし、韓国語版、英語版、中国語版、雑誌総集編版と、版が変わるたびに購入しています。また、赤江瀑の限定版も色違いや送り箱の有無で2冊もっていたりするなど、エスカレートするいっぽうです。革装3方金ステンドグラス箱入りで私家版を作ったりもしてます。

当然、普通に読む本もできるだけ本を痛めないように、そ~っと開いて読みます。ですが、読んでいました、というのが正しいかもしれません。あるときまでは、本の角を折ることはしないし、書き込みするなんてありえない、と思っていたのです。

デジタル化で得た「自由」

そのあるときとは、本をデジタル化し始めたころです。

本を解体してデジタル化すると、基本的に本は原型をとどめず、紙束になり、リサイクルする以外に方法がなくなります。場合によっては、本を読み終わると、ほとんど即座に、デジタル化するようにさえなりました。なんにしてもエスカレートするものです。

こうなると、本を綺麗に読む意味はほとんどなくなります。だってすぐに解体してしまうのです。綺麗もきたないもないのです。

なぜ本を綺麗に読む必要があるんでしょうか、どうせすぐに解体してしまうのに。

ということに気づいてから、本は(別にわざわざ落としたり泥をつけたりはしないけど⁠⁠、いろいろ書き込みをしたり、もっと自由に読んでもいいんだ、と考えるようになりました。

図3 ちょうどいま読んでいる『究極のC#プログラミング完全版』⁠技術評論社)
図3 ちょうどいま読んでいる『究極のC#プログラミング完全版』(技術評論社)
つい赤字を入れたりしてます。

ああ、本を読む自由。
自由に読む本。

なんて、ゆったりした気分でしょうか。いや、ほんとうに自由っていいもんです。

紙の本に対するこだわりと、デジタル化とは共存するわけです。

デジタル化時代のアナログ読書

そこで、そのときから、感銘を受けた場所に赤線を引きながら読むことにしました。

本を読んだときに、ここはと思うところは、ひんぱんに書き写しています。でも、2、3ページとなると、ふむむと思うし、書き写すほどでもないちょっとした感銘を受けた場所を全文書くかというと、それほどでもないこともあります。

そういう場所に、赤線を引くことにしたのです。

図4 川西蘭『セカンドウィンド3』⁠小学館)
図4 川西蘭『セカンドウィンド3』(小学館)
「今を疎かにすれば、未来はない⁠⁠。おお。そうですね。いいこというな~。とかと赤線を入れてみてます。

これはこれでなかなかいい感じです。最近では、本を日記帳代わりにしたり、メモ帳にしたりすることさえあります。

赤線のページを抜き出す

もちろん、そこにはしたたかな計算もあります。

本のページというのは、デジタル化してサムネイルで見ると、ほとんど特徴をもっていないのはご存じかと思います。ここから特定のページを見つけ出すのは、普通、OCRで文字化する以外に方法がないと考えられているようです。

でも違うんじゃないかと思ったのです。

本のページは、白かクリーム色、すこし色あせた場合には茶色のかった色の紙に、黒いインクで文字を刷っている場合がほとんどです。そうだとすれば、赤字で書き込みをすれば、画像解析したら、そのページだけ抜き出せるのではないか、と考えていたわけです。

わたしはこの2年くらいプログラムの勉強中なのですが、ようやくそれを書くことができ、本のページの特徴を抜き出すことができました。ページを解析して、ピクセルをカウントすることにしたのです。

ページのカラー構成

その結果、おおむね本のページは、(地)が80~92%、黒インクが1~2%程度ということがわかりました。

図5 画像を解析してみました
図5 画像を解析してみました
これで赤字を入れたページを呼び出すことができるようになりました。

そして、赤の書き込みをしたページを、見事に分離することに成功しました。

パーセント表示だと0になってしまいますが、ピクセルでいうと、0ピクセルの場合には、赤字の書き込みがないことを示し、書き込みが多いほど赤字が多い、ということがわかりました。

この結果を使うと、全ページのなかから、赤字の書き込みが多い=重要なページを抜き出したり、赤字のページだけをスライドして表示したりを容易に行えます。

加えて、グラデーションを認識して分離することで、イラストや写真などのページも分離できそうです。

これで、アナログで赤字で書き込みした痕跡を、デジタルでも無駄にせずに活用できるわけです。

今後は、スキャンした画像に対して、デジタルでマーキングを追記することを検討したいと考えています。デジタルでのマーキングは、表示/非表示を切り替えることができるなど、アナログの赤字書き込みとは違う使い方ができるのではないかと思います。

おすすめ記事

記事・ニュース一覧