アンケートご協力のお願いgihyo.jpでは,2010年度に向けて豪華プレゼントが当たる読者属性アンケートを実施しております。ご協力ください。

gihyo.jp » LIFESTYLE STAGE » 連載 » Lifelog~毎日保存したログから見えてくる個性 » 第41回 本のデジタル化の作業

Lifelog~毎日保存したログから見えてくる個性

第41回 本のデジタル化の作業

電子書籍か紙か

アマゾンのKindleの日本国内での販売開始,Googleのブックスキャンなど,書籍をめぐる電子化の動きは,近年次第に高まりを見せています。

かくいう筆者自身も,厖大なコストと手間をかけて所蔵する本のデジタル化を進めており,書棚がすかすかになるほどのペースでプロジェクトを進めています。

本をデジタル化する物理的な作業は,断裁機で断裁して,ドキュメントスキャナで読むことです。

この作業は,ほんとうに物理的な作業なので,効率化するといってもあまりよい方法はありません。ただし,デジタル化の作業では,これ以外にも,細かい作業がいくつもあり,それをどうするかによって効率はけっこう変わってくるんじゃないか,と考えています。

ひとことでいえば,「本を買って読んでデジタル化してあとはタグをつけたり検索して役立てる」。

大まかな手順はこうです。

読むときには紙で読み,デジタルでは読まないのが筆者のスタイルです。デジタルのディスプレイは表現力で紙に劣ります。いっぽう紙は蓄積のしやすさ,検索性などで劣ります。検索性に関しては,記憶をたどってぱらぱらめくることも検索と位置づければ,単純にデジタルが優っているともいいがたいですけれども。

図1 紙で読んだ本

図1 紙で読んだ本。

これをこれからデジタル化していく。

図2 すでに断裁機で断裁ずみ

図2 すでに断裁機で断裁ずみ

カットしてしまうので,本としては成立せず,紙ゴミとしてリサイクルに。

本のタイトルでフォルダを作る

デジタル化にあたって行わなくてはならないのが,フォルダを作る作業です。筆者の場合,スキャンはJPEGファイルで,ページ単位で保存しています。引用などでページ単位で使うことも多いし,さまざまなブラウザで表示するためには,ページ単位で扱えるほうが都合がよいと考えているためです。

フォルダの名称は,基本的に書名と一致しています。書名は日本語の漢字かなまじり文であることが大半ですから,フォルダを作るときにも,シェル上でかな漢字変換をする必要があります。これは結構めんどうな作業です。

いっぽう,筆者はかなり詳細な日記を30年にもわたってつけています。文字を書くのがめんどうなのではないのです。シェルの貧弱な環境で文字を書くのがたいへんなのです。

日記はライフログの中核的なツールでもありますが,単純に書誌リストとしても使うことができる情報をもっています。なんか回りくどいですね。つまり日記には本に関する情報が,ことこまかに書いてあるわけです。タイトル,作者,出版社,抜き書き,感想,etc.

ここにすでに書誌情報があるのに,わざわざフォルダの名前にもういちどタイトルを入力するなんて,ちとばかげていると思うのです。しかも本のタイトルは個性的でかな漢字変換で出てこないことも少なくありません。

さらにいうと,アマゾンで買う場合,買う本のタイトルは検索するときに入力するため,そのときに入力した文字列を使わないのはもったいない話です。Googleに日本語入力を作られている場合じゃないです。

ログである一度入力した文字列は徹底的に使います。すなわち,以下の用途に利用します。

  • 検索して購入するのに使う
  • 書誌データとして使う
  • スキャンするときのフォルダの生成に使う

このくらい使い回してこそ,やっと元をとれた気がしてくるわけです。

ISBNから書誌データを一括作成

ここまでインターネットで購入する場合ですが,本の購入は,リアルな書店でも行います。

リアル書店の場合には,本を買った挙げ句に,それを家まで運び,さらにデータベース化する必要さえあります。これはなしくずしに送料無料化を行いつつあるアマゾンに比べて,リアル書店の危機かもしれません。

リアル書店で買ったら,買った本の書誌データをメールで送るくらいのサービスをしてほしいものです。リアル書店だと,つい平積みから積み上げて,まとめ買いしてしまう傾向があるため,よけいにそんな気がします。10冊もまとめて書誌データを入力していると,ちょっと気がめいってしまいます。

そこで,いろいろ考えた結果,ISBNとバーコードリーダーを使って,書誌データを自動で取得し,日記を書き,ついでにスキャン用のフォルダを作成し,すでにスキャンずみならそのフォルダを開くソフトを試作しました。

図3 バーコードリーダーでISBNを読む

図3 バーコードリーダーでISBNを読む

ワンタッチで簡単。

図4 試作したアプリケーション

図4 試作したアプリケーション

検索やコマンド実行機能をもつ,1行エディタ。ここにISBNを入れてEnterを押す。

図5 ターゲットマシンに,日付入りのフォルダを作成する

図5 ターゲットマシンに,日付入りのフォルダを作成する

ターゲットマシンは,いまのところスキャン専用に使用しているタブレットPC。タイトルの前につく日付は購入した日を自動的にデータベースから検索している。

スキャンをしたファイルを一括してフォルダにいれたり,フォルダを年月日のフォルダに格納することも一括処理します。これは次回ビューアーと同時にご紹介します。

このような細かい手順を半自動化したことで,スキャン作業の手間を大幅に軽減することができるようになりました。

著者プロフィール

美崎薫(みさきかおる)

夢想家,未来生活デザイナー,『記憶する住宅』プロデューサー,記憶アーティスト。住宅,書斎,机をはじめ,ハードウェア,ソフトウェアの開発をプロデュース。著書『デジタルカメラ2.0』(技術評論社)など多数。

コメント

コメントの記入

パスサポ

多数の情報処理技術者試験対策書籍の発行実績を誇る技術評論社がお届けする,資格試験合格サイト「めざせ! 情報処理試験 パスサポ」が開設されました。

ピックアップ

サクセスストーリーに続く,快適サーバー運用管理のヒント!

データの増大,煩雑な管理,システムダウン,セキュリティなど,迫りくる課題からシステム管理者の負担を軽くするポイントを解説します。

gihyo.jp インフラエンジニア情報局

ネットワークやITにかかわるあらゆる業種で必要とされるインフラエンジニアに向けた技術情報や心構え,その魅力について多角的に紹介。

テストエンジニア ステーション

いま,ITに関わるあらゆる開発業務で注目されつつあるテスト系エンジニアをターゲットにしたコンテンツサイトを展開します。

一行クイックアンケート

gihyo.jpで取り上げてほしいネタは?

※検索はページ右上の検索ボックスをご利用ください。

その他の連載

読むウェブ ~本とインタラクション

ディスプレイで読む活字とそのインタラクション(interaction:相互作用)について,最新Webを紹介しながら読み解いていく。

いま,見ておきたいウェブサイト

この連載では,国内外の最新のウェブサイトを隔週更新で取り上げ,これら最新サイトの特徴や素晴らしい部分を,さまざまな角度から解説していきます。

Windows phoneアプリケーション開発入門

Windows Marcketplace for Mobileがサービス開始され,作成したアプリケーションを個人でも世界をターゲットに公開できる環境が整ってきました。これを機にWindows phoneアプリケーションの開発をしてみませんか?

ここは知っておくべき!Windows Server 2008技術TIPS

5年ぶりのサーバOSとなったWindows Server 2008が出荷されて早2年。2009年にはR2が出荷され,再び注目を集めています。発売前から実施したトレーニングによって感じた,インフラエンジニアの方々に知っておいていただきたい機能を中心にご紹介します。

キーパーソンが見るWeb業界

本連載はWeb Site Expert/gihyo.jpとの連動企画です。阿部淳也, 長谷川敦士, 森田雄のお三方による,Web業界をテーマにした座談会です。

きたみりゅうじの聞かせて珍プレー

ソフトウェア開発の現場で体験したトホホな失敗,思わずうなる珍プレーをきたみりゅうじ氏が四コママンガで紹介。みなさんからの投稿もお待ちしてます!

ActionScript 3.0で始めるオブジェクト指向スクリプティング

野中文雄氏が,簡単なスクリプトは書いたことがあるという初級者を対象に,ActionScript 3.0の基本からクラス定義までを解説します。

まだ間に合う「ITパスポート」受験対策 原山先生の短期合格塾

この連載では,4月18日のITパスポート試験の受験に向けて,短い期間で効率良く受験対策を行う方法や,確実に得点するための裏ワザなどを伝授していきます。

連載一覧

gihyo.jp

  • DEVELOPER STAGE
  • ADMINISTRATOR STAGE
  • WEB+DESIGN STAGE
  • LIFESTYLE STAGE
  • SCIENCE STAGE
  • NEWS & REPORT

書籍案内

  • 新刊書籍
  • 書籍ジャンル一覧
  • 書籍シリーズ一覧
  • 新刊ピックアップ
  • ロングセラー
  • 電脳会議

定期刊行物一覧

  • Software Design
  • WEB+DB PRESS
  • Web Site Expert
  • 組込みプレス