いつの間にか夏至もすぎ,
本連載でも何度か書籍の電子化の話題をとりあげたように,
そのような作業をしている中で
「きょうの料理」のテキスト
いうまでもなく
もっとも筆者自身はテレビを見なくなって久しく,
「きょうの料理」
1冊150ページ前後のテキストは,
もちろん
ページをOCRで読み取ってテキストファイル化できれば全文検索も簡単なのになぁ…,
何かいい方法はないかなぁ…,
ページごとのキーワード付け
ページ単位でアクセスするにはzipファイルで1冊の形を保つより,
各ページは"page_
$ cd 2009/01 $ ls page* | sed "s/jpg/jpg: /" > 2009-01.dat $ cat 2009-01.dat page_0001.jpg: page_0002.jpg: page_0003.jpg: ...
次に,
page_0001.jpg: 放送カレンダー
page_0002.jpg: 目次1
page_0003.jpg: 目次2
page_0004.jpg: CM タカラ本みりん
page_0005.jpg: 美しい味ことば 一月 雪花和 しめさば おから
page_0006.jpg: 冬のお手軽洋風おかず
page_0007.jpg: 冬のお手軽洋風おかず
page_0008.jpg: 冬のお手軽洋風おかず 塩田ノア バスク風おかずきんぴら 豚肩ロース ピーマン ごぼう にんにく
page_0009.jpg: 冬のお手軽洋風おかず 塩田ノア バスク風おかずきんぴら 写真
...
最近の横長ディスプレイだと,
当初は,