この記事を読むのに必要な時間:およそ 0.5 分
ダウンロード
本書のサンプルファイルは,以下のリンクよりダウンロードできます。
- ダウンロード
- wiser-20140928.tar.gz
ファイルをダウンロード後,適宜解凍してご利用ください。
また,本書で利用するWikipediaのデータは以下のリンクからダウンロードできます。
http://dumps.wikimedia.org/jawiki/
お詫びと訂正(正誤表)
本書の以下の部分に誤りがありました。ここに訂正するとともに,ご迷惑をおかけしたことを深くお詫び申し上げます。
(2015年11月4日更新)
P.20 表1-3見出し
P.23 「転置インデックスから単語を探す」9行目
誤 |
各ポスティングリストが含まれる文書IDの共通集合を取ればよいのです。 |
正 |
各ポスティングリストに含まれる文書IDの共通集合を取ればよいのです。 |
P.27 小見出し
誤 |
N-gram(q-gram)よる分割 |
正 |
N-gram(q-gram)による分割 |
P.32 図1-5 一番左の枠
P.42
誤 |
最初に、文書ごとにレコード<単語、文書ID、文書における単語のTF>を生成し、
|
正 |
最初に、各文書において、当該文書を構成する単語ごとにレコード<単語、文書ID、文書における単語のTF>を生成し、
|
P.42 リスト1-4 5行目
P.42 ①の示す範囲
誤 |
5行目のみ
|
正 |
4行目から6行目(for all word∈ d do ~ end for)
|
P.46 最終行
P.54 「Debianの場合」の実行例
誤 |
> aptitude install build-essential sqlite3 libsqlite3-dev bzip2
|
正 |
> aptitude install build-essential sqlite3 libsqlite3-dev libexpat1-dev bzip2
|
P.55 1行目
Bは小文字が正しいです。
P.57 1行目
※先頭のwは大文字
P.57 下から4行目
P.58 2つめの実行例
誤 |
articles .xml |
正 |
articles.xml |
「articles」の後ろに改行が入らないのが正しいです。
P.58 実行例2
誤 |
jawiki-●●●●●●●●-pages-article.xml
|
正 |
jawiki-latest-pages-articles.xml
|
P.58 最終行
誤 |
time grep 'Wikipedia' jawiki-latest-pages-articles.xml
|
正 |
time grep 'Wikipedia' 1000.xml
|
P.73 9行目および図3-2キャプション
末尾の句点が不要です。
P.73 図3-2
以下の図のようになります。図をクリックすると大きく表示できます。
P.106 2行目
誤 |
10 = 5 × 1 + 4
|
正 |
9 = 5 × 1 + 4
|
P.140 下から3行目
P.162 図7-1の「適合率」の説明
P.162 図7-1「再現率」の説明
P.170 コラム1行目
P.173 本文9行目
「何」の後ろの「ら」が入らないのが正しいです。
P.176 下から3行目
P.181 本文2行目
P.189
※「(参考文献7)」削除
P.191 下から5行目