RとPythonで学ぶ[実践的]データサイエンス&機械学習

サポートページ

この記事を読むのに必要な時間:およそ 0.5 分

ダウンロード

付録記事のダウンロード

本書をご購入いただいた方は,次の特別記事をダウンロードしてお読みいただけます。

  • Anacondaのインストール
  • RとRStudioのインストール
  • RStudioの使い方
  • Jupyter Notebookの使い方
  • Anacondaでのライブラリ追加方法

ご購入の証明として,以下の場所に記載された文字列をご入力のうえ,ダウンロード後に解凍してご利用ください。

ExtraIssue20190325.zip(4MB)

サンプルソースのダウンロード

(2019年6月25日更新)

本書のサンプルソースがダウンロードできます。

ダウンロード
sample20190625.zip(約300KB)

解凍すると章ごとフォルダにサンプルが配置されています。

3.2.04.ModelComparison.R(P.155)のコメント行を修正したので差し替えました。

補足情報

(以下2019年9月11日更新)

Rの最新バージョン(3.6.1:2019年7月リリース)では,P.308のリスト4.8でtabplotパッケージ(1.3-2:2019年5月リリース)を使った次のコードを実行する際にエラーが発生することが確認されています。


tableplot(DF[, -1], sortCol ="契約")
tableplot(DF[, -1], sortCol ="通話分数")

2019年9月4日時点では,エラーを回避するためにはRの3.5.3以前のバージョン をインストールして使う必要があります

(以下2019年3月26日更新)

図3.15(P.129)のプロットをWindows環境で描画すると文字化けが生じる場合があります。その場合,リスト3.3「3.1.04.Correlation.R」(P.124)の関数qgrah()内の引数に次の1行を挿入してください(P.125の下から10行目に相当する箇所/#③相関係数のグラフ表示内)。


labels=colnames(COR), #ラベルを省略せずに表示

お詫びと訂正(正誤表)

本書の以下の部分に誤りがありました。ここに訂正するとともに,ご迷惑をおかけしたことを深くお詫び申し上げます。

(2019年9月11日最終更新)

P.325 リスト4.8内 下から17行目


box.col = c("pink", "palegreen3")[CRT1$frame$yval])


box.col = c("pink", "palegreen3")[CRT3$frame$yval])

P.329 本文 下から2行目

実測値と一致します。
ロジスティック回帰による予測結果と一致します。

(以下2019年7月23日更新)

P.329 図4.47:枝を買った決定木

末端ノード(9)の一部の文字と背景色を変更しました。

zu4.47.png

(以下2019年7月2日更新)

P.47 例2.7:ベクトルへの要素の追加(上から3~4行目)

[1] 2 2 2 4 6 8 10 12 14 16 18 20 22 24 26 28 30 32 34
[20] 36 38 40 42 44 46 48 50 52 54 56 58 60 62 64
[1] 4 6 8 10 12 14 16 18 20 22 24 26 28 30 32 34 36 38 40
[20] 42 44 46 48 50 52 54 56 58 60 62 64

P.47 例2.7:ベクトルへの要素の追加(下から1~2行目)

[1] 2 2 2 2 4 6 8 10 12 14 16 18 20 22 24 26 28 30 32
[20] 34 36 38 40 42 44 46 48 50 52 54 56 58 60 62 64 64 64 64
[1] 2 4 6 8 10 12 14 16 18 20 22 24 26 28 30 32 34 36 38
[20] 40 42 44 46 48 50 52 54 56 58 60 62 64

(以下2019年6月25日更新)

P.82 (3)条件分岐の構文

コード例がRの記述になっておりました。


if (論理式) {
    論理式の評価がTRUEの場合の処理
} else {
    上記以外の場合の処理
}


if 論理式 :
    論理式の評価がTRUEの場合の処理
else :
    上記以外の場合の処理

P.155リスト3.6の中 16行目のコメント行

「#predict()関数:モデルをデータに当てはめ予測値を算出」はコメント行のため実行上は問題ありませんが、利用していない関数の説明であるため削除します。
併せてサンプルソースのダウンロードファイルも差し替えました。

(以下2019年5月31日更新)

※以降の訂正は第2刷では修正されています。

P.15 本文 上から7行目

その商品が落ちたのか、
の商品が落ちたのか、

P.20 本文 下から3行目

といるルールで
といルールで

P.51 リスト2.2 2.2.03.DataStructure.R(続き)の上から14行目


DFSize[, 3]      #すべてのrow, column 2


DFSize[, 3]      #すべてのrow, column 3

P.56 例2.14の上から8行目


> DFSize[, 3]      #すべてのrow, column 2


> DFSize[, 3]      #すべてのrow, column 3

P.61 本文 上から6行目

与えられたリスト(最初の引数)
与えられたベクトルやリスト(最初の引数)

P.94 本文 上から8行目(参照ファイル名)

2.4.01.sample.csv
sample.csv

P.123 本文 下から1行目

市町村の名称
市区町の名称

P.129 図3.15 相関係数のグラフ表示

項目名称が見切れていました。

図

P.135 本文 下から7行目

プログラムの中、
プログラムの中では

P.145 注17 上から4行目

123×104=1230000
123×104=1230000

P.157 図3.26 通常の線形回帰モデル

「x2方向の傾き0.68」を指し示す位置を変更しました。

画像

P.161 図3.29 左「負の交互作用の例」の式

b0 = 100, b1 = 100, b2 = 3, b3 = -0.1
b0 = 100, b12, b2 = 3, b3 = -0.1

P.161 図3.29 右「正の交互作用の例」の式

b0 = 100, b1 = 0, b2 = 0, b3 = -0.1
b0 = 100, b1 = 0, b2 = 0, b30.1

P.182 本文 下から5~6行目(丸数字は紙面では黒丸数字)

有意に多いカテゴリが赤(⑤⑥)、有意に少ないカテゴリが青(①②)
有意に少ないカテゴリが赤(⑤⑥)、有意に多いカテゴリが赤(①②)

P.184 本文 上から3行目

図3.38では
図3.39では

P.187 本文 上から6行目

実測値と平均値との差 fi - M
実測値と平均値との差 yi - M

P.187 本文 上から7行目

予測値と平均値との差 yi - M
予測値と平均値との差 fi - M

P.201 本文 上から8行目

よいでしょう。」
よいでしょう。

P.202 本文 下から1行目

図3.44のような
図3.45のような

P.204 図番号

図3.44
図3.45

P.210 本文 上から10行目

しかしVIFが
VIFが

P.211 図3.47 交互作用を含むモデルと中心化

右側の説明から指す矢印の場所を修正し,数値の意味を追記しました。

画像

P.267 本文 下から2行目

小数の
数の

P.278 図4.26 表「因子負荷量」のヘッダ

英語   数学
第1因子  第2因子

P.296 本文 下から3行目

わかります。ます。
わかります。

P.310 本文 上から4行目

図4.37のように
図4.39のように

P.335 本文 下から9行目

SEMモデリングでは、
SEMでは、

P.339 図4.48 各変数間の因果関係

「販促」と「チラシ配布」の矢印の向きを修正します。

画像

P.375 本文 上から1行目

また、境界線は
また、境界線

(以下2019年4月2日更新)

P.xiii 上から2行目

(2) 一般線形モデル(GLM)
(2) 一般線形モデル(GLM)

P.302 下から3行目(見出し)

(2) 一般線形モデル(GLM)
(2) 一般線形モデル(GLM)

(以下2019年3月26日更新)

P.115 リスト3.2(3.1.02.Summarize.R)の6行目


stringsAsFactors = FALSE), #文字列を文字列型で取り込む


stringsAsFactors = FALSE) #文字列を文字列型で取り込む

P.154 リスト3.6(3.2.04.ModelComparison.R)の9行目


stringsAsFactors = FALSE, #文字列を文字列型で取り込む


stringsAsFactors = FALSE) #文字列を文字列型で取り込む

P.167 リスト3.7(3.2.05.TwoRegression.R)の9行目


stringsAsFactors = FALSE, #文字列を文字列型で取り込む


stringsAsFactors = FALSE) #文字列を文字列型で取り込む

P.209 リスト3.13(3.3.07.MultiColinearity.R 続き)の22行目


stringsAsFactors = FALSE, #文字列を文字列型で取り込む


stringsAsFactors = FALSE) #文字列を文字列型で取り込む

P.215 リスト3.14(3.4.01.StadardizedRegression.R 続き)の29行目


#目的変数の分散(不偏分散)


#目的変数の標準偏差

P.215 リスト3.14(3.4.01.StadardizedRegression.R 続き)の31行目


#説明変数の分散(不偏分散)


#説明変数の標準偏差

P.215 リスト3.14(3.4.01.StadardizedRegression.R 続き)の36行目


#  偏回帰係数*説明変数の不偏分散/目的変数の不偏分散


#  偏回帰係数*説明変数の標準偏差/目的変数の標準偏差

P.237 リスト4.1(4.2.03.Scaling.R)の7行目


sd(x)  #標準偏差(不偏標準偏差)


sd(x)  #標準偏差(不偏分散の平方根

P.260 リスト4.5(4.2.06.Outlier.R 続き)の21行目


#lof値が2を超えてかどうかをTRUE/FALSEで配列化


#lof値が2を超えているかどうかをTRUE/FALSEで配列化