概要
注目の職種として脚光を浴びたデータサイエンティストですが,実際には多くの企業や組織で人材が不足しており,これにはいくつかの原因が考えられます。生まれて間もない職種のため,ビジネスデータ分析に関する知見が溜まっていないことや絶対的な人数が少なく育成される環境が整っていないことなどが挙げられます。本書は,データサイエンティストを目指す方に向けて,データ分析ソフトウェアとして一定の地位を得たRの活用方法を解説していきます。集計処理,時系列分析,インフラの知識など現役のデータサイエンティストにも有用な情報が満載です!
こんな方におすすめ
目次
第1章 データサイエンティストを取り巻く環境…… 酒巻 隆治,里 洋平
- データサイエンティストの育成を阻む要因
- データサイエンティストのキャリア
- ビジネスデータ分析におけるR
第2章 データサイエンティストに必要な統計知識…… 里 洋平,酒巻 隆治
- データ分析と統計学
- 記述統計学入門
- 推測統計学入門
- データマイニング入門
- 機械学習入門
第3章 Rによるモダンな集計処理…… 市川 太祐
- data.table/dplyrパッケージを用いた高速集計
- reshape2/tidyrパッケージを用いたデータ整形
- magrittrパッケージおよびpipeRパッケージを用いたpipe処理
第4章 時系列分析の基礎…… 福島 真太朗
- 暦の影響を受けるデータ
- 時系列データのハンドリング
- 時系列データの可視化と統計量
- 時系列データの予測
第5章 .NET FrameworkとRの連携…… 安部 晃生
- NET FrameworkとRの連携
- R.NET
- データ型ごとの操作
- R Type Provider
第6章 Rエンジニアがおさえておきたいインフラの話…… 和田 計也
- Rの特徴とメモリ
- CPUの高速化
- CPU,メモリ両方の観点から
第7章 技術計算のための新言語Julia…… 久本 空海,西薗 良太
- Juliaとはなにか
- Juliaの基礎
- RとJulia注目を浴びる職種の現実
サポート
ダウンロード
本書で使用するサンプルデータをダウンロードできます。圧縮ファイルをダウンロードしていただき,適宜解凍してご利用ください。
(2014年11月28日更新)
- ダウンロード
- datascientist.zip
圧縮ファイルに収録されているファイルは,以下の通りです。
- P.23 data2.csv
- P.35 kmeans_sample_data.csv
- P.41 MobilePhones.csv
- P.57 reg_sample_data.csv
正誤表
本書の以下の部分に誤りがありました。ここに訂正するとともに,ご迷惑をおかけしたことを深くお詫び申し上げます。
(2016年10月5日更新)
P.25
P.55 表5
誤 |
SVM(多項式カーネル) 92.83%
|
正 |
SVM(多項式カーネル) 96.22%
|
誤 |
ランダムフォレスト 93.91%
|
正 |
ランダムフォレスト 99.991%
|
P.141
誤 |
注2)Etsyにてデータサイエンティストとして...
|
正 |
注2)Estyにてデータサイエンティストとして...--
|
P.154(初版第2刷,初版第3刷)
誤 |
注34)http://yomichi.hateblo.jp/entry/2015/12/01/022544
|
正 |
注34)http://yomichi.hateblo.jp/entry/2016/08/11/120654
|