概要
RStudioはR言語のIDE(開発環境)です。エディタ,コンソール,グラフなどを1つの画面内で確認できるほか,データ分析プロジェクトをスムーズに進めるための機能が豊富に用意されているので,RユーザにとってRStudioを利用したデータ分析はスタンダードになっています。本書はRStudioの基本的な機能を解説したあとに,データ分析ワークフローを一通り解説していきます。データの収集(2章),データの整形(3章),可視化(4章),レポーティング(5章)など,データ分析に欠かせないこれらの要素の基礎を押さえることができます。また,本書はtidyverseパッケージを用いてこれらのデータ分析ワークフローを解説している側面を持ちます。tidyverseの考えに触れ,モダンなデータ分析をはじめましょう。
こんな方におすすめ
- Rユーザ,データサイエンティスト,RStudioを使ってみたい方
サポート
正誤表
本書の以下の部分に誤りがありました。ここに訂正するとともに,ご迷惑をおかけしたことを深くお詫び申し上げます。
P.63 1つ目のコード
RSeleniumパッケージは,2018年11月29日現在はCRANに公開されているため install.packages("RSelenium")でインストールが可能ですが,一時的にCRANから削除されている時期がありました。この場合は以下のようにdevtoolsパッケージを使ってインストールする必要があります。
誤 |
install.packages("RSelenium")
|
正 |
install.packages("devtools")
library(devtools)
install_github("johndharrison/binman")
install_github("johndharrison/wdman")
install_github("ropensci/RSelenium")
|
RSeleniumおよびその依存パッケージは
devtoolsパッケージのinstall_github()を使うことでGitHubからインストールできます。devtoolsパッケージは,install.packages()
を使ってインストールをします。
P.204 注5.17
P.55 HTMLの要素を取得のコード
誤 |
url_title <- html_nodes(url_res, css = "html > head > title")
|
正 |
url_title <- html_nodes(url_res, css = "head > title")
もしくは
url_title <- html_nodes(url_res, css = "title")
|
P.162
下部のコードを以下に差し替えてください。
install.packages("plotly")
library(plotly)
g <- ggplot(data = mpg, mapping = aes(x = class, y = displ, colour =
class)) +
theme_bw() +
geom_violin() +
geom_jitter(size = 1, alpha = 0.5, width = 0.25, colour = "black")
ggplotly(p = g)
|
P.7 1行目
誤 |
.Rprojという名前のファイル
|
正 |
[プロジェクト名].Rprojという名前のファイル
|
補足情報
本書のサンプルコード(3章,4章)について
本書のサンプルコード(3章,4章)については
こちらをご確認ください。
なお,利用にはGitHubアカウントが必要です。