新刊ピックアップ

データ分析に必須のツールRStudio

この記事を読むのに必要な時間:およそ 1 分

RStudioとは

効率的なプログラミングを進めるためにIDE(Integrated Development Environment; 統合開発環境)は欠かせません。本稿で紹介するRStudio図aはRでプログラミングする際に利用されるIDEの定番です。RStudio社が主導して開発を進めており,OSS(Open Source Software)で公開されています。

図a RStudio

図a RStudio

Rとデータ分析

ここでデータ分析の流れについて見てみます。データ分析では,まずデータを集める必要があります。そしてその集めたデータに最適な解析手法を適用し,データの特徴を解釈していきます。ここで分析は終わりではなく,通常は誰かにその結果を見てもらうためにレポーティングが必要になります。

Rにはこれらのデータ分析の各作業を便利にするパッケージが豊富に用意され,開発が続いています。ほかのプログラミング言語では用意されていない解析手法や可視化方法が豊富なパッケージによって提供されているのです。統計解析でRが利用されるの要因の1つは,この豊富なパッケージ群の存在があります。

RStudioの機能

RStudioにはRのプログラミングを効率化するためにさまざまな機能が備わっています。ほかのIDEと同様に,プロジェクトごとにファイルを管理できたり,コマンド名だけでなく関数名やパッケージ名も補完できたりします。今や欠かせなくなったGitによるバージョン管理機能もあります。

RStudioの操作画面を見てみましょう。RStudioの画面は,ペインと呼ばれるウィンドウに区切られ,さまざまな機能がタブで管理されています図b⁠。

図b RStudioの画面

図b RStudioの画面

左下には,Rのコンソールを利用できる[Console]ペインと端末を操作する[Terminal]ペインがあります。右下の[Files]ペインではプロジェクト内のファイルが確認でき,⁠packages]ペインではパッケージの管理やインストールができます。

ここでRStudioの便利な機能を2つ紹介します。

まずは「グラフの出力」についてです。レポーティングの際は分析の結果をグラフにして説明することもあるでしょう。⁠Console]ペインで描画した結果は右下の[Plots]ペインで確認できます。ここに表示したグラフはGUI操作で画像のサイズや出力形式などを設定でき,かんたんにグラフを出力できます。

また,RにはR Markdownと呼ばれるドキュメント作成の機能があります。R Markdownでドキュメントを記述すれば,RStudioの[knit]ボタンから,html形式やpdf形式のレポートがすぐに作成できます。ドキュメントにはRのコードを挿入し,グラフの出力結果も含めることができます。分析とドキュメント作成を行うツールがRStudioだけで済みますので,分析の効率が上がることは間違いありません。

おわりに

2018年6月に発売になるRユーザのためのRStudio[実践]入門は,Rの分析フローをワンストップで解説した書籍です。効率的にデータ分析を進めたい方には必見の内容となっています。