新刊ピックアップ

『パーフェクトR』執筆者に聞きました!

この記事を読むのに必要な時間:およそ 1.5 分

統計解析ソフトRの機能が網羅的に執筆されたパーフェクトRがいよいよ発売されます。発売を記念して執筆者8名にアンケートを取り,執筆者の職種やスキル,注目している技術などを見ていきます(複数回答可⁠⁠。どんな結果が得られるでしょうか。

Q1.現在の職種を教えてください

  • 経営者(2票)
  • データアナリスト/データ分析コンサルタント
  • 研究開発職
  • データエンジニアという名のなんでも屋
  • CTO
  • 医師

なんと2名の執筆者が経営に関わっていました。Rユーザは経営も得意なのでしょうか。

Q3.Rを利用する場面を教えてください

  • 統計モデリング(3票)
  • レポーティング(3票)
  • 予測モデル構築(3票)
  • 経営収益分析(2票)
  • とりあえずサクッと集計

やはり,予測モデリング,レポーティングでRは活躍していることが見えます。

Q2.普段業務で使っているプログラミング言語を教えてください

  • R(7票)
  • Python(4票)
  • Go
  • Julia
  • C++
  • ※Excel(2票)

Pythonが堂々の2位。半数の方が業務で使っています。プログラミング言語ではありませんが,Excelの業務利用も外せないようです。

Q4.Rの便利だと思う機能を挙げてください

  • dplyrパッケージ(5票)
  • knitrパッケージ(3票)
  • 可視化(2票)
  • shinyパッケージ(2票)
  • rmarkdownパッケージ(2票)
  • rstanパッケージ
  • magrittrパッケージ
  • 予測モデル作成
  • API
  • バッチ
  • S3クラス

データ整形に欠かせないdplyrパッケージに5票入りました。⁠dplyrは神」との回答もありました。そのほかにもオリジナルのダッシュボードが作成できるshinyパッケージやレポーティングが楽になるknitrパッケージやrmarkdownパッケージに複数の回答がありました。

Q5.Rを利用するときに参考にするWebサイト,文献を教えてください

  • ヘルプドキュメント(4票)
  • Stack Overflow(3票)
  • Google検索(3票)
  • パッケージの公式サイト(2票)
  • 同僚
  • ソースコード
  • データサイエンティスト養成読本 R活用編
  • R-Tips
  • R Internals(Rの実装)
  • r-wakalang
  • ホクソエム

ヘルプドキュメントを読み込む方が多いようです。RのSlackコミュニティ「r-wakalang」も注目すべき回答です。

Q6.いま注目している技術を教えてください

【R関連】
【プログラミング関連】
  • Go言語
  • Julia
  • Rust
  • Nim
【分析関連】
  • オンライン異常検知
  • 因果推論
  • (逆)強化学習
  • SVM(サポートベクターマシン)とBN(ベイジアンネットワーク)のディープラーニングのような計算省略方法による手法の進化に関わる研究
  • ストリーム学習
  • 異常検知
  • 進化計算の分野で自分の博士課程時代の研究が有効かどうか
  • ブロックチェーン
  • 金融系で使えそうな分析技術

この設問にはさまざまな種類の回答がありました。⁠金融系で使えそうな技術」⁠ブロックチェーン」など,Fintech系の話題に注目しているという回答や「オンライン異常検知」「ストリーム学習」などデータ分析にもリアルタイム性が求められている雰囲気を感じさせる回答が得られました。

Q7.パーフェクトRのお勧めの章を教えてください

  • 全部(4票)
  • 1章
  • 3章
  • 20章
  • 24章

アンケートの結果としては全部お勧めということが分かります。


いかがでしたでしょうか。アンケートの中では「Q4.Rの便利だと思う機能を挙げてください」の設問への回答が興味深い結果になりました。⁠データを高速で処理し,可視化して,レポーティングする。」これはRの特長と言って良いでしょう。データ分析の現場で求められる機能がそれぞれ便利なパッケージとして用意されているのがRなのです。Rが統計分析ソフトウェアとして一定の地位を得ていることから,この結果は必然と考えることもできます。本書もこのRの特長を押さえて解説を進めます。以下に目次を掲載します。

Part1 R Overview
  • 1章 R概説
Part2 R言語仕様
  • 2章 R言語の基礎
  • 3章 データ型
  • 4章 式,制御構造
  • 5章 変数
  • 6章 関数
  • Part3 データハンドリング
    • 7章 データ入出力
    • 8章 データ加工
    • Part4 データ可視化
      • 9章 古典的なデータ可視化
      • 10章 モダンなデータ可視化
      • 11章 インタラクティブなデータ可視化
      • Part5 データ分析
        • 12章 データ分析で使用される手法の整理
        • 13章 クラスタリング
        • 14章 クラス分類・回帰
        • 15章 時系列解析
        • 16章 頻出パターンの抽出
        • Part6 実践的な開発
          • 17章 コマンドラインアプリケーション
          • 18章 Webアプリケーション
          • 19章 レポーティング
          • 20章 パッケージ開発
          • 21章 チューニングの原則
          • 22章 パッケージによる高速化
          • 23章 他言語の利用と他言語からの利用
          • 24章 Rcpp

Rの特長を押さえた上で,Rをひと通り使いこなすための知識がまとまっています。ぜひ手にとってご覧ください。