この記事を読むのに必要な時間:およそ 1 分
「Harvard Business Review」2012年10月号で"Data Scientist:The Sexiest Job of the 21st Century”(データサイエンティストは21世紀で最もセクシーな職業)として取り上げられ,「データサイエンティスト」が新しい職種として注目を浴びてからもうすぐ4年が経とうとしています。
「セクシー」として取り上げられたデータサイエンティストは,多くの人が就きたい職業として注目を浴びることになりました。ビッグデータというキーワードもそれ以前から流行していましたので,企業がデータ分析できる人材を探す時期ともマッチしていました。ふだんデータに関わることのあるエンジニアやマーケッターだけでなく,さまざまな人たちがデータサイエンティスト職を志望したのです。
しかし,実際の仕事は泥臭い作業が多く,プログラミング技術も必要です。これらは,すでにデータ分析を仕事にしている方々からは明確な事実でしたが,志望者の多くは自分のスキルとのギャップに戸惑うことになります。メディアはデータサイエンティストを注目の職業として取り上げ続けたためバズワード化する一方で,ギャップの激しさを嘲笑して本当のデータサインティストのスキルを持つ人はいない,とまで言われることにもなります。
このギャップを埋められなかった原因のひとつに,データサイエンティスト志望者に対して適切な書籍が提供されなかったことが挙げられます(もちろん原因はほかにも考えられます)。種種雑多なデータを扱うデータサイエンティストはそれを整形して活用するためのプログラミングや統計知識が必要です。具体的にはRやPythonといったプログラミング言語のスキル,基本的な統計解析の知識にあわせて最近では機械学習の知識も必要になっているかもしれません。技術的な内容に触れていない書籍をたよりにデータサイエンティストを志した方は,残念としか言いようがありません。
2013年に刊行したデータサインティスト養成読本は,データサイエンティストのスキルをまとめ,プログラミングのコードを掲載しながらどのようにデータ分析を進めていくかをいちはやく解説しました。なかには「難しすぎる」との声もありましたが,実務でデータ分析をしている執筆者陣がどのようなツールや手法を使っているか垣間見ることができ,本気でデータサイエンティストを目指す方への最初の1冊としてはちょうど良かったのだと思います。あらためて本書の目次を掲載します。
- 巻頭企画 データサイエンティストの仕事術
- 第1章 データサイエンティストに必要なスキル
- 第2章 データサイエンスのプロセス
- 第3章 「ビッグデータインフラ」入門
- 特集1 データ分析実践入門
- 第1章 Rで統計解析をはじめよう
- 第2章 RStudioでらくらくデータ分析
- 第3章 Pythonによる機械学習
- 第4章 データマイニングに必要な11のアルゴリズム
- 特集2 マーケティング分析本格入門
- 第1章 Rによるマーケティング分析
- 第2章 mixiにおける大規模データマイニング事例
- 第3章 ソーシャルメディアネットワーク分析
- 特別記事 Fluentd入門
- 特別企画 データ分析のためにこれだけは覚えておきたい基礎知識
- 第1章 SQL入門
- 第2章 Webスクレイピング入門
- 第3章 Tableau実践入門
いかに幅広い知識が必要か分かると思います。もちろん本書だけでは満足なスキルが得られるとは限りません。これでスキルの概観ができたら興味の持てたところから掘り下げていくのが良いでしょう。データサイエンティスト養成読本のシリーズラインナップとして,機械学習入門編とR活用編があります。「機械学習入門編」は前半(第一部)で機械学習のアルゴリズムやビジネスの応用方法,流行の深層学習などに触れ,後半(第二部)ではPythonをつかった機械学習,画像認識,推薦エンジンの構築などを解説しながら,手を動かして試すことができるようになっています。「R活用編」はデータ分析ソフトウェアとして一定の地位を得たRの活用方法を解説します。この2冊も現在のデータ分析事情をおさえるにはお勧めですので,機会があれば手にとってみてください。
データサイエンティストはけして幻の職業ではありません。本書の執筆者もデータサイエンティストとして活躍している方々ですが,それぞれ得意なジャンルも所属する業種もバラバラな印象を持ちます。最低限のスキルを持った上で,自分の得意なジャンルで勝負しているデータサイエンティストが多いのかもしれません。
「結局プログラミングの知識が必要なのか」と思わない限りデータサイエンティストの道は開けています。本書を参考にしてデータ分析の一歩を踏み出してください。