Kaggleで勝つデータ分析の技術
2019年10月9日紙版発売
2019年10月9日電子版発売
門脇大輔,阪田隆司,保坂桂佑,平松雄司 著
B5変形判/424ページ
定価3,608円(本体3,280円+税10%)
ISBN 978-4-297-10843-4
書籍の概要
この本の概要
データサイエンスの認知の高まりとともに,データ分析に関するコンペティションが多数開催されるようになってきました。最も有名なコンペティションプラットフォームであるKaggleにおけるプレイヤー数は10万人を超え,多くのエンジニアが自分の腕を試すためにコンペティションに参加しています。分析コンペでは,実際のデータを扱うため,機械学習の解説書にはあまり載っていないような手法やテクニックが数多く活用されています。これらを理解し自身で使えるようにしておくことはコンペだけでなく,実務でのモデル構築において非常に役に立ちます。
そこでこれらのテクニックや事例を多くの人に知っていただくために,現時点で最新のものを整理して本書にまとめました。特徴量の作り方,バリデーション,パラメータチューニングなどについて,一般的な書籍ではあまり言及されない暗黙知やポイントについて記述しています。分析コンペにこれから参加してみたい方,あるいはもっと上を目指したい方だけでなく,実務で予測モデルの精度を上げたいという方にも参考になる情報が多いでしょう。
こんな方におすすめ
- Kaggle をはじめたい方、データ分析者、データサイエンティスト
この書籍に関連する記事があります!
- データ分析コンペとは
- データサイエンスの認知の高まりとともに,データ分析のコンペティションが多数開催されるようになってきました。
- データサイエンティストへの登竜門!DS検定の紹介
- 私たちの身の回りは,データに溢れています。データが蓄積されるにつれ,有効に活用し,課題を解決に導くスペシャリストが求められるようになりました。データサイエンティスト検定(DS検定)は,こうした状況の中でデータサイエンティストとして活躍していくために必要なスキルを持っているか証明する試験です。
この本に関連する書籍
-
改訂新版 前処理大全 〜SQL/pandas/Polars実践テクニック
BigQuery,Pandas,Polarsを使った実用的なモダン前処理を学びましょう! データ分析において前処理が重要かつ多くの時間をとられる業務であることは広く知られてき...
-
科学で迫る勝敗の法則 ――スポーツデータ分析の最前線
「データを見て楽しむ」,こんなスポーツの楽しみ方はいかがでしょう! 近年,親密さを深めつつあるスポーツとデータ。本書は野球,サッカー,バスケ,ラグビー,バレ...
-
評価指標入門 〜データサイエンスとビジネスをつなぐ架け橋
「評価指標でXXXという最高のスコアが出た!」と喜び勇んで,機械学習モデルが出力してくる予測結果をもとにビジネスを運用したとします。 ところが,ビジネス上のKPIと...
-
効果検証入門 ~正しい比較のための因果推論/計量経済学の基礎
ビジネスで利用されるデータの多くは,その施策の意思決定を行う人物や組織の目的にそった活動の延長上で作られています。具体的には,DM送付などの広告施策であれば,...
-
わけがわかる機械学習 ─現実の問題を解くために、しくみを理解する
機械学習が話題に上ることも増えてきましたが,実際には手っ取り早くできるものではなく,ライブラリを使うだけではやりたいことをうまく実現できません。もとになる考...
-
RとPythonで学ぶ[実践的]データサイエンス&機械学習
本書は野村総合研究所のシステムコンサルティング事業本部で実施している「アナリティクス研修」をベースにした書籍で,「統計的なモデリングとは何か?」「モデルに基...
-
前処理大全[データ分析のためのSQL/R/Python実践テクニック]
データサイエンスの現場において,その業務は「前処理」と呼ばれるデータの整形に多くの時間を費やすと言われています。「前処理」を効率よくこなすことで,予測モデル...