書籍概要

改訂新版 前処理大全
SQL/pandas/Polars実践テクニック

著者
発売日
更新日

概要

BigQuery,Pandas,Polarsを使った実用的なモダン前処理を学びましょう!

データ分析において前処理が重要かつ多くの時間をとられる業務であることは広く知られてきました。同時に前処理を実現するためのライブラリは大きく改善されてきています。また,機械学習モデルの進化によって,求められる前処理の内容も変わってきています。本書は,初めて学ぶ方にも昔学んでから知識をアップデートしていない方にも,悪いサンプルコードと良いサンプルコードを紹介しながら丁寧にデータ分析の前処理を学べる技術書です。

本書は,第一版の前処理大全から大きく構成や内容を変更しています。SQLはBigQuery準拠に変更し,Pandasは最新バージョンの思想に沿い新機能を使ったコードに変更しました。Rの代わりにR同様にパイプラインで書きやすくかつ処理エンジンがRustベースで書かれているため高速なPolarsに変更しました。また,前処理内容も大きく変更し,より現在よく使われる処理を実用ケースとともに解説しています。また,新たな試みとしてコラムとして少しマニアックだけど役立つプログラムの裏側の解説や分析テクニックを紹介しており,中級者の方にとっても有用な知識をお届けしています。

こんな方におすすめ

  • データ処理業務に従事するエンジニア
  • データ分析者

目次

Part 1 前処理の基礎知識

  • 第1章 前処理とは
  • 第2章 SQL
  • 第3章 pandas
  • 第4章 Polars

Part 2 データの構造を対象とした前処理

  • 第5章 抽出
  • 第6章 集約
  • 第7章 結合
  • 第8章 分割
  • 第9章 整形

Part 3 データの内容を対象とした前処理

  • 第10章 数値
  • 第11章 カテゴリ
  • 第12章 日時
  • 第13章 文字列
  • 第14章 ウィンドウ関数

Part 4 実践前処理

  • 第15章 演習問題

サポート

現在サポート情報はありません。

商品一覧