データ分析の世界は広く、
- 実務で使える場面が多い、実用性の高い手法であること
- 教師なし学習や統計モデリングなど、発展的な機械学習・
統計手法を学ぶのに適した題材 であること
この記事では、異常検知がなぜデータ分析スキルを広げるのに最適なのか、そして本書がどのようにその学びをサポートするかを紹介します。
異常検知は「実務で使える」テーマ
ビジネスにおいて
熱中症を例に挙げると、次の図のように気象データをもとに異常を検知して早期に対策することで、健康被害のリスクを未然に防ぐことができます。
損失防止というメリットにダイレクトに寄与する異常検知は、製造業・
異常検知は「機械学習・統計の学びを深められる題材」でもある
データ分析の基礎を身につけた方が次に悩むのが、より発展的な内容をどのように学ぶかです。
たとえば機械学習では、まず線形回帰やランダムフォレストのような教師あり学習を学ぶことが一般的ですが、次のステップとして人気があるのが、密度推定やクラスタリングのような教師なし学習です。東京大学のデータサイエンス養成プログラムでも、教師あり学習の直後に教師なし学習を学ぶ構成となっています。
一方で、予測というわかりやすい目的を持つ教師あり学習と比べ、教師なし学習は
また統計分野においても、発展的な学習対象として人気が高い統計モデリング・
10月27日発売の
実践で直面する課題にも対応
本書ではこのような手法の紹介に加え、異常検知を現場で活かすために避けては通れない課題とその解決策を、実例を交えながら丁寧に解説しています。
- 異常データが十分に集められない
- 計数
(カウント) データで誤判定が増えやすい - 変数が多く、どれをモデルに入れるべきか分からない
- 時間の経過でモデルの性能が落ちる
(モデルドリフト)
これらの問題に向かい合いながら、実務で使える
Pythonで実装しながら学べる!
サポートページでは、書籍の内容に対応したJupyter Notebook形式のサンプルコードを多数公開しています。読むだけでなく
また書籍中では扱いきれなかった内容を理論を中心に解説しており、異常検知や統計・
異常検知でデータ分析の「次のステップ」へ
このように本書は、
ちなみに、来年度には画像を対象とした深層学習による異常検知を扱う
- プロフィール
中村謙太
Qiita
(@c60evaporator) などの技術発信プラットフォームで、Pythonを用いた機械学習、クラウド、IoTの記事を多数公開。