機械学習を解釈する技術
〜予測力と説明力を両立する実践テクニック
2021年8月4日紙版発売
2021年7月30日電子版発売
森下光之助 著
A5判/256ページ
定価2,948円(本体2,680円+税10%)
ISBN 978-4-297-12226-3
書籍の概要
この本の概要
機械学習の研究開発が急速な勢いで進んでいます。理論研究はもちろん,機械学習手法が実装されたオープンソースのパッケージ開発も進み,それらを実務で利用するためのノウハウも蓄積されてきています。結果として,機械学習をはじめたばかりの入門者でも比較的高い精度の予測モデルを構築できるようになりました。
Deep Learning, Gradient Boosting Decision Tree, Random Forestなどの機械学習モデルは高い予測精度を誇りますが,モデルの解釈性が低いという欠点があります。これらの複雑なブラックボックスモデルにおいて,モデルがなぜそのような予測を行っているのかを知ることは困難ですが,データ分析者自身がモデルの振る舞いを把握し,説明責任を果たすことを実務においては頻繁に求められます。
本書では,このような予測精度と解釈性のトレードオフを克服するための手法について,実務において特に有用と考えるものを厳選して紹介します。
本書の構成は以下になります。
1章: 機械学習の解釈性とは
2章: 線形回帰モデルを通して「解釈性」を理解する
3章: 特徴量の重要度を知る〜Permutation Feature Importance〜
4章: 特徴量と予測値の関係を知る〜Partial Dependence〜
5章: インスタンスごとの異質性を捉える〜Individual Conditional Expectation〜
6章: 予測の理由を考える〜SHapley Additive exPlanations〜
付録A: R による分析例~ tidymodelsとDALEXで機械学習モデルを解釈する~
付録B: 機械学習の解釈手法で線形回帰モデルを解釈する
2章では極めて高い解釈性を誇る線形回帰モデルを通して,予測モデルに求められる解釈性について説明します。以降の4つの章では,それらの解釈性をブラックボックスモデルに与えるPFI, PD, ICE, SHAPと呼ばれる手法について解説します。
本書は機械学習の解釈手法を実用して頂くことを目的としています。Pythonでゼロから手法を実装することを通じて解釈手法のアルゴリズムを理解し,実データの分析を通じて解釈手法の勘所を押さえて頂きます。機械学習の解釈手法は強力な反面,使い方を誤ると間違った結論を導いてしまう危険もあります。本書では解釈手法を実用する際の注意点についても丁寧に触れています。
こんな方におすすめ
- 機械学習エンジニア
- データサイエンティスト
- 機械学習エンジニア,データサイエンティスト職を志望する学生
この書籍に関連する記事があります!
- 第2回 実務における機械学習の解釈手法と因果推論の位置づけ
- 2021年8月に発売された『機械学習を解釈する技術』の著者である森下光之助氏と『施策デザインのための機械学習入門』を共著した齋藤優太氏,安井翔太氏の3人が集まり,執筆の経緯や書籍への想いについて3回にわたって語る第2回。
- 第3回 研究を実務に活かすには ―執筆陣がお勧めする書籍の「使いどころ」
- 2021年8月に発売された『機械学習を解釈する技術』の著者である森下光之助氏と『施策デザインのための機械学習入門』を共著した齋藤優太氏,安井翔太氏の3人が集まり,執筆の経緯や書籍への想いについて語る,今回はその最終回です。
この本に関連する書籍
-
データのつながりを活かす技術 〜ネットワーク/グラフデータの機械学習から得られる新視点
ネットワークデータは,点と点の「つながり」によって表現されるデータです。決して特別なデータではなく,私たちの日常生活のさまざまな場面に存在しています。たとえ...
-
Rユーザのためのtidymodels[実践]入門 〜モダンな統計・機械学習モデリングの世界
Rには多くの分析手法を実行するパッケージが提供されていますが,同じ用途であってもパッケージごとに関数の記法が違ったり,データの入力形式や出力形式が違ったりする...
-
施策デザインのための機械学習入門 〜データ分析技術のビジネス活用における正しい考え方
予測に基づいた広告配信や商品推薦など,ビジネス施策の個別化や高性能化のために機械学習を利用することが一般的になってきています。その一方で,多くの機械学習エン...
-
データ活用のための数理モデリング入門
データが価値を生み出す資源として脚光を浴び,ソフトウェアで手軽にデータ分析ができる時代を迎えました。一般の企業/組織では,機械学習や統計モデリングなどの数理...
-
効果検証入門 ~正しい比較のための因果推論/計量経済学の基礎
ビジネスで利用されるデータの多くは,その施策の意思決定を行う人物や組織の目的にそった活動の延長上で作られています。具体的には,DM送付などの広告施策であれば,...