因果推論入門 〜ミックステープ:基礎から現代的アプローチまで

「因果推論入門」のカバー画像
著者
Scott Cunningham 著
加藤真大かとうまさひろ河中祥吾かわなかしょうご白木紀行しらきのりゆき冨田燿志とみたようじ早川裕太はやかわゆうた兵頭亮介ひょうどうりょうすけ藤田光明ふじたこうめい邊土名朝飛へんとなあさひ森脇大輔もりわきだいすけ安井翔太やすいしょうた 翻訳
定価
4,180円(本体3,800円+税10%)
発売日
2023.5.9
判型
B5変形
頁数
416ページ
ISBN
978-4-297-13417-4 978-4-297-13418-1

概要

因果推論とは、ある要因が何を(どれくらい)引き起こしたのかを判断するためのツールです。本書は、因果推論に関する最近までの進展をまとめ、学生や実務家を対象として、因果関係に関する意味のある回答を導き出すために必要な統計的手法を解説していきます。

本書の最大の特徴は、理論だけでなく、統計プログラミング言語(R、Stata)による実装を重視している点にあります。例題には、読者が利用できるデータとコードが添付されており、すぐに手を動かして実践することができます。本書は機械学習に関するトピックを含まない一方で、理論的な解説が詳細であるほか、DAGや合成コントロール法といった発展的なトピックを扱っています。これらのトピックは、近年の因果推論の理論的進展において重要ですが、入門レベルの書籍において解説している点で希少性があります。

こんな方にオススメ

  • 経済を専攻する学生
  • 実務に因果推論を使おうと考えている方

目次

第1章 導入

  • 1.1 因果推論とは何か
  • 1.2 相関と因果を混同してはいけない
  • 1.3 最適化はすべてを内生化する
  • 1.4 例:需要の価格弾力性の識別
  • 1.5 まとめ

第2章 確率と回帰の概要

  • 2.1 確率論の基礎
  • 2.2 事象と条件付き確率
  • 2.3 確率木
  • 2.4 ベン図と集合
  • 2.5 分割表
  • 2.6 Monty Hall問題
  • 2.7 総和オペレータ
  • 2.8 期待値
  • 2.9 分散
  • 2.10 共分散
  • 2.11 母集団モデル
  • 2.12 平均独立
  • 2.13 最小二乗法
  • 2.14 OLSの代数的な性質
  • 2.15 適合度
  • 2.16 OLSの期待値
  • 2.17 繰り返し期待値の法則
  • 2.18 CEF分解の性質
  • 2.19 CEF予測の性質
  • 2.20 分散分析定理
  • 2.21 線形CEF定理
  • 2.22 最良線形予測定理
  • 2.23 回帰CEF定理
  • 2.24 それで?
  • 2.25 回帰解剖定理
  • 2.26 OLS推定量の分散
  • 2.27 頑健標準誤差
  • 2.28 クラスタ頑健標準誤差

第3章 非巡回的有向グラフ

  • 3.1 DAG 記法の紹介
    • 3.1.1 シンプルなDAG
    • 3.1.2 合流
    • 3.1.3 バックドア基準
    • 3.1.4 合流点バイアスの他の例
    • 3.1.5 差別と合流点バイアス
    • 3.1.6 標本選択と合流点バイアス
    • 3.1.7 合流点バイアスと警察の実力行使
  • 3.2 まとめ

第4章 潜在アウトカム因果モデル

    • 4.0.1 統計的推論
  • 4.1 物理的なランダム化
    • 4.1.1 潜在アウトカム
    • 4.1.2 平均処置効果
    • 4.1.3 平均アウトカムの単純差
    • 4.1.4 独立性の仮定
    • 4.1.5 SUTVA
  • 4.2 ランダム化推論
    • 4.2.1 紅茶を試飲する女性
    • 4.2.2 Fisherのシャープな帰無仮説の方法
    • 4.2.3 p値へのステップ
    • 4.2.4 例
    • 4.2.5 そのほかの検定統計量
    • 4.2.6 大きなnのもとでのランダム化推論
    • 4.2.7 レバレッジ
  • 4.3 まとめ

第5章 マッチングと層別化

  • 5.1 層別化
    • 5.1.1 背景
    • 5.1.2 識別のための仮定
    • 5.1.3 層別化の練習:タイタニックデータセット
    • 5.1.4 次元の呪い
  • 5.2 完全マッチング
  • 5.3 近似マッチング
    • 5.3.1 最近傍共変量マッチング
    • 5.3.2 バイアス補正
    • 5.3.3 傾向スコア法
    • 5.3.4 事例:NSWの職業訓練プログラム
    • 5.3.5 傾向スコアによる重み付け
    • 5.3.6 最近傍マッチング
    • 5.3.7 粗い完全マッチング
  • 5.4 まとめ

第6章 回帰不連続デザイン

  • 6.1 回帰不連続デザインの大流行
    • 6.1.1 復活を待つ
    • 6.1.2 RDDのグラフ表現
    • 6.1.3 百聞は一見に如かず
    • 6.1.4 RDDのデータ要件
  • 6.2 RDDの推定
    • 6.2.1 シャープRDD
    • 6.2.2 連続性の仮定
    • 6.2.3 ローカルおよびグローバルな最小二乗回帰を用いた推定
    • 6.2.4 ノンパラメトリックカーネル
    • 6.2.5 メディケアと国民皆保険
    • 6.2.6 推論
    • 6.2.7 ファジーRDD
  • 6.3 識別への挑戦
    • 6.3.1 McCraryの密度検定
    • 6.3.2 共変量バランステストとプラセボテスト
    • 6.3.3 ランニング変数上での非ランダムな集中
  • 6.4 人気のデザインを再現する:接戦選挙
    • 6.4.1 再現演習
    • 6.4.2 接戦選挙デザインについての結論
  • 6.5 回帰屈折デザイン
  • 6.6 まとめ

第7章 操作変数

  • 7.1 操作変数の歴史:父と息子
  • 7.2 操作変数の直感的説明
    • 7.2.1 標準的な操作変数のDAG
    • 7.2.2 良い操作変数とは奇妙であるべし
  • 7.3 均質な処置効果
    • 7.3.1 2段階最小二乗法
  • 7.4 親のメタンフェタミン乱用と里親制度
  • 7.5 弱い操作変数の問題
  • 7.6 異質な処置効果
  • 7.7 応用例
    • 7.7.1 居住する郡にある大学
    • 7.7.2 フルトン魚市場
  • 7.8 有名な操作変数デザイン
    • 7.8.1 抽選
    • 7.8.2 裁判官固定効果
    • 7.8.3 バーティク操作変数
    • 7.8.4 シフトvsシェア
  • 7.9 まとめ

第8章 パネルデータ

  • 8.1 DAGの例
  • 8.2 推定
    • 8.2.1 プールされたOLS
    • 8.2.2 固定効果(群内)推定量
    • 8.2.3 識別のための仮定
    • 8.2.4 注意1:固定効果は逆の因果関係を解決できない
    • 8.2.5 注意2:固定効果は時間を通じて変化する未観測の異質性に対処できない
    • 8.2.6 結婚のリターンと未観測の異質性
  • 8.3 演習:成人向けサービス提供者の調査
  • 8.4 まとめ

第9章 差分の差デザイン

  • 9.1 John Snowのコレラ仮説
    • 9.1.1 表XII
  • 9.2 推定
    • 9.2.1 簡単な表による説明
    • 9.2.2 単純な2 × 2差分の差デザイン
    • 9.2.3 差分の差デザインと最低賃金
  • 9.3 推論
    • 9.3.1 ブロックブートストラップ
    • 9.3.2 集計
    • 9.3.3 クラスタリング
  • 9.4 イベントスタディや平行リードによる平行トレンドの証拠の提供
    • 9.4.1 処置前の平行トレンドのもとで差分の差デザインの係数について、(一つでは足りないと思ったので)もう一つ余計なことを書いておきます
    • 9.4.2 処置群とコントロール群の処置前バランスのチェック
    • 9.4.3 アフォーダブルケアアクト、メディケイドの拡大と人口死亡率
  • 9.5 差分の差デザインの識別戦略におけるプラセボの重要性
    • 9.5.1 三重差分デザイン
    • 9.5.2 州が義務付ける出産手当金
    • 9.5.3 中絶合法化と長期的な淋病の発生率
    • 9.5.4 Cunningham and Cornwell(2013)を超えて
    • 9.5.5 批判としてのプラセボ
    • 9.5.6 繰り返しクロスセクションデータにおける構成の変化
    • 9.5.7 最終的な考察
  • 9.6 異なるタイミングでの処置をともなう二元配置固定効果
    • 9.6.1 Bacon分解定理
    • 9.6.2 分解の潜在アウトカムによる表現
    • 9.6.3 分散で重み付けられたATT
    • 9.6.4 分散で重み付けられた共通トレンド
    • 9.6.5 時間上でのATT の異質性によるバイアス!
    • 9.6.6 城の原則法と殺人事件
    • 9.6.7 Cheng and Hoekstra(2013)の再現のようなもの
    • 9.6.8 Bacon分解
    • 9.6.9 差分の差デザインの未来
  • 9.7 まとめ

第10章 合成コントロール法

  • 10.1 比較事例分析の導入
    • 10.1.1 キューバ、マイアミ、そしてマリエルボートリフト
    • 10.1.2 合成コントロールを選ぶ
    • 10.1.3 定式化
    • 10.1.4 カリフォルニア州プロポジション99
    • 10.1.5 反証
  • 10.2 刑務所の建設と黒人男性の収容
  • 10.3 まとめ

第11章 結論

プロフィール

加藤真大かとうまさひろ

東京大学経済学研究科を中退後、2020年に東京大学情報理工学系研究科を修了。2020年株式会社サイバーエージェントに入社。機械学習や計量経済学の手法の研究開発に従事。

河中祥吾かわなかしょうご

2021年奈良先端科学技術大学院大学先端技術研究科博士課程修了後、サイバーエージェント入社。小売領域におけるグロースマーケティングに向けた分析・効果検証およびデータ基盤構築に従事。

白木紀行しらきのりゆき

2009年慶應義塾大学大学院修士課程修了後、日本銀行入行。日本経済や金融市場の分析・予測、金融政策や国際金融規制の効果検証などに携わる。2021年株式会社サイバーエージェント入社。Data Science Center小売DXLab室長として、機械学習や統計モデリングの手法を用いたコンサルティング・研究に従事。2023年より厚生労働省政策企画官として、EBPMや統計業務の改善に取り組む。

冨田燿志とみたようじ

2019年東京大学大学院経済学研究科修士課程修了、2020年サイバーエージェント入社。AI Lab経済学社会実装チームにて、マーケットデザインの研究・社会実装に取り組む。主な興味分野は、ゲーム理論、マッチング理論、マーケットデザイン、およびそれらの応用・社会実装。

早川裕太はやかわゆうた

2019年東京工業大学情報理工学院修士課程修了後、サイバーエージェント入社。アドテク領域にて分析及び研究開発に従事。2020年より小売との協業事業において、POSデータを活用した広告配信プロダクトの立ち上げに参画。現在も小売企業のデータを用いたデジタルマーケティングの改善やリテールメディア化の推進に取り組む。

兵頭亮介ひょうどうりょうすけ

2021年早稲田大学基幹理工学研究科修士課程修了後、サイバーエージェント入社。小売との協業事業において、データサイエンスや機械学習の応用に取り組む。主な興味は、定量・定性データおよび機械学習を用いた産業領域のグロース。

藤田光明ふじたこうめい

2018年東京大学経済学研究科修士課程修了後、サイバーエージェント入社。AI事業本部Dynalystにて広告配信アルゴリズムの開発・実装やチームマネジメント、研究開発に従事し、研究組織AI Labとの共著論文はWWWなどの国際学会に採択。現在は小売DX領域にて、経済学を活用した新規事業の立ち上げ中。

邊土名朝飛へんとなあさひ

2021年長岡技術科学大学大学院工学研究科修士課程修了後、サイバーエージェント入社。同子会社の株式会社AI Shift、およびAI Labにて音声対話システムの研究開発に従事。

森脇大輔もりわきだいすけ

2006年東京大学経済学部卒業、内閣府入府。経済対策のとりまとめ、国会対応、経済財政白書や月例経済報告の作成、統計改革などに携わる。2017年株式会社サイバーエージェントに中途入社。研究開発組織AI Labにおいて、経済学やデータサイエンス、機械学習を用いたアルゴリズム開発、社会実装プロジェクトを実施。2021年より経済学社会実装チームリーダー。EBPM推進のためのプラットフォーム「EBPMデータベース」管理人。経済学博士(ニューヨーク州立大学アルバニー校)。著書:『少子高齢社会における世代間移転と家族』(共著、日本評論社, 2020年)

安井翔太やすいしょうた

2011年、立教大学経済学部卒業。2013年、ノルウェー経済大学修士課程修了後、サイバーエージェント入社。入社後は広告代理店で広告効果検証等を行い、2015年にアドテクスタジオへ異動。その後は機械学習の応用や、機械学習が使われている状況下でのデータ分析や効果検証を主な業務とする。2016年よりAI Lab経済学グループを設立。2019年よりData Science Center副所長も務める。2022年より主席データサイエンティスト。

著書:『効果検証入門』(技術評論社、2020年)『施策デザインのための機械学習入門』(技術評論社、2021年)