書籍概要

数値シミュレーションで読み解く統計のしくみ
Rでためしてわかる心理統計

著者
発売日
更新日

概要

心理学における研究の最前線では,高度な数理統計モデルが利用されており,学生にとっては学部で学んだ統計の知識だけでは最新の論文やレポートを読解することができません。また,統計の誤用を原因とする「再現性問題」はたびたび話題にあがり,研究者であっても正しく統計モデルを使用することが求められています。これらの問題を受けて,心理統計における数理的な基礎概念を学び直すべきであるという機運は高まっています。

しかし,数学理論をもとにした抽象的な議論や統計の誤用のもととなる倫理的な指摘は実感を持って理解しにくく,具体的かつ直感的に理解するには工夫が必要です。そこで本書は,数学的な仮定や理論を「目に見えて」「具体的な」ものとしてとらえるために,プログラミングによる数値シミュレーションを利用して解説します。数値シミュレーションによる解説の利点は2つ挙げられます。1つは抽象的な概念をイメージしやすいグラフに落とし込むことができます。もう1つは具体的に操作できる世界を与えることによって,パラメータが変わればどのような結果が導かれるのかが理解しやすくなることです。

これによって,統計の基本となる確率分布の性質と使い方,統計モデルを誤用すると何が起きるか,実験に妥当なデータの量はどれくらいなのか,といった今押さえておきたい知識を1冊にまとめます。

こんな方におすすめ

  • 統計を学んだはずなのに自信がない方
  • 統計の実践にあたって不安のある方
  • 統計に苦手意識のある方

目次

第1章 本書のねらい

  • 1.1 はじめに
  • 1.2 シミュレーションとは
  • 1.3 シミュレーションでわかること
  • 1.4 プログラミングをはじめよう
  • 1.5 本書の構成
  • 1.6 本書のねらいと使い方

第2章 プログラミングの基礎

  • 2.1 言語の基礎
  • 2.2 オブジェクトと変数の種類
  • Column パイプ演算子の活用
  • 2.3 関数をつくる
  • Column Rによるプロット
  • 2.4 プログラミングの基礎
  • Column コード規約
  • Column 実行時間
  • 2.5 演習問題

第3章 乱数生成シミュレーションの基礎

  • 3.1 確率変数と確率分布
  • Column 非復元抽出
  • 3.2 確率分布の期待値と分散
  • Column 正規分布の再生性
  • 3.3 乱数生成シミュレーションで確率分布を模倣する
  • Column t分布とF分布の関係
  • 3.4 任意の相関係数を持つ変数が従う確率分布
  • 3.5 演習問題

第4章 母数の推定のシミュレーション

  • 4.1 統計的推測の基礎
  • 4.2 母平均の信頼区間
  • Column 母分散を必要としない統計量Tの導出
  • 4.3 相関係数の標本分布と信頼区間
  • 4.4 演習問題

第5章 統計的検定の論理とエラー確率のコントロール

  • 5.1 統計的検定の論理
  • 5.2 Rによる統計的検定の実際
  • 5.3 エラー確率のシミュレーション
  • 5.4 一元配置分散分析のデータ生成
  • 5.5 反復測定分散分析のシミュレーション
  • 5.6 演習問題

第6章 適切な検定のためのサンプルサイズ設計

  • 6.1 統計的検定とQRPs
  • 6.2 タイプⅡエラー確率のコントロールとサンプルサイズ設計
  • 6.3 サンプルサイズ設計の実践
  • 6.4 いろいろな検定におけるサンプルサイズ設計の実践
  • 6.5 非心分布を使わないサンプルサイズ設計のシミュレーション
  • 6.6 演習問題

第7章 回帰分析とシミュレーション

  • 7.1 回帰分析と確率モデル
  • 7.2 シミュレーションデータで統計指標の意味を理解する
  • 7.3 回帰分析における仮定と注意点
  • 7.4 発展的な課題
  • 7.5 確率モデリングへ
  • 7.6 演習問題

サポート

正誤表

本書の以下の部分に誤りがありました。ここに訂正するとともに,ご迷惑をおかけしたことを深くお詫び申し上げます。

また,最新の正誤表については,以下のWebサイト(GitHubリポジトリ)を参考にしてください。
https://github.com/ghmagazine/simulation_stats_book#正誤表

(2023年9月19日最終更新)

P.6  Rコード

n <- 2500
n <- 25

「00」は不要です。

P.18 7行目

BはAと同じくxを3列2行に
BはAと同じくxを32

P.18 Rの出力の要素

0
1から24までの数字が順に入ります。

P.104 Rコード最後の行内

df(line_x,df1 = nu_1, df2= nu_2)
df(line_x,df1 = 1, df2= nu)

「nu_」「_2」は不要です。

P.134 Rコード

var_p
var_p()

P.182 Rコード

t.test(sample_r)$conf.int[1:2]
cor.test(dat_obs[, 1], dat_obs[, 2])$conf.int[1:2]

P.181

パーセンタイル信頼区間の方が広くなっています。
パーセンタイル信頼区間の方が狭くなっています。

P.182 FisherのZ変換の下限

0.4973
0.4217412

P.182 FisherのZ変換の上限

0.5011
0.5897387

ダウンロード

以下のGitHubリポジトリから,本書のサンプルコードをダウンロードできます(GitHubへのアカウント登録が必要です)。

(2023年9月19日更新)

数値シミュレーションで読み解く統計の仕組み・サポートサイト
https://github.com/ghmagazine/simulation_stats_book

商品一覧