はじめMath! Javaでコンピュータ数学

第62回 統計の数学 相関係数とは [前編]

この記事を読むのに必要な時間:およそ 1.5 分

問題 CSVファイルのデータから,紙と鉛筆,電卓を用いて,相関係数を計算しましょう。

データファイルdata001.csvには3つの座標値しかありませんから,相関係数を手で計算するのは大した手間ではありません。手計算でおおよその値を得て,次回の問題のプログラムが正しく実行されたかどうかを確かめるための準備をしておきましょう。

データファイル data001.csv


  • 100,120
  • 200,195
  • 278,280

解説

以下に計算の様子を示します。切りの悪い数字はなるべくきりの良い数字に丸めて概算します。平方根のところだけは概算が煩雑ですし,計算精度をあまり落とさないために電卓を用いました。こうして結果を見立てておくと,プログラムが正しく作られているかどうかの確認を自信を持って行うことが出来ます。この計算結果を見ると,データファイルdata001.csvは非常に相関の高いデータであるといえます。このデータは,グラフにすれば回帰直線の近くで密集するでしょう。

今回はここまで

今回は,相関係数とは何かを大雑把に解説し,相関係数の計算を手計算で実施してみました。次回は測定データから相関係数を求めるプログラムを作成してみましょう。

今回のまとめ

  • 最小二乗法を用いて得られた直線の妥当性を判断する手段として,相関係数を紹介しました。

著者プロフィール

平田敦(ひらたあつし)

地方都市の公立工業高等学校教諭。趣味はプログラミングと日本の端っこ踏破旅行。2010年のLotYはRuby。結城浩氏のような仕事をしたいと妄想する30代後半♂。