はじめMath! Javaでコンピュータ数学

第59回 統計の数学 回帰直線[前編]

この記事を読むのに必要な時間:およそ 1.5 分

散布図のデータをつなぐ直線を右クリックすると,図59.6のようなポップアップメニューが表示されます。このメニューから「オブジェクトの属性」を選択してください。

図59.6 散布図のデータ曲線を右クリックしたところ

図59.6 散布図のデータ曲線を右クリックしたところ

図58.7のダイアログが表示されますので,⁠統計」タブを選択し,右下の「線形回帰」をクリック,⁠OK」ボタンをクリックしてください。

図59.7 ⁠オブジェクトの属性」を選択して表示されたダイアログ

図59.7 「オブジェクトの属性」を選択して表示されたダイアログ

表示された回帰直線を右クリックすると,図58.8のポップアップメニューが表示されます。この中の「回帰曲線等式の挿入」を選択しましょう。

図59.8 回帰直線を右クリックし,ポップアップメニューから回帰曲線等式の挿入を選択

図59.8 回帰直線を右クリックし,ポップアップメニューから回帰曲線等式の挿入を選択

上記の手順で作成されたグラフが図58.9です。

図59.9 回帰直線の例 テストデータを用いてOpenOfficeのCalcで回帰直線を描いたところ

図59.9 回帰直線の例 テストデータを用いてOpenOfficeのCalcで回帰直線を描いたところ

Officeソフトを使えば,以上のようにして手軽に回帰直線を得ることが出来ます。出力も美しいですから,ほとんどの場合はこれで事足りることでしょう。この程度のデータ数,また単にグラフが欲しいだけでしたら,自分でプログラムを作るまでもありません。

今回はここまで

今回は,ばらついてはいるが,ある直線的な傾向を示しているデータ群から,その傾向を示す一次等式,回帰直線をオフィスソフトを利用して手軽に得る方法を紹介しました。次回は,回帰直線を得る方法を詳しく学び,Java言語でグラフを描いてみましょう。

今回のまとめ

  • 線形回帰とは何かを学びました。
  • OpenOfficeのCalcで回帰直線を得る方法を学びました。

コラム 回帰直線の回帰とは?

最小二乗法を用いて見いだした一次方程式,直線の式のことを回帰直線と呼びます。しかし,回帰,という言葉,不思議だと思いませんか?どうして回帰なんて呼ぶのでしょう。

遺伝学者のゴールトンは1885年に王立人類学研究所で,親の身長と,その子が成人した時の身長の統計データを発表しました。親の身長を横軸に,子の身長を縦軸にとると,ばらつきこそあるがある一定の傾向を示しているというのです。データのばらつきが最小限になるよう,およそ全てのデータに対して最も近い直線を引くと,その直線の傾きは1より小さかったのです。

傾きが1より小さい,ということは,グラフは「小さな親からは大きな子供が,大きな親からは小さな子供が生まれている」ということを示しています。つまり,親が小さくとも,子供がそれより大きくなることで,世代を経ても極端に小さな人ばかりが生まれないという仕組みがあるようなのです。親の身長が大きくとも,その子は親よりは小さいことが多いので,世代を経ても極端に大きな人が生まれないようです。これをゴールトンは「先祖返り」「先祖への回帰」と考え,回帰現象と名付けました。それ以来,統計データから得られた直線のことを回帰直線と呼ぶようになったそうです。なるほど,⁠回帰」という言葉には,そんないわれがあったのですね。

しかし,それにしても,大きな親からは大きな子供が生まれるのでは?というのが「何となく」常識として思っていましたが,そうでもないのですね。

参考
『やさしい統計入門 視聴率調査から多変量解析まで』田栗正章・藤越康祝共著 ブルーバックスB-1557 講談社刊

著者プロフィール

平田敦(ひらたあつし)

地方都市の公立工業高等学校教諭。趣味はプログラミングと日本の端っこ踏破旅行。2010年のLotYはRuby。結城浩氏のような仕事をしたいと妄想する30代後半♂。