markdown
相関と回帰の入口md 0761749
lecture/math/statistics/相関と回帰の入口-講義.n.md
Download as PDF
相関と回帰の入口
mathstatisticshighschoollecture
導入
この講義で最重要なのは、2 変量の統計では、平均や分散を別々に見るだけでなく、「2 つが一緒にどう動くか」を見る必要があるということです。
用語と定義
散布図 は、2 つの量の組を平面に打った図です。
相関係数 は、2 変量の直線的な結びつきの強さを表す量です。
回帰直線 は、散布図の傾向を 1 本の直線で近似するものです。
方針
まず散布図で全体の形を見て、そのあと相関係数で強さを、回帰直線で傾向を表します。
直感的な説明
身長と体重のように、一方が大きいと他方も大きくなりやすい組があります。この「一緒に増えるか」「逆に動くか」「関係が薄いか」を見るのが相関です。
厳密な説明
相関係数 r は -1 から 1 の間の値を取ります。r が 1 に近ければ強い正の相関、-1 に近ければ強い負の相関、0 に近ければ直線的な関係は弱いと見ます。
回帰直線は、各点から直線までのずれをできるだけ小さくするように引かれます。これによって、一方の値から他方の傾向を読み取りやすくなります。
具体例
勉強時間と得点の散布図が右上がりなら、「長く勉強した人ほど高得点になりやすい」という傾向が見えます。ただし、これだけで因果関係が証明されるわけではありません。
見分け方
- 2 種類の量が同時に与えられているなら、まず散布図を考える
- 一緒に増えるかどうかを見たいなら相関
- 値から傾向を予測したいなら回帰
どこまで成り立つか
相関があることと因果関係があることは別です。また、相関係数が捉えるのは主に直線的な関係です。