SSブログ

統計 相関係数についてのお話 [ネコ騙し数学]

統計 相関係数についてのお話


例えば、下の表に示すXYのデータがあるとする。



このデータをもとに下の表を作り、平均、(共)分散、標準偏差を求める。




なお、上の表でE(x)E(y)は、xyの平均(期待値)であり、

  

である。
したがって、相関係数は

  


あるいは、共分散xyの標準偏差を用いて

  

である。


statics-yodan-graph-01.png以上のことから、

回帰直線の傾きa

  

y切片b

  

したがって、回帰直線の方程式は

  

である。

したがって、このxyの間には正の相関がある。



もっともらしく聞こえることだろう。

しかし、この(x,y)の値はコンピュータ上で乱数を発生させたもので、このxyには何の関係(無相関)もない。
この例のように、xy010の値をとるまったくランダムな変数にもかかわらず、データの数が少ないと、相関係数を計算すると相関があるかのような結果が出ることがある。


なお、相関係数によって、相関の強さは、たとえば、次のように分類される。

statics-yodan-tab-03.png

これはおおよその目安であり、本によって分類の仕方が異なるので、あくまで一例である。


statics-yodan-graph-02.png次に、データの数を10組から200組に増やすと(上の例は、最初の10組を抜き出したもの)、散布図は右図のようになる。
この結果を見ると、xyの間に相関がない、無相関であることがわかると思う。


母集団の相関係数ρ=0のときでも、(標本の)相関係数rを計算をすると、r=0.5程度の値が出ることがあるので、相関係数rを計算しただけで相関の有無を判断することは危険という話でした。


 


タグ:統計
nice!(0)  コメント(0)  トラックバック(1) 

nice! 0

コメント 0

コメントを書く

お名前:
URL:
コメント:
画像認証:
下の画像に表示されている文字を入力してください。

トラックバック 1

この広告は前回の更新から一定期間経過したブログに表示されています。更新すると自動で解除されます。