相関係数の有意性検定の比較

昨日は、相関係数のシミュレーションをしてみました。
SEMの相関係数の有意性検定って、なんでZ検定なのかというのが気になって仕方なかったので、トライアンドエラーで、標準誤差の式を発見し(!)しました。数学的なところはすっとばしてるんで、間違えてる可能性はありますけど。
相関係数の標準誤差=  ((r^2+1)/(N-1))^0.5
だと思います。
なお、rは標本相関係数、Nはサンプルサイズです。^2は2乗を、^0.5は平方根を意味しています。
この標準誤差で相関係数を割ってやると、Z値が得られるのです。SEMの最尤法でいろんな相関係数を入れて何度も試してみましたけど、この計算式の結果と完全に一致したので、たぶんあってると思います。
で、普通の方法で検定すると以下のようにt値が得られます。
t値= r*(N-2)^0.5 / (1-r^2)^0.5
この二つの有意確率を見比べたかったので、シミュレーションしてたわけです。すると、普通の方法のほうが、若干有意になりやすいようです。でも、サンプルが十分に大きいと、ほとんど違いはありません。どっちがあってるのかわかりませんが、実用上違いは無いですね。
面白いのは、最尤法では標準誤差は推定値が大きいほど大きくなります。でもちゃんと検定統計量は推定値が大きいほど大きくなるのです。t検定を使う方法は、標準誤差は推定値が大きいほど小さくなります。
そして、通常法では相関係数が1のとき、Nが何人であってもt値は無限大になります。しかし、最尤法の場合、相関係数が1でもZ値は無限大にはなりません。Nが9人未満の場合、相関係数が1でも有意にはならないのです。これは、最尤法が母集団をちゃんと推定してるんだということを示しているのかもしれません。
あー楽しかった。


追記
母相関0の母集団からサイズ500のサンプルを500回収集するシミュレーションをしてみました。
通常法の検定は、500回中28回、5%水準で有意と判断しました。つまり、0.056の危険率でした。
最尤法の検定は、500回中27回、5%水準で有意と判断しました。つまり、0.054の危険率でした。
これから、t検定の結果より、最尤法のほうがいいのかなぁという気がします。まぁ、500回程度のシミュレーションじゃあなんともいませんが。

This entry was posted in 心理統計学. Bookmark the permalink.