分析のいろんな仮定と,それに対する頑健さ・対処法

 
 
 

 

統計分析にはいろんな「仮定」があります。例えば,t検定はデータが正規分布である必要がある,などなど。しかし,仮定を満たさないからといって,その方法が全く使えなくなるとは限りません。

そこで,よく使われる統計手法の仮定と,それらに対する頑健さ,つまりどれぐらい逸脱を許容できるのかについてまとめておきます。

また,仮定の逸脱に対して脆弱なものにたいして,どのような対処が可能かについても書いておきます。

ただ,この記事で書いているいくつかの基準は,ただの目安なので盲目的に信じないでください。僕は統計の専門家ではないので,「ああ,そんな感じなのね」的に受け取ってもらえればと思います。

 

二群の平均値の差の検定(t検定)

いわゆるt検定の仮定は,3つあります。

・母集団が正規分布に従っている(母集団の正規性の仮定)
・二群の分散が等しい(分散の均一性の仮定)
・サンプルが独立に抽出されている(サンプルの独立性の仮定)

まず,母集団の正規性,あるいはデータの正規性については,t検定は頑健だといわれています。それは,サンプルサイズが十分大きければ,母集団が正規分布でなくとも,推定する差の分布は正規分布に近づくからです(中心極限定理)。

中心極限定理とは,母集団の平均値を推定するための誤差の分布は,母集団がどんな分布であったとしても,正規分布に近づいていく,という性質を示しています。ただし,ある程度サンプルサイズが大きい必要があります。ただサンプルサイズは30以上であれば,十分大きいと考えてもよいようです。つまり,データが間隔尺度でサンプルサイズが大きければ,ノンパラ検定は使う必要はない,ということです。しかしサンプルサイズが小さい場合は,正規性の検定をすることも必要かもしれません。

次に,二群の分散が等しい,つまり分散の均一性の仮定の逸脱に対して,t検定は脆弱です。つまり,この仮定が満たされていないと誤った検定結果になってしまうことがわかっています。よく等分散の検定を行ってからt検定をする,というのを習った人もいるかと思いますが,それは忘れてください。最近では,常にWelchの検定を行うのがよいということが言われています。また,異分散の場合は,ノンパラ検定よりもWelch検定のほうがよいそうです。

最後に,サンプルの独立性の仮定の逸脱に対して,t検定は脆弱です。この仮定が満たされない時は,いわゆる二段抽出法や,グループ単位にデータを取る,などの方法によってデータ収集がなされている場合だと思います。この問題を解決するためには,回帰分析のところに書いてある(下記参照),クラスタ標準誤差を用います。あるいは,Mixedモデルを利用するといいでしょう。

これらのことから,t検定を行うために,正規性の検定や等分散の検定などは使う必要はあまりないことがわかります。とくに等分散の検定は積極的に行うべきではないです(検定の多重性のため)。つねにWelchの検定を使い,サンプルが独立でない場合はクラスタ標準誤差を利用しましょう。クラスタ標準誤差はWelchの検定と同様,不均一分散に対しても補正をしているので有効です。ただし,サンプルサイズが小さいなら,正規性は意識したほうがいいです。

※もし母集団が正規分布に従っていることが仮定できるなら,サンプルサイズは小さくてもt検定は成り立ちます。5人とか10人でもt検定は威力を発揮します。すげぇ,t検定。

 

分散分析(参加者間計画)

参加者間計画の分散分析の仮定は,t検定と同じです。つまり,正規性に対しては頑健ですが,不均一分散や非独立性には脆弱です。

一要因計画なら,Welchの分散分析というのがあります。常にこれを使うのがいいでしょう。二要因計画以上の場合にはWelchのような補正方法はありません。ただし,頑健標準誤差を用いた階層的重回帰分析を使えば,一応は不均一分散を補正した主効果・交互作用の検定ができます。

ネストされたデータの場合は,参加者内計画を使うか,Mixedモデルを用いるのが有効です。

 

分散分析(参加者内)

参加者内計画の場合は,分散の均一性の仮定の代わりに,球面性の仮定というのがあります。球面性の仮定とは,各群間の差の分散がすべて等しい,という仮定です。この仮定は比較する群が三つ以上の場合に問題となります。二群の場合は問題にはなりません。

球面性の仮定は満たされることがあまりないので,大抵は何らかの補正が必要だと考えておきましょう。よくつかわれるのは,自由度の補正方法で,Greenhouse-Geisserと,Huynh-Feldtの方法が有名です。G-Gのほうが補正が厳しいです。サンプルサイズが大きいならH-F,小さいならG-Gのほうがいいといわれています。

サンプルサイズが大きいなら,多変量分散分析を利用できます。しかし,多変量分散分析は検出力があまりよくありません。より柔軟に分析を行うなら,Mixedモデルが有効です。Mixedモデルは球面性以外にも様々な仮定を置くことができます。データに合ったモデリングができるという意味で,とても有効です。また,頑健標準誤差を用いた分析も実は有効です。

※Mixedモデル(線形混合モデル)の紹介

分散分析のところで,たびたびMixedモデルという言葉が出てきたので,ここで解説しておきます。

Mixedモデルとは,誤差項以外にも分散成分を推定することができる,分散分析のパワーアップバージョンです。分散分析が無茶な仮定でガチガチなのに対して,Mixedモデルはかなり柔軟な分析ができます。

まず,頑健標準誤差が利用できるので(SASやRなど。SPSSは無理),不均一分散に対して強いことが挙げられます。また,サンプルが独立でなくても,その非独立性をモデリングできるので,解決できます。さらに,参加者内計画の時,球面性を仮定しなくてもよいので,問題ありません。さらにさらに,最尤法を使いながらも最小二乗法と同じ不偏性をもつ,制限付き最尤法を用いるので,サンプルサイズが小さくてもバイアスが小さくできる点がメリットです。

それ以外に,最尤法の利点を利用して,欠損値の推定ができる,参加者効果を固定効果ではなく変量効果として推定できるので,結果の一般化も妥当であるなど,分散分析に比べて長所ばっかりです。なぜ心理学者が未だ分散分析を使っているのかがわからなくなるほどです。

 

回帰分析・一般化線形モデル

回帰分析の仮定はt検定とほぼ同じです。つまり,正規性,分散の均一性,そして独立性です。

やはり正規性に対しては頑健ですが,不均一分散と非独立性に対しては脆弱なので,補正が必要となります。

幸いにして,どちらの脆弱性に対しても頑健な標準誤差による補正方法があります。分散が均一でないなら不均一分散に対する頑健標準誤差を,データがネストされているなら,クラスタ頑健標準誤差や階層線形モデルが利用できます。頑健標準誤差についてはこちらの記事を参照してください。

 

一般化線形モデル

一般化線形モデルは,回帰分析が目的変数が正規分布を仮定するのに対し,その他の指数分布に一般化したモデルです。たとえばポアソン分布,二項分布,ガンマ分布などです。

これらの分布からの逸脱は,多くの場合は過分散,つまり想定している分布よりも誤差の分散が大きくなってしまう場合です。一般化線形モデル(特にポアソン分布,二項分布)は過分散に対して脆弱なので補正が必要です。

ポアソン分布の場合は,負の二項分布や一般化ポアソン分布などの拡張された分布が利用できます。二項分布の場合は過分散に有効な代替分布がないので,頑健標準誤差を利用する必要があります。

 

因子分析

因子分析はほとんどの場合,検定を用いることがないので,実はそれほど仮定は厳しくないです。例えば,データが正規分布じゃないとー,とか,連続変量じゃないとー,とか,いろいろ言われますが,因子分析は意外と大丈夫です。

まず,データの正規性について。最尤法や最小二乗法,どの方法についても,検定しないなら推定値の一致性はサンプルサイズが大きければ満たされるのでそれほど神経質になる必要はないでしょう。

次に,データの尺度水準について。5件法あれば,カテゴリカル因子分析は使う必要はない,といわれています。逆に,3~4あたりはグレー,2件法はカテゴリカル因子分析がよい,とのことです(狩野・三浦(2002)グラフィカル多変量解析参照)。

むしろ問題になるのは,サンプルサイズです。因子分析では多くのサンプルサイズがないと,一致性が満たされません。だいたい,項目の5倍~10倍といわれています(芝の因子分析法参照)。

よって,データの正規性とか間隔とかよりも,まずは多くのデータを取りましょう。

 

構造方程式モデル(SEM)

構造方程式モデルは,最尤法を使うことが多いので,ここでは最尤法を用いた分析についても簡単に触れておきます。

最尤法は,平均値の差の検定や分散分析,回帰分析で用いられる最小二乗法とは異なる推定方法です。最尤法は尤度という確率に近い概念を用いてパラメータを推定するため,仮定も最小二乗法よりも制限が大きいです。

具体的には,最尤法は母集団ではなく,「データ」の正規性を仮定します。母集団であれば中心極限定理やらで回避出来ましたが,データの正規性となるとやっかいです。もしかしたら,この仮定ゆえに「最尤法は使いづらい」と思っている人もいるかもしれません。

しかし,最尤法の推定値そのものは,データが正規分布から逸脱していても,頑健性があります。つまり,最小二乗法と同じように一致性や漸近正規性といった性質が成り立つのです。ただし,推定値の標準誤差は誤った推定になることがあります。つまり,検定が怪しくなります。

「なーんだ,やっぱ最尤法危ないじゃん」と思うかもしれませんが,SEMでもRやMplusを用いれば,回帰分析と同様,頑健な標準誤差で補正することができます。万能か,頑健標準誤差!

<追記>頑健標準誤差は確かに検定をする場合には,比較的正確なp値が得られるので便利です。しかし,もちろん万能なわけではありません。まずはそのデータがどういうモデルから生成されているかをきっちり吟味する必要があります。その上で,どうしても既存の確率分布で近似しきれない場合に用いる,という発想がいいと思います。人事を尽くして頑健標準誤差,といったところでしょうか。

つまり,最尤法を用いたSEMをはじめ,一般化線形モデル,探索・確認的因子分析なども,頑健標準誤差を利用すれば,データの正規性が満たされていなくても妥当な推定を行うことができます。

むしろ,最尤法にとっての一番のネックは,サンプルサイズです。最尤法で用いられるのはχ2乗分布(あるいは正規分布)を用いたWald検定です。Wald検定はt分布を用いた検定と比べて,大きなサンプルサイズを要求します。50~100程度はないとバイアスが生じることがわかっています。

よって,SEMや一般化線形モデルを利用する場合はサンプルサイズに注意する必要があります(とはいえ,高度に有意なら,おそらく最小二乗法を使っても有意になるでしょうから,微妙な結果のときには慎重になる,程度でいいと思います)。

また,SEMでは内生変数(つまりは目的変数)の正規性が問題にされているのであって,外生変数の分布は問われません。さらに,最近のソフトウェア(Mplus)ではSEMでも順序カテゴリカル変数やポアソン分布を仮定した分析などが可能です。なので,従来のように「SEMは多変量正規分布が成り立たないと使えない!」という思い込みは必要ありません。必要なのはサンプルサイズぐらいです。

思っていたよりも長くなったので,とりあえず今回はここまでにしておきます。

This entry was posted in 心理統計学. Bookmark the permalink.