HADでｔ検定（ノンパラ検定含む）をする方法

ｔ検定（二つの平均値の差の検定）は今まで分散分析のプロシージャで走らせていましたが、ver9.5からは「分析」ボタンから簡単にできるようになりました。

ここではその簡単版のやり方を説明します。

また、順位の差の検定であるノンパラ検定の方法もほぼ同じなので、触れておきます。
続きを参照してください。

まずは、データの説明から。以下のようなデータを例に使います。

このデータを「データ読み込み」で読み込んで、モデリングシートに移動します。

ここから分析が始まるのですが、ｔ検定には対応あるｔ検定と対応のないt検定があります。

対応のないｔ検定は、二つのグループの平均値の差を比較する方法です。
対応のあるｔ検定は、同じ人が答えた二つの変数の平均値を比較する方法です。

以下ではそれぞれの方法について説明します。

◆対応のないｔ検定

対応がない場合は、比較したい変数と、比較するグループを識別する群分け変数を指定する必要があります。今回の例では、aという変数でx4の差を検定したいとします。

その場合、目的となる変数x4を先に指定し、その後ろに群分け変数aを指定します。具体的には以下のようにします。

上の図のように、C列のセルにx4を、D列のセルにaを入力します。
覚え方としては、従属変数（目的変数）が先、独立変数（群分け変数）が後、です。
それでは「分析」ボタンを押してみましょう。以下のようなユーザーフォームが立ち上がります。
ここで、「平均値の差の検定」の「対応なし」を選択します。

この状態で「OK」ボタンを押せば、分析が実行されます。
以下のような結果が出力されます。

　対応のないｔ検定では、通常のｔ検定の結果以外に、「Welch検定」の結果を出力します。Welch検定とは、各群の分散が等しくない場合、普通の方法ではｔ分布に従わないため、調整をする方法です。

　従来では、等質性の検定（F検定など）を行い、有意だった場合にはWelch検定、そうでない場合には普通のｔ検定というのが常識でしたが、最近ではそうではないようです。それは、F検定→ｔ検定が、検定の二重性の問題を持つという指摘があるからです。つまり、「F検定で有意だった場合だけWelchで、それ以外はｔ検定」という手続きを繰り返して実行すると、危険率を5%に抑えられない、ということです。

　たとえば青木先生のページでは、常にWelchの検定を行う方が、タイプⅠエラーを犯す危険が最も低いことをシミュレーションで示しています。この結果は、F検定などせずに、常にWelch検定を採用することが妥当であることを示しています。また、Rのt.test関数はデフォルトがWelch検定で、普通のｔ検定はオプションで指定しないといけないようになっています。

　これらを踏まえ、HADでは等質性の検定は行わず、デフォルトでWelch検定をそのまま載せています。同時に、等分散を仮定するｔ検定結果も出力しています（ただしエラーバーは等分散を仮定しない標準誤差に基づく）。とはいえ、Welch検定はあくまで「近似」であるため、絶対に分散が等質だという確信が何らかの理由であるなら、t検定を採用してもいいでしょう。

　また、ver9.5から、差についての効果量を出力するようにしました。「ｒ」とあるのがそれです。
この表の隣には、以下のようなグラフが出力されます。