潜在曲線モデルとHLM

今日は潜在曲線モデルとHLMの異同について。興味ない人にはまったく面白くないお話ですみません。
潜在曲線モデルは成長曲線モデルとかいろいろ呼ばれてます。この分析法は反復測定データなど、時系列によって変化するデータ(発達データなどが一番わかりやすい)に対して以下のような分析ができます。
 サンプルそれぞれについて、時系列変化の切片と傾きを算出し、確率 変量としてモデルに組み込むことができる。つまり、個人によって発 達の仕方が違う場合、その個人差を分析できる、というわけ。切片は 初期値にあたる。
これはつまり、ランダム係数モデルに非常に近いんですけど、いろいろ制約があったり、利点があったりします。
1.全サンプルが同じ反復回数のデータをもっていなければならない。
2.切片と傾きを算出するための変数は、すべてのサンプルで共通している必要がある。
3.切片や傾きを独立変数にしたモデルを構築できる。
で、今日の話は、この潜在曲線モデルをSASのMIXEDプロシージャで再現する方法を紹介しよう、というわけなんです。それだけです。


ここで、いくつか注意点を。
1.HLM6では多分できない。
2.上記にも書いたが、切片と傾きを独立変数にしたモデルは構築できない。
3.分散成分の標準誤差の推定値が微妙に違う(小数第2位ぐらいで)。
4.分散成分の有意性検定の結果が微妙に違う。
5.早い話、Amosでやれば何も問題はない。
3と4については原因がイマイチわからず。でも固定効果の検定結果とか平均値の推定結果はぴったり一致しています。
5については、この記事の存在意義が問われるだけで、統計的な問題でもなんでもないです。
で、SASのMIXEDプロシージャでは以下のように書くといいと思います。
PROC MIXED covtest noitprint;
CLASS id timec;
MODEL v1 = time /SOLUTION ;
RANDOM intercept time / SUBJECT = id TYPE =UN G GCORR;
REPEATED timec / SUBJECT = id TYPE =UN(1) R;
RUN;
ただし、
id 個人を識別する変数
v1 従属変数
time 測定時点
timec 測定時点(repeated文に記述するために、クラス変数指定用に別に作っている)
random文にあるtypeオプションは、切片と傾きの共分散構造をどうするか、という指定です。もし潜在曲線モデルにおいて切片と傾きの共分散を仮定しない場合、UN(1)を指定してください。仮定するならUNを指定。
GとGCORRオプションは、切片と傾きの共分散行列と相関行列を出力するオプションです。
潜在曲線モデルは誤差分散に共分散をいれられないので、repeated文では分散成分のみを推定するように指定します。Rは誤差共分散行列を出力するオプションです。
なお、timeの変数をセンタリングすると測定時点を通しての平均値が切片で推定されます。
また、切片や傾きを従属変数にした分析をしたい場合は、次のように記述します。
PROC MIXED covtest noitprint;
CLASS id timec;
MODEL v1 = time v2 time*v2 /SOLUTION ;
RANDOM intercept time / SUBJECT = id TYPE =UN G GCORR;
REPEATED timec / SUBJECT = id TYPE =UN(1) ;
RUN;
ただし、v2は測定時点を通して変化しない変数。
そしてv2は平均値でセンタリングをする必要があります。単純な話、標準化すれば問題ないです。
SASのMIXEDでは誤差に共分散構造を仮定できるので、より当てはまりのよいモデリングが可能になります。ただ、潜在曲線モデルはSEMのパッケージでできるので、豊富な適合度指標が参照できます。全部の利点を得るというのはなかなかできないもんですね。
というわけで、SASのMIXEDで潜在曲線モデルをやってみよう!という個人的なプロジェクトの成果でした。終わり。

This entry was posted in 心理統計学. Bookmark the permalink.