先日、知り合いからマルチレベル分析における集団レベルと個人レベルの関連について質問がありました。
それに対して、メールを書いた文章を、メモ代わりにここに記録しておきます。
おそらく同じような疑問を持つ人もいるだろうなと思うので(事実、同じ質問をされている)。
質問の趣旨は、
「マルチレベルSEMにおいて、集団レベルの変数と個人レベルの変数にパスを引けないのはなんか変だ」というものです。
社会心理学では特に、集団レベルの概念が個人レベルの概念を説明する例はたくさんあります(例えば、集団凝集性が個人のパフォーマンスに影響するなど)。このような現象を説明できないなら、マルチレベルSEMは意味ないじゃん!という疑問はありえます。
この点について、「続き」に書いてるので興味がある人は参照してください。
マルチレベル分析(以下、ML分析)では、以下の仮定で分析を行います。
個人の得点=集団レベルの得点+個人レベルの得点
ただML分析は、個人レベルと集団レベルという言い方は本来はしないほうがいいです。
正確にはWithinレベルとBetweenレベルと言うべきです(理由は後述)。
ML分析では、個人単位で測定された変数の分散を、一次抽出単位間(これを普通集団レベルと呼ぶ)と一次抽出単位内(これを普通個人レベルという)の分散に分解します。前者をBetweenレベル、後者をWithinレベルと呼びます。
これは分散分析がわかりやすくて、全体平方和が群間平方和と郡内平方和に分解できるのと同じ理屈です。分散分析では条件が単位になっているのに対し、ML分析では集団が単位になっています。
さて、最初に書いた、個人の得点=集団レベルの得点+個人レベルの得点という式を、ML分析では群間と郡内に当てはめます。つまり、個人の変動=群間変動+郡内変動となるわけです。
このように分解した上で、それぞれの共分散行列に構造を与えます。このとき、レベルをまたがった変数同士は無相関になります。これは「定義上」こうなります。分散分析でも群間変動と郡内変動に関連がないのと同じです(入れ子になっているのだからあるはずがない)。
これが直接的な「集団レベルと個人レベルにパスがひけない理由」です。
でもまぁこれだけでは概念的には納得がいかないのもわかります。以下に、これをどう考えればいいのかについて書きます。
例えば集団アイデンティティ(GI)を個人単位で測定したとします。当然、なんらかの集団カテゴリーが実験で与えられていて、その集団に対するアイデンティティを答えるとします。そして複数の集団についてのデータが手元にあるとします。
つぎに、例えば集団パフォーマンスが測定されたとします。これは集団に一つだけ得点が与えられるような(例えば、グループでの課題正答率とか)変数だとします。これがいわゆる集団レベルの変数です。
ここで、われわれは集団レベルのパフォーマンスが個人レベルのGIにどのように影響するかに関心があるとすると、集団レベル→個人レベルというパスを想定したいわけです。
ここで、概念上での集団レベル・個人レベルと、分析上での集団レベル・個人レベルの乖離があるのがわかると思います。GIは個人に測定されているのだから、個人レベルの概念だと思うわけです。しかし、ML分析では個人レベルとは、GIの変動をBetweenとWithinに分解したあとの、Withinレベルのことをさしています。
なので、この問題は以下のように考えればOKです。つまり、集団レベルの概念である集団パフォーマンスが、個人レベルの概念であるGIへの影響を検討するには、集団パフォーマンスとBetweenレベルのGIの相関を見ればいいわけです。ML分析上では「集団レベルの関連」を見ているに過ぎませんが、概念上は集団レベルの概念と、個人から測定した概念への影響を検討していることになります。
当然、ML分析におけるWithinレベルの変動と集団パフォーマンスには相関は仮定できません。この場合のGIのWithinレベルは、集団パフォーマンスとは関係ない、個人内の変動(例えば、アイデンティティを感じやすいパーソナリティなど)であると考えればいいです。
個人から測定した変数は、概念上、どのレベルとして考えればいいかは、研究者の立場や関心によります。例えば、集団凝集性という集団レベルの概念を測定したかったとします。もちろん、集団凝集性を直接は測定できないので、「操作的に」GIのBetweenレベルを集団凝集性と定義することも可能でしょう。これについては異論は当然ありえますが、GIの平均値を同様に定義するよりは誤差(例えばパーソナリティなど)を省けている分、妥当性・信頼性は高くなっているといえます。また、凝集性をBetweenレベルとして定義した場合、Withinレベルは測定誤差であると定義されることになるでしょう。
長くなりましたが、結論としては、「社会心理学における概念上でのレベルと、ML分析における分析上でのレベルは、必ずしも一致しないので、注意が必要」ということです。これは研究者の立場によるわけです。なので、見方によっては「集団レベルと個人レベルの概念との関連をみること」も可能です。
更なる疑問、意見などあったら清水までどうぞ。
追記:
マルチレベルSEMにおいて、「Betweenレベルの変数は、個人の変数を足し算しただけじゃないか」という批判がよくあります。確かにある意味その通りなのですが、考え方によっては別の解釈が出来ます。
上に書いたように、マルチレベルSEMでは
個人の得点=集団レベル+個人レベル
という分解を前提とします。これは、実は因子分析の仮定と似ています。
これはつまり、集団の影響に誤差がくっついたものが、個人が実際に評定する得点である、という見方も出来るということです(個人を誤差だと言うとは何事か!と怒られそうな気もしますが)。
この場合、集団の影響は個人の単純集計というものではなく、そもそも個人の評定に影響を及ぼしている潜在的なものとして考えられているわけです。マルチレベル分析では、この集団の潜在的な影響を推定しましょう、という方法論だと捉えなおすことが出来ます。
であるなら、マルチレベル分析では「集団を個人の合算として考える」といういわゆる主成分分析的な考えより、まず個人には集団の影響が不可分にあり、その影響力を分析上推定する因子分析的な考え方である、といえるのではないかと思います。社会心理学者としてはそのように考えるほうがわかりやすいと思います。
まぁお気づきのように、結果としてはあまりやってることは変わりませんけどね。でも、誤差を取り除いて推定している、という点では平均値を出すよりはマシじゃないですかね。
あ、あと、上記の理由(集団レベルを個人の合算うんぬん)でHLMのほうが妥当だとか、いいモデルだと言う人がたまにいますけど、完全に誤解です。HLMも同様の仮定を置いているので、HLMがマルチレベルSEMより優れている点はほとんどありません。重回帰分析とSEMの違いぐらい、後者のほうが優れています(後者ではまだ3レベルモデルを実行できるソフトウェアがないので、その点ではHLMのほうがやりやすい場合はあります)。