前回は、因子分析の因子抽出法について書きました。その続きになります。
因子軸の回転法は、大きく分けて2種類あります。
- 特定の回転基準を設定して、回転させる方法
- 他の因子負荷量行列を参考にして、それに最も近くなるように回転させる方法
おそらく多くの人は1.の方法を使っていると思います。2.の方法はあまり知られていないかもしれません。
今回は従来使われてきた回転法の解説に加えて、最新の方法についても触れます。
興味ある人は続きをどうぞ。
因子軸の回転方法とは
因子分析では、共通性を推定するだけでは因子負荷量は一意に定まりません。それはパラメータの制約が足りないからです。よってデータの適合とは別に、解を識別させるための基準を外的に導入するのが、回転法を用いる理由です。
しかし、その外的な基準といっても様々です。回転法の種類は、どういう制約を与えて解を定めるかという点で異なってくるわけです。
制約の与え方も、上で説明したように2種類あります。
- 因子負荷量全体に特定の基準から制約を与えて、解を求める
- 別の因子負荷行列に最も近くなるように解を求める。
前者はバリマックス回転・プロマックス回転などがそれです。後者はプロクラステス回転やターゲット回転がそれに当たります。
特定の回転基準を設定する方法 直交回転と斜交回転
よく知られている回転方法は、ここで説明する、特定の回転基準を設定する方法です。
どんな基準を設定するかというと、因子の構造が解釈しやすいように設定するのが普通です。
いわゆる単純構造解(各項目が、一つの因子だけに負荷し、他は0に近くなる解)を目指すわけです。
解の基準の説明の前に、回転軸の斜交性について触れておきます。
これまたよく知られているように、回転基準を設定する方法には2種類あります。
- 直交回転
- 斜交回転
直交回転は、因子軸が直交することを仮定するモデルです。因子軸が直交するとは、因子間の相関が0であることを意味します。よって、直交回転を行うと因子間相関がすべて0になります。
斜交回転は、因子軸が斜交する、つまり因子間の相関を仮定するモデルです。ただし、データによっては斜交回転を施しても相関がほとんどない場合もあります。
直交回転と斜交回転のどちらがいいのかは、立場によって変わるでしょう。ただ、心理学の分野では最近ではほとんどが斜交回転の利用が推奨されています。それは、以下の理由が考えられます。
- 同じ尺度で測った心理的な構成概念同士が無相関であるという仮定を置きにくいから。
- 斜交回転のほうが単純構造になりやすいから。
実用的な理由としては後者になるでしょう。斜交回転のほうが柔軟なモデリングを行っている分、項目と因子の相関を大きくすることができるので、より単純構造に近くなるわけです。直交回転の場合、直交性がデータに合っていなければ、どうしても単純構造からは遠くなります。
各種回転の基準と回転法
単純構造の定義は、サーストンによって提案されました。サーストンの基準は若干ややこしいので簡単に説明すると、
それぞれの項目について、一つの因子の負荷量は高く、それ以外の因子は0に近いような因子
負荷行列のこと
という感じになります。
この基準を満たすための方法がいくつか考えられてきました。伝統的には、直交回転と斜交回転でそれぞれ異なる基準が提案されているので、それぞれごとに説明します。
オーソマックス基準・・・直交回転の基準
オーソマックス基準は、もともとはバリマックス基準というのが提案されて、それに類するものがのちに提案され、そのグループとしてまとめられたものです。
バリマックス基準は、因子負荷行列(の2乗)の列の分散の和を最大にする基準です。つまり、特定の因子についてある項目は負荷量の絶対値が高く、別の項目は小さいような因子負荷行列を求めるのです。分散(バリアンス)を最大(マックス)にするので、バリマックス基準です。
バリマックス回転は、バリマックス基準を満たす回転方法です。バリマックス基準は、オーソマックス基準のうちの一つで、他にもクォーティマックス、エカマックス、因子パーシモニーなどがあります。これらの方法では、因子説明率のバランスが変わってきます。クォーティマックスが最も第一因子の説明率が高くなり、バリマックス、エカマックス、因子パーシモニーとなるにつれ、因子説明率が等しくなっていきます。ただ完全に等しくなることはありません。
オブリミン基準・・・斜交回転の基準
オブリミン基準も、コバリミン基準やクォーティミン基準などの総称です。
コバリミン基準は、因子負荷行列(の2乗)の共分散を最小にする基準です。共分散が小さいということは、各項目がそれぞれ違う因子に負荷するようになる、ということです。よって単純構造に近くなります。
コバリミンとクォーティミンは因子の斜交性が異なります。コバリミンのほうが因子間相関が弱くなります。クォーティミンは逆に因子間相関が高い傾向にあります。その真ん中のバイクォーティミン基準が良い結果を示すといわれています。
また、SASの「オブリミン回転」は、tauの値を変化させることでオブリミン基準の回転を包括しています。tauが0の時はクォーティミン回転、1の時はコバリミン回転、0.5の時はバイクォーティミン回転となります。
一方、SPSSの直接オブリミン回転のデルタは何を意味しているのか、よく分かりませんが、デフォルトの0はクォーティミン回転と一致します。
Crawford-Ferguson Family基準・・・オーソマックス+オブリミン基準
おそらく多くの人が聞いたことないかと思いますが、オーソマックス基準とオブリミン基準を統合した基準です。つまり、上記の基準を一般化した包括的な回転基準になります。
この基準に基づけば、例えば斜交バリマックス回転なんかも可能になります。斜交バリマックスは、コバリミン回転に近い解を出します(でも一致はしません)。また、斜交クォーティマックス回転は、クォーティミン回転、つまりオブリミン回転のtau=0と一致します。
この一般化されたCrawford-Ferguson族基準はSASで提供されてます。また、CEFAというフリーの因子分析ソフトでも対応しています。一度いろんな回転をやってみたい人は触ってみてはいかがでしょう。
ジェオミン基準
ジェオミン基準は、近年注目されている回転基準です。Mplusの探索的因子分析のデフォルト方法がこのジェオミン基準による回転、ジェオミン回転になっていたので僕も知りました。
ジェオミン基準はとてもシンプルで、各項目の因子負荷量(の2乗)の積の和を最小にする基準です。積和は一つでも0があると0になってしまうので、微小値を加えて最適化します。この基準は、各項目について一つ以上の負荷量が0に近くなるような因子負荷量行列を単純構造とみなす方法です。
ジェオミン基準は解の単純性を担保しつつも、複雑性(複数の因子に負荷する項目がある因子負荷行列)も許容するため、事前に解の複雑さが高いと考えられる場合は、ジェオミン回転がオススメです。ただし、心理尺度の因子分析にはあまり向かないかもしれません。
Harris-Kaiserの独立クラスター回転・・・直交回転による斜交回転
独立クラスター回転は、別名オーソブリック回転(Orthblique rotation)ともいわれる方法です。この回転方法は、簡単に言えば因子の分散をすべて基準化した(分散を1にした)状態で直交回転を行う方法です。しかし、因子の重みを考慮すると因子間には相関が生じます。つまり、方法としては直交回転(クォーティマックス回転)なのに、結果としては斜交回転となるのです。Orthbliqueとは、直交と斜交が混ざった回転方法、という意味です。
この回転が便利なのは、回転の解が簡単に求まる割に、他の方法に比べて単純性が高い解になることです。心理尺度のように、一つの項目は一つの因子だけに負荷してほしい場合、独立クラスター回転は威力を発揮します。ただし、因子間相関はオブリミン回転に比べて高くなる傾向にあります。
他の因子負荷量に近づける回転方法
今までは、特定の回転基準を導入して解を求める方法を紹介しました。
次に、他の因子負荷量行列に近づける方法、それの発展形の回転法を紹介します。
プロクラステス回転
プロクラステス回転は、ターゲットとなる因子負荷行列に最小二乗基準で最も近くなるように回転する方法です。例えば、先行研究で得られた因子負荷行列に近い解を得たい場合などに使えます。
ついでに、プロクラステスとは、ギリシャ神話に出てくる「ベッドの大きさに合わせて人の体を切ったり伸ばしたりする」盗賊のことです。無理やり基準に一致させる、という意味からこの名前が付けられました。
また、プロクラステス回転は直交制約を付けることもはずすこともできるため、直交プロクラステス回転、斜交プロクラステス回転の両方が可能です。ターゲット行列が直交か斜交かによって使い分けることができます。
さらに、因子負荷行列は部分的に欠けていても大丈夫で、確実に0になりそうなところを0とするだけでも回転することができます。これを不完全プロクラステス回転と呼びます。ただし、不完全プロクラステス回転は収束しないこともあります。
プロマックス回転
バリマックス回転の次によく知られているプロマックス回転は、実はプロクラステス回転を用いる回転方法です。ターゲット行列にバリマックス回転を施した因子負荷行列を用い、斜交プロクラステス回転を行うのです。ただし、ターゲットにするのはバリマックス回転の解そのものではなく(そのものだったらバリマックスと同じ解になってしまう)、因子負荷行列を3~4乗したものを使います。なぜ累乗するかといえば、そうすることで高い負荷量は高いままで、小さい負荷量をより小さくすることができるからです。そして累乗した負荷量行列を基準化したうえで斜交プロクラステス回転を行うと、バリマックス回転の解に近い、斜交回転が可能になります。
プロマックスという名前も、プロクラステス+バリマックスという結構安易な発想でつけられています。
プロマックス回転は、オブリミン回転に比べて計算が速く、確実に収束し、バリマックス回転に近い解を出すことから、コンピューターの計算が遅い時代にとても重宝されました。しかし、プロマックス回転は理論通りの解をださないことが知られています。例えば一つの項目が一つの因子だけに負荷する完全クラスター解が真の因子負荷行列であるようなデータを回転させても、プロマックス解は真の解には一致しないことがあります。このことから、プロマックス回転はあくまで簡便的な方法として用いるべきだという考えもあるようです。
プロマックス回転では、バリマックス解を何乗するかがハイパーパラメータとなっています。SASでは3乗、SPSSでは4乗がデフォルトです。値を高くすると、因子間相関が高くなります。解の単純性と因子間相関の高さのバランスを考えると3~4あたりが妥当なようです。
シンプリマックス回転
プロマックスのパワーアップ版です。バリマックス→プロクラステスという二段階を踏むのではなく、一度に解を求めます。また、因子負荷量行列に含まれる0の個数を指定します。0が多いほど単純構造になり、0が少ないほど複雑さの高い構造になります。0の個数を決めるのがやや面倒ですが、柔軟な回転ができます。
オススメの回転方法
いろいろ書いてきましたが、こんなにいっぱいあったらどれを使ったらいいのかわからなくなりそうです。僕個人のオススメを書いておきます(あくまで僕のオススメであって、参考程度にとどめてください)。
直交回転か斜交回転か
心理尺度なら、斜交でOKです。解が単純構造に近くなるからです。直交回転を使うのは、因子空間が独立した次元で構成されているという仮定がある場合にのみ使うといいでしょう。
よって、よく使われてきたバリマックス回転は、実はあまり使う必要がないとも言えます。
斜交回転の中ではどれがいいか。
よく使われているのはプロマックス回転です。実際、使い勝手がいい上に、多くの論文で使われているのでプロマックス回転を使っていれば特に問題はないです。それほどこだわりがなければ、プロマックス回転でいいでしょう。
ではどういうときにプロマックス回転以外の選択肢が活きてくるのでしょうか。ここではいくつかの観点から整理したいと思います。
まず、より単純構造が知りたい場合。オススメはHarris-Kaiserの独立クラスター回転です。プロマックス回転は、そこそこいい解を出すのですが、ダブルローディングが多く出現することもあります。また、個人的な経験として、プロマックス解では一つの因子のほとんどの項目が負荷して、最後のほうの因子は2項目とか非常に少ない項目しか負荷しないという場合でも、独立クラスター回転はバランスよく負荷してくれることがあります。さらに、独立クラスター回転は、確認的因子分析で推定された因子間相関と最も近くなるそうです。そういったことからも、独立クラスター回転は単純構造に一番近い回転といえるかもしれません。
プロマックス回転でやってみて、「あれ、なんか解釈しにくい・・・」と思ったら、独立クラスター回転を使ってみてはいかがでしょう。
次に、複雑さを高めたい場合。知能テストなどは、一つのテストが複数の知能と関連するのはほぼ常識です。そのような実質的科学的知見を無視して、単純構造を目指すのはやや疑問が残ります。そのような場合は、プロマックス回転よりもジェオミン回転やオブリミン回転がオススメです。どちらかというとジェオミン回転のほうが複雑さを許容した回転を行います。
解の単純さ複雑さの性質で回転法を並べると、個人的に以下のような感じかなぁと思います。ただ、ジェオミンは意外に単純な解を出したりするので何ともいえない感じではあります。
独立クラスター プロマックス(Power=4) オブリミン(クォーティミン) ジェオミン オブリミン(コバリミン)
最後に、先行研究と同じような因子構造を得たい場合。一番いいのは確認的因子分析ですが、それを除けばプロクラステス回転になると思います。ただ、回転方法はデータの適合度とは関係ないので、そもそも先行研究の因子構造がデータに適合していなければ、程遠い結果になることもあるので注意が必要です。
結局何がいいのか
総合すると、
- 基本はプロマックス回転で問題ない。プロマックス回転で思うような解が得られない場合は他の回転を試す。
- より単純構造を目指したいなら独立クラスター回転がオススメ。
- そもそも単純構造にならないと思われるデータの場合、ジェオミンやオブリミン回転がオススメ。
- 先行研究を再現したい場合は、出てほしい因子負荷量を指定してプロクラステス回転を使う。
- 他にも確認的因子分析という選択肢もある。
という感じにあるでしょうか。
対応しているソフトウェア
ここを見ている人はSPSSユーザーが多いでしょうか。SPSSはあまり回転法は対応していないので他のソフトも使えるようになると便利です。手前味噌ですが、HADについても触れておきます。
オーソマックス基準の回転
どんなソフトウェアにも入っています。バリマックスだけの場合もありますが、バリマックスで十分です。
オブリミン基準の回転
これも多くのソフトウェアに対応しています。SPSSは直接オブリミン回転がありますが、パラメータの意味がよくわかりません。SASもオブリミン回転があり、tauを指定できます。HADはオブリミン回転に対応していますが、クォーティミンだけです。
Crawford-Ferguson Family基準
対応しているソフトはあまりありません。SASはすべて対応しています。Rotate = OBLIGENGCF()で指定できます。詳しくはこちらを参照してください。あと、すでに紹介したCEFAも対応しています。
また、RのGPArotationの中にもあります。
ジェオミン基準
まずMplusはデフォルトです。次にRのGPArotationの中にもgeomin回転が直交・斜交ともにあります。SPSSにはありません。HADにもありませんが、今後入れたいなと思っています。
独立クラスター回転
Harris-Kaiser回転とも呼ばれます。SASではRotate = HKで指定できます。HADにも入っています。
プロマックス回転
これもほとんどのソフトウェアに入っています。SPSS、SAS、R、ついでにHADで利用できます。ただ注意が必要なのは、SPSSとSASではPowerの値のデフォルトが違います。SPSS=4、SAS=3です。Rは4だったように思います。HADも4にしています。
シンプリマックス回転
RのGPArotationに含まれています。
ややマニアックな内容になりました。いろいろ試したい人は、ぜひ。