無駄にパロったタイトルにしてみましたが、久々の本の紹介です。
本屋に行ったらなんとこの本が出ていたのです。
「共分散構造分析 理論編」が!
さっそく見てみたら、噂に聞いていた高次積率について書いてました。
積率については続きを見てもらうこととして、高次積率を使うとこんなにいいことがあります。
1.パス解析で因果の方向の特定が簡単にできる
2.同値モデルがなくなる
3.因子分析の回転がいらなくなる(解が一意に決まる)
4.多変量正規分布というイデア世界の仮定がいらない
5.識別不定な状態がぐっと減る
などなど。これらは、解を求めるのに必要な情報量を多く利用することができるため、モデルの自由度が従来の2次積率モデルより多くなるためです。
具体的には、重回帰分析は普通、飽和モデルとなりモデルの自由度は0になります。
でも3次積率まで使えば、自由度は0より大きくなり、パスの引き方によって適合度に変化が見られます。コレを利用して、どちらの因果方向が適合的かを判断することができるのです。
まぁ、そんなことがびっしり書いてます。これからの統計学はまた違ったものになるでしょう。
共分散構造分析 理論編―構造方程式モデリング (統計ライブラリー) (2007/10) 豊田 秀樹 |
さて、積率の話。
平均値を1次の積率、分散を2次の積率と呼びます。共分散も2次の積率です。
要は、データの何乗までを情報として使うか、という意味です。
で、今までのSEMは2次までの積率しか使ってきませんでした。共分散構造分析という名前は2次の積率しか使ってませんよ、という意味なのです。
で、3乗とか4乗も使ったらもっといいことがあるよ、ということなのです。
3乗とは歪度を、4乗は尖度を意味します。これら高次積率を使えば、なんと因果関係を特定することができます!!
3次の積率の場合、パス係数や変数の分散以外に、3乗に関するいくつかの母数が情報として機能するので、それらの母数を用いて適合度の違いを判断することができるのです。
実際に、明らかに因果関係が特定されるようなデータ(物理学的なデータ)を用いて分析したら、たしかに因果方向によって適合度に大きな違いがあるのがこの本を見ればわかります。
また、正規性の仮定がいらないので、さまざまなデータに適合するモデルを構築することができます。もちろん、正規分布であるという仮定をおいた分析も可能です。
なお、正規分布を仮定するとは、歪度が0である、つまり2次の積率だけで分析しますよ、という宣言なのです。例えば、誤差変数の歪度は0である、という局所的な仮定もこれまでのSEMと同じ感覚で可能です。
さらに、3次の積率を用いたモデルは、
1.2次の積率モデルよりも結果が安定している(標準誤差がやや小さくなる)
2.たとえ3次の積率の推定値が0に近い値であったとしても結果は安定する
という優れた性質も持っています。
もちろん、欠点もあります。
1.計算に時間がかかる
2.独立な標本を多く必要とする
これらは使う情報が増えるため、避けては通れない道なのです。
20項目の因子分析を行うのにこれまでは100~200ぐらいで十分だったのが、800~1000を必要とします。どひゃー。
まぁ、どうしても必要な部分の積率を使えばいいので、計算量は適宜抑えられるかもしれません。
そんな感じで、高次積率はすごいよ、未来だよ、という話でした。
2 thoughts on “君は高次積率を知っているか?”