2015年最初のバージョンアップです。HAD12.40をアップしました。
HADのダウンロードはこちらからどうぞ。
今回のバージョンアップは,
- 非階層クラスタ分析に,潜在混合分布モデルが追加されました
- クラスタ分析に,新たに潜在クラス分析が追加されました
クラスタ分析にはいろんな種類があります。心理系でよくつかわれるのは階層クラスタですが,クラスターに階層性が仮定できること,というのは実はそれほど多くはありません。
むしろ,潜在的に質の異なる母集団を探索したい,という場合のほうが多いかもしれません。例えば,マーケティングにおけるマーケットセグメントのように,ニーズのことなるグループを見つける,というような場合です。今回追加した潜在混合分布モデルと,潜在クラス分析はまさにそのための方法で,潜在的な母集団を複数仮定して,それぞれの母集団の特徴などを明らかにします。また,回答者をむりやりクラスタに分類するのではなく,それぞれの所属クラスタにどれぐらいの確率で所属するかを推定します。
潜在混合分布モデルと,潜在クラス分析は基本的には同じような方法です。違うのは,分類に使う変数が間隔尺度か名義尺度の違いです。前者の混合分布モデルは,変数が複数の多変量正規分布に分割できると仮定して,回答者それぞれの所属確率を推定する方法です。潜在クラス分析は,変数が複数の多重クロス表で表されることを仮定して,回答者の所属確率を求めます。
また,すでに実装している改良k-means法と混合正規分布モデルは,回答者の所属確率が0か1をとるという制約を課すのが前者,課さないのが後者,という違いだけです。混合正規分布モデルのほうが基本的には尤度は高くなるので,よりよい推定ができますが,逆に無理やり回答者をクラスタに分けたい場合は改良k-means法のほうがうまくいくことがあります。あと,計算は圧倒的に改良k-means法のほうが速いです。両者の関係の詳細については,後日記事にしたいと思います。
今回の実装では,潜在クラス回帰分析などはまだできませんが,今後実装できるようにする予定です。