HAD9.30βをアップしました

HAD9.3のβバージョンをアップしました。
こちらからどうぞ
今回は、かなりいろんな分析ができるようになりました。
主に、カテゴリカルデータに対する分析が増えました。
1.クラスター分析と多次元尺度法
2.コレスポンデンス分析
3.ロジスティック回帰分析
4.ポリコリック相関分析
の4つが主な追加です。
それぞれの使い方は随時アップしますが、今回の記事ではこんな感じだよ的なのを載せておきます。
興味ある人は続きをどうぞ


◆クラスター分析
クラスター分析は、データの距離からサブジェクトや変数をグループ分けするための分析法です。
サンプルデータは、豊田先生の「データマイニング入門」のクラスター分析の章にあるやつです。
クラスター数を指定すれば、所属しているサブジェクトや、クラスターごとの特徴を表示します。
cluster1.jpg
デンドログラムも表示します。
cluster2.jpg
サブジェクト数が多い場合、要約したデンドログラムも表示できます。
次に多次元尺度法
多次元尺度法は、クラスター分析の一部として組み入れています。
距離行列をもとに、2次元にマッピングします。
cluster3.jpg
◆コレスポンデンス分析
コレスポンデンス分析は、数量化Ⅲ類と同じ統計モデルです。
カテゴリーデータを数量化して、2次元にマッピングすることができます。
例えば、5件法で得たデータをマッピングしたり、
mca1.jpg
サブジェクトと一緒にマッピングもできます。
mca2.jpg
◆ロジスティック回帰分析
ロジスティック回帰分析は、従属変数が2値データの時に使われる回帰分析の一種です。
0と1で得られたデータを、ロジット変換して線形回帰モデルにします。
HADにはもともと階層的重回帰のオプションがありましたが、従属変数が2値の場合自動的にロジスティック回帰に切り替えることができます(しないようにもできます)。
つまり、今まで回帰分析で可能だった、ステップごとの投入やステップワイズ法、交互作用効果の検討、単純効果の検討がすべてできます。
ロジスティック回帰分析の結果
lreg1.jpg
オッズ比の出力
lreg2.jpg
グループの判別結果
lreg3.jpg
交互作用効果のグラフ
lreg4.jpg
◆ポリコリック相関分析
ポリコリック相関係数は、順序カテゴリカルデータ(リッカート尺度のような、間隔が等しいとはいえないようなデータ)の相関係数を、より正確に推定したものです。具体的には、データのクロス表が最も得られやすいような二変量正規分布の相関係数を最尤法で推定します。
ポリコリック相関係数
poly.jpg
また、カテゴリカル因子分析用にポリコリック相関行列と標準誤差、そして閾値母数をまとめて出力できます。
poly2.jpg
これをつかって、カテゴリカル因子分析(のようなもの)も実行できます。
poly3.jpg
カテゴリカル因子分析を実行する場合は最小二乗法がお勧めです。本来はポリコリック相関係数の標準誤差で重みを付けた最小二乗法を実行する必要があるのですが、まだそこまでは実装していません。
このように、HAD9.3はカテゴリカルデータに強くなりました。

This entry was posted in HAD. Bookmark the permalink.