ケリケン

久々のケリケン。先輩と二人でやってる研究会。
家族の調査の分析について話し合ったり、グルダイの発表について話したり。
尺度構成でIRTを使ってるんだけど、3相データをどうやってIRTやるんだという話に。これまでは2相につぶしてやってたんだけど、データに正直になるにはやっぱり3相でやらないとダメっぽい。3相因子分析の方法はいくつかあるけど、それをカテゴリカルにした場合は可能なのだろうか。そして、項目母数や被験者母数の推定は可能なのだろうか。
IRTも最近勉強し始めたばっかりなのに、いきなりこんな壁にぶつかってしまった。とにかく、専門家に聞くのがはやそうだ。


先輩のブログにもあるけど、ユーザーにとって確率変量という概念はかなり敷居が高い。分析が高度になっても、なんだかんだとデータを直にさわってる感じはあったのだけど、HLMやIRTの分野になってくると、それがどんどん遠くなってくる。
我々はついつい、尺度の平均値が「測りたかったもの」と考えてしまうけど、統計学ではその背景に正規分布に従った確率変量を想定している。その数値上の表れが平均値に過ぎないのだ。
なので、基本的には平均値やβ係数などは値が算出された時点で「誤差」が入り込んでしまう。いうなれば、回答者一人一人が持っている(あるいは計算された)データというのは、基本的に信頼性が低いのだ。だから平均やβ係数などを計算して、それをさらに分析に投入するのは、あまりオススメされないのだ。
最尤推定法などの導入から、分析で確率変量をそのまま扱えるようになってきた。なので、回答者のデータを算出せずとも、ダイレクトにモデルを構築することができるようになったわけだ。その典型例がSEMだ。
そうなると、ユーザーとしては頭を切り替えないといけない。常に母集団を仮定したモデル構築をやっているという考えを持たないと、最新の分析がいわんとしていることについていけないくなるわけだ。
僕が勉強しているMCA(マルチレベル共分散構造分析)やHLMになってくると、さらにその傾向が強くて、「集団レベルの~が高い」という言い方にならざるをえない。ユーザーとしては「評定得点の平均値」とか、手にとれるデータを中心に考えてしまうので、イマイチ集団レベルとか、被験者母数とかの概念がわかりづらい。僕もHLMの授業とかしてて、いつもこの部分で説明に困ってしまう。
その背景には、おそらく今の統計学の授業がそこまで至ってない、あるいは十分に説明されていない、という問題があるのだろう。でも、学部時代にそんなの教わったってどうしようもないってのもある。
院生になってからの統計の授業の充実が求められるんだろうなぁ。

This entry was posted in 研究生活. Bookmark the permalink.

コメントを残す

メールアドレスが公開されることはありません。

Note: 他の人のコメントに返信したい場合は,[Reply to 名前] のボタンを押してください