企画者: | 粕谷英一 |
久保拓弥 |
野外調査や実験で得られた生態学的データを統計学的な手段で解析するときに、 多数の落とし穴がそこにもここにもあなたを待っている。 この自由集会では、 おちいりやすい誤りとそこからの脱出方法について議論したい。
まず粕谷が、 変数変換とその周辺にひそむ落とし穴について説明する。 分散が一定でないデ−タに適当な変数変換をほどこした後で 分散分析や重回帰を行うというのはよくあるデ−タ解析の流れである。 角度変換、 平方根変換、 対数変換などはおなじみの変換である。 だが、 変換した後のデ−タを使った分析結果がもとのデ−タについて語るのは何だろうか。 変数変換したデ−タに重回帰や いくらか複雑な分散分析を適用したときに起こる誤りを検討し、 誤りを避ける手段をさぐる。
つぎに久保が統計学的まちがいを自力で発見する方法論のひとつとして、 ランダム標本集団を「飼い慣らす」 計算機ワザの基礎を紹介したい。 Free な統計ソフトウェア R や言語 Perl の命令をいくつかならべるだけで、 さまざまな乱数セットを作りだせる。 この「標本」は統計学の実験材料として利用価値が高い。 統計ソフトウェアに読み込ませて 推定結果と真の値のずれを評価する、 といった応用的実益はもちろん …… 統計学の背骨なす「確率論的モデル」と「その標本集団」、 これら中核概念への「親しみ」わいてくる効果も指摘したい。