KuboWeb top

更新: 2013-03-04 15:40:35

生態学のデータ解析 - 生態学会大会2012

[W23] データ解析で出会う統計的問題 -- 分割表の問題と統計モデリング

概要

分割表 (contingency table) は生物の生存/死亡など,質的なデータを表現するのに広く使われている.また連続量のデータをカテゴリー化して分割表にして分析することもある.このようによく遭遇するタイプのデータ集計であるが,あまり良く理解されずに使われている場合もある.この自由集会ではこれらの問題について,参加者といっしょに議論したい.

最初に粕谷が分割表の中で最も単純な 2x2 分割表をめぐる問題点を紹介する.仮説もモデルもきわめて単純に思える 2x2 分割表だが,複数枚の分割表があると,一気に複雑さを増す.複数の分割表のそれぞれには同じ傾向があるのに,プールして1枚にすると個々の分割表とは反対の傾向が生じることがある (Simpson のパラドックス).2 枚以上の分割表があれば仮説やモデルもいろいろなタイプが可能になる.また,カイ 2 乗検定や Fisher の正確確率検定など,よく行なわれている分割表の分析での overdispersionなどについての仮定など見逃されやすい問題にもふれる.

次に久保が,分割表の作図と統計モデリングについて紹介する.R の package を使って分割表をわかりやすく図示したり,分割表に格納されたデータを階層ベイズモデルであつかう方法を示す.

話題提供

  1. 2x2 分割表 ー 単純,誤解,深淵
    • 粕谷英一 (九州大・理)
  2. 分割表の作図・GLM・ベイズモデル
    • 久保拓弥 (北海道大・環境)

資料