更新: 2013-03-04 15:40:35
生態学のデータ解析 - 生態学会大会2012
[W23] データ解析で出会う統計的問題 -- 分割表の問題と統計モデリング
- 日時: 2012 年 3 月 19 日 (水) 17:30 - 19:30
- 場所: 龍谷大学, 生態学会大会 A 会場
- 企画者: 粕谷英一 (九州大・理), 久保拓弥 (北海道大・環境)
- 短縮 URL: http://goo.gl/qQ1Ok
- 大会サイト内の 要旨
- 自由集会後のうちあげ
- 事前に 生態学会自由集会のうちあげ ペイジをみて「参加もうしこみ」をしてくだささると助かります
概要
分割表 (contingency table) は生物の生存/死亡など,質的なデータを表現するのに広く使われている.また連続量のデータをカテゴリー化して分割表にして分析することもある.このようによく遭遇するタイプのデータ集計であるが,あまり良く理解されずに使われている場合もある.この自由集会ではこれらの問題について,参加者といっしょに議論したい.
最初に粕谷が分割表の中で最も単純な 2x2 分割表をめぐる問題点を紹介する.仮説もモデルもきわめて単純に思える 2x2 分割表だが,複数枚の分割表があると,一気に複雑さを増す.複数の分割表のそれぞれには同じ傾向があるのに,プールして1枚にすると個々の分割表とは反対の傾向が生じることがある (Simpson のパラドックス).2 枚以上の分割表があれば仮説やモデルもいろいろなタイプが可能になる.また,カイ 2 乗検定や Fisher の正確確率検定など,よく行なわれている分割表の分析での overdispersionなどについての仮定など見逃されやすい問題にもふれる.
次に久保が,分割表の作図と統計モデリングについて紹介する.R の package を使って分割表をわかりやすく図示したり,分割表に格納されたデータを階層ベイズモデルであつかう方法を示す.
話題提供
- 2x2 分割表 ー 単純,誤解,深淵
- 粕谷英一 (九州大・理)
- 分割表の作図・GLM・ベイズモデル
- 久保拓弥 (北海道大・環境)
資料
- 粕谷
- 久保
- 当日の投影資料 kubo2012table.pdf
- 当日宣伝していた教科書: 本/データ解析のための統計モデリング入門
- データファイル: kubo2012.RData
- 作図と GLM の R コード: plot.R
- WinBUGS を動かす R コード: runbugs.R
-
runbugs.R
を動かすためには R2WBwrapper が必要です
-