更新: 2017-04-22 08:01:20
生態学のデータ解析 - 生態学会大会2017
[W12] データ解析で出会う統計的問題: 原因→結果の統計モデリング
- 日時: 2017 年 3 月 15 日 (水) 18:00 -- 20:00
- 場所: 早稲田大学, 生態学会大会 B 会場
- 企画者: 粕谷英一 (九州大・理)・久保拓弥 (北海道大・地球環境)
- 短縮 URL: https://goo.gl/5H9cLI
- 大会サイト内の 自由集会要旨
概要
この自由集会では,「原因→結果」を関係づける統計モデリングについて議論します. とくに「介入効果の推定」と「偏回帰係数と因果推論の関係」について検討します.
(林)保全生態学では、保全のためにしばしば人為的な「介入」が行われる。 そのような「介入がもたらす効果」の統計的な予測のためには、本来、「統計的因果推論」の理解が必要となる。 しかし、国内外問わず、現在の生態学分野では「何にでもGLM(M)とAIC」のような、 介入効果の推定の観点からは非常にマズい解析慣習が定着してしまっている。 本講演では、統計的因果推論の基礎概念(交絡、do演算子、バックドア基準等)を解説し、 また、生態学分野で多用される重回帰分析を念頭に、介入効果推定のための交絡への諸対処法を解説し議論する。 実際にformalに交絡変数を吟味することで結論がひっくり返る既往研究の事例も紹介する
(粕谷)データ解析の直接的な目的の多くは、どの要因(変数)がどのように影響しているのかといった 構造の理解やある量の変動を精度よく予測するにはどうしたらいいかといった予測の最適化であることが多い。 これらの“普通の”データ解析と因果推論は、一見、別物で関係が薄いように見えるかもしれない。 だが、予測でも構造の理解でも因果関係についてなんらかの仮定をしている。 一般化線形モデルのような回帰の枠組みに属する方法を使う際には、おおまかに原因(説明変数)と結果(目的/応答変数) や因果関係の流れを仮定している。
また、一般化線形モデルも含む重回帰での偏回帰係数の解釈は、因果推論の初歩の中の初歩と見ることができる。 データ解析からわかる因果関係と、因果推論の要点の理解は、“普通の”データ解析でも大いに役立つ。 なるべくシンプルな例で説明したい。
話題提供
生態学者のための統計的因果推論入門:重回帰の結果に基づき「介入」する前に
- 林岳彦 (国立環境研)
- 当日の投影資料: (後日掲載)
- その preview版
- 当日の投影資料: (後日掲載)
因果推論は、“普通の”データ解析の役に立つ
- 粕谷英一 (九州大・理)
- 当日の投影資料: (後日掲載)
参考になりそうな資料
- 林さんの blog (人気順)
- KRSK さんの blog
- 操作変数法 (Wikipedia) https://ja.wikipedia.org/wiki/%E6%93%8D%E4%BD%9C%E5%A4%89%E6%95%B0%E6%B3%95
- 生態学会自由集会のうちあげ - 未定