更新: 2017-04-29 16:04:58
生態学のデータ解析 - FAQ 事前分布
- ベイズ統計モデルで使う事前分布についてのよくある質問と 久保拓弥 によるてきとーなる回答を並べてみました(まだ書きかけです)
- 参照: FAQ 系ペイジ一覧, ベイズ統計 & MCMC
- Prior Choice Recommendations (Andrew Gelman 編) https://github.com/stan-dev/stan/wiki/Prior-Choice-Recommendations
[項目]
- 事前分布って何ですか?
- 事前分布って主観的にてきとーに決めればいいんですか?
- 無情報事前分布ってどういうものですか?
- 階層ベイズモデルの事前分布ってどういうものですか?
- 共役な事前分布って何ですか?
- 主観的事前分布って何ですか?
- 以前の研究の成果を反映して事前分布を設定していいのでしょうか?
(まだかきかけです)
事前分布って何ですか?
- ベイズ統計モデルでは,観測データにもとづいて推定したい (つまり知りたい) パラメーターについては事前分布を仮定します
- 事後分布(β) ∝ 尤度(β| 観測データ) × 事前分布(β)
- つまりパラメーターβが「こんな確率分布にしたがうんじゃないかしらん?」といったことをあらわす確率分布です
- 事前分布には次の三つのタイプがあります (くわしくは後述)
- 無情報事前分布
- 階層的な事前分布
- 主観的な事前分布
事前分布って主観的にてきとーに決めればいいんですか?
- 極言すればどんな事前分布も「主観的」でありますが……
- 自然科学のデータ解析では,「無情報な事前分布」または「観測データに事前分布を決めさせる」としたほうが説明がラクでしょう
無情報事前分布ってどういうものですか?
- (メモ) 別名あるいはちかい概念: vague prior, weakly informative prior (Gelman)
階層ベイズモデルの事前分布ってどういうものですか?
共役な事前分布って何ですか?
- 事前分布と事後分布が同じ種類の確率分布になるような事前分布です
- 例: 正規分布の平均値μの事前分布を正規分布に設定すると,μの事後分布も正規分布になる
- これを読んでください: http://en.wikipedia.org/wiki/Conjugate_prior
主観的事前分布って何ですか?
- 「このパラメーターの事前分布はこうに決まってる」といったかんじで解析者の主観にもとづいて決められた事前分布のことです
- 久保が考える主観的事前分布のつかいみち:
- 測定誤差のモデリング: 測定誤差と「個体差」の区別がつかなくて困るときは,測定誤差の大きさを主観的に「えいやー」と決めてしまうといった方法をとらざるをえない場合がある
- あるいは測定危機のマニュアルなどにかいてある「精度」などを信じる
- これがイヤなら (少なくとも一部の) 標本を 二度以上独立に測定 してください
- アヤしい「事前情報」とやらを使わざるをえないとき
- どう考えてもこの因子・数量を説明変数にするのはおかしいだろ,という場合
- 測定誤差のモデリング: 測定誤差と「個体差」の区別がつかなくて困るときは,測定誤差の大きさを主観的に「えいやー」と決めてしまうといった方法をとらざるをえない場合がある
以前の研究の成果を反映して事前分布を設定していいのでしょうか?
- これは主観的事前分布になります
- McCarthy の 本/ベイズカエル本 にはそのような事例が満載です
- 久保はあまりいい方法だとは思っていません
- 以前のデータも含めて階層ベイズモデルで再解析したほうがよい,と考えています
- 久保はあまりいい方法だとは思っていません