KuboWeb top

更新: 2017-04-29 16:04:58

生態学のデータ解析 - FAQ 事前分布


[項目]


(まだかきかけです)

事前分布って何ですか? 

  • ベイズ統計モデルでは,観測データにもとづいて推定したい (つまり知りたい) パラメーターについては事前分布を仮定します
    • 事後分布(β) ∝ 尤度(β| 観測データ) × 事前分布(β)
    • つまりパラメーターβが「こんな確率分布にしたがうんじゃないかしらん?」といったことをあらわす確率分布です
  • 事前分布には次の三つのタイプがあります (くわしくは後述)
    1. 無情報事前分布
    2. 階層的な事前分布
    3. 主観的な事前分布

事前分布って主観的にてきとーに決めればいいんですか? 

  • 極言すればどんな事前分布も「主観的」でありますが……
    • 自然科学のデータ解析では,「無情報な事前分布」または「観測データに事前分布を決めさせる」としたほうが説明がラクでしょう

無情報事前分布ってどういうものですか? 

  • (メモ) 別名あるいはちかい概念: vague prior, weakly informative prior (Gelman)

階層ベイズモデルの事前分布ってどういうものですか? 

共役な事前分布って何ですか? 

  • 事前分布と事後分布が同じ種類の確率分布になるような事前分布です

主観的事前分布って何ですか? 

  • 「このパラメーターの事前分布はこうに決まってる」といったかんじで解析者の主観にもとづいて決められた事前分布のことです
  • 久保が考える主観的事前分布のつかいみち:
    • 測定誤差のモデリング: 測定誤差と「個体差」の区別がつかなくて困るときは,測定誤差の大きさを主観的に「えいやー」と決めてしまうといった方法をとらざるをえない場合がある
      • あるいは測定危機のマニュアルなどにかいてある「精度」などを信じる
      • これがイヤなら (少なくとも一部の) 標本を 二度以上独立に測定 してください
    • アヤしい「事前情報」とやらを使わざるをえないとき
    • どう考えてもこの因子・数量を説明変数にするのはおかしいだろ,という場合

以前の研究の成果を反映して事前分布を設定していいのでしょうか? 

  • これは主観的事前分布になります
  • McCarthy の 本/ベイズカエル本 にはそのような事例が満載です
    • 久保はあまりいい方法だとは思っていません
      • 以前のデータも含めて階層ベイズモデルで再解析したほうがよい,と考えています