install.packages()
はできるけど,
update.packages()
しようとすると Program_Files 内の上書き禁止がどーのこーので
うまく動作しなかった.
library(R2WinBUGS)
を使って R から
WinBUGS
を呼びだして使いたい場合もこの「管理者」起動が必要とされる,
といったあたり.
WinBUGS が何やら Program_Files 内のファイルを書き換えたりするんだよね.
ROC や AUC は何だかよくわかっていなかったのですが,いろいろ勉強してみると,保全生物学的な文脈のもとでは,prediction が重要かつ偽陽性 (不在なのに在と主張) が偽陰性よりまずい,というのがひとつのまとめかたかも,という気がしてきました.
つぎに ROC や AUC は何をしているのかと考えると,これはあてはまりの良さというより偽陽性のおこりやすさ (予測におけるまちがいの一部) を評価しているわけですが,保全生態学的な個体群サイズ予測では偽陽性は偽陰性より深刻な問題であると明確に指摘・主張するのもよいのではないかと思います. たとえば,個体群浮動 (population drift) が発生しうる状況では個体群サイズの過大予測は絶滅確率の予測をおおいにゆがませるといった指摘ですね (個体群浮動に関する論文には個体群サイズと絶滅確率の関係がいろいろとあると思います).
さて,ROC+AUC は偽陽性の存在を示すひとつの方法ですが,これだけでは個体群サイズ見積りに関してどのようなバイアスが生じているのかよくわかりません.そこで cross validation の結果を利用して,それぞれのモデルによる個体群サイズ (この場合だと合計「在」地点数の予測?) の予測のよしあしを明示的に示すのが良いかと思います.たとえば,このモデルだと個体群サイズを ○倍過大に推定し,その予測分布 (MCMC の結果を利用して生成) はこのようにずれていると示してみるのはどうでしょうか.
これに対して,あてはまりの良さは必ずしも重要な点ではないように思いますので, deviance をつかった指標などは不要ではないでしょうか.あてはまりの良さにしつこくこだわる読者が多いような気もしますが,こういうヒトたちはだいたいにおいて (言うところの) 「説明力」と予測力の区別がついていないので,そのあたりを明確に記述すれば良いでしょう.
i
での
「在」
確率
p[i]
が与えられているとすると,
p[i]
をランダムにひとつ選ぶ
p[j]
をランダムにひとつ選ぶ
p[i]
> p[j]
となっている確率が AUC に等しい,
ということになる.
完全識別できていれば
p[i]
> p[j]
となる確率 (AUC) は 1 となる.
p[i]
> p[j]
となる確率が低ければ低いほど,
偽陽性が多くなるとは言えるけれど,
同時にそれは偽陰性も増えるということだ.
つまり,
こういう識別の問題においては偽陽性が大きければ,
自動的に偽陰性も大きくなる,
ということになる.
これってあたり前のことなんだろうけど,
ぜんぜん気づかなかった.
マヌケだ.
Rosindell, Wong & Etienne (2008) A coalescent approach to spatial neutral ecology.Ecological Informatics 3:259-271そして深谷君が
Etinenne & Alonso (2007) Neutral Community Theory: How Stochasticity and Dispersal-Limitation Can Explain Species Coexistence. Journal of Statistical Physics 128 485-510の途中まで (つづきは明日). どちらもたいへん勉強になった. このあたりまた後日にでも.
1. データ解析に不可欠な統計モデル ・以降の章の内容などが修正されないままになっている 2. 確率分布と統計モデルの最尤推定 ・内容の入れかえなどの修正がまだ十分ではない 3. 一般化線形モデル (GLM) ・全体のまとめなどが新しい内容を反映していない 4. GLMのモデル選択と検定 ・まだまだ大幅な修正が必要 ・モデル選択についてはあまりくわしく書けないかも ・検定については久保の意見みたいなものを大幅削除する 5. GLMあれこれ ・以前の GLM 章の内容の「雑」な部分を並べただけの状態 6. 一般化線形混合モデル:観測できないランダム効果のモデル化 ・もうちょっと他の章とのつながりを説明する 7. マルコフ連鎖モンテカルロ法と GLM のベイズ化 ・説明かきがまだまだ必要 ・簡単な Gibbs sampler 例題を追加する必要あり ・WinBUGS の使い方はこちらに移動する 8. GLMMの階層ベイズモデル化 ・WinBUGS 関係を第 7 章に移動 ・個体差 + 場所差のような例題を追加 9. 空間構造のある階層ベイズモデル ・ここまでの章の変更を反映する…… ただし, ここに書いてたあれこれは, 夕方の相談では「無理なんじゃないの」 という方向になったわけだが.