ぎょーむ日誌 2007-05-17
2007 年 05 月 17 日 (木)
-
0700 起床.
コーヒー.
朝飯.
昨日,
現実逃避でながめてた某査読原稿のオワりかたについて考えてしまう
……
人間,
こういういいかげんな内容のものを読まされると感情的になりがちなのだけど,
ともかく冷静に対処しなくては
……
と考えてるうちに朝から気分わるくなってきたので,
もう査読報告でも書いておくりかえしてしまおうかしらん,
という方向に.
0900 自宅発.
曇.
0915 研究室着.
-
気分汚染問題,
数式をいろいろ書いてみて整理・検討するうちに少しおさまってきた.
-
ということで,
不毛な労働はアトまわしにして,
昼前の時間はもう少し生産的なコトに使おう,
ということで地衣類繁殖論文原稿,
志水さんぱーと読み
……
今日はなんとか読めた.
というか
(現時点ではまだ)
短いものなんだからさっさと読め,
というかんぢですね.
-
どういう方向で書けばよいかわかってきたので,
地衣類繁殖の階層ベイズモデル作文にとりくんでみる
……
で,
「書き直し」の手間をはぶくべく
OpenOffice
で書いてるんだけど,
やっぱこういう「わーぷろ」ってのは楽しくないねえ.
-
おっと,
後藤さんから LaTeX 質問が.
LaTeX はこんなに快適なのにー
-
ああっ!
昨日よけーなこと書いてしまったせいか,
amazon.co.jp において
Clark 御大本
Models for Ecological Data: An Introduction (ハードカバー)
(ペイジ数 632)
とやらが 2490 円から 8854 円
に「値上がり」している!
ねんのため書いとくと
amazon.co.jp で言うところの
Models for Ecological Data (ペーパーバック)
(ペイジ数 152)
って内容はまったく別のもの
(おそらく R コードとか掲載した演習本)
なので注意してね.
-
地衣類論文原稿,
繁殖モデルの前にめんどうな
太陽軌道ハナシ
も書かんといかんなあ.
これも完全にド忘れしてるし.
-
そして太陽光強度のハナシとはすなわちこれまた三次元計算のハナシなのである.
これの説明かきは激烈に疲れるであろう.
なンか世の中の生態学研究者たちの中で
私ばかりが何度も何度も三次元計算の説明やらされてるような被害者的気分に
おちいりつつあるんですけど.
-
昼飯.
動員解除されて渡島駒ヶ岳から無事に復員してきた院生たちから
劣悪きわまりない彼地の労働体制について
……
-
Vine Linux の
SCIM
ってかなりダメ,
という気がしてきた.
scim-heler
とか多数のプロセスが暴走的に増殖していくのである.
以前からできるだけ使わぬよう
(つまり古き悪しき (?) kinput2
愛用)
していたんだけど,
本日は最後にのこっていた X 端末機的 lex
でも sudo apt-get remove scim anthy
してしまった
(Anthy には罪はなさそうだけど,
これって Vine Canna にまだいろいろな面で負けてるような気がしたんで).
-
またトドマツの世界にひきもどされる.
で,
後藤さんとメイルやりとりしてるうちに,
ちょっと不思議なことに気づいた.
-
ここでは階層ベイズモデルで一般化線形混合モデル (GLMM)
的な状況あつかってるんだけど,
こういった GLMM における random effects ってのは,
じつは (一般化ではない) 線形混合モデルのそれとはちょっと意味あいが
異なるのかも
……
という可能性にいまさらながら気づいた.
もしも仮に random effects を
「確率分布の平均
はかえないけれど,
ばらつきはかえる要因」
と定義してしまうと
(これは古典的というか
Crawley 的
というか),
いわゆる link 関数が log だの logit だののときには
……
はい,
成立してないように見えますね.
-
ちなみに分布が正規分布であってもパラメーターの結合が
非線形の場合
(
nlme()
であつかうような問題)
についてもやはり同様である.
-
まあ,
非線形の場合はどうすればいいのかちょっとわからないけど,
GLMM 的なやつに関しては,
random effects の定義を
(たとえば)
「線形予測子の平均
はかえないけれど,
ばらつきはかえる要因」
とすればいいのかな
(「線形予測子の確率分布」みたいなヘンなこと考えてますね).
つまりこれは,
なんというのか,
link 関数で変換された世界の線形モデル,
という描像がつねにつきまとうわけね
(観測データを変換してるわけじゃないよ).
-
ということで,
事後分布つかった「予測」計算は慎重にというか,
まあよけーなこと (推定したパラメーターの一部だけ使って計算,など)
やらずに素朴に事後分布全部で積分しなさい,
ということなのかな.
-
ともかく知りたい「何か」の事後分布をだす → 最後に積分
-
あるいは何でもかんでも積分するのではなく,
事後分布のパーセンタイル値
というか ``quantile'' 値
(中央値とか 95% 信頼区間とか)
とかのほうが無難かねえ
……
「○○の事後分布の平均」
には要注意
(○○に依存),
ということで
(あたりまえか).
-
江川さんとサロベツ種子まき実験データ解析相談.
なるほど「こんたみ」を
(嗚呼また)
random effects
に押しつけてしまって
glmmML(生残数 ~ あれこれ, family = poisson, offset = ...)
とするのはウマいやりかただなあ.
この場合,
offset 項
は
offset = log(最初の種子数)
にしましょう,
といった助言
(理由は「offset 項」リンク先に).
-
窓の外はいつのまにやら雨.
-
江川さんがまた
glmmML()
質問にきて話しているうちに
……
「めんどうな問題は Bayesian で」
方針が適用されてしまった.
-
どこがめんどうか,
というと
-
処理区によって播種した種子数が異なる
-
さらに播種数ゼロの区画でも実生はでる
---
埋土種子があるから
(上記「こんたみ」)
-
そして播種数ゼロ区画では offset わざが使えない!
(
log(0) = -∞
)
-
とうぜんながら,
播種数 > 0 な区画でも埋土種子由来の実生がまじってる
-
そこで
埋土種子から発芽実生数を
隠れ状態
(確率変数)
としてあつかう
そして言うまでもなく,
160 個あるサロベツ湿原上の実験区画ごとの
``random effects'' がかなり大きい.
-
……
といったことを BUGS 言語で書いていく.
なんか最近は毎週のように
新しい階層ベイズモデルプログラムかきをやってるよーな
……
-
R2WinBUGS
から Wine
経由でよびだされるゐんばぐす上で MCMC 計算が走りはじめたので,
江川さんのチェックをうけつつヨシ・ヌマガヤ・ミカヅキグサ
発芽実験の結果を表現できる階層ベイズモデルを改良していく.
いろいろと工夫を重ねて
「すばやく収束するモデル」
を発見した
……
ふーむ,
興味ぶかい
……
-
本日の計算はここまで.
2315 研究室発.
雨.
晩飯.
2430 帰宅.
-
[今日の運動]
-
[今日の食卓]
- 朝 (0730):
シリアル.
- 昼 (1340):
研究室お茶部屋.
モリモトのサンドイッチ.
- 晩 (2400):
北 14 「串ごん」でシーフードピザ.