ぎょーむ日誌 2006-11-24
2006 年 11 月 24 日 (金)
-
0830 起床.
0840 自宅発.
曇.
ちょっと雪.
0855 研究室着.
-
昨晩めいじておいた計算,
Moliniopsis-f
(ヌマガヤ開花個体)
で停止しているな
(Trap 窓が出現)
……
集計してみるとたしかにここは 5
個体しかいなくて推定できない,
と.
> sapply(c("s", "j", "f"), function(st)
+ sapply(v.target.spc, function(sp)
+ sum(data[data$spc.stage == paste(sp, st, sep = "-"),]$Freq)))
s j f
Rhynchospora 232 367 287
Hypochaeris 299 180 39
Drosera 153 47 172
Solidago 172 165 13
Moliniopsis 169 132 5
Lobelia 12 153 8
Eriophorum 62 60 1
Carex 17 92 3
ということで,さっそく小山さんと相談.
また多変量正規乱数の活躍の場が増えてしまいそうな予感
……
とりあえず,
お茶部屋で朝飯.
コーヒー.
コードみなおしてるうちにセミナー時間.
1030
研究室セミナー,
本日は北村君の阿寒アカエゾマツ直径成長速度解析
(年輪データ).
ガンマ分布の GLM つかった解析.
まあこんなもんか,
というかんじで
……
とりあえず同じ個体から何度も観測値とっている
縦断的 (longitudinal) なデータ構造なので,
random effects
考慮した混合モデル化が必要,
といった毎度のごとき指摘とか.
これでかなりすっきりするだろう.
このテの問題となると甲山さんコメントが
(よくも悪くも)
かなり「独特」なものになり,
つきあいの長い人間でなければなかなか理解できぬ甲山わーるどが展開する.
で,
甲山さん言うことをもし仮に全部マにうけたとすると,
すごく複雑な階層ベイズ + random field モデルになるな
……
とアタマの中でモデリングしながら拝聴してたんだけど,
ご本人はそのへんをどこまで理解しているのやら,
興味ぶかいところだ.
[いつのまにか雪]
かとー記念おふぃすからの光景
(東側).
さてセミナー終了後は北大構内走によい時間なんだが
……
けっこう雪がふっている状況.
うんどう不足の日々をすごすうちに冬になってしまったのか.
計算はうまくいってないけど,
だからといって「自分を罰するために雪の中を走る」
という心境にはなれないしなあ.
-
成長段階 (
s, j, f
の 3 段階)
をばらばらに解析するのではなく,
これらをまとめて,
かつ同時に stage 間の相違も推定するよう BUGS 計算まわりを改善する.
6 次元の多変量正規分布を事前分布としてつかわねばならぬ,
と.
-
Wishart 分布まわりのばぐにやられつつ,
なんとか改造終了.
お,
雪がやんでるな.
ということで,
北大構内走にでることに.
ついでにその間は長めの計算やらせてみる.
-
1345 研究室発北大構内走.
雪が路上にあるとやはり走りにくい.
そして突発的に雪がふったりやんだり.
1420 研究室もどる.
昼飯.
しかしお茶部屋内の院生密度が急激に高まる event が発生したので,
すばやく逃げ出す.
-
6 次元多変量正規分布モデル,
計算にえらく時間かかってるな.
40-50 分ぐらいで終了するかと思ったけど,
すでにその二倍以上が経過している.
まあ,
途中で止めるのもなンだし,
最後まで計算させてみるか
……
う,
きちんと確認できなかったんだけど 1000 step に二時間ついやしたような.
あと 600 step.
-
お茶部屋で宮田さんと
輪読会
の予習.
第 10 章の ESS 種子サイズだの移動分散の進化だの書いたの
Deborah Charlesworth か?
うーむ,
計算結果だけ示されてもねえ
……
-
アキノキリンソウ 3 stage まとめて ZIP 階層ベイズモデル,
3 時間 20 分を費して終了
……
しかし BUGS 言語で書いた model 定義に
一文字
の書きまちがいがあり,
遠路 12000 秒の MCMC 探索の旅路の果てに得られた何もかもは
一瞬にして鳥有に帰したのであった.
嗚呼.
気をとりなおして再計算を命じる.
-
メイリングリスト
stats
にながれた
R user 会 (12/8, 12/9)
の
abstract.
なんと Ripley 先生は 12/8 だけでなく 12/7 も講演するのか.
残念ながらこれには参加できないが.
それより自分の準備がですね
……
いやいやまだスケジュール破綻ではないけれど.
-
600 MCMC step ではまだまだ収束してませんなあ.
これでも 4440 秒ついやしたんだが.
計算そのものは破綻なく進捗するようなので,
8 植物種ぜんぶ,
合計にして十数時間かかりそうな計算を命じる.
-
計算まち時間は先日「とりあげた」シウリザクラ受粉実験データの解析.
「花序差」
を考慮した GLMM
による解析.
定番の
glmmML(),
cbind(結実した, しなかった)
表記法は使えるは stepAIC()
は使えるは (今日は使わなかったけど),
ホントに便利になりましたねえ.
-
2004 年の自由集会
で紹介した
グループわけ
関数を使っていろいろな組みあわせ
(4 処理あるので 15 とーり)
のもとで
glmmML()
してみる
……
という部分はささっとできたんだけど,
見ばえのよいテイブルを作るところで苦闘というか,
かなり「汚い」 coding になってしまった.
set AIC autogamy geitonogamy control outcross SD
(naive prob.) (690) 0.08 0.17 0.33 0.51 --
1 (a)(c)(g)(o) 207.9 0.06 0.15 0.31 0.57 0.87
2 (a+g)(c)(o) 212.5 0.10 0.10 0.31 0.57 0.93
3 (a)(c+g)(o) 214.0 0.06 0.22 0.22 0.57 0.95
4 (a)(c+o)(g) 215.8 0.06 0.14 0.44 0.44 0.96
5 (a+g)(c+o) 219.6 0.10 0.10 0.44 0.44 1.01
6 (a+c+g)(o) 229.1 0.15 0.15 0.15 0.58 1.12
7 (a+c)(g)(o) 231.1 0.15 0.14 0.15 0.58 1.12
8 (a)(c+g+o) 233.9 0.06 0.32 0.32 0.32 1.17
9 (a)(c)(g+o) 235.9 0.06 0.33 0.31 0.33 1.16
10 (a+c)(g+o) 251.0 0.15 0.33 0.15 0.33 1.36
...
やはり 4 処理ごとに結実率が異なるとするグループわけ
(a)(c)(g)(o)
が最小になったか.
(naive prob.)
ってのは (結実合計)/(花数合計) という単純なわりざんち.
この AIC が劣悪である理由は
「花序間の overdispersion がとても大きい」
ということだ.
繁殖生態学のヒトたちって,
なぜかしら割算だい好き &
このあたりきちんと解析する気がないんだよねえ
……
よくあるのは花序ごとの割算値 (すなわち平均値)
のそのまた平均値の計算,
とか.
それって下の図のごとく花序サイズ
(○ の大きさ)
がけっこうちがうデータでやったら,
ホント意味不明な平均値ですよ
……
ということでこういうありがちな受粉実験データ解析なんかも
glmmML()
とかでやったほうが良いと思うんだが.
-
てなことを (苫小牧ではなくこちらの)
平尾君に (無理矢理) 見せて説明してるうちに,
上のややこしいテイブル生成の中にバグあること発見
(上に示しているのはすでに修正ずみ)
……
見せびらかして良かった.
ついでに
「上の図みたいに非アルファベット順 box plot横軸を生成するには?」
なるいつもの R FAQ うけたので,
バグとり御礼ということで,
factor(data$treatment, levels = c("a", "g", "c", "o"))
「レヴェル変換わざ」
の実演つき説明.
-
というあたりで本日は撤退.
2020 研究室発.
雪やんでる.
2040 帰宅.
体重 71.6kg!
ひさびさに 71kg 台の世界にかえってきましたなあ
……
今年の最悪の時期
(6 月ごろ?)
とか今より +3kg ぐらい太っていた.
晩飯の準備.
晩飯.
-
[今日の運動]
-
[今日の食卓]
- 朝 (0940):
研究室お茶部屋.
食パン.
- 昼 (1440):
研究室お茶部屋.
食パン.
- 晩 (2210):
米麦 0.7 合.
ハクサイ・ネギ・ショウガ・豆腐・ワカメのシチュー.