ぎょーむ日誌 2004-11-16
2004 年 11 月 16 日 (火)
-
0830 起床.
朝飯.
コーヒー.
0920 自宅発.
雪.
いよいよ本格的に寒くなってきたかな.
0930 研究室着.
-
苫小牧直径成長モデル,
昨日午後からやらせてる計算は
rain:time = 0.03
なんだけど,
最良モデルの AIC は 2047 あたりか?
rain:time = 0.01
はやはり傑出しているな.
-
とりあえず,
この計算は中断.
昨日メイルやりとりで検討した
モデル選択のやりかた改良に着手してみる.
-
ついでに Nelder-Mead 法な
optim()
やめてみて,
数値微分な
nlm()
も試みてみるが
……
こういう難しい推定問題では
nlm()
はあまり良くないような気がする.
ということで,
今後も
Nelder-Mead 法な optim()
使うことに.
-
さて,
いま検討しているモデル選択方式の改善策は,
以前から考えている
「気象値をみて事前選抜,高速化」
とかなり近いことに気づいた.
こういうふうに整理してみるとわかる.
原則
-
気象値
ps.prev
と mb6
は必ず含まれる
-
交互作用項
x:y
は
x
と y
がすでに選択されている場合のみ採用を検討する
手順 (ある気象値セットに関して)
-
まず
const + ps.prev + mb6
モデルを評価する.これが今までの
「最良な
const + ps.prev + mb6
モデル」より良くなければ,この気象値セットに
ついては検討をやめる.
-
const + ps.prev + mb6 + dbh.log
と
const + ps.prev + mb6 + dbh.log + dbh.log.sq
を評価して,これらのうち良いモデルが
1. のモデルより良ければそれを採用する.
良くなければ 1. のモデルを採用して,
この気象値セットについては検討をやめる.
-
交互作用項
dbh.log:ps.prev
と
dbh.log:mb6
のそれぞれを 2. に加えたモデルを評価する.
これらのうち良いほうが 2. より良ければ,
それを採用する.
ふたつの交互作用項が同時に入ったモデルは検討しない.
-
といったふうにやってみます,
と苫小牧ボスに連絡してから改造に着手.
1210 ごろ改造終了.
試運転してみてバグをとる.
-
1240 ごろから本格的に推定計算再開.
とりあえず
rain:time = 0.07
で
……
うーむ,
速いっ!
少なく見ても 10 倍
は高速化された.
-
それでありながら,
推定結果はまったく妥当にみえる
……
まあ,
こういう高速化が可能になったのは
「樹木の成長はどうきまっているか」
だけでなく
「何を重点的に推定すべきか」
が明確になったので,
それをうまく利用しているわけだ.
今までの計算はいわば「何もかも重要」方式,
といえる.
-
まあ,
私の場合,
樹木たちのふるまいがよくわかってきた,
とゆーより,
モデルの中における樹木データの挙動が
だいたいアタマの中で予想できるようになった,
というべきなんだろうが.
-
しかし 10 倍 (あるいはそれ以上)
の高速化が実現したところで,
けっきょくはひとケタの改善なのである.
というのも 70 時間近くかかっていた計算が,
7 時間になった,
というだけのことで.
いや,
10 倍でもたいへんありがたいんだけど,
高速化によって調べられる範囲はそれほど拡がったわけではない,
ということで.
-
まずはイタヤカエデ計算進捗中.
全体の 1/3 が片づいたところで 25 分ちょいか.
まあ,
やはり 15 倍ぐらいの高速化か?
全樹種の計算に必要な時間は 4-5 時間ぐらいかな.
-
げ,
また北大内のメイル配送が遅延している.
1 時間ちょい,
かな.
-
計算方式議論メイルを書いていると,
イタヤカエデの計算結果が出た
(イタヤカエデに関しては最終的に 18 倍ぐらいの高速化).
予想どーり,
以前の時間のかかる探索方式で
最良気象値セットが今回も最良気象値セットとして選択された.
つまり,
上でやってるように
const + ps.prev + mb6
なモデルだけで気象値を選抜してもそれほど問題なさそう,
ということだよな.
-
一区切りついたので昼飯.
今日は弁当がないので北大生協に調達に出る.
外は,
吹雪.
もどって昼飯.
-
1500 より
講座セミナー,
本日は M2 の堀端君で,
林床草本を痛めつけて見物しましょう,
という虐待もの.
データ構造みて
glm()
使うのはいいんだが
(いよいよ普及してきましたなぁ),
意味不明な
offset()
項とかの使いまくりはよせ
……
おかげで解析は全滅.
どうやら
林床植物師匠たる小菅せんせーの厳しい指導もあったようで,
生物学的な内容に関しては完璧なる隠匿に成功している.
修論だいじょうぶなのかね.
-
1240 ごろに始まった高速化計算は 4 時間で
6 樹種終了 (ウダイカンバは気象依存性が推定できない,
と判定されたので削除した).
まあ,
15 倍速ぐらいかな.
-
で,
気象値選抜とかよさそうではある.
尤度的にもそれほど悪くなっていない
(少々悪くなるのは不可避).
ただし,
この段階的モデル選択のせいで,
やや単調なみかけの結果ばかりに
……
まあ,
今までが複雑すぎたんだけどね.
-
苫小牧ボスからのご指示で,
このモデル選択をもう少し複雑にするよう
関数を書き換える
……
これって意味あるかなぁ,
ということで option 指定で挙動を変えるように作っておく.
まあ,
とりあえずはひととーり計算させてみるか,
ということで同じ設定で再計算.
-
1900 研究室発.
まだ雪.
1910 帰宅.
体重 73.0kg.
晩飯.
-
またメイル書きなど.
今日は苫小牧問題で一日が終わった.
計算十倍速はなかなかの進歩だ.
しかし計算だけですまされないところが世の中のツラいところだ.
なんとなく,
すけじゅーりんぐ破綻の予感があるのですが
……
-
[今日の運動]
-
腹筋運動 30 ×
3 回.
腕立ふせ 5 ×
3 回.
-
[今日の食卓]
- 朝 (0850):
米麦 0.7 合.
ハクサイ・ニンジン・ブナシメジのシチュー.
- 昼 (1450):
研究室お茶部屋.
北大生協サンドイッチ.
- 晩 (2000):
米麦 0.9 合.
ダイコンのキムチの素づけ.