ぎょーむ日誌 2008-04-23
2008 年 04 月 23 日 (水)
-
0730 起床.
朝飯.
コーヒー.
NHK 北海道の朝のラジオ,
本日は地環研の春木さんが登場して,
寿都町のブナ林のハナシをしていた.
そういえば,
ちょっと前に森林総研の北村さんが登場してたなぁ.
0845 自宅発.
晴.
明日からは気温は低下,
つまり平年なみになるそーで.
0900 研究室着.
-
昨日の帰りがけになげておいた 40000 MCMC step 計算,
6660 秒で終了してた.
これは昨日の 10328 秒より短縮されてるわけだが
……
-
昨日の悪戦苦闘はこの計算時間短縮にしか反映されてない,
ともいえる.
やはりいまだに shading してる (ことになってる) 草本の挙動
(
log.w.herb[1:6]
)
がうまくモデル化できていなくて,
見くらべてみると
収束ぐあいとしては昨日の朝とあまり変わるところがない
……
-
自分自身,
すぐにド忘れしてしまうので記録しとくけど,
昨日とのちがいは
alpha
なるパラメーターをもちこんで,
草本による shading の値が 0-1 間におさまるようにしたところである.
これがそれほど有効ではなかった,
ということなのかな?
-
ふーむ
……
今までいいかげんにデータ解析されてた分野,
とくに群集生態学なんかは今後は Bayes 化が進行していくのは
マチガイないところだろうとおもうんだけど,
このデータ解析でも見られるようになかなか面倒な部分がある.
それは群集内の種間の相互作用の推定というやつだ.
-
生態学でいう相互作用とやらは
(相関ではなく) 因果関係であり,
因果関係を推定したいならば原理的には時間変化データが必要とされる.
しかしながら,
なかなかそのようにはデータがとられていない.
データがないのに相互作用らしきモノを無理矢理に推定しようとすると
こういう悪戦苦闘状態におちいる.
-
それじゃー気あいと根性で時間変化データとりゃあいいのか,
というとハナシはそう簡単ではない.
昆虫とかの動物群集の場合,
群集の変化はわりと短期間に観察されるんだけど,
季節変化とかイヤな外力に振りまわされる部分が大きいので,
データとる回数が増えるにつれ次第に様相が複雑怪奇化していく,
つまり自滅的な状況におちいったりすることなんかも.
-
いっぽうで植物群集なんかだと変化はもっとゆっくりしてるんだけど,
ゆっくりしすぎていていったい何年ぶんのデータとれば
言うところの相互作用とやらが推定されるの?
ということになりがち.
-
ベイズ統計学の推定計算にもちいられる
Markov chain Monte Carlo (MCMC) 計算,
その故郷である統計力学でかくのごとき計算方法が発達してきた背景には
「相互作用の強さの推定が困難 (だけど推定したい)」
を克服することにあった.
すなわち,
システムの構成要素間のミクロな相互作用が推定困難な
(何が原因で何が結果なのか観測による識別がしんどい)
状況のもとで,
システムの内部状態の可能なパターンを列挙
& システム全体のマクロな統計量を算出できるところがウリになっている.
-
群集生態学のデータ解析においても MCMC 計算の
この性質を悪用してみせたいところなのだが
……
まあ,
上のように「内部状態の可能なパターンを列挙」させるためには,
システム全体が (熱力学的) 平衡でなければならんような気も.
この場合の「平衡」の定義は (私のアタマの中では) あいまいなのだが
……
-
まあ,
放棄スキー場植生の問題にたちかえると,
ここで推定がうまくいってない理由は
……
たとえばある quadrat で稚樹の本数がゼロだったときに,
このモデルに組みこまれているふたつの説明
-
「ここは草本がたくさんいるから樹木稚樹は少ない」
(fixed effects 的)
-
「この場所にはそもそも樹木なんていないんだよ」
(random effects 的)
推定計算の中でこれらの
「オレが正しい (オレが尤度を改善してやってるんだ)」
バトルの決着がまったくさだかではなく,
いつまでたっても
「やっぱり草本による shading」
-
「いやいやそもそもいないんだ」
の両者のあいだを激しくふらふらさまよっている
(つまり熱力学的平衡とゆー範囲をこえて挙動に落ちつきがない)
ことにありそうだ.
-
ひとことで言えば,
現在のモデル + 観測データの組みあわせのもとでは,
どちらの説明が正しいのか
……
というか,
それぞれの貢献の大きさの範囲を決めることができません,
と.
-
……
てなコトを考えつつ,
モデルをでたらめに改訂しつつ
(random effects まわりは改訂の余地が少ないので,
草本による shading の関数型をひねくるぐらいしかできない),
計算まち時間にメイルを書いたり,
研究室ネット雑用をこなしたりしつつ
……
-
さすがにこれだけぢたばたしてると,
統計モデルの挙動が (いまさらながら)
わかってくるのでだいたいの解決のめどがついてきた.
やはり残念ながらどうしても計算時間は長くならざるをえない,
という状況のようだ.
-
しかし本日もまだケリがつかずに,
1930 研究室発.
1945 帰宅.
晩飯の準備.
ちょっとうんどう.
晩飯.
-
「ふたつの確率分布間の距離」
というのを考える.
カルバック-ライブラー情報量
(Kullback-Leibler divergence)
ってのは対称的ではないからなぁ
……
などと考えつつ Wikipedia をながめてたら,
symmetrised divergence
として対称的な「距離」が定義されてた.
ハナシは簡単で
D(P | Q) + D(Q | P)
と足してるだけ
……
ああ,
なんでこんな簡単なことが自分では気づかなかったのだろうか.
-
[今日の運動]
-
腹筋運動 30 ×
3 回.
腕立ふせ 10 ×
3 回.
スクワット 100 回.
-
[今日の食卓]
- 朝 (0750):
米麦 0.6 合.
ダイコンサラダ.
- 昼 (1340):
研究室お茶部屋.
米麦 0.6 合.
春雨スープ.
- 晩 (2140):
米麦 0.8 合.
キャベツ・タマネギ・ニンジン・ひき肉のトマト煮.
豆腐.