ぎょーむ日誌 2008-06-30
2008 年 06 月 30 日 (月)
-
0750 起床.
朝飯.
コーヒー.
0900 自宅発.
曇.
地環研前のガソリンスタンドで「佐賀」ナンバーの
警察車両が給油していた.
現在,
北海道内には日本全国から警官部隊が派遣されてるのである.
0915 研究室着.
-
R 自由集会の生態学会誌記事の修正.
本日中ぐらいに提出しないといけない
……
何ヵ所か修正してみる.
-
午前中でだいたい推敲終了.
共著者の竹中さん・粕谷さんに御連絡メイル.
-
明後日夕方の酒井章子さんの
セミナーペイジ
を更新
……
こりゃー,
けっこう難しそうなハナシだ.
-
昨晩,
かえりがけに投げておいた
帯広樹木開花モデルの MCMC 計算
……
10000 MCMC step に 13000 秒,
BUGS code
と
事後分布表.
まあ,
こんなところかなぁ.
-
まあ念のため,
「前年開花しなかった」
説明変数を
「前年開花した」
にとりかえて試しに計算させてみるか.
あまり意味がないけど,
結果は多少かわってくるので.
-
昼飯.
-
なんだか ThinkPad (Vine Linux) の CPU 負荷がみょーに高い,
と思ったら
……
CUP が起動した
/usr/bin/cnpkmodule
が動きまわっていた.
これはどうも lprm
で print job を殺しそこなうと,
かくのごとき状況におちこむらしい.
とりあえず sudo killall -KILL cnpkmodule
で粛正する.
-
R 自由集会原稿を学会誌編集部の命じている形式で
生成するための LaTeX わくぐみ作り.
ようするに,
いままで「できあがり誌面的なレイアウト」(下の図の左)
などで分量など調整してきたわけだが,
これを「いかにも『わーぷろ』出力」(右)
みたいにしなさい,
ってコトで.
-
どこかアホらしさもある作業,
もちろん「ファイルの内容をこぴぺ」するわけではなく
(これは自滅的だ),
「すでに作った部品をカタにながしこむ」
的にしあげるのである.
ただし図まわりがちょっととりっきーなので,
変換用 Perl スクリプトを作って対処する.
-
変換システムできた.
図が少なかったので,
2 年前
に書いてた
GLMM 解説記事
のときほど苦闘しなかった.
-
データ解析こんさる,
とかちょっとメイルかき
……
のつもりだったけど,
意外とてこずってしまった.
-
R でいうと
glm(y ~ x - 1, family = gaussian, ...)
というふうに「原点をとおる直線をつかった直線回帰」
をやったときに,
y
に関する「予測値」のハバは
x
とともに増大する.
というのも,
(傾きの推定誤差) カケることの x
,
というふうに「(後述するなんらかの) 誤差」がひろがるからだ
(intercept がゼロでない場合はもう少し
ハナシがややこしくなるけど).
-
図で示せば簡単なコトで,
こう.
下の図では
-
各
{X, Y}
のペアには Y = b * X
なる関係があるんだけど,
この b
は定数ではなく乱数
(平均 = 1, SD = 0.1 の正規乱数)
-
Y
の「測定誤差」
はつねに一定 (SD = 0.01)
となってるわけだが,
Y
に関する「予測値」のハバは
X
とともに増大します,
と.
-
「各
{X, Y}
のペアを関係づける b
は定数ではなく乱数」
ってどういうコトよ,
と思われるかもしれないけど
……
各 {X, Y}
が生物一個体で観測された量
(たとえば {アタマの長さ, アタマの幅})
なんかの場合,
個体ごとに b
なる値がちがっていても不思議はないでしょう.
-
まあ,
一個体から一測定値セットしか得られないけど.
以前から言ってるように (言ってたっけ?),
このあたり測定誤差と個体差
(ここでいう
b
のちがい)
を区別したければ一個体から「二回以上の測定」
するしかありませんなあ (前の測定値は見ないで).
-
全個体共通の
b
だ! と断定されるヒトもいるかもしれない.
だとしても,
Y
に関する「予測値」のハバは
X
とともに増大する.
それは有限個のデータで推定しているために,
b
の推定値にハバが生じるためだ.
ただし,
この立場 (非ベイズ的立場?)
をとるならばサンプル数 (ここでいう個体数)
をどんどん増やせば b
の推定値のばらつきはどんどん小さくなります
……
となるわけだが,
はたして実データではどうなってるでしょうね.
-
ま,
ともあれ生物なんかの測定値の場合,
傾きだかなんだかの
b
って個体ごとにちがっててもぜんぜん不思議ではないよね.
するといくらサンプル個体数ふやしても上の図みたいな
ばらつきが消せない.
-
で,
このときに
「分散パラメーターが
X
とともに
増大する統計モデルをゐんばぐすで実装するぞ!」
などと
むやみに
ハリきってしまうのは場合によってはまずいのかもしれない.
それは「測定誤差 (分散パラメーター) の増大」ではなく,
単なる「b
のばらつき (個体差)」
で説明できてしまうかも,
といった状況かもしれないわけだ
……
はい,
このあたり自戒をこめて書いております.
-
めんどくさいのは「切片」なる量がゼロでない場合だ.
-
昨年度の修論したうけ計算についてふりかえってみると
……
樹木のシュートや実生に関するカタチの統計モデリングでは
何も問題ナシ,
というかんぢですな.
これらは「あろめとりー」っぽいモデリングになっており,
原点をとおるからだ.
-
えーい,
しかしながら,
いつもいつもめんどうを招来するのは
樹木・森林生態学における暗黒大陸,
すなわち樹木の太さ-樹高 (D-H) 関係だ.
これはめんどうだ
……
仮に「D-H 関係ってそもそも何?」
といった考えるだけでもイヤになる問題についての検討を放棄したとしても
……
-
と不安なキモチになっていたら,
ありがたいことに帯広樹木開花の「念のため計算」が終了したので,
結果の回収・保存・記録.
BUGS code
と
事後分布表.
やはりあまり意味のない計算だったけど,
parameter 6 に関しては「対称」にちかいカタチになってて,
なかなかよろしい
……
うん?
これってどういう意味なのかな?
-
これでぜんぜん完成したモデル,
というかんぢではないけど一連の計算はひとまずここで終了.
本日えられた結果に関していろいろ作図プログラムとか作らんといかんね.
-
しかしながら,
粕谷さん・竹中さんから R 自由集会記事の推敲不足などのご指摘いただき
……
ああ,
どうして私は作文のみなおし集中力なるものが継続しないのだろう,
と反省しつつみなおし.
-
で,
本日が〆切とゆーことになっているので,
生態学会誌編集部に原稿ファイルを提出,
で本日はオワってしまった.
2000 研究室発.
2015 帰宅.
ちょっとうんどう.
晩飯の準備.
晩飯.
-
[今日の運動]
-
腹筋運動 30 ×
3 回.
腕立ふせ 10 ×
3 回.
スクワット 100 回.
ストレッチ.
-
[今日の食卓]
- 朝 (0810):
米麦 0.6 合.
キャベツ・ミズナ・ニンジン・ネギのサラダ.
- 昼 (1420):
研究室お茶部屋.
米麦 0.6 合.
ネギ・サバの電磁波蒸し.
- 晩 (2130):
米麦 0.8 合.
キャベツ・タマネギ・ニンジン・ホタテのカレー.
キャベツ・ミズナ・ニンジン・ネギのサラダ.