ぎょーむ日誌 2003-11-13
2003 年 11 月 13 日 (木)
-
0830 起床.
朝飯.
コーヒー.
0910 自宅発.
晴.
雪はほとんど融けてる.
0920 研究室着.
-
別の保険屋撃退するべく勉強.
1000 に来るといってたのに 1100 にくる.
15 分で撃退.
-
さー,
こっからがたいへんだ.
苫小牧
樹木「月ごと」直径成長データの解析.
ともかく混沌たるデータなので
R
の便利作図関数
xyplot()
使ったり (といってもこれが初使用),
また作図関数作ったり
……
すでに研究室内に取り立てのヒトが来ておられるよーなんだけど,
「気づかぬふり」
をして作図問題に取り組む.
どうやら他の院生たちと昼食に出られたようなので,
私もお茶部屋でこそこそと昼飯.
-
1300 より研究室お茶部屋で
鍋嶋さんと直径成長モデリングに関する談判開始
(作図はなんとか間に合った)
……
月別直径成長というのはなかなか面白い.
私はまるっきり知らなかったんだけど,
冬期にはじっさいに直径が縮んでしまうってことのよーで
(幹内の流水量うんぬんと関係あるらしい).
-
で,
このあたりのデータと気象データのあいだに対応つけてしまおう,
というハナシなんだが
……
ただでさえ難しいハナシをしてるのに,
どんどん disturbance が入って,
もう混乱のきわみに.
-
さきの年末年始の苦闘を連想させる
苫小牧の村上さんが現れる
……
本日は苫小牧借金取り二重攻撃の日かとみがまえたんだけど,
どうも低温研に用事があって,
というようなことだそーで.
-
不毛なる書類書きに疲幣した甲山さんが徘徊してきて,
直径成長解析なんざぁ何もかもモーメント法でやればいいんだ,
というような正気を疑わせる暴言を.
たぶんバテて心神喪失状態になったところをネラって,
さまよえる
Karl Pearson
の亡霊が憑依したんだろう.
-
石井さんからの督促で,
論文セミナー関連
ペイジ
を生成するスクリプトを書き直す.
なんか本日は,
ぢりぢりする顧客の前で
即興コーディングを強いられる状況が何度も
……
-
大澤君が強制わりこみ
……
R MASS library の
stepAIC()
の挙動がヘンだぁ?
結果をみるとたしかにヘンに見える.
しかし原因がすぐには特定できんので後まわし
……
あとになってこれは私と大澤君がすさまじく間抜けな
(かつ重要な)
失敗を共作していた,
ということが判明する.
いつもココロにこの標語を:
ヘンだヘンだは工夫がヘンだ.
-
1800 ごろに鍋嶋さんと村上さんが
「本日のところはこれでカンベンしてやろう」
というあたりでカンベンしていただく.
宿題あれこれ:
-
連続なのか離散なのか,
非負なのかそうでないのか判然とせぬ確率分布を定式化する
-
確率論的ゆらぎと測定誤差と
不可知論的個体差の三者を混同せぬよう
混合モデルする方法をでっちあげる
-
月別変化もしくは累積値のどちらに意味あるのかよくわからぬ
気象データを線形予測子じみたものとして
あつかえる方法を考える
……
サイズによる応答の違い,
とか (アタマがヘンになりそうだ)
-
苫小牧の人々の統計学的解析環境を改善できるよーな
R
側面における情報論的な
(すなわちエントロピー減ずるよーな)
支援の
(村上「合宿でもやりますか」(直接的) &
鍋嶋「私,勉強します」(間接的))
要請
……
これこそが将来負担を軽減する布石たるべし
と自分に納得させる
ゆいいつの救済は,
昨年度の修論手伝いのごとき「いまそこにある締め切り」
がないこと.
-
わざわざ断るまでもなく,
いつものごとく,
ぎょーむ日誌には誤解をわざと誘発させるために
歪んだ表現に満ちてるわけだが
……
逆の立場からみると,
鍋嶋さんもこのややこしい問題を私に理解させるためなどなどに,
少なくとも相当の準備と忍耐を費されたのは間違いないところである.
-
で,
次にかとー先生にも助けていただいて,
大澤君が発見した
glm() + stepAIC()
の問題を解明してみる
……
たしかに重要な問題だと思う.
つまりですね,
たとえばこういうデータ
month ID treatment Nmg Cmg Wmg LMA light height
1 JUNE C13 root_cut 0.2785449 4.771599 34.34000 10.1 2.979790 168
2 JUNE C13 root_cut 0.2376043 4.192669 30.27273 9.0 2.979790 168
3 JUNE C13 root_cut 0.2165695 3.788283 26.24000 8.2 2.979790 168
4 JUNE C26 root_cut 0.2856090 5.112085 34.04545 10.7 4.825112 278
5 JUNE C26 root_cut 0.2536511 4.790712 33.78750 10.6 4.825112 278
6 JUNE C26 root_cut 0.2769423 4.891322 32.16923 10.2 4.825112 278
7 JUNE C29 root_cut 0.2167092 3.779484 29.33333 8.0 2.649079 190
8 JUNE C29 root_cut 0.2460125 4.078369 33.06000 8.7 2.649079 190
9 JUNE C29 root_cut 0.2554726 4.212116 28.06923 8.9 2.649079 190
10 JUNE B723 non_cut 0.2690879 4.212890 32.24000 9.3 3.230316 206
…… (以下略) ……
を使って,
(なんでもいいけど)
かかる一般化線形モデルの適用
glm(formula = Nmg ~ 1 + month + ID + treatment + light + height,
family = Gamma, data = data)
やってはいけません.
ダメな理由は ID
が入ってるから.
パラメーター推定の結果はこうなる:
Coefficients:
(Intercept) monthJULY monthJUNE
4.93667 -0.04065 -0.93114
IDB746 IDB759 IDC13
0.09820 -0.42489 0.25401
IDC26 IDC29 treatmentroot_cut
-0.36445 0.19452 NA
treatments_disturbed light height
NA NA NA
見てのとーり,
treatment
と
light
と height
の最尤推定値が得られていない
……
というのは自由度の欠如によるもので,
このデータではシウリザクラ個体の
ID
が決定されれば,
一義的に実験処理・その場の明るさ・樹高が決ってしまうためだ.
-
なるほど,
これこそが混合モデルを使うべき状況,
ということなんだねえ
……
じつは大澤君のデータ解析は,
上記以外は混合モデルになっているんだけど.
この呪われ CN コーダーデータを混合モデルで扱ってないのは,
glmmML()
では
family = Gamma
を計算できんから.
-
しかし,
まあ,
私はなんで指摘されるまで
こういう基本的な失敗に自分自身では気づかんのだろーか?
うかつだなぁ.
-
で,
R はこのあたり,
計算不能という回答をもって人間のまぬけさを指摘してくれるわけだが
……
NA
表示には注意ぶかくあるべきだな.
-
お茶部屋で混合モデル雑談してから
2150 研究室発.
2200 帰宅.
晩飯.
ばて.
-
2500 消灯.
-
[今日の素読]
-
[今日の運動]
-
[今日の食卓]
- 朝 (0840):
米麦 0.7 合.
ハクサイ・タマネギ・エノキダケ・豆腐・煮干の味噌汁.
- 昼 (1210):
弁当.
研究室お茶部屋.
米麦 0.7 合.
ハクサイ・マイタケ・卵の炒めもの.
- 晩 (2220):
米麦 0.7 合.
ハクサイ・タマネギ・エノキダケ・豆腐・煮干の味噌汁.