ぎょーむ日誌 2003-05-12
2003 年 05 月 12 日 (月)
-
0820 起床.
朝飯.
コーヒー.
0900 自宅発.
晴.
0910 研究室着.
-
にせアカマツ再編成.
最後の conclusion 周辺に関して,
小林さんの御意見をうかがいつつも
手前勝手に単純化して
make upload
.
そのあたりを説明する作文やってみる.
-
自分ではあまり書く必要があるとは思えない
(しかし読者の一部は読みたいんであろう)
他の樹木モデルに関する簡単な説明を追加していく.
Roux et al (2001) の分類空間をながめつつ,
人気度も加味して LIGNUM, CROBAS, TREGRO を
「いろいろあります」
の代表候補としてみる.
さて.
-
昼飯くって 1300 より
講座セミナー.
今日は M2 森君のシウリザクラの
マイクロサテライト配列を使った親子判定の話.
1500 ごろ終了.
-
来週の苫小牧演習に関する相談.
私はやはり月曜日から木曜日まで全参加ということになりそうで.
なんか話さんといかんし.
-
小菅君の
ユキザサ
隠匿データをみる.
今日わかったことあれこれ.
-
地下部は二叉に分裂しうる
-
むかしの地下部から地上部がでることがある
-
二年目以降も葉の枚数が 1 でありうる
-
種子は発芽するまでに 1.5 年以上かかる
などなど
-
次は赤坂君統計学問題.
R の glm だけで問題を解こうとすると,
けっこう面倒だ.
難問なのでかとーさんもまきこんで検討する.
面倒のカギは (いまだよく理解していない)
対比行列 (contrast matrix)
の決定と適用にある
……
けれど,
これについては今日も頓挫した.
-
3 水準以上の名義変数を使った場合,
自動的に導入されるダミー変数の挙動をよく考える
-
summary.glm
を解読したところ,
ここで係数推定値に対して
自動的に適用される怪しげな検定は
やはり Wald 検定であった
(最尤推定値近傍における放物近似を敷衍)
……
その意味するところと
限界をよくよく検討せんとかなり危険
-
すぐにど忘れする手法:
複数の
glm
オブジェクトの比較でなんとなく使われるのは
anova(glm1, glm2, test = "Chisq")
というような
……
つまり分散分析といっても,
生態学者がむやみに使うあれは狭義のもので,
anova
の test
としては
-
Chisq
:
尤度比検定……二項分布・ポアソン分布
-
F
:
F 検定…… Gaussian 分布,quasi- な分布
-
Cp
:
Mallow's index……
(residual deviance) + σ2 DF
というような AIC にちかいもの
などがある.
see also: anova.glm
, stat.test
-
今日のかとーわざ:
線形モデル
(定数) + β ×
(連続変数)
において,
βだけ水準間でかえたい場合は
glm(1 + f:x)
-
ようやくひとくぎりついてお茶部屋にいくと,
会社帰りの井田君と M2 西村さんが植生解析ハナシをしてたので,
なんとなくそれに介入してしまった.
あるていど以上に複雑な群集 (植物+動物)
を調べるには三層以上の neural network が有用ではないか,
と気づいた.
便利というだけでなく,
生物間の相互作用みたいなのもこれで勘案できるんでは,
と.
学習させたネットの妥当性もチェックできるし.
あやしげな「予測」すらできる.
-
つまり多変量解析みたいなのが利用される状況
……
要因が乱雑でかつ極端に現象論的なモデリングの許容されうる
スケイルの問題においては,
こういう方向性もありかと.
-
ひさびさに統計学コンサルタントじみたことで半日以上を
費してしまった.
2250 研究室発.
2310 帰宅.
-
[今日の運動]
-
で,
今日も運動してない
……
やはり昼飯前の時間を使うべきだな
-
[今日の食卓]
- 朝 (0830):
「北欧」バゲット.
- 昼 (1510):
「北欧」ベイグルチキンサンド.
- 晩 (2400):
米麦 0.7 合.
納豆.
コマツナ・タマネギ・マイタケの炒めもの.