ぎょーむ日誌 2005-09-22
2005 年 09 月 22 日 (木)
-
0720 起床.
朝飯.
コーヒー.
0845 自宅発.
曇.
0900 研究室着.
-
昨日の屋久島葉っぱ問題うだうだ考えつつ,
ぎょーむ日誌に書いてみる.
書いてみても問題解決につながらん.
-
現代の統計科学はこういう欠測問題にもがんばってとりくんでるわけだが
(なぜかというと,
人間は観測できることがあまりにも限定されていて
……
そしてしばしば「うかつ」であるから),
まあそれを取りこむとモデリングとしては,
ちょっとわかりにくいモノになったりするわけですよ.
-
そういや,
昨日の「いちばん簡単モデリング」で (当年葉の)
窒素含量を説明変数として組みこむの忘れてた
……
と
R
で「もとデータ」を点検してたら
(R は「入力まちがいさがし」にとても便利だと思う
……
data.frame
と
vector
を使いこなす必要あるけど),
またまた「ゑくせるの呪い」を発見してしまった.
個体コード
"urajirogashi x"
と
"urajirogashi x "
,
あるいは
"hisakaki 1"
と
"hisakaki 1 "
は別もんです.
入力したヒトは「同じ」つもりなんだろうけど
(ゑくせる上では区別をつけるのが難しい).
-
このあたりの修正,
午後からやることに.
ちょっと R のコード調べて次に自作関数つくるときの参考にする.
ふーむ
……
library(MASS)
って
package
VR
(Venables and Ripley)
の一部だったんだ.
-
北大生協に昼飯調達に.
あいかわらず曇天.
今朝はてちがいで弁当が作れなかったんで.
研究室にもどって昼飯.
-
1330-1630 ごろまで牛原さんと屋久島葉っぱモデリングの続き.
よくわからぬ窒素含量の影響もくみこんだ
(例の問題アリだけど
glm()
で計算できる)
logistic 死亡曲線推定.
なんか樹種によっては窒素がすごく影響してるんですけど
……
種内個体間差を説明する要因として.
わけわからん.
-
やはり,
さっさと個体差をくみこんだ混合モデルにすべきか?
それからアヤしげなる「樹種差」もこのモデリングでは
random effects 扱いになってしまうのか
……?
そういうモデリングなら MCMC 計算が必要になってしまうんだけど.
-
まあそれよりも欠側値処理なんだよな.
glm()
内部の計算を考えると,
こういうごまかしは可能なんだよね.
> glm(cbind(c(10, 10), c(20, 0)) ~ 1, family = binomial) # これはふつーの計算
Call: glm(formula = cbind(c(10, 10), c(20, 0)) ~ 1, family = binomial)
Coefficients:
(Intercept)
-2.88e-16
...
> glm(cbind(c(10, 10), c(20.5, 0)) ~ 1, family = binomial) # これはごまかし
Call: glm(formula = cbind(c(10, 10), c(20.5, 0)) ~ 1, family = binomial)
Coefficients:
(Intercept)
-0.0247
...
警告メッセージ:
二項 glm で整数でないカウントがありました! in: eval(expr, envir, enclos)
つまり「見なかった年枝」を
その個体の「年枝内最大葉数の平均値」などで近似してごまかせる,
ということだ
……
しかし気色わるいから,
やっぱりやめとくか.
どうせ logistic 死亡曲線というアイデアは一時しのぎの代用品
(と言ってわるければ統計モデリング教育用の非実用品)
にすぎないわけだし.
で,
その場合,
「見なかった年枝」
の葉数分布は経験分布で代用して
(というのもサクラツツジやシキミのごとくぴったり
3 枚だすようなヘンなのもいるからだ),
その出現尤度をきちんと計算する,
と.
いやはや,
計算手間がふえる.
まあ,
ともかく現状までをまとめてもらうことに.
私はそのあいだに次の計算のやりかたをのそのそと検討してみますか.
glm()
って便利なんだけど,
すぐにこういうふうに限界に到達してしまうんだよねえ
……
メイルやりとりとかやってると夜になってしまった.
1955 研究室発.
2020 帰宅.
「北大構内走にでよーかどーか」
といつものごとく逡巡してるうちに,
雨ふりが激しくなってきたのでヤメ.
晩飯.
ひさびさに
Gmail
アカウント二個発送.
残り 98 個.
世の中
「spam メイルが多くて」
と困ってるヒトがたくさんいるんだから,
もうちょい需要があってもいいと思うんだけど
……
まあ,
たぶんメイル送受信のしくみが理解できてないから
切りかえられないんだろう.
あるいは,
Google 社なんて信頼できない,
という主張.
これは確かにあるていどの説得力ある.
しかしながら
……
現在においても将来においても少なくとも北大ネットよりはマシだと思う.
[今日の運動]
[今日の食卓]
- 朝 (0750):
米麦 0.7 合.
サンマのショウガ煮.
海藻スープ.
- 昼 (1300):
研究室お茶部屋.
北大生協サンドイッチ.
- 晩 (2330):
米麦 0.8 合.
サンマのショウガ煮.