ぎょーむ日誌 2003-11-07
2003 年 11 月 07 日 (金)
-
0750 起床.
朝飯.
コーヒー.
0845 自宅発.
晴.
0855 研究室着.
-
また
R
プログラミング.
-
Matt が先日のモデルのパラメーター推定計算がうまく収束せん,
と言ってくる
……
それは私には予想されてた困難だったんで,
線形予測子を exp(線形予測子) とすれば,
と回答.
これでうまく計算できるはずだ.
-
で,
そっちは片づいたんだけど,
Mathematica 使いたいと言いだしたんで,
それに対応せんといかん (前からも言ってたし).
北大は Mathematica キャンパスライセンスっつーのを
取得してたはずで,
それならばかなり安く使用可能なはず
……
-
ところが,
いつものごとく,
というか北大計算機 & ネットワーク関連の
できの悪いサイト
(実際のところ死ぬほどめちゃくちゃで
学部学生が演習とかでいやいや作らされた web site のごとし
……
あんたらそれでも
情報処理
の専門家か? と詰問したくなるしろもの)
で右往左往な探索してよーやく
発見
したわけだが
……
専攻科単位で申請しろって?
また意味不明なことを.
とはいえ,
抗議するのも疲れるので岩熊専攻科長に
「Mathematica 利用申請だしたいんですが」
おうかがいメイルをだす.
-
Matt 計算,
optim()
の Nelder-Mead
と
BFGS
の計算結果が一致しないって?
しかも simulated annealing (SANN
)
がコケる,
と.
彼の計算命令 をちょい手直しして
Nelder-Mead
と SANN
が一致することを示す
(あたりまえだ……どちらも目的関数の微分に依存しないんだから).
っつーことで,
あんたの導関数計算がまちがっとるんでしょーが,
ということで落着.
-
これで午前終了ですよ,
ということで北大構内走.
天気はいいけど寒い.
本日は道内何か所かで「遅い」初雪.
札幌はまだだけど.
-
夕方ごろに,
よーやくにして一般化線形混合モデルを
glmmML
で計算させた結果を stepAIC
する関数,
glmmML.stepAIC
ができた
(後記: これはむしろ stepAIC.glmmML
と命名すべきだったなぁ)
……
苦闘した.
とりあえず乱数を使った試験運転クリア.
-
しかし,
シウリザクラ観測データを投入する勇気がないので,
お茶部屋で時間をつぶす.
-
が,
いつまでも先のばしにはできんので,
葉っぱ死亡速度を推定させる計算スタート.
さすがに時間かかる
(ThinkPad240Z Cerelon 500MHz (遅!) だと 20 分ちょい)
……
計算結果の
例.
なかなかよろしい.
ばてた.
-
苫小牧の鍋嶋さんから直径成長データ送っていただく.
これもまた
glmmML.stepAIC
おくりになってしまうのか?
なんでもかんでも混合モデルにすりゃあいいってもんじゃないけど.
-
で,
シウリザクラ当事者たる M2 大澤君がなかなかスルどい指摘を
……
たしかに
stepAIC
系のアルゴリズムは全面的に信用してはいかん,
という可能性がある.
というのも,
一般化線形モデル
(たとえば二項分布 + ロジスティックモデルなどなど)
において,
-
個体差を区別しない
glm
+ stepAIC
-
個体差を個体 ID の名義変数化で表現してみた
glm
+ stepAIC
-
個体差をランダム変数として混合モデル化してみた
glmmML
+ glmmML.stepAIC
これら,
1.-3. において得られた結果が常に必ずしも無矛盾とはかぎらん,
というところ.
たぶん 1. と 3. の比較は素朴にやればよろしい.
問題なのは 1. と 2. だ.
モデル 1. は 2. に「含まれている」はずだから,
1. なんぞは省略してしまえ,
という考えかたもありうるわけだが
……
じつは計算結果をみると個体差無視したモデル (1.)
のほうが AIC が低い (つまり良い) のに,
2. においては個体 ID が名義変数として「選択」されてしまった,
という状況がありえた!
ということ.
-
このあたり,
詳しく調べてみる必要がある.
とうめんの対応策としては,
愚直に 1. から 3. までを「予選」的に計算してみて,
つぎに各計算における最良モデルたちのあいだで「決選」
すれば問題はない.
(後記: 問題ありあり …… 翌日の記述参照)
-
2030 研究室発.
2040 帰宅.
体重 71.6kg.
-
2310 消灯.
-
[今日の素読]
-
Salsburg, D. 2001.
``
The Lady Tasting Tea
-- How statistics revolutionized science
in the twentieth century''.
Owl Book.
-
Chapter 18. Does Smoking Cause Cancer?
-
The epidemiologists were using the tools Fisher developed
for the analysis of designed experiments, such as his
methods of estimation and tests of significance. They were
applying these tools to opportunity samples, where the
assignment of treatment was not from random mechanism
external to the study bun an intricate part of the study
itself. Suppose, he mused, that there was something
genetic that caused some people to be smokers and others
not to smoke. Suppose, that this same genetic dispostion
involved the occurence of lung cancer. It was well known
that many cancers have a familial component. Suppose, he
said, this relationship between smoking and lung cancer
was because each was due to the same event, the same
genetic dispostion. To prove his case, he assembled data
on identical twins and showed that there was a strong
familial tendency for both twins to be either smokers
or nonsmokers. He challenged the others to show that lung
cancer was not similarly genetically influenced.
-
On one side there was R.A. Fisher, the irascible genius
who put the whole theory of statistical distributions on
a firm mathematical setting, fighting one final battle.
On the other side was Jerry Cornfield, the man whose
only formal education was a bachelor's degree in history,
who had learned his statistics on his own, who was too
busy creating important new statistics to pursue a higher
degree. You cannot prove anything without a randomized
experimental designs, said Fisher. Some things do not lend
themselves to such designs, but the accumulation of
evidence should prove the case, said Cornfield. Both men
are now deceased, but their intellectual descendants are
still with us. These arguments resound in the courts,
where attempts are made to prove discrimination on the
basis of outcomes. They play a role in attempts to
identify the harmful results of human activity on the
biosphere. They are there whenever great issues of life
and death arise in medicine. Cause and effect are not
so simple to prove, after all.
-
[今日の運動]
-
北大構内走 1220-1300.
ストレッチング.
-
[今日の食卓]
- 朝 (0810):
米麦 0.7 合.
大豆カレー.
- 昼 (1320):
研究室お茶部屋.
リンゴかじっただけ
大豆カレーは高カロリーなのか,
いったん食うとなかなか空腹にならん.
- 晩 (2120):
米麦 0.7 合.
大豆カレー.