ぎょーむ日誌 2003-02-04
2003 年 02 月 04 日 (火)
- 0800 起床.
朝飯.
コーヒー.
0840 自宅発.
曇.
0850 研究室着.
なンと,
かとー先生がすでに登校している.
「今日は試験監督らしくて早朝集合だったんです」
と眠そうに.
誰が,
については述べるまでもない.
- 0900 なぜかしら
「顔だけは出しておかないといけないのかしらん」
と誤断しちゃったとある博士論文公聴会に出てみる.
生態学のハナシではない
……
私よりよほど年上のようにみえる学位申請者は
学内組織上はすごく近いはずなんだけど,
これが初見である.
で,
あまりまじめに聞く気もしないんで,
破綻修論の最初のツメである
統計モデルの定式化を紙にらくがきしたりしながら,
なんとなーく聞いてたんだけど
……
これがなんともはやなもので.
- 副査を押しつけられてる某教授も珍しく御立腹のようで厳しく尋問
……
しかしまっとうな返事が得られない.
私は一番基本的なところだけ尋ねてみる.
「これこれこういう条件を満たしていないので
t 検定とか使えないんじゃないですか」
「差を調べる場合には t 検定が適切だとわたくしは認識しております」
「いや,そうじゃなくて
……
じゃあ,
はっきり言いますけど,
それって統計学的検定がぜんぜん使えない状況でしょう.
確率分布なんかとは無関係な決定論的モデルから得られた計算結果,
しかも時系列上の値どうしの比較やってるんですよね」
「差を調べる場合には t 検定が適切だとわたくしは認識しております」
一字一句同じ返答だったので不審に思って,
ふと相手の表情を確認してみる
……
目の焦点が無限遠にあった.
当然ながら質問は中止
……
そう,
日本国憲法は信仰の自由を保証している.
それを行使して博士号を得るとは斬新な手法だ.
- 修論破綻処理問題のつづき.
午前中はお茶部屋で当事者たちに加えて
PD 石井さん・長谷川宣教師殿にも
ここまでの作図結果など見てもらって
いろいろと助言いただく.
これはかなり有用だった.
- その場でこれまで唯一「実験処理の影響あった」
ことを示すとされていた破綻修論の図が,
じつは単なるゑくせる手動操作のミスとわかった.
正しい結果はこれも「影響ナシ」.
他のひとびとは「なんだー」と脱力してたけど,
私などは対ゑくせりあん悟りの境地にあるので
「やっぱりそーか」と思っただけ.
スプレッドシートの上で電気鼠 copy & paste
してひねりだした結果はこのように激しく「汚染」されている
……
いつものことだ.
- そういう間違いを避けるために,
この問題解決用のデータハンドラーと
自動作図機構を作ってきたわけで.
で,
これらの Perl モジュールを部品として使うプログラム群は
どんどん出そろいつつある.
このデータ解析において「手で作った」図など
もはや不要で邪魔なだけだ.
- 1245 北大構内雪上走発.
走ってるあいだにも雪が降ったり止んだり.
1320 研究室帰着.
昼飯.
- 14 個体のトドマツのあちこちで観測された一次枝・二次枝先端シュート
(ただし個体最上部の「二段」はのぞく)
の長さ成長をまとめて説明する統計モデリングにとりくむ.
確率分布はガンマ分布.
個体の成長の良さ・個体内の高さ・枝次数・実験処理有無
を使って分布の平均と分散を決める.
これらの平均・分散を表す式は期せずしてどちらも
exp(線形モデル)
というカタチになってしまった.
- つまり一般化線形モデルに属するモデルになっている.
このクラスのモデルならいつものことながら R
の
glm
で解けるわけだが
……
後述するようにたくさんのモデルを計算しないといけないのに,
私の R プログラミング技術はへぼいので,
ちょっと時間がかかってしまいそうだ.
ということで,
今回も Perl 最尤推定.
- パラメーター数は最大 7 個.
もちろん 7 個ぜんぶ使うわけはなく,
これらの可能なすべての組み合わせの中から最良のセットを探索する.
こんなに多くしているのは
「……が効いてませんか」
攻撃をまとめてつぶすためである.
- パラメーター推定は最尤推定法.
今回は先日作った汎用最尤推定プログラムの
部品である Polytope 法モジュール
NelderMead.pm
を再利用する.
最良のパラメーター個数・組み合わせを決定する
モデル選択基準は
……
今回もとりあえず AIC でやってみるか?
- 夕方すぎに,
とりあえず単発推定はできるようになった.
- このモデリングが「最初のツメ」と書いてたけど,
残り時間からみて最後のデータ解析ということになりかねない.
しかし,
そうだとしても何とかなるかも.
「この組み合わせが良いんでは」
とあたりをつけていたところを計算させてみる
……
よーし,
だいたい予想どーりの結果になった.
- これがトドマツという生き物の挙動の説明として
ふさわしいかどうかわからないけど,
このデータセットに関してはちゃんとした説明になっている.
すわなち標的の包囲が完ペキに閉じた,
ということだ.
あとは追撃するのみ.
- で,
全ての組み合わせについて
自動的に調べあげるコードを書いてしまう.
パラメーター 7 個のうち定数 2 個は必ず
使わないといけないんで,
取捨選択できるのは残りは 5 個.
つまり 25 = 32 ということで,
32 とーりの場合を調べればよい.
- 試験運転だけすませて撤退.
今日は PlotNet なるよくわからぬ集まりがここであって,
甲山さんつながりのヒトたちがたくさん来てたのに,
ほとんど話す機会もなかった.
やれやれ.
2140 研究室発.
2155 帰宅.
体重 72.2kg.
あいかわらず修論やせ状態なんだろうか?
- 晩飯食いつつ,
32 モデルの計算を順番にやらせていく.
15 分ほどかかる.
あ,
最大化対数尤度の計算のついでに AIC を計算させるの忘れてた.
まぁ,
またあとでやりなおせばいいや.
- で,
結果も良いように見える
……
最良モデルを要約すると,
実験処理とやらは長さ成長の平均
には何の影響も及ぼしていない
(蛇足ながら生態学者ってのはなぜかしら
平均値を異様に重視するヒトばかり).
まあ,
もともとはこれをねらってたんだろうけど,
実験設定とその観測の両方がへぼかったということで.
- ただし,
だ.
長さ成長の分散
(を決めるパラメーター)
にはかなりあからさまに影響が出ている
(蛇足ながら多くの生態学者はなぜかしら分散という量は軽視している).
これを出すためにわざわざ可変分散なモデリングにしたんだよね
……
破綻修論をサルベイジするにはこういう奇策も必要ということ.
- 長さ成長の分散に影響がでる「意味」?
……
そんなのはなんとでも
(聴いてるヒトたちの趣味にそうように)
ハナシをでっちあげればいいわけで.
ま,
てきとーに.
職業的うそつきとはそういうものだ.
- しかし私のこのやり口はじつはカタチを変えた
「ゆーい差決戦主義」にほかならないな.
いやはや
……
だってもう時間も追加データもないんだもん.
- これで全自動解析の過程を計算機に理解させることはできた
……
ということは次にこれを人間にわからせないといけないのか.
そちらのほうがよほどたいへんだ.
嗚呼.
- [今日の運動]
- [今日の食卓]
- 朝 (0830):
米麦 0.5 合.
ネギ・シイタケ・ワカメ・豆腐・煮干の味噌汁.
- 昼 (1245):
弁当.
研究室お茶部屋.
米麦 0.5 合.
ホウレンソウおひたし.
- 晩 (2220):
米麦 0.7 合.
朝昼の残りで雑炊.