ぎょーむ日誌 2003-02-(01-10)
2003 年 02 月 01 日 (土)
- 0930 起床.
よく寝てしまった.
朝飯.
コーヒー.
- 「修論破綻処理問題やりたくねー」
状態でサボタージュ.
だったら運動でもすりゃいんだけど,
雪がけっこう降ってるのでそういう気分にもなれず.
- いつまでもでれでれしてられんので
1410 自宅発.
雪.
|
[雪にうずもれる街]
車道を除雪するとこのように歩道に
雪の小山が作られてしまう.
現在の高さはおよそ 3m
……
手前のひさしと向うの人影からわかると思うけど.
なかなかたいへんなことになってるわけで.
|
1420 研究室着.
- あれこれ片づけてから,
またプログラミング.
昨日でひととーりデータハンドラーを作り上げた.
これは入口なので,
今日は出口である作図機構.
どうしようかと思ったんだけど,
今回は gnuplot 中心でいく.
で,
いままで自分では gnuplot を召喚する Perl モジュール
作ったことなかったんだよね.
- CPAN にも gnuplot にアクセスするモジュールあるんだけど,
これはデキがあまりよくなくて使う気がしない
……
ということで自分で作ろうと.
- 1900 すぎごろに
EZgnuplot.pm
の作成と試験運転すませる.
このモジュールは 300 行もない短いものだけど,
必要最小限の機能と当方が望む柔軟性は実現できた.
- まぁ,
使いかたもごく素朴で
……
use EZgnuplot; # EZgnuplot.pm を読みこむ
my $ez_gnuplot = new EZgnuplot;
# set を押しこんでいく
$ez_gnuplot->Push_set(['term png class', 'output "tmp.png"']); # この行と
$ez_gnuplot->Push_set(['size 0.5', 'grid']); # この行では複数の設定を一度に
$ez_gnuplot->Push_set('xrange [0:10]'); # この行では設定ひとつだけ押しこんでいる
# plot する内容を押しこんでいく
$ez_gnuplot->Push_plot('sin(x) with linespoints 1');
my @random_data = map {[$_, rand(1.5) - 0.75]} (0 .. 10); # 乱数データ
$ez_gnuplot->Push_plot_data(\@random_data, 'u 1:2 t "random" w lp 3');
$ez_gnuplot->Generate; # 作図 (この実行例では png ファイル出力される)
- あるいは軸変換なんかも比較的簡単にできるようにしてみた
(上と異なる部分だけぬき書き).
my $xtics = $ez_gnuplot->Constants('months'); # 組み込みデータ months
my @month = map {$_->[0]} @$xtics;
my @random_data = map {[$month[$_], rand(1.5) - 0.75]} (1 .. 12); # 乱数データ
my $ez_data = new EZdata(\@random_data);
$ez_gnuplot->Push_plot_EZdata($ez_data, 'u 1:2 t "random data" w lp 3');
$ez_data->Set_xtics($xtics, 0); # "Jan" -> 1, ..., "Dec" -> 12 と変換
- この
EZgnuplot.pm
,
ちょっと他のぎょーむにもいろいろ使えるかも,
という感触を得て本日は撤退.
2020 研究室発.
2040 帰宅.
晩飯.
- なんとなくでれでれしてしまう.
- う.
スペイスシャトル一号機 <Columbia>
空中分解か.
なにがあったのか.
お婆さん機体を働かせすぎたか?
原因が気になる.
- そして,
どうなることやら
……
高度 20 万フィートだから 6 万メートルか.
脱出は無理っぽいな.
<Challenger>
以来の大惨事になってしまうのか.
[今日の食卓]
- 朝 (0940):
米麦 0.6 合.
ハクサイ・シイタケ・豆腐のカレー.
- 昼 (1330):
米麦 0.6 合.
ハクサイ・シイタケ・豆腐のカレー.
- 晩 (2200):
米麦 0.7 合.
ハクサイ・シイタケ・豆腐のカレー.
2003 年 02 月 02 日 (日)
- 0900 起床.
昨晩は 0300 ごろまでニュースサイト回ってた
(当家には TV がない)
のでねむい.
そして <Columbia> 続報は
……
やはり搭乗員もろともばらばらと断定されているようで.
どのような作用でもって瞬時にばらばらになるのかよくわからない.
そして今後の動きだの対策だのはまったく予想できない
……
考えるのやめ.
いずれにせよ,
これまでの経緯と対応をながめつつ憶測すると,
超高空かつ極超音速の世界なるものは
工学的にはいまだ十分わからぬまま
有翼飛翔体を「滑空」させてたみたいなんで,
今後の帰還突入においても予測困難な惨事が発生しうるということだろう.
つまり 1986 年の
(打ち上げ時のブースター破損が原因だった)
<Challenger> の事例よりいろいろな意味で
「難しい」と言えるのかもしれない.
- なんとなく脈絡なく思いついた
……
2003 年は 1903 年に Wright 兄弟が
動力飛行機による初飛行に成功してからちょうど 100 年.
世界の空にとってこの 100 年間は.
そして次の 100 年は
……
- 朝飯後に
EZgnuplot.pm
の手直しに着手.
軸変換の部分で変換関数の reference を渡すようにする.
考えてみればこの機能は現在の修論破綻処理問題にはあまり関係なさそうで
(まだわからんけど),
よくも悪くも「理系的」な gnuplot を初めてさわって苦闘してる
M1 大澤君救済用のような気もする
……
- ともあれ,
ひととーりできた.
昼飯食ってから
1410 自宅発.
雪.
1400 研究室着.
- こんどは入口のデータハンドラー部分の修正.
すでに作った
調査地→樹木個体→位置→シュートという経路に加えて,
これとは逆つまり
シュート→位置→樹木個体→調査地とたどれる経路も追加する.
- 1600 から 1800 前まで下野さんの
D 論本審査 (明日) の練習につきあう.
同じハナシをなんべんも聞いてるわけだが,
聞くたびに何か新しい改善点を思いついてしまうのは
聴き手として良いことなのか悪いことなのか
……
- データハンドラーさらに手直し.
- なぜか急激に空腹になったので撤退.
1920 研究室発.
1940 帰宅.
体重 72.4kg.
げ,
修論やせだ.
晩飯.
- なかなか作業の続きに着手できん.
風呂など入ってみる.
- 入口である
ToefAbies.pm
と出口である EZgnuplot.pm
の「あいだ」をつなぐ経路網
……
つまりデータ解析のコードをじりじりと書きススめる.
応急に作成したこれら入口・出口は意外とできがよく,
実際に使ってみると「負担軽減」感がかなりある.
ついでに共有雑用 Perl モジュール ToefMisc.pm
をでっちあげる.
- お,
もう 2500 すぎか.
明日も明後日もまだまだやらねばならんようなので,
今日はここまでにするか
……
ってすでに日づけは変わっているわけだが.
- [今日の運動]
-
ああ,
今日も運動できんかった
……
ということで肩こりが徐々に悪化中.
- [今日の食卓]
- 朝 (0950):
パン.
コーヒー.
- 昼 (1300):
米麦 0.6 合.
ダイコンナ・タマネギ・マイタケ・卵の炒飯.
- 晩 (2030):
ダイコンナ・タマネギ・マイタケの焼きそば.
ネギ・シイタケ・ワカメ・豆腐・煮干の味噌汁.
2003 年 02 月 03 日 (月)
- 0820 起床.
ねむい.
朝飯.
コーヒー.
0900 自宅発.
晴.
0910 研究室着.
- ぢりぢりと作業をススめる.
- 1030 よりユニさんの本審査の公聴会.
すでに予備審とか終わってるんで,
本審はわりとセレモニー化したりするんだけど,
今日は質疑応答における
ユニさんの堂々たる攻防がさまになっていたので,
見物客たちも楽しめました.
1130 終了.
- 1200 北大構内雪上走発.
走ってると肩こりなどが解消する.
1235 研究室帰着.
昼飯.
- 1300 こんどは下野さんの公聴会.
ちょっとお疲れぎみのようで.
しかし 1410 無事に終了.
今年度の博士課程関連の行事は片づいた.
- 午前も午後も私が会場のすみでこそこそと ThinkPad を使ってるのを見て
「発表内容のメモでもとってるの?」
と甲山さん.
私は画面ながめつつ
「ええ,
もちろんそうです.
ここは博士論文の公聴会の場ですから.
まかりまちがっても破綻修論の
データ解析プログラミングなんぞを
こんなところでやっているなんてことは
絶対にありえません」.
- 一日中コード書き.
しかしこれでようやく統計モデリングの
一歩手前までは到達した.
2220 研究室発.
2230 帰宅.
体重 72.6kg.
あいかわらず修論やせ状態.
晩飯.
- 2520 までまた作業のつづき.
自動作図の結果の見てくれの改善.
よし明日はパラメーター推定だ
……
たぶん順当に
「この実験処理はまったく何の影響もありませんでした」
という結果になるだろう.
最低でも 1 年間ぐらいは経過を追うべきなのに,
4ヵ月ぐらいしかやってないんだからなぁ.
あ,
これは言いすぎか.
ひとつだけ効果あったな.
「被陰実験をしている場所では
光量の測定値がゆーいに減少していた」
……
- [今日の運動]
-
北大構内走 1200-1235.
ストレッチング.
- [今日の食卓]
- 朝 (0830):
米麦 0.6 合.
ネギ・シイタケ・ワカメ・豆腐・煮干の味噌汁.
- 昼 (1245):
弁当.
研究室お茶部屋.
米麦 0.6 合.
ダイコンナ・タマネギ・マイタケの炒めもの.
- 晩 (2300):
米麦 0.6 合.
ネギ・シイタケ・ワカメ・豆腐・煮干の味噌汁.
2003 年 02 月 04 日 (火)
- 0800 起床.
朝飯.
コーヒー.
0840 自宅発.
曇.
0850 研究室着.
なンと,
かとー先生がすでに登校している.
「今日は試験監督らしくて早朝集合だったんです」
と眠そうに.
誰が,
については述べるまでもない.
- 0900 なぜかしら
「顔だけは出しておかないといけないのかしらん」
と誤断しちゃったとある博士論文公聴会に出てみる.
生態学のハナシではない
……
私よりよほど年上のようにみえる学位申請者は
学内組織上はすごく近いはずなんだけど,
これが初見である.
で,
あまりまじめに聞く気もしないんで,
破綻修論の最初のツメである
統計モデルの定式化を紙にらくがきしたりしながら,
なんとなーく聞いてたんだけど
……
これがなんともはやなもので.
- 副査を押しつけられてる某教授も珍しく御立腹のようで厳しく尋問
……
しかしまっとうな返事が得られない.
私は一番基本的なところだけ尋ねてみる.
「これこれこういう条件を満たしていないので
t 検定とか使えないんじゃないですか」
「差を調べる場合には t 検定が適切だとわたくしは認識しております」
「いや,そうじゃなくて
……
じゃあ,
はっきり言いますけど,
それって統計学的検定がぜんぜん使えない状況でしょう.
確率分布なんかとは無関係な決定論的モデルから得られた計算結果,
しかも時系列上の値どうしの比較やってるんですよね」
「差を調べる場合には t 検定が適切だとわたくしは認識しております」
一字一句同じ返答だったので不審に思って,
ふと相手の表情を確認してみる
……
目の焦点が無限遠にあった.
当然ながら質問は中止
……
そう,
日本国憲法は信仰の自由を保証している.
それを行使して博士号を得るとは斬新な手法だ.
- 修論破綻処理問題のつづき.
午前中はお茶部屋で当事者たちに加えて
PD 石井さん・長谷川宣教師殿にも
ここまでの作図結果など見てもらって
いろいろと助言いただく.
これはかなり有用だった.
- その場でこれまで唯一「実験処理の影響あった」
ことを示すとされていた破綻修論の図が,
じつは単なるゑくせる手動操作のミスとわかった.
正しい結果はこれも「影響ナシ」.
他のひとびとは「なんだー」と脱力してたけど,
私などは対ゑくせりあん悟りの境地にあるので
「やっぱりそーか」と思っただけ.
スプレッドシートの上で電気鼠 copy & paste
してひねりだした結果はこのように激しく「汚染」されている
……
いつものことだ.
- そういう間違いを避けるために,
この問題解決用のデータハンドラーと
自動作図機構を作ってきたわけで.
で,
これらの Perl モジュールを部品として使うプログラム群は
どんどん出そろいつつある.
このデータ解析において「手で作った」図など
もはや不要で邪魔なだけだ.
- 1245 北大構内雪上走発.
走ってるあいだにも雪が降ったり止んだり.
1320 研究室帰着.
昼飯.
- 14 個体のトドマツのあちこちで観測された一次枝・二次枝先端シュート
(ただし個体最上部の「二段」はのぞく)
の長さ成長をまとめて説明する統計モデリングにとりくむ.
確率分布はガンマ分布.
個体の成長の良さ・個体内の高さ・枝次数・実験処理有無
を使って分布の平均と分散を決める.
これらの平均・分散を表す式は期せずしてどちらも
exp(線形モデル)
というカタチになってしまった.
- つまり一般化線形モデルに属するモデルになっている.
このクラスのモデルならいつものことながら R
の
glm
で解けるわけだが
……
後述するようにたくさんのモデルを計算しないといけないのに,
私の R プログラミング技術はへぼいので,
ちょっと時間がかかってしまいそうだ.
ということで,
今回も Perl 最尤推定.
- パラメーター数は最大 7 個.
もちろん 7 個ぜんぶ使うわけはなく,
これらの可能なすべての組み合わせの中から最良のセットを探索する.
こんなに多くしているのは
「……が効いてませんか」
攻撃をまとめてつぶすためである.
- パラメーター推定は最尤推定法.
今回は先日作った汎用最尤推定プログラムの
部品である Polytope 法モジュール
NelderMead.pm
を再利用する.
最良のパラメーター個数・組み合わせを決定する
モデル選択基準は
……
今回もとりあえず AIC でやってみるか?
- 夕方すぎに,
とりあえず単発推定はできるようになった.
- このモデリングが「最初のツメ」と書いてたけど,
残り時間からみて最後のデータ解析ということになりかねない.
しかし,
そうだとしても何とかなるかも.
「この組み合わせが良いんでは」
とあたりをつけていたところを計算させてみる
……
よーし,
だいたい予想どーりの結果になった.
- これがトドマツという生き物の挙動の説明として
ふさわしいかどうかわからないけど,
このデータセットに関してはちゃんとした説明になっている.
すわなち標的の包囲が完ペキに閉じた,
ということだ.
あとは追撃するのみ.
- で,
全ての組み合わせについて
自動的に調べあげるコードを書いてしまう.
パラメーター 7 個のうち定数 2 個は必ず
使わないといけないんで,
取捨選択できるのは残りは 5 個.
つまり 25 = 32 ということで,
32 とーりの場合を調べればよい.
- 試験運転だけすませて撤退.
今日は PlotNet なるよくわからぬ集まりがここであって,
甲山さんつながりのヒトたちがたくさん来てたのに,
ほとんど話す機会もなかった.
やれやれ.
2140 研究室発.
2155 帰宅.
体重 72.2kg.
あいかわらず修論やせ状態なんだろうか?
- 晩飯食いつつ,
32 モデルの計算を順番にやらせていく.
15 分ほどかかる.
あ,
最大化対数尤度の計算のついでに AIC を計算させるの忘れてた.
まぁ,
またあとでやりなおせばいいや.
- で,
結果も良いように見える
……
最良モデルを要約すると,
実験処理とやらは長さ成長の平均
には何の影響も及ぼしていない
(蛇足ながら生態学者ってのはなぜかしら
平均値を異様に重視するヒトばかり).
まあ,
もともとはこれをねらってたんだろうけど,
実験設定とその観測の両方がへぼかったということで.
- ただし,
だ.
長さ成長の分散
(を決めるパラメーター)
にはかなりあからさまに影響が出ている
(蛇足ながら多くの生態学者はなぜかしら分散という量は軽視している).
これを出すためにわざわざ可変分散なモデリングにしたんだよね
……
破綻修論をサルベイジするにはこういう奇策も必要ということ.
- 長さ成長の分散に影響がでる「意味」?
……
そんなのはなんとでも
(聴いてるヒトたちの趣味にそうように)
ハナシをでっちあげればいいわけで.
ま,
てきとーに.
職業的うそつきとはそういうものだ.
- しかし私のこのやり口はじつはカタチを変えた
「ゆーい差決戦主義」にほかならないな.
いやはや
……
だってもう時間も追加データもないんだもん.
- これで全自動解析の過程を計算機に理解させることはできた
……
ということは次にこれを人間にわからせないといけないのか.
そちらのほうがよほどたいへんだ.
嗚呼.
- [今日の運動]
- [今日の食卓]
- 朝 (0830):
米麦 0.5 合.
ネギ・シイタケ・ワカメ・豆腐・煮干の味噌汁.
- 昼 (1245):
弁当.
研究室お茶部屋.
米麦 0.5 合.
ホウレンソウおひたし.
- 晩 (2220):
米麦 0.7 合.
朝昼の残りで雑炊.
2003 年 02 月 05 日 (水)
- 0810 起床.
ねむい.
夜中にプログラミングやるとその後にアタマのクーリングダウンに
時間がかかってなかなか眠れないことがある.
4 時間ぐらいは寝たかなあ.
朝飯.
コーヒー.
0900 自宅発.
曇.
0910 研究室着.
- 計算とかに着手する前に
……
とあるかたに論文別刷り送っていただ礼状書きが遅延してたんだけど,
これをなんとか書いてしまう.
ばて状態なのか,
やたらと時間がかかってみたり.
- 苫小牧 parasitoid 修論 (破綻じゃない修論のほう)
の作図発注が来ていたので,
こちらから取り組んでみる.
PDF ファイル生成プログラムのひとつを複製して改造,
三種類の結果一覧を生成するだけなんだが
……
これまた時間がかかる.
1220 ようやく終了.
- 北海道ハワイ化計画
のため先方との連絡役として協力してくださる
(植物生態学調査という名目でしばしばハワイ往還している)
清野さんが関西にもどられる.
清野さん構想では北海道-ハワイに加えて
沖縄との連係を考えるべきとのこと.
- 1240 北大構内走.
1310 もどる
……
あ,
今日は
セミナー
だった.
うーむ,
ついに修論ばてにやられつつあるのか?
- すでに D1 赤坂君のハナシが半分以上おわっていた.
いやはや.
お,
可塑性とか適応的とかあやしげなこと言ってるな.
渡島駒ヶ岳のカラマツ侵入のハナシ.
- その後に 10 分間の休憩があり,
その間に昼飯を食う.
つづいて低温研 M1 の鯨岡君の発表.
雨龍研究林のダケカンバを地下部ごと毎月 5 本伐採してきて,
カタチをあれこれはかってから,
各パーツが「貯蔵器官」としてどう働いてるかを見るために
グルコースやスターチの量を測定しました,
というもの
……
いろいろとヨタなコメントをしてしまった.
- さっさと破綻修論整理ぎょーむをかたづけてしまわなくては
……
と思っていたら,
お茶部屋でラグビー競技者 M1
大澤君の猛烈なるデータ解析タックルをくらってその場に転倒.
脳内作業メモリにはシュート伸長成長な統計モデルが入っていたのに,
それがぜんぶ押し流されてしまって,
かわりに窒素だのフェノールだのがざらざらと入り込んできたときには
アタマがヘンになりそうだった
……
1 時間ちかくもかけてしまって,
どうにかこうにか面倒なデータ構造となんちゃら仮説を収納できたので,
当方の都合のよいように問題を分断.
分断したひとつに関して数式なんぞをつらつらと書いてみて
「こりゃー,なかなか推定とか難しいなあ」
と先方を混乱させる時間かせぎに成功したので,
すかさず逃亡する.
- しかしもはや体力ぎれ.
どうにかこうにか事務書類ひとつだけをかたづけて
1840 研究室発.
1850 帰宅.
体重 72.0kg.
修論やせとまらず
(またすぐに太るような気もするが).
- 晩飯くってしばらくでれでれと.
- 今日はメイルが少ないと思ったら,
fetchmail
を daemon モードで動かすの忘れてた.
ああ,
ぼけてる.
- こういうときにかぎってメイルがたくさん来ていたり
……
しかし半分はすぐに削除できるものだった.
- なになに
……
私が 2000 年 4 月の「ぎょーむ日誌」に書いた Perl/Tk の説明が
役に立った
……
「ぎょーむ日誌」ってのがお役にたつってのも,
なんとも驚きというか.
- 昨日の
「差を調べる場合には t 検定が適切だとわたくしは認識しております」
問題に関して,
粕谷さんも自分もかなり似た体験があったと教えてくださった.
絶望的に終わってるハナシと
統計学は得意ではないけれど粕谷コメントをうけて
善き方向にススもうとするハナシ.
前任地の新潟大におけるこれら対照的な事例がセットになっていて,
いわば
「若き異端審問官の肖像」
というかんぢでなかなか面白い.
途中で「こりゃだめだ」と投げてしまっている私とはちがって,
もちろん粕谷さんは第一のケイスに関して理路整然かつ
徹底的に追及されたわけだが.
- ところで,
昨日のばて状態だとかえってうだうだと書いてしまう記載に
意味の通らないところがあるじゃないか.
私はそのとき
「それって統計学的検定がぜんぜん使えない状況でしょう」
と言ったのでした.
- ああ体力が続かないなぁ,
と早めに寝てしまう
……
つもりなんだが,
電灯を消しても生活周期のずれのためかなかなか眠れない.
- [今日の運動]
-
北大構内走 1240-1310.
ストレッチング.
- [今日の食卓]
- 朝 (0840):
昨晩の残り.
- 昼 (1345):
研究室.
ベイグルのサンドイッチ.
- 晩 (1915):
レタス・ニンジン・ピーマン・レタス・エリンギの焼きそば.
2003 年 02 月 06 日 (木)
- 0600 起床.
昨晩はいつもより早めに寝たのでいつもより早起き.
破綻処理に着手してみたんだけど遅々たる進捗.
朝飯.
コーヒー.
0840 自宅発.
晴.
0850 研究室着.
-
第22回進化植物学研究会
のペイジをアップロードしてとくれと言われたんだけど,
<center>
とか
<font>
とか
私のあまり好きではないタグが混入していたので,
全部書き換えてみる.
呪われブラウザーこと Netscape Navigator 4.x でも
ある程度は見れるようにするところで苦闘.
ようやくできた,
と思ったら時刻はすでに 1110.
ああ,
いったい何やってるんだろうね.
- さっさと破綻処理を
……
というタイミングをねらって M2 井田君が統計質問.
ポアソン分布を使う一般化線形モデルに関するものだったんで,
これは簡単に片づく
……
と見せかけておいて,
ここで隠し玉の難解なる統計モデリングの
ハナシをもちだしてくる.
うーむ.
- ともあれ午前中はそれで終わってしまった.
1240 北大構内雪上走発.
晴かつ雪.
1315 研究室帰着.
昼飯.
- 夜中までかかって
計算メモ
書き.
- 2320 どうにかこうにかできた.
が元凶の張本人はすでに逃亡ずみ,
か.
2350 研究室発.
2400 帰宅.
- [今日の運動]
-
北大構内走 1240-1315.
ストレッチング.
|
[雪のザンゴウを走る]
北大の低温研・獣医学部前の歩道.
車が通らないので季節をとわず
走るのには適している.
こういう道も歩道専用除雪機で
処理されてるので助かる
(が,そのコストは莫大なので
札幌市は税金が高い).
|
- [今日の食卓]
- 朝 (0730):
米麦 0.6 合.
ハクサイ・ニンジン・油揚・煮干の味噌汁.
- 昼 (1325):
弁当.
研究室お茶部屋.
米麦 0.5 合.
レタス・ニンジン・ピーマン・レタス・エリンギの炒めもの.
- 晩 (2030):
米麦 0.4 合.
昼飯の残り
……
では腹が減ったんで帰宅後に朝飯の残り.
2003 年 02 月 07 日 (金)
- 0950 起床.
にせ修論生を演じるのであれば,
やはりちゃんとこういうくずれた生活周期でなければ
……
朝飯.
1010 自宅発.
曇.
1020 研究室着.
- 昨日かいた計算メモをあちこちで検分していただかなくては.
その準備として図版を web 上にアップロードする
(紙に印刷すると白黒になるんで).
計算メモ
を印刷してそこらの PD・えらい院生の皆様に
配ってまわる.
「修論の解析部分書いてみたので御指導よろしくお願いいたします」
「……久保さんが修論を?」
「はい!
周りのヒトたちが修士号をめざしていたり,
すでに取得されたりしているので自分もがんばって
修士にならなくてはと思って書いてみました」
「しかし,すでに……」
「いえ,私が持っているのは古色蒼然たる修士号 (理学) なんです.
これからの地球環境問題時代にはやはりここ
地環研
公認の地球環境科学修士でなくてはやっていけないだろう
と考えました」
- というふうにあちこちご説明してまわっていて時間がかかる.
計算内容に関する反応としては,
まあこのへんで手をうつしかないんじゃないの,
というあたりで.
たしかにそんなところでしょう.
- この問題をひきおこしてる張本人がよーやくあらわれて,
自分でやった解析がどーのこーのと.
で,
問題は統計学的な検討いぜんにあるわけで
……
すでにこのデータに関してはデータとった本人より
私のほうがよほど詳しくなっているので,
先方が
「ここにゆーいがひとつだけでました」
とか莫迦なことを言いながら示している図を見たとたんに
「こりゃヘンだ」と気づく.
自動処理で作図させたこちらの図と照合してみると
……
図という図ことごとくに
明白なる間違い
(点の個数が足りない・分布がぜんぜん合っていないなどなど)
がぼろぼろと出てくる.
すなわち,
いつものごとくゑくせるデータ処理に起因する間違いである
(さらに本人がどういう操作をしているか理解していないようで).
- お茶部屋におけるこの間違いチェックの現場に
不幸にもいあわせてしまった PD 石井さんは
「えー? その結果も間違いだったの?」
とショックをうけて激しく脱力しておられる
……
修論解析でばたばたしていてさぼってばかりの私とは異なり,
石井さんは何度も修論生発表練習につきあって
結果に関する考察とかいろいろ議論されていたわけで
……
- しかし気をとりなおして,
ゑくせる悪口ばかりならべている私に
「いや,ゑくせるでもちゃんと使えば」
と上級ゑくせる作法についてあれこれとご教示いただく.
copy&paste の回数をゼロに漸近させるやりかただとか,
入力データの double check とか
……
なるほど,
ゑくせりあん集団内部にもかかる熟練生残者から
絶望へたれに至るまでいろいろ混在している,
というのはよくわかりました
……
ということで,
習熟度によって「脱ゑくせるのススメ」
(つまりゑくせる悪口の種類)
を変えないといけないのかしらん?
- とりあえず上級者には
「階層構造のあるデータとかはどう取り扱います」
とでも聞いてみるか?
これは二次元配列には
うまく格納できない
から,
そこらでちょっと苦闘してるかも.
- 一区切りついたのでおそい昼飯.
- しばらく前に発注いただいた小林さんからの作図依頼にとりくむ.
にせアカマツ図版のカラー化などなど.
とりあえず版をアップロードする.
- 修論に関しては体力・やる気・アイデアがつきたので本日は撤退.
2030 研究室発.
2050 帰宅.
体重 72.6kg.
- 今晩は仕事すすめる気になれづ.
- [今日の素読]
- [今日の運動]
- [今日の食卓]
- 朝 (1000):
米麦 0.5 合.
ハクサイ・ニンジン・油揚・煮干の味噌汁.
- 昼 (1630):
研究室お茶部屋.
パン.
- 晩 (2130):
米麦 0.8 合.
ハクサイ・ニンジン・油揚・煮干の味噌汁.
2003 年 02 月 08 日 (土)
- 1030 起床.
うーむ,
いいかげんに修論生周期はやめなくては.
朝飯.
コーヒー.
- 破綻処理もそろそろイヤになってきたなぁ
……
と怠業.
- 残念ながらいつまでも怠業できないので
1400 自宅発.
曇.
1415 研究室着.
- 低温研の加藤京子さんから Abies 伸びモデリングに関して
いろいろとご教示いただく.
- 個体の高さ成長と階層構造の間に「交互作用」
とでもいうようなものがありうる……?
かなり疑問に思いつつとりあえず推定してみようと思ったんだが
……
定式化のアイデアがうかばない.
えーい,
どちらも非負の値だということで,
お試し推定方程式としてカケ算項を追加したものを
でっちあげて計算してみると
……
なンとかなり最大化尤度が向上してしまった.
- いやー,
推定式をよくよく検討しなおす必要あるんだけど,
これは加藤さん言うところの
「高さ成長の速い個体では樹冠下部は
横のび成長よくない」
「高さ成長の遅い個体では樹冠下部の
横のび成長はそれほど悪くならない」
……
ということなのかなあ.
- 面白そうだけど,
残念ながら現時点ではこれ以上モデルを複雑にするのは
……
ちょっと避けたいところだ.
ということで,
「その後」の懸案事項ということに.
- この計算やってるうちに,
ある個体 i の
高さ成長項を log(Hi) だけでなく Hi でも計算させる
方法がわかった
(初期値 scaling をケタにあわせて小さくするだけ
……ああ,なぜ気づかなかったのか).
おどろくべきことに,
どちらでも最大化対数尤度はほぼ同じ
(ずれは 0.01% ぐらい).
|
[高さ成長項はどうするか?]
log(Hi) と Hi の推定結果 (期待値) の比較.
このようにほぼ同じ.
式の意味としては exp 内の項は log(Hi)
とするほうが伝統的なあろめとらーたちの
趣味に合致するんだろうけど
(趣味うんぬんはたしかにそれなりに重要),
じゃあなんで言うところの
「ベキ乗式」
とやらでなくてはならんのか,
というのがど素人の私なんぞにはわからないところで
……
|
- まあ,
いろいろあって
……
夜中になぜか
Fisher の正確確率検定
のプログラムを書いている自分を発見.
- じつはこの基本的な手法について自分はまったく理解していなかった,
というのを発見してしまって.
言いわけするなら contingency table
なんぞ作ったことなかったから.
ともかく計算方法まるでわかっていなかった
……
3 時間ちかくもかけて,
2x2 行列専用の簡単な
プログラム書いて結果を見て「あれヘンだな」
を繰り返しているうちに,
よーやく何をやっているか理解できるようになってきた.
じつに,
いやはや.
- で調べたいパターンは 2x2 行列ではなく 2x3 になるかもしれないんで,
しょうがないからその場合は R で計算
(最初からそっちをやれって?).
> budtable <- matrix(c(135, 314, 25, 74, 238, 7), nr = 3)
> budtable
[,1] [,2]
[1,] 135 74
[2,] 314 238
[3,] 25 7
> fisher.test(budtable)
Fisher's Exact Test for Count Data
data: budtable
p-value = 0.01467
alternative hypothesis: two.sided
- ゆーい差ありました
……
と信じていいのかどうかよくわからないところで,
現在のサンプル数・事象発生確率のもとにおいて
この検定方法って信用できんのか?
- ということで,
せっかくつくった 2x2 専用 Perl プログラムで試してみる.
まずは「ホントに同じモデルだった場合」
ということで
- 無処理区 474 標本 (事象発生確率 p = 0.25)
- 実験処理区 319 標本 (事象発生確率 p = 0.25)
で危険率を 0.05 として,
10 回ランダムサンプルを与えてみると
……
350 124 247 72 → 0.275359
356 118 243 76 → 0.737150
363 111 255 64 → 0.294857
352 122 235 84 → 0.869039
359 115 240 79 → 0.932888
329 145 244 75 → 0.035344 ErrorI
358 116 234 85 → 0.506095
365 109 238 81 → 0.446209
346 128 239 80 → 0.565245
350 124 233 86 → 0.806051
おお,
この標本数&確率だと
第一種の過誤ってのはほとんどおこらないわけね.
- じゃあ,
検定力のほうはどうなのか,
と調べてみる.
「ホントに差がある (ホントにモデルが異なる) 場合」
- 無処理区 474 標本 (事象発生確率 p = 0.28)
- 実験処理区 319 標本 (事象発生確率 p = 0.23)
ってのでランダムサンプル生成してみると
……
350 124 242 77 → 0.560353 ErrorII
339 135 249 70 → 0.046986
328 146 248 71 → 0.009275
331 143 241 78 → 0.089789 ErrorII
338 136 239 80 → 0.290445 ErrorII
347 127 243 76 → 0.362349 ErrorII
345 129 246 73 → 0.183942 ErrorII
335 139 247 72 → 0.040381
329 145 249 70 → 0.009051
324 150 253 66 → 0.000829
というかんぢで危険率を 0.05 とかにすると,
けっこうな頻度で第二種の過誤が発生する.
この設定では
……
しかし contingency table の値がちょっとずれただけで
table 発生確率って
がたがたと変わるもんなのね.
- つまりこの標本数と事象生起確率の値,
あ,
それから「標本ごとに独立にある事象が確率 p で生起する」
と仮定する確率論的モデル (ベルヌーイ試行) のもとで
得られた contingency table に対して,
Fisher の正確確率検定
(これはベルヌーイ試行とかは仮定してない)
によって
「ゆーいでした」
という結果は「まあ大丈夫なのかなぁ」
なんだけど,
「帰無仮説棄却できませんでした」
となると
「ホントに差がないの?」
と疑うべきなのかもしれない
……
とはいえ,
これの逆の組み合わせよりはマシなんだろうな.
- AIC とかのモデル選択だとどういう結果になるのか?
しかしもはやばて.
そして生活周期のずれが悪化する方向に
……
- スケジューリング破綻の帰結として残り時間もない,
ということは
……
さんざん苦闘したあげくにこの問題も
「ゆーい差決戦主義」で終わるとは
われながらホントに終わってるなと思いつつ
(統計学的ゆーい差ではなく生態学的「有意差」を!)
2610 研究室発.
まあ,
私にとってはナゾにみちた分割表の世界が少しだけわかった,
というか実感できた,
ということで.
2620 帰宅.
- [今日の運動]
-
北大構内走 1600-1655.
肩こりその他を少しでも修復するために,
ながくゆっくりと走る.
ストレッチング.
- [今日の食卓]
- 朝 (1130):
パン.
コーヒー.
- 昼 :
なんとなく食っていない.
あ,
北大構内走のあとに少し食べた.
- 晩 (2030):
とくに匿名希望する料理人氏と院生たちが
準備してくれた修論なべ
……
なぜか修論生はひとりもいなかったわけだが
(にせ一名をのぞく).
タラ・豆腐のなべでうまかった.
2003 年 02 月 09 日 (日)
- 1030 起床.
いかん.
朝飯.
コーヒー.
- 1130 自宅発.
曇.
1140 研究室着.
- 昨日の計算のメモを書く
……
あまり面白い内容ではないので,
ついでに,
シュート伸長量 vs そこについてる芽の個数,
を作図してみるとちょっと面白かったり.
- 破綻処理は (おもに残り時間のせいで)
徐々に収束しつつあるのだが
……
- なぜか EPS ファイルという普遍的な図ファイル形式を
WMF などというひどく使いどころの限定された形式に
変換しようとぢたばたしてみたり
……
WMF → EPS はいろいろあるんだけどねえ.
- いくつかツールらしきものはあるけれど,
いづれも途中で bitmap に変換されてしまう
……
ついにコマンドライン動作な画像処理ソフトウェア
ImageMagick
(これはすごく便利)
の最新版までコンパイルしちゃったんだけど
……
えーい,
これもダメか.
- ということで,
結局のところカブトをぬいで,
現時点でもっともうまく EPS → WMF 変換してくれるのは,
Adobe Illustrator
(研究室にあるのは Mac 版 9.0.2)
にほかならない,
という事実を認めざるを得なかった.
もはや自分でやるのはイヤなんで,
それをやるべき人物に Mac の使いかた教えて逃亡.
- もはや夜になってからお茶部屋でおそい昼飯くってると,
D1 小菅せんせーが「出しおしみ」修論の一部を見せてくれた.
一部,
といってるのは「隠し」データが多々あると言われているため
……
そう,
この人物は
「こんなによい観測データは自分だけがこっそり楽しめばよいのだ,
ふふふ」
と「出しおしみ」しているのである.
しかし,
隠匿データださないと強制査察だという外圧に抗しかねて,
それをかわすために出しても惜しくない部分を選んでいるところらしい.
- で,
そういう経緯で
今回でてきた中に林床植物の開花フェノロジーに関するものがあり,
初夏の特定の季節に開花する植物種のグループと
その後に開花期をずらせながらだらだらと花を咲かせるグループが
あるように見える.
こういうパターンを生成するモデル,
季節変化する資源分割の怪しげ計算とかを大昔にやったことがあるなぁ,
と思い出したんで,
そういうハナシをしてみたり.
- 破綻処理がらみで
ガンマ分布の線を描いて遊んでみる
……
とかいうわりには,
ぢつはひどく悪戦苦闘していたり.
|
[平均ひとしく分散ことなる]
ガンマ分布とはこーゆーものです.
|
- 体力・気力がおちてくると時間の使いかたが散漫になる
……
2340 研究室発.
2400 帰宅.
晩飯.
- [今日の運動]
-
今日は休日で人通りと車が少なかったのに
北大構内走に出れなかった.
- [今日の食卓]
- 朝 (1100):
米麦 0.6 合.
タイナ (体菜)・ピーマン・マイタケの炒めもの.
- 昼 (1800):
弁当.
研究室お茶部屋.
米麦 0.6 合.
タイナ (体菜)・ピーマン・マイタケの炒めもの.
- 晩 (2400):
米麦 0.6 合.
タイナ (体菜)・ピーマン・マイタケの炒めもの.
2003 年 02 月 10 日 (月)
- 0830 起床.
朝飯.
コーヒー.
0900 自宅発.
曇.
0910 研究室着.
- 破綻処理.
- 枝学師匠・牧先生からシュート伸びモデリングに関するコメントを
いろいろといただく.
芽の個数分布に関しては,
シュート伸び→芽の個数
の計算やったら,
というご指摘で
……
いやはや,
さっさと mutinomial logistic regression
でケリをつけるべき問題,
とはわかっているんですけどね
……
- 1225 北大構内走発.
1300 研究室帰着.
昼飯.
- 1400
講座セミナー
,
今日は塩寺さん.
「熱帯はたいへんそうだなぁ」
というかんぢ.
私などはおそろしくて 100 種以上もの種間比較とか
絶対にできそうにない.
- 破綻処理.
なぜか生じる「待ち時間」には,
ここしばらくほうり出していた事務書類あれこれとか.
- 岩熊さんが有無をいわせぬ電話攻撃で月末の院試 (二次募集)
試験監督をおしつけてくる
……
まぁ,
院試だから気楽にやればいいわけだが.
- 夜になってから本日中には破綻処理の最終段階第一フェイズが
終了しないと確定.
- やれやれ,
と思って帰ろうとしたんだけど,
M1 大澤君へのちょっとしたデータ解析質問が引き金となって,
そのままシウリザクラ不思議世界をさまようことに
……
私が Perl なデータ窓口をいつまでたっても完成させないために,
大澤君はゑくせる泥沼にはまってしまっていて,
ですね
……
- 2300 研究室発.
途中まで歩いて,
破綻処理がらみでやり忘れていた件に気づく.
しょうがないので研究室にいったんもどって応急処置.
2340 帰宅.
体重 72.0kg.
修論やせ状態継続.
晩飯.
- [今日の運動]
-
北大構内走 1225-1300.
ストレッチング.
- [今日の食卓]
- 朝 (0840):
米麦 0.6 合.
モロヘイヤ・ピーマン・エリンギの炒めもの.
- 昼 (0840):
弁当.
研究室お茶部屋.
米麦 0.7 合.
モロヘイヤ・ピーマン・エリンギの炒めもの.
- 晩 (2400):
米麦 0.8 合.
レトルトパウチドのカレー.