ぎょーむ日誌 2005-02-21
2005 年 02 月 21 日 (月)
-
0730 起床.
朝飯.
コーヒー.
0830 自宅発.
晴.
0840 研究室着.
-
0905 研究室発.
正門横の学術交流会館へ.
次の金曜日に二次試験あるんで,
その監督ぎょーむ説明.
書類ぱらぱらと見てるうちに,
ぢつは二次試験も (センター試験とくらべると)
科目数が少ないだけで
「朝から晩まで拘束」
であることにかわりない,
と気づいた.
「国語」の試験なんていやはや 150 分もつづくのか.
-
0920 説明会うだうだと始まる.
やはり「朝から晩まで」か.
当日はどうやって時間つぶそうかな.
1010 終了.
1020 研究室もどる.
-
先月のセンター試験のもふくめて
監督ぎょーむ説明会でわかったこと:
-
大学院重点化とか制度のひねくりあれこれあっても,
依然として本邦では大学学部入試こそが
(北大総長あいさつによれば)
「人生の一大事」
---
受験者の周辺・大学・お役所・マスコミにおいて
……
大卒者をとる企業はどうなのか?
-
とゆーことで大学事務部門では「入試課」は権力をもってる
-
試験監督者どもは社会常識から逸脱してる部分が少なくない,
と入試課は認識している
(この点についてはまったく同意する)
-
にもかかわらず,
(監督バイトとか傭うのではなく,
おもてむきは
「大学の一大事ですからせんせーがたに」
とでもおだててみせつつ)
このアブない連中を使い続ける理由は,
招集の手間がラクな労働力であり,
何年も使いまわせば
多少の経験値をかせぐやつもいるかもしれない,
と考えてるから
-
とはいえ基本的には
監督どもの学習能力には期待できないので,
二次試験もセンター試験と同様の
監督者用の「分きざみのスクリプト」がある
-
独立行政法人といったところで,
大学は文部科学省の下っぱであることにかわりなく,
センター試験だけでなく二次試験であっても各科目の受験者数を
ほぼリアルタイム
にて東京方面に報告せねばならない
(この観測に測定誤差や記帳まちがいあると
各所で平身低頭ぺこぺこ謝罪が必要になるらしい)
-
なぜこれほどまでに
「ある時刻における厳密なる受験者数」
ごときが重視されるか?
---
マスコミなヒトたちが
現象のかかるうわっつらだけに偏執するからである
(一方で,
こういった意味不明に中央集権的な報告管理体制が
疑問視されたりはしない)
-
大学・お役所としても
「受験者数の厳密さが大事」
という無意味な虚構につきあう
---
かかる単純わーるどは気分的にはラクだから
-
えー,
入試課の期待どおりに常識がおおいに欠落してる私は,
監督ぎょーむ説明会はロクに聞いておらず,
パラメーター推定問題とかをヒネくっておりました.
アタマの中に未解決問題あれこれと貯めておくと,
けっこうヒマつぶしには有効である.
-
で,
そのつづきで研究室にもどってからも,
統計学勉強にはまりこんでしまった.
いつものごとく空間相関その他「相関あり推定」まわり,
その生態学的なデータ解析における難問解決への応用なんだが
……
-
生態遺伝学・系統樹推定まわりを除くと,
このあたりの研究はまだあまり発表されていない
(しかし,
まだ論文になってないだけで,
日本をのぞく世界のあちこちでばきばきと現在進行中なのは疑いないところだ).
で,
その数すくない文献をたぐってみると,
またしても
Jim Clark
をダウンロードすることになってしまったり.
Clark, J.S, Mohan, J., Dietze, M., and Ibanezb, I.
2003.
Coexistence: how to identify trophic trade-offs.
Ecology 84: 17-31.
``Trophic trade-offs'' とかいってるけど,
これは
Acer rubrum
(アメリカハナノキ,カエデのたぐい)
と
Liriodendron
(モクレン科ユリノキ属のたぐい)
の局所明るさ vs 高さ成長競争みたいなハナシのようだが.
-
で,
これら二樹種の高さ成長に関していろいろなモデルを検討してるわけで
……
-
樹木ごとの個性ナシ,
場所ごとのばらつきナシ,
局所明るさにばらつきナシ
(traditional model)
-
個性ナシ,
場所ごとのばらつきナシ,
局所明るさにばらつきアリ
(Bayesian, method1)
-
個性ナシ,
場所ごとのばらつきアリ,
局所明るさにばらつきアリ
(Bayesian, method2)
-
光応答に個性アリ
(場所ごとのばらつきはこれで代替),
局所明るさにばらつきアリ
(Bayesian, method3)
結果の図で示してやがるのは
Maximum a posteriori (MAP) 推定値だろうな
……
いや,
後述する事後分布の平均値か?
-
モデル選択規準は deviance information criterion
(DIC) でこれは Bayesian information criterion (BIC)
を一般化したもの,
とのこと.
-
本文の定義より deviance
D(φ)
と尤度 L(φ)
の関係を D(φ) = -2 ln(L(φ))
とする.
右辺の第一項は「deviance の事後分布」の平均値を二倍したもの,
第二項はパラメーターの事後分布の平均値を使って計算した deviance
……
まあ,
つまりパラメーター平均値ふきんでのあてはまりがよくても,
周辺尤度の分布があてはまりの悪いところを含んでるモデルはダメ,
ということか.
-
このあたりの Clark な結果ながめてるうちに,
私がなんでべいぢあんあまり好きでないのか,
という理由がわかった
……
このパラメーター推定値 (というか推定された分布)
使って,
生物の動態シミュレイションとかやるときに,
いちいち MCMC 法つかって
Gibbs 分布の乱数を生成してやらんといかん,
という面倒さにヨワってるんだろうな.
まあ,
ぢたばたしてみたところで,
将来的にはべいぢあん推定を主につかってるんだろうけど.
こうなりゃ,
なんでもかんでもぎぶすですよ.
-
しかし full model を構成する確率分布のごちゃごちゃぶりには
アタマくらくらさせられる.
各分布がなぜコレに選ばれたか,
にはいちおう理由がありそう,
と憶測できるけど
(ここでは説明略)
……
-
単純な「誤差」は正規分布
-
局所明るさはふらつきこみでベータ分布
-
局所明るさパラメーターセットの事前分布は二変量正規分布
-
「成長速度最大の 50% となる明るさ」
パラメーターの (無情報) 事前分布はベータ分布
-
誤差の (無情報) 事前分布は inverse Gamma 分布
-
局所明るさの平均ヴェクトルのハイパーパラメーターの
(無情報) 事前分布は二変量正規分布
-
局所明るさの共分散行列のハイパーパラメーターの
(無情報) 事前分布は Wishart 分布
(6. と 7.
で個体差をあらわしてるようだけどいまいちわからん)
……
これらすべてのかけ算が事後分布だ.
なンとも楽しくきちがいじみた世の中になりつつあるではありませんか.
-
昼飯.
本日は院生密度ひくい.
-
どうでもいいことだけど,
上の DIC の定義式の画像ファイルを作るところでぢたばたする.
-
LaTeX ファイルを準備する
(こんなの
---
box size を指定せねばならぬところがまぬけ)
-
platex dic.tex
-
dvips -E -x 3000 -y 3000 dic.dvi -o dic.eps
(以前は epsffit
ワザ使って
文字を拡大してたんだけど,
それはヤメた)
-
convert dic.eps dic.png
-
べいづばて.
お茶部屋にいくとなんだかアヤしげな相談やってるし.
-
1700 すぎからアカマツ問題にとりくむ.
とりあえず,
追加データに関しては処理プログラムは先日できてしまったんで,
「残骸」たるシミュレイション関係の整理整頓やらねばならんわけだが
……
-
とりあえず,
「押しこみさき」候補地のひとつ,
Ecological Modelling
の最新号の目次を特に意図もなくながめてみる.
なンと冒頭の論文は,
ここでもまたしても,
またしても ``Bayesian'' だし
……
-
で,
本日はすでにべいづにやられてるわけだし,
もはや毒をくらわばとざっと目をとおしてみる
……
こいつは (うさん) くせえッー (Speedwagon 氏談,椅子を蹴り飛ばしつつ).
ハイイログマうろうろする森林公園の保全の
あだぷちぶ管理うんぬんとか書いてあるんだが,
べいづはべいづでもひどく古びた主観確率むきだしのやつだよよん
---
現代的なべいぢあんはそのあたりをいかに巧妙に隠ぺいするか,
がキモであり上述の Clark ごとき
「七段がまえ」の確率分布などなどを準備するのである.
しかるに,
このあだぷちぶは主観確率のもとでの期待値みたいなのを計算してるだけ,
というしろもののよーで.
-
いやー,
さすがわ Ecological Modelling.
こんなのでも掲載されんのか,
と同誌の編集方針に勇気づけられました.
しかし採否水準の事前分布
--- いやいやこんな凶々しいコトバはだめだ ---
random effects の確率分布のばらつきは大きい,
と仮定すべきだろう.
-
べいぢあん雑談.
かとーさんと spam メイルフィルターのハナシをやってると,
必然的にべいぢあんになる.
なんとならば,
多くの spam filter は Bayesian estimation によって
spam かどうかを判定しているからだ.
ところが,
かとーさんがしぶとくしらべたところ,
MacOS X についてる Apple Mail の場合,
latent semantic analysis
による spam 判定やってて,
これはどうも Bayesian filter とは別モノらしい.
-
そして二人のハナシはいつのまにか
「すぱむ業者になって金もうけをする方法」
の熱心な検討にうつってしまっていた.
-
結局のところ,
べいづべいづで半日おわってしまって
1945 研究室発.
2000 帰宅.
運動.
晩飯.
-
[今日の運動]
-
[今日の食卓]
- 朝 (0750):
米麦 0.8 合.
タマネギ・卵の炒めもの.
- 昼 (1330):
研究室お茶部屋.
米麦 0.7 合.
トマト・ホウレンソウ・ブナシメジ・豆腐のソース.
- 晩 (2220):
米麦 1.0 合.
トマト・ホウレンソウ・ブナシメジ・豆腐のソース.