ぎょーむ日誌 2009-08-28
2009 年 08 月 28 日 (金)
-
0740 起床.
ねむい.
朝飯.
コーヒー.
0850 自宅発.
雨.
0910 研究室着.
-
じつは昨日から
(有限というか 2 group の)
混合分布モデル
猿になってしまっていて
(蛇足ながら混合分布モデルは mixture model であり,
まぎらわしいけど混合モデル mixed model とは別モノ
……
なのだが,
じつはウラでつながりがある),
邪悪になりがちな WinBUGS coding の創意工夫をつみかさねていたりする
……
-
たとえば,
WinBUGS のわかりにくい Trap 窓のひとつ,
「ほとんど生起確率がゼロに近い
(0.0000...01 てなかんじの)
事前分布を設定して,
その事後分布からサンプリングしようとすると,
trap 窓がでる (ことがあったりなかったり).
対処法は,
たとえば生起確率をあらわす logistic 関数に「げた」
をはかせる.
誇張した図示をするとこんなかんぢで
(実際にはゲタはもっと小さくする).
-
これは一見くだらないワザだけど,
混交のよくない MCMC において「ごくまれにオキテやぶりな遷移が発生する」
ようにしておくと混交が改善する
……
じつは,
これは昔からよく知られていたワザ,
ということで.
-
あるいは二個の混合分布モデルで「どっちが上でどっちが下?」
問題に対処する奇策らしきものも考えた.
それは標本中,
最小 (あるいは最大でもよいが)
の値をもつ標本をたとえば group 1 所属と指定
(実際には group 1 に所属する確率がきわめて高いという事前分布を設定)
するとその group 1 は自動的に「小さいほうの group」
ということに
……
-
まあ,
これは明らかにダメな方式だし,
いつもうまくいくわけでもなさそう
……
なのだが,
あーだこーだと試行錯誤しているうちに,
こういうアイデアもうかんだりするのである.
少なくとも何か試験運転のようなものをするときには
便利かもしれない.
-
で,
午前が終わってしまって,
昼飯くって,
大学院入試の面接会場に.
受験生あいてに何か質問しても
おもしろい回答が得られる確率はきわめて低い,
ということをつくづくサトってしまったので,
ほとんど沈黙をまもっていた.
じゃあ,
なんでわざわざいるのかといえば,
受験生を控え室に呼びにいき,
面接室に案内する役が必要とされるため.
私がやらなければ,
甲山さんなんかは受験生に受験生を呼びにいかせたりするんだよね
(で,
私としてはそれはいくら何でもヒドすぎると思うんで)
……
-
1530 ごろ終了.
面接試験会場だった人文社会系棟
(地環研 A 棟はすでに工事中で使えないので)
から工学部の難民キャンプにもどる.
雨.
-
で,
面接試験中いろいろとアタマの中で考えたのだが,
WinBUGS で混合分布モデルの実装に創意工夫をつみかさねる
とゆー現在の路線からは撤退したほうがよさそう.
-
ハナシを簡単にするために
「ヒト山か? それともフタ山か?」
の判断を AIC によるモデル選択ですませたい
(後記:
じつはこれはよろしくナイ
……
翌日のぎょーむ日誌参照)
-
ならば
EM アルゴリズム
による混合分布モデル推定がよさそうだ
……
-
それって誰かがすでに R package 化してるだろう
-
さて,
いろいろ調べてみたのだが
……
AASC (Austrian Association for Statistical Computing)
の
Finite Mixture Models
project のペイジで紹介されている
library(flexmix)
がよさそうだ.
詳しい
vignette
もある.
-
同 project では
bayesmix
なる JAGS
を利用したベイズな混合モデルの R package もあるのだが
……
まあ,
今回は AIC によるモデル選択でハナシをすませてしまいましょう,
と.
-
さらに蛇足ながら,
およそ何でもある
library(VGAM)
の
vglm()
において
family = mix2normal1
などと指定した推定計算が可能であり
(おそらく EM アルゴリズムではなく単純に最尤推定していると思う),
フタ山な正規分布のパラメーターを推定できる,
とわかった.
-
で,
library(flexmix)
の挙動をいろいろ調べてみる.
推定結果を格納する flexmix
class は S4 class なので,
slotNames(results)
や
results@components
といったふうに操作する.
-
AIC とかも評価してくれるので,
まあ,
とりあえずはモデル選択とかもお手軽にはできそう.
連絡メイルなど書いてみる.
-
アタマばてぎみ電池きれぎみなので,
撤退.
1930 研究室発.
2000 帰宅.
晩飯.
-
今日もおサル論文原稿改訂もできなければ,
岩波統計モデル本作業のつづきもできなかった
……
-
[今日の運動]
-
[今日の食卓]
- 朝 (0820):
米麦 0.6 合.
ネギ・ブナシメジ・豆腐の炒めもの.
- 昼 (1230):
北大中央生協.
ライス S.
和風ハンバーグ.
サラダバー.
522 円.
サラダバーで野菜・海藻をたくさんとったので,
やや高めになった.
- 晩 (2040):
スパゲッティー.