ぎょーむ日誌 2006-10-10
2006 年 10 月 10 日 (火)
-
0800 起床.
朝飯.
コーヒー.
0900 自宅発.
晴.
0915 研究室着.
-
今日はいろいろな偶然から「シウリザクラな半日」になるはずなので,
とりあえず以前に書いたシウリザクラ作文
(お,
もうひと月
ちかくも経過してたか)
をみなおす.
-
よくある質問
「対数尤度が正の値になった (あるいは AIC が負の値になった)
んだけど,
それって問題ないのか?
(対数尤度って確率の対数だから 0 以下になるんでは?)」
に対する回答の一例.
ひとことで言えば「対数尤度として計算されている数量がプラスになることはよくあ
ること」で理由は「尤度が確率ではなく確率に比例する量になっていることが多いか
ら」ということです.
たとえば観測値 x の統計モデルにおいて,x のばらつきを説明するために正規分布
を使っていたとしましょう.正規分布は連続分布なので,たとえば x は平均ゼロで
分散 0.1 の「せまい」正規分布にしたがうとすると,その「確率密度」 y はだいた
いのところ,
x y
[1,] -0.20 0.53
[2,] -0.15 1.29
[3,] -0.10 2.41
[4,] -0.05 3.52
[5,] 0.00 3.98
[6,] 0.05 3.52
[7,] 0.10 2.41
[8,] 0.15 1.29
[9,] 0.20 0.53
というふうになります.このような連続分布ですから x が 0 ぴったりである確率は
ゼロであるのに対して,x が 0 から 0.0001 のあいだに存在する確率はおよそ 3.98
* 0.0001 = 0.000398 ぐらいになります.
x = 0 である (あるいは 0 ちかくにいる) 「確率」はこのように計算されるべきな
のですが,尤度計算では x = 0 というデータが得られた場合,その「尤度」を 3.98
にして計算します.つまり尤度とは何かと聞かれれば,正確には確率に比例する量,
ということになります.
連続分布を使った統計モデルではこのように尤度や対数尤度が計算されていくので,
データ全体の対数尤度が正になることはよくあります.
また離散確率分布 (ポアソン分布や二項分布など) を仮定している場合でも,計算の
つごうで (例:「定数項」を省略) などによって対数尤度が正になることがあります
(最尤推定においてはそれで特に不都合はないので).
1030 より
研究室セミナー,
本日は森君で格子状に植えられたシウリザクラの結実数解析
……
サッカーの試合とかよく知らないんだけど,
前半終了までにオウンゴールで 3 失点自滅,
というかんぢ.
終了後,
セミナーに来ておられた永光さん・森君・私で「三者面談」.
私までまきこまれてしまったシウリザクラ論文かき
(森君が修士課程でやってた研究)
の論文とりまとめの作業分担とか.
私が分担すべき作文の量がまた増えつつある
……
その後,
三人で北大生協で昼飯.
研究室お茶部屋にもどって,
永光さんと社会性昆虫モデリング雑談.
ユキモチソウメイルかき.
R 「通信講座」は難しそうな予感.
院生に命じられて,
A801 部屋の共用ゐんどーづ機に
「時計あわせ」
ソフトウェア
(よくわからないので
桜時計)
のインストール & 設定.
NTP server はてきとーに
検索
して産総研の予備の予備を指定.
12 時間おきに自動的に時計を修正するよう設定.
ちかごろの
R-help
mailing list の一部では
「R の block comment
の仕様はどうあるべきか」
というまにあっくな議論でもりあがっている.
現存する R の block comment は
if (FALSE) {"
block comment!
"}
# ふつーのコメントはこう書く
だけなんで.
いまさらながら,
昨日のぎょーむ日誌が「乱丁」とでもいうべき状態にあるのを発見.
修正.
香川の小林さんから母子里林冠モデル作文の
修正コメントおくっていただいたので,
それにしたがって改訂作業をススめる.
1850 研究室発.
1905 帰宅.
体重 73.8kg.
[今日の運動]
[今日の食卓]
- 朝 (0820):
米麦 0.5 合.
ネギ・豆腐・ワカメ・煮干の味噌汁.
- 昼 (1320):
北大生協中央食堂.
気仙沼マグロ漬丼.
サラダバー.
味噌汁.
535 円.
499 キロカロリー.
- 晩 (2010):
米麦 0.8 合.
ゆでサンマ.
ネギ・ナメコ・ワカメの味噌汁.