「ぎょーむ日誌」目次に戻る | KuboWeb top に戻る | twilog | atom

ぎょーむ日誌 2004-12-04

苦情・お叱りは，たいへんお手数かけて恐縮ですが，久保 (kubo@ees.hokudai.ac.jp) までお知らせください．

本日 (kubolog20041204) | 次の日 | 1 日前 | 7 日前 | 31 日前 | 365 日前 | top

2004 年 12 月 04 日 (土)

0830 起床．朝飯．コーヒー．
朝から，昨日のつづき， MCMCpack 調査にとりくむ．これも一種の怠業に他ならない．
とりあえず，定数項が正規乱数になってる normal logit model の推定問題．乱数生成&推定&作図のプログラムはこれ (glms.R)．推定結果などはこれ (glm.txt)．

上の図はよくでる推定結果パターンの一例 (これはたまたま glm() と MCMClogit() の推定結果が良かった場合)．一番単純な一般化線形モデル glm() と一番複雑な MCMC ベイズ推定の MCMClogit() の結果がだいたいいっしょで (glm(..., family = quasibinomial) は推定値に関しては glm() と常にまったく同じ)，罰則つき擬似尤度法 glmmPQL() は「傾き」のキツすぎる推定結果をだし，最尤法による一般化線形混合モデル推定 glmmML() はそこまではキツくない結果になる．
他によくでる結果の例としては
- どれでやっても同じ (どれも同じように良い，もしくはどれも同じように悪い)．
- glmmPQL() だけが異なる
あたりかな．ただし，最尤法な glmmML() はそもそも収束計算をしくじることが多く，もっとも不安定な推定計算方法と言える．
で，わざわざ MCMC 法使っていながら，しかもわざわざパラメーターにばらつき持たせている状況でありながら， MCMClogit() の結果はよろしくないような．何度やっても，こういったばらつきをまったく考慮しない glm() とほとんど同じ推定結果になるんで，これだったらベイズ推定とかやる御利益とか何もないぢゃん．
まあ，この例題があまり適切でなかったかも，という可能性はあるにしても，だ．
MCMClogit() の出した事後分布．この事例ではたまたま推定値の平均はそれっぽい値になっているけれど，いっぽうで variance がむちゃくちゃでかいんですけど ……

昼飯．しばらく R でうだうだしてから 1430 自宅発の北大構内走．曇天．しかし夜間にふった雨のおかげで雪はかなりとけている． 1530 帰宅．体重 72.8kg．
1630 自宅発．すでに夜．曇． 1700 研究室着．
動物行動学会大会でお疲れの粕谷さんからご指摘メイルいただく．昨日のぎょーむ日誌に書いた， glm.binomial.disp() (in dispmod) は擬似尤度 (quasi-likelihood) 最大化でパラメーター推定やってる，とのこと．マニュアルよく読むと，たしかにそう書いてある．ベータ二項分布に合致するように variance をややこしく決めて，これを擬似尤度法で解いているらしい．ふーむ．
しかもまぬけなことに，今年 8 月末の生態学会釧路大会のときに，私は粕谷さんからこの dispmod のことを教えてもらっていた …… らしいんだけど，まるっきり失念していた．嗚呼．
ともあれ，このあたりのベータ二項分布問題について，粕谷さんがネット上に何か文書を掲載される予定，だとか．
蛇足ながら， quasi likelihood は擬似尤度なる訳語が定着しつつあるようだけど，むしろもっと直訳的に「準尤度」とでもしたほうがよいかも．理由として一番わかりやすいのは， pseudo likelihood なるものがまた別にあり，これも擬似尤度と呼ばれることあるからだ (ニセもの好きな私としては「にせ尤度」と呼んでいるけど)．じつは pseudo likelihood と呼ばれるものには少なくとも二種類あり，空間統計学でつかわれるものと， (私は実際に使われているのを見たことないんだが) 未知の確率分布の平均と分散を定式化してこれを正規分布で計算してしまう方式 (……だったような?) があって，ですね．

dispmod ついでに …… ガンマ混合ポアソン分布を計算する glm.poisson.disp() 関数のほうは，昨日かいたとーり，「ほぼ」負の二項分布モデルと考えてよいようだ (何か iterative な方法で最尤推定やってると書いてある)．たとえば， example(glm.poisson.disp) で

> mod.disp

Call:  glm(formula = incid ~ offset(log(pop)) + Age + Cohort, family = poisson(log),
           weights = disp.weights) 

Coefficients:
  (Intercept)       Age55-59       Age60-64       Age65-69       Age70-74  
       -8.645          0.823          1.549          2.128          2.696  
     Age75-79       Age80-84  Cohort1860-64  Cohort1865-69  Cohort1870-74  
        3.172          3.474          0.355          0.519          0.774  
Cohort1875-79  Cohort1880-84  Cohort1885-89  Cohort1890-94  Cohort1895-99  
        1.012          1.151          1.299          1.546          1.575  
Cohort1900-04  Cohort1905-09  Cohort1910-14  Cohort1915-19  
        1.628          1.464          1.372          1.256  

Degrees of Freedom: 48 Total (i.e. Null);  30 Residual
Null Deviance:      9140 
Residual Deviance: 30   AIC: 194

こういう結果でてくるんだけど，同じデータセットを負の二項分布な一般化線形モデル計算関数 glm.nb() (in MASS pacakge) で推定させると，

> glm.nb(formula = incid ~ offset(log(pop)) + Age + Cohort)

Call:  glm.nb(formula = incid ~ offset(log(pop)) + Age + Cohort, init.theta = 479.389611087294,
              link = log) 

Coefficients:
  (Intercept)       Age55-59       Age60-64       Age65-69       Age70-74  
       -8.642          0.822          1.549          2.128          2.695  
     Age75-79       Age80-84  Cohort1860-64  Cohort1865-69  Cohort1870-74  
        3.166          3.472          0.357          0.520          0.775  
Cohort1875-79  Cohort1880-84  Cohort1885-89  Cohort1890-94  Cohort1895-99  
        1.012          1.151          1.301          1.541          1.572  
Cohort1900-04  Cohort1905-09  Cohort1910-14  Cohort1915-19  
        1.623          1.464          1.373          1.253  

Degrees of Freedom: 48 Total (i.e. Null);  30 Residual
Null Deviance:      12400 
Residual Deviance: 43.7         AIC: 535

…… となる．推定値がびみょーに違うのは収束計算のやりかたが異なるので，そのへんが反映されてるのではないか．

ただし，上の計算結果をみると， deviance とか AIC の値なんかは違うよね．憶測だけど，これは glm.poisson.disp() ではガンマ分布の部分は連続関数のまま計算してるのが影響してんのではなかろーか，と …… いや，ちょっとこれは変かな? きちんと数値積分してれば両者は (だいたい) 一致するはず． glm.poisson.disp() で使っているという Breslow (1984) の計算アルゴリズムとやらを調べんとわからんのかも．
急速に空腹になったので撤退準備．どうも長距離を走ると，あとになって急に空腹感をおぼえたりするよーな．本日もぎょーむ進捗せず． 2015 研究室発． 2025 帰宅．
いかん．夜も怠業状態つづく．
[今日の運動]
- 北大構内走 1430-1530．ストレッチング．
- 腹筋運動 30 × 3 回．腕立ふせ 5 × 3 回．
[今日の食卓]
- 朝 (0930): 米麦 0.7 合．キャベツ・ダイコン・豆腐・サバぶしの味噌汁．
- 昼 (1230): 蕎麦．
- 晩 (2200): スパゲッティー．タマネギ・マイタケのトマトソース．

本日 (kubolog20041204) | 次の日 | 1 日前 | 7 日前 | 31 日前 | 365 日前 | top

KuboLog | KuboWeb