更新: 2018-01-16 12:26:08
生態学のデータ解析 - Gamma 分布の GLM
- LinksRenv の 一般化線形モデル の推定関数
glm()
でデータのばらつきをガンマ分布 (family=Gamma
) を指定したときの統計モデリングに関するメモです (かきかけ)- Gamma 分布: Wikipedia の記述 を参考にしてください
注意すべき特徴
- ここでは R のガンマ分布の確率分布関数の記法である
shape
とrate
パラメーターを使ったものにします- つまり平均は
shape/rate
で分散はshape/rate^2
- つまり平均は
dispersion parameter phi
も推定される
- dispersion パラメーター
phi
については Faraway の赤い GLM 本など参照- 分散 =
phi
× 平均2
- 分散 =
- 平均を
m
とするとshape = 1/phi
でrate = 1/(phi*m)
- ただし
phi
は最尤推定されているわけではなくchi^2/(n-パラメーター数)
で推定されているようだ (上記 Faraway 本にも同様の説明あり)
- ただし
(R の summary.glm() のコードからの抜粋)
df.r <- object$df.residual
……
sum((object$weights * object$residuals^2)[object$weights > 0])/df.r
ゼロデータ問題
-
glm(y ~ ...)
とした場合に,応答変数y
にゼロが含まれている場合は推定計算をしてくれない - ごまかしわざ?:
y
全体に微小な値をたす?y.cheat <- y + 1.0e-9