KuboWeb top

更新: 2018-01-16 12:26:08

生態学のデータ解析 - FAQ ぶんさんぶんせき

  • このペイジは分散分析 (ANOVA) に関するペイジとはよべないかもしれません
    • 何でもかんでもぶんさんぶんせき」なヒトたちに「もっと GLM/GLMM/べいづ な視点から考えなさいよ」とうながすための FAQ です
    • 参照: よくまとまっている分散分析ノート http://androids.happy.nu/ja/anova-note (中西さんのサイト)
  • Clawley (2005) の p.110 あたりの記述とりあえずそのままな内容を紹介してみます
    • Crawley. 2005. Statistics: An Introduction using R. Wiley (URL)

      aiur

  • つまり「ぶんさんぶんせきだ何だというのは ……
    • いっけんするとごちゃごちゃややこしそうに見えるけど
    • 実際のところは R の一般化線形モデルというか一般化されてない線形モデル lm(...) なんちゃらにすぎない,ということです
      • lm() のことを一般化 (generalized) ではない 一般線形モデル (general linear model) とよぶこともありますが
    • ということで lm(...)... と言うところのぶんさんぶんせきの対応関係を列挙してみます

    Rlogo

  • 参照: FAQ 系ペイジ一覧, FAQ 一般化線形モデル, GLM 参照

[項目]


分散分析って統計モデルなんですか? 

  • 統計モデルではなく特定のクラスの統計モデルの推定結果を調べる手段のひとつです
  • 世の中でいうところのぶんさんぶんせきで使われてる統計モデルとは……
    • 応答変数のばらつきは正規分布,分散は一定
    • パラメーター×説明変数は線形に結合される,つまり線形予測子
    • link 関数は identity
    • つまり R の lm(...) 関数であつかう統計モデルです
  • ぶんさんぶんせき自体は統計モデルではなく統計モデルで得られた推定値とそのときのあてはまりの良さを調べる方法です
    • この調べかたにうるさいお約束がいろいろあります
      • しかし生態学まわりの ANOVA ゆーざーの多くはそういったお約束なんかは無視してます

ぶんさんぶんせきって何で分散を調べるのですか? 

  • 推定された統計モデルの良さを分散の大きさで評価するからです
    • 等分散正規分布モデルにおいては分散があてはまりの悪さになります
  • ANOVA を一般に拡張すると AOD (analysis of deviance) になります

回帰 (regression) とか一元分散分析 (one-way ANOVA) で使っている統計モデルは何ですか? 

  • 応答変数は y,説明変数は x だとすると
    • lm(y ~ x)

二元分散分析 (two-way ANOVA) で使っている統計モデルは何ですか? 

  • 応答変数は y,説明変数は x1x2 だとすると
    • lm(y ~ x1 + x2)

Factorial ANOVA で使っている統計モデルは何ですか? 

  • 応答変数は y,説明変数は x1,...,x3 だとすると
    • lm(y ~ x1*x2*x3)

三元分散分析 (three-way ANOVA) で使っている統計モデルは何ですか? 

  • 応答変数は y,説明変数は x1,...,x3 だとすると
    • lm(y ~ x1*x2*x3 - x1:x2:x3)

共分散分析 (ANCOVA) で使っている統計モデルは何ですか? 

  • 応答変数は y,説明変数は x1x2 だとすると
    • lm(y ~ x1 + x2)
    • または lm(y ~ x1*x2)

Nested ANOVA で使っている統計モデルは何ですか? 

  • 応答変数は y,説明変数は x1x2 だとすると
    • lm(y ~ x1 + x1:x2)

Split-plot ANOVA で使っている統計モデルは何ですか? 

  • 応答変数は y,説明変数は x1x2 だとすると
    • aov(y ~ x1*x2 + Error(x1/x2))
    • (これはホントにこれでいいのかな? あとで調べる)