KuboWeb top

更新: 2012-09-24 21:50:27

生態学のデータ解析 - 統計学授業 2011 (Bayes)

  • 統計学の授業やります (2011 年度前期前半, 2011 年 4-5 月)
    • 「生態系機能学総論」の一部, 2011 年の 4/11 (月) から開始
      • 誰でも参加できます
      • 事前のもうしこみなどは何も必要ありません (聴講のみで,単位を必要としない場合)
      • 全部ではなく部分的に参加してもらってもかまいません
      • 途中から参加する人久保 まで連絡ください
    • 講義のーとは「統計モデリング入門」として出版されました
    • 月曜日・水曜日の 2 講目 (10:30-12:00)
    • 教室: 地球環境科学研究院 A 棟 A809 (エレヴェイターでてすぐ前の部屋)
    • 短縮 URL: http://goo.gl/Brd9g
  • 授業のねらい
    • 対象とする人: GLM とかは何とかわかるけれど,それだけでは現実的なデータ解析が難しいので「発展型 GLM」などより応用範囲のひろい統計モデルをあつかいたい大学院生たち
      • と書いてるにもかかわらず,データ解析の経験がまったくない M1 がたくさんきてしまったので,じゅぎょー内容をより入門的なものに変更せざるをえなくなりました (2011-04-11)
    • この授業に参加した人たちは,授業終了時に少なくともこういうことがわかっていてほしい
      • 統計ソフトウェア Rデータを操作したり作図 (lattice など高度なもの)
      • データ解析で重要なのは「検定」ではなく統計モデル作りだと理解する
      • あるデータをみたときに,こういう確率分布でああいう GLM なんかを作れるんじゃないかなと判断できる
      • 個体差のような random effects の概念を理解する
      • 階層ベイズモデルがどのように役にたつのかを説明できるようにする

(各回の内容)


生態学の統計モデル

第 1 回: 4/11 (月) 観測されたパターンを説明する統計モデル 

  • 内容: 今回は統計モデルとは何か,そして授業であつかう基本統計モデルである GLM について説明し,モデリングの工夫の重要性を説明する
  • 参考: R のインストール, GLM 参照
  • 例題 1a
    • 例題のデータファイル: d.RData (R データファイル)
    • 例題の推定・作図: estimate.R
  • 例題 1b (今日は説明してる時間ありませんでした)
    • 例題のデータファイル: d2.RData (R データファイル)
    • 例題の推定・作図: off.R
  • 課題 1
    1. R のインストール などを参考に自分の PC に R をインストールして,うまくいったかどうかを報告.使っている OS なども書いてください.
    2. 第 1 回の例題 1a のデータを R に読みこんでください.読めたら先頭部分のデータを表示してそのコピーをメイルにはりつけてください
    3. 例題 1a の glm() の推定をして結果をメイルにはりつけ,結果について解釈してください.

第 2 回: 4/13 (水) R 入門 

  • 内容: 統計ソフトウェア R の使いかたの基本の実演 -- R の基本がわからないことには授業にならないんで
  • 配布資料: kubostat2011C2.pdf
    • データの CSV ファイル: data.csv
  • 説明してることの web 版: R のとりかかり, R-primer/data.frame 実習 1, R-primer/plot 実習 1
  • 参考: 作図例, RGM, データフレイムの操作, 生態学会大会2008
  • 課題 2: 教科書の第 3 章を読んで,以下の内容について各自で考えて回答してください.
    • 提出〆切日: 4/20 (水)
    1. ポアソン回帰にリンク関数で log を指定することと,応答変数 y から log(y) を作って直線回帰することはどうちがうか? (特に検討してもらいたい状況は,データ y がカウントデータで y が 0, 1, 2, ... といったカウントデータである場合についてはどうだろうか,いった問題です)
    2. 3.3 節の最初の plot() 関数で指定している pch = c(21,19)[d$f] はどういう意味か?
    3. 第 3 章を読んで,意味がよくわからなかったところ,説明文が読みづらいところ,まちがいなどを指摘してください.

第 3 回: 4/18 (月) GLM 入門のつづき -- 何でも「割算」するな! 

  • 内容: やたらと割算ばかりするデータ解析やめよう --- 対策: offset 項やロジスティック回帰といった統計モデリングを!
  • 投影資料: kubostat2011C3.pdf
  • offset 項の例題
    • 例題のデータファイル: d2.RData (R データファイル)
      • R でこのデータをよみこむときには load("d2.RData")
    • 例題の推定・作図: off.R
  • ロジスティック回帰の例題
    • 例題のデータファイル: data.csv (CSV ファイル)
      • R でこのデータをよみこむときには d<-read.csv("data.csv")
    • 例題の推定・作図: glm.R
  • 課題 3: 教科書の第 6 章などを読んで,以下の内容について各自で考えて回答してください.
    • 提出〆切日: 4/22 (金)
    1. あなたの指導教員が短気なヒトだとして,「結局,直線回帰とロジスティック回帰ってどうちがうの?」と聞かれたら,どうてっとりばやく回答する?
    2. 第 3,4 章も読んで,第 6 章の「x の効果を考慮したモデル」「してないモデル」をどうやって比較しているか,簡単に説明せよ
    3. 第 6 章を読んで,意味がよくわからなかったところ,説明文が読みづらいところ,まちがいなどを指摘してください.

第 4 回: 4/20 (水) 階層ベイズモデルの基礎 (1) 個体差のモデリング 

  • 内容: 最尤推定法と MCMC といったパラメーター推定,そして個体差などを考慮して GLM をパワーアップする階層ベイズモデルの紹介
  • 投影資料: kubostat2011C4.pdf
  • 例題のデータなど
    • データ (個体差なし): d.RData (Rdata ファイル)
    • データ: data.csv (CSV ファイル)
  • 参照: ベイズ統計 & MCMC, GLMM 参照
  • 課題 4: 教科書の第 8 章などを読んで,以下の内容について各自で考えて回答してください.
    • 提出〆切日: 4/25 (月)
    1. 尤度が高いモデルはなぜ「良い」モデルなのか?
    2. MCMC サンプリングによってパラメーターの事後分布が得られるけれど,推定結果が確率分布として得られる利点にはどのようなものがあるだろう?
    3. 第 8 章を読んで,意味がよくわからなかったところ,説明文が読みづらいところ,まちがいなどを指摘してください.

第 5 回: 4/25 (月) 階層ベイズモデルの基礎 (2) WinBUGS による推定 

  • 内容: 階層ベイズモデルのパラメーター推定,そのためのソフトウェア
  • 投影資料: kubostat2011C5.pdf
  • 例題のデータなど
    • データ: data.csv (CSV ファイル)
    • R コード: runbugs.R (テキストファイル)
    • BUGS コード: model.bug.txt (テキストファイル)
    • ラッパー関数セット R2WBwrapper.R: R2WBwrapper からダウンロードしてください
  • 参照: ベイズ統計 & MCMC, R2WinBUGS
  • 課題 5: 教科書の第 10 章を読んで (7-9 章なども参照),以下の内容について各自で考えて回答してください.
    • 提出〆切日: 4/28 (木)
    1. 「えー,ベイズって主観的とかいうやつじゃないの? そんなの研究に使えるの?」と言われたらどう答える?
    2. 一般化線形混合モデル (GLMM) と階層ベイズモデル (HBM) はどういう関係なのか?
    3. 第 10 章を読んで,意味がよくわからなかったところ,説明文が読みづらいところ,まちがいなどを指摘してください.

第 6 回: 4/27 (水) 階層ベイズモデルの応用 (1) 空間・時間構造をあつかう 

  • 内容: 複数のランダム効果,空間構造のあるランダム効果,時間構造のある統計モデリング
  • 投影資料: kubostat2011C6.pdf
  • 参照: ベイズ統計 & MCMC, R2WinBUGS
    • ラッパー関数セット R2WBwrapper.R: R2WBwrapper からダウンロードしてください
  • 複数のランダム効果の例題のデータなど
    • データ: d1.csv (CSV ファイル)
    • R コード: runbugs.R (テキストファイル)
    • BUGS コード: model.bug.txt (テキストファイル)
  • 空間相関のランダム効果の例題のデータなど
  • 課題 6: 教科書の第 11 章を読んで,以下の内容について各自で考えて回答してください.
    • 提出〆切日: 5/2 (月)
    1. 今日の授業で最初にあつかった個体差 + ブロック差の例題で,もし各植木鉢にひとつの個体しか植えていなかった場合,ランダム効果はどのように設定すれば良いか,それは何由来の効果だと考えればよいのか?
    2. 空間相関のある random effects としてはどのようなものがありそうか,あるいはどのようにして生じるのか?
    3. 第 11 章を読んで,意味がよくわからなかったところ,説明文が読みづらいところ,まちがいなどを指摘してください.

第 7 回: 5/02 (月) 階層ベイズモデルの応用 (2) 資源分配など割合をあつかう 

  • 内容: 階層ベイズモデルを使って,重量比・タテヨコ比など連続値の割算値をうまく統計モデリングする
  • 投影資料: kubostat2011C7.pdf (とりあえず版)
  • 例題 1, 2 (植物の地上部・地下部の重量分割)
    • 生態学会大会2010 から例題データ,R と BUGS のファイルをダウンロードしてください
  • 例題 3, 4 (モウセンゴケの葉のタテ・ヨコ長さ,3 種の識別)
  • 課題 7: 教科書の第 1, 2, 4, 5, 7, 9 章のうち どれかひとつ を選んで,読んでください.それを第 k 章とします.
    • 提出〆切日: 5/11 (水)
    1. 第 k 章で強調されていることを要約してください
    2. 教科書の中で第 k 章と他の章の関連を考え,全体の中で第 k 章はどのような役割を果たしているのか説明してください
    3. 第 k 章を読んで,意味がよくわからなかったところ,説明文が読みづらいところ,まちがいなどを指摘してください

  • 当初の予定 (「想定外」に M1 受講生が多かったので,内容を上のように変更しました)
    • 第 2 回: 4/13 (水) 現実の複雑さを表現する階層ベイズモデル
    • 第 3 回: 4/18 (月) Markov chain Monte Carlo 法による推定
    • 第 4 回: 4/20 (水) 種差・場所差・個体差の階層ベイズモデル
    • 第 5 回: 4/25 (月) 空間構造を組みこんだ階層ベイズモデル
    • 第 6 回: 4/27 (水) 資源分配・状態変動の階層ベイズモデル
    • 第 7 回: 5/02 (月) 時間変化する生物現象の階層ベイズモデル