更新: 2015-05-08 10:10:39
生態学のデータ解析 - 生態学会大会2015
[W11] データ解析で出会う統計的問題: 時間の長さ・時系列データの統計モデリング
- 日時: 2015 年 3 月 19 日 (木) 18:00 -- 20:00
- 場所: 鹿児島大学郡元キャンパス, 生態学会大会 A 会場
- 企画者: 粕谷英一 (九州大・理)・久保拓弥 (北海道大・地球環境)
- 短縮 URL: http://goo.gl/LK9q4g
- 集会終了後の 懇親会 (要・予約!!)
概要
この集会では生態学における「時間の長さのデータ」と「時系列データ」のデータ解析について議論したい。
「時間の長さデータ」の例としては、観察している対象生物が「死ぬまでの時間」あるいは「ある行動・状態が持続する時間」の長さがあげられる。これらの長 短を説明できそうな要因の効果などを知りたいときに、どのような統計モデルを作ればよいだろうか。時間の長さデータの特徴として「時間の長さは常に非負」「調査を途中でやめる場合がある(うちきり)」などがあり、これらを考慮したデータ解析法は(生死データでない場合でも)生存時間分析とよばれる。カプラン・マイヤー法、比例ハザードモデル、パラメトリック回帰モデルなど、さまざまな生存時間分析の方法を比較しつつ説明するとともに、生存時間分析の基本となるハザード関数や生存関数などについても述べる。
次に「時系列データ」の解析について検討する。時系列データとは、同じ個体・調査地などから一定期間内に何度も調査をくりかえして得られる、時間軸にそった観測値である。観測対象はひとつの場合も複数の場合もある。この時系列データに対して、たとえば「観測日時」あるいは「調査地気温の時系列データ」など を説明変数に指定して直線回帰、その結果として「近年の温暖化の悪影響」などを発見しようとする方法は「あぶない」といった例の紹介から検討する。時間相関なども考慮した統計モデルのあてはめによって「あぶない」結論を回避する方法を議論したい。
話題提供
時間の長さを分析する
- 粕谷英一 (九州大・理)
- 当日の投影資料: kasuya2015ESJ.pdf
時系列データの統計モデリング入門
- 久保拓弥 (北海道大・地球環境)
- 当日の投影資料: kubo2015ESJ.pdf (とりあえず当日使用したファイル,もうちょっと修正したい…)
参考になりそうな資料
- CRAN Task View: Time Series Analysis
- 伊東宏樹さん:
- 状態空間モデルの実行方法と実行環境の比較 (slideshare)
- ESJ61 T-13 企画集会: 生態学における状態空間モデルの利用
- KFASをつかってみた
- (JSS の特集号) Special Volume: Statistical Software for State Space Methods http://www.jstatsoft.org/v41
- 馬場真哉さん: dlmの使い方
- TJO さん: Rで計量時系列分析:単位根過程、見せかけの回帰、共和分、ベクトル誤差修正モデル
- 2015-02-11 時系列データ解析のためのメモ (ryamadaのコンピュータ・数学)
- 下野寿之さん 時系列の相関係数の解釈は注意を要する (ランダムウォーク同士の相関係数は±0.72の外側に15%も分布することなど)
- 角谷拓さん 時系列間の相関
- 「とんでも」な時系列間「相関」あれこれ spurious correlations
- Wikipedia
- 生態学会自由集会のうちあげ - 鹿児島では懇親会やる予定です
- 自由集会つぎは何?