「ぎょーむ日誌」目次に戻る | KuboWeb top に戻る | twilog | atom

ぎょーむ日誌 2008-03-11

苦情・お叱りは，たいへんお手数かけて恐縮ですが，久保 (kubo@ees.hokudai.ac.jp) までお知らせください．

本日 (kubolog20080311) | 次の日 | 1 日前 | 7 日前 | 31 日前 | 365 日前 | top

2008 年 03 月 11 日 (火)

0820 起床．朝飯．コーヒー．またメイル書き，とか． 1000 自宅発．ちょっと雨． 1015 研究室着．
1030 より研究室セミナー，本日は西村さんでサロベツ湿原でたくさん窒素肥料をまいたらどうなるか実験，のハナシ．植物ごとのバイオマスの変化なんかが知りたいところなんだけど，バイオマスってのは破壊的にやらないとわからないので，実験前 vs 実験後の比較ができない．となると， Bayes 推定で「観測されなかった量」つまり実験前のバイオマスを確率分布として …… となるわけだが，なかなかそれもたいへんだろうなぁ．甲山さんは無機窒素が土壌中の細菌によって気体として放出される，といった難しい指摘を．それがホントだとすると何がなんだか ……
データ解析こんさるぎょーむな関数作成．たとえばこういデータ
```
> head(d) # データの最初の部分をみてみる
     type  n year1 year2 year3
1 B->A->B 31     B     A     B
2 A->C->B 28     A     C     B
3 A->A->C 28     A     A     C
4 B->A->C 27     B     A     C
5 C->E->C 26     C     E     C
6 E->E->D 26     E     E     D

> dim(d) # data frame の大きさ
[1] 500   5
```
つまりいろいろな場所があって year 1 -> 3 のあいだに， B->A->B と変化した場所は 31 箇所ありましたよ，というデータがずらずらと 500 ばかりならんでるとしよう A, B, ..., E なる 5 type がいくつあったかを R で集計するのは簡単なんだけど，
```
> sapply(c("year1", "year2", "year3"), function(y) tapply(d$n, d[,y], sum))
  year1 year2 year3
A  1824  1873  1474
B  1849  1723  1886
C  1598  1731  2032
D  1532  1595  1892
E  1883  1764  1402
```
ただしこれはやや手ぬきな sapply() & tapply() よびだしなので，たとえば year1 に A が一個もない場合はこういうふうに table みたいな出力は得られない (list として出力される)．
それでは year ごとに A->B といった変化がいくつあったか集計しなさい，ただし A->B の個数がゼロだった場合もちゃんとゼロと出力せよ，という場合には一行では書けない処理になってしまう．ということで， count.change() なる関数を count.R 内で定義してみた．こんな動作になる．
```
> count.change(d, "n", c("year1", "year2", "year3"))
   type.T1 type.T2    type.T1T2 year1 year2
1        A       A      A->A   394   373
2        B       A      B->A   466   142
3        C       A      C->A   414   458
4        D       A      D->A   221   271
5        E       A      E->A   378   230
6        A       B      A->B   259   296
7        B       B      B->B   293   378
8        C       B      C->B   282   417
9        D       B      D->B   357   344
10       E       B      E->B   532   451
... (以下略) ...
```
まあ，ただ単に数えてるだけなんだけど …… われながらあまりわかりやすい R coding ではないような気がする．
わかりにくい理由のひとつは，処理の中で sapply() & tapply() がプログラム読者には想像しにくい複雑なデータ構造，つまり label つき vector を生成する (そしてその後の処理はその生成された label に依存する) というあたりかな．もしこれを他のプログラム言語で記述したならば，おそらくこのあたりもっと長く冗長に (もしかしたら読みやすく) なってしまうわけで．
また別のハナシ．メイリングリスト R-help で何げなくみかけたんだけど …… library(sspir) (CRAN) というのがあって，これは時系列データの一般化状態空間モデリング (state space modeling) を可能にしている (R Graphical Manual に掲載されてる図一覧)．応答変数に対応する確率分布は Poisson 分布なども可 (ssm() 関数)，つまり GLM 的な時系列解析ができるってコトですなぁ． Journal of Statistical Software にこの package のくわしい論文も掲載されてる．
昼飯．窓の外はいつのまにか雪．
またメイル書きやら何やら．窓の外はかなり吹雪っぽい．
書き忘れてたけど，自由集会のうちあげというか懇親会，場所と料理がきまった．参加したいヒトは久保までご連絡ください．おっと，また連絡メイルを忘れてた．
次の作業，残された福岡大会準備 (自由集会 & 企画集会の準備) をやってしまいたいんだけど，トドマツ再投稿の作業分担をやらねばならぬようだ ……
原稿よみなおしてメイル送信．
そしてまた別のデータ解析こんさるにとらっぷされてしまった ……
教訓: 学会大会前だろうが何だろうが，こちらの事情に関係なく (いやむしろ苦しい状況においてこそ) 「待ったなし」なデータ解析こんさるメイルは来襲する．
2030 研究室発． 2045 帰宅．晩飯．
真夜中すぎになってもこんさるな作業はつづく ……
生態学会福岡大会初日 (3/14 金) まであと 3 日 (えーと …… これは残りは水木金というカウント方法だよ)．最低限のやることリスト:
- (ひとまず終了) 一般講演: アリポスターの準備
- R プログラミング自由集会: 前口上的な部分
- ベイズ企画集会: コメント (まあ 1-2 分で終わるような)
- (ひとまず終了) 山地生態学企画集会: 占部さんの計算したうけ，PP-ZP-Fish 系の再計算
何とかさっさと終わらせて他のヒトからコメントいただきたいところなんだけどなぁ ……
[今日の運動]
- どんどんうんどう休養日 ……
[今日の食卓]
- 朝 (0830): タマネギ・エノキダケのクリームシチュー．クラッカー．ヨーグルト．リンゴ．
- 昼 (1340): 研究室お茶部屋．米麦 0.5 合．とろろコンブ．
- 晩 (2130): マカロニ．キャベツ・タマネギ・ひき肉のトマト煮．

本日 (kubolog20080311) | 次の日 | 1 日前 | 7 日前 | 31 日前 | 365 日前 | top

KuboLog | KuboWeb