「ぎょーむ日誌」目次に戻る | KuboWeb top に戻る | twilog | atom

ぎょーむ日誌 2007-01-(11-20)

苦情・お叱りは，たいへんお手数かけて恐縮ですが，久保 (kubo@ees.hokudai.ac.jp) までお知らせください．

- 01/10 | 01/11 | 01/12 | 01/13 | 01/14 | 01/15 | 01/16 | 01/17 | 01/18 | 01/19 | 01/20 | 01/21 -

本日 (kubolog20070111) | 次の日 | 1 日前 | 7 日前 | 31 日前 | 365 日前 | top

2007 年 01 月 11 日 (木)

0700 起床．朝飯．コーヒー． 0900 自宅発．晴． 0915 研究室着．
おお，間瀬さんから先日の {0, 1} 変換わざについて「かっこいい」解法おしえてくださるメイルが ……

データはたとえばこうでっちあげてみよう．今回は n.sample はふぞろい，という状況 (前回は n.sample = 5 と固定)．

> (data <- data.frame(id = 1:4, n.sample = c(4, 3, 5, 5),
  x = c(2, 1, 3, 4), y = c("red", "yellow", "green", "blue")))

  id n.sample x      y
1  1        4 2    red
2  2        3 1 yellow
3  3        5 3  green
4  4        5 4   blue

まず，こいつを n.sample の回数ぶんだけタテにのばす．この「のばし」わざ!

> (Data <- data[rep(1:nrow(data), data$n.sample),])
    id n.sample x      y
1    1        4 2    red
1.1  1        4 2    red
1.2  1        4 2    red
1.3  1        4 2    red
2    2        3 1 yellow
2.1  2        3 1 yellow
2.2  2        3 1 yellow
3    3        5 3  green
3.1  3        5 3  green
3.2  3        5 3  green
3.3  3        5 3  green
3.4  3        5 3  green
4    4        5 4   blue
4.1  4        5 4   blue
4.2  4        5 4   blue
4.3  4        5 4   blue
4.4  4        5 4   blue

つぎに x 列を {0, 1} におきかえる． mapply() を使う． mapply() の使いどころとはこういうところだったのか ……

> Data$x <- ifelse(unlist(mapply(seq, data$x, 1+data$x -data$n.sample)) > 0, 1, 0)
> Data
    id n.sample x      y
1    1        4 1    red
1.1  1        4 1    red
1.2  1        4 0    red
1.3  1        4 0    red
2    2        3 1 yellow
2.1  2        3 0 yellow
2.2  2        3 0 yellow
3    3        5 1  green
3.1  3        5 1  green
3.2  3        5 1  green
3.3  3        5 0  green
3.4  3        5 0  green
4    4        5 1   blue
4.1  4        5 1   blue
4.2  4        5 1   blue
4.3  4        5 1   blue
4.4  4        5 0   blue

さて，ここでなぜこのように「手品」のごとく {0, 1} 変換ができるのか説明してみよう．まず mapply() 部分だけを動かしてみると

> mapply(seq, data$x, 1+data$x -data$n.sample)
[[1]]
[1]  2  1  0 -1

[[2]]
[1]  1  0 -1

[[3]]
[1]  3  2  1  0 -1

[[4]]
[1] 4 3 2 1 0

このような整数 vector の list になっていることがわかる． unlist() すると

> unlist(mapply(seq, data$x, 1+data$x -data$n.sample))
[1]  2  1  0 -1  1  0 -1  3  2  1  0 -1  4  3  2  1  0

全部くっついた vector になり，さらに不等式にわたすと

> unlist(mapply(seq, data$x, 1+data$x -data$n.sample)) > 0
 [1]  TRUE  TRUE FALSE FALSE  TRUE FALSE FALSE  TRUE  TRUE  TRUE FALSE FALSE  TRUE  TRUE
[15]  TRUE  TRUE FALSE

logical 型 ({TRUE, FALSE}) vector になるので ifelse(..., 1, 0) すれば {0, 1} 変換できる．

最後に行名をととのえればできあがり，と．

> dimnames(Data)[[1]] <- 1:nrow(Data) # rownames(Data) <- 1:nrow(Data) でも可
> Data
   id n.sample x      y
1   1        4 1    red
2   1        4 1    red
3   1        4 0    red
4   1        4 0    red
5   2        3 1 yellow
6   2        3 0 yellow
7   2        3 0 yellow
8   3        5 1  green
9   3        5 1  green
10  3        5 1  green
11  3        5 0  green
12  3        5 0  green
13  4        5 1   blue
14  4        5 1   blue
15  4        5 1   blue
16  4        5 1   blue
17  4        5 0   blue

いやー，すばらしいですね ……

1300 すぎまでメイルやりとりとかばかり …… なぜなんだ．ともあれ 3 月の松山大会の旅程は確定し，旅費調達のめどもたち，北大生協に「旅割」航空券の予約もできた．予約完了は 1/24 (水) 予定．完了したら九大・理・生物事務室に連絡，と．
もひとつメイル書き．アリ科研でやるべき分担研究，おもいきって観測データよりに (つまり本来の久保的に) 方向転換しつつあり．香川の伊藤さんとはごいっしょに進めていけそうなかんじなので，二の矢を沖縄にむけて放つ．さーて，こちらもどうなることやら …… と，昼飯．
もう一件わけわからん事務雑用あるけど，これはしばらく放置だ．
で，周囲から圧力を受けつつある 1/22 & 1/24 統計学授業の準備，ちょっとだけ手をつけてみる …… でさー，ようやく思い出したんだけど …… 今回は「べいづ」にまで踏みこんでしまうつもりなんだけど， 12 月の R ユーザー会の発表でやったみたいな JAGS だの R2WinBUGS ではなくて， lmer() で得られた結果を mcmcsamp() する，という手順がよいのではないかな?
こうすれば Gibbs sampler ソフトウェアだの BUGS 言語だのの説明はいらんし …… と library(lme4) まわりでいろいろと試行錯誤してみる．
で，わかったんだけど「びみょー」と言いますか．「個体」ごとの事後分布とか出力されないみたいで …… そういうのナシで階層ベイズモデル + MCMC 計算の説明できるかしらん? と考えこむ．
すると永光さんがシウリザクラ原稿を送ってくださったので，ちょっと気になってたモデルまわりをチェック …… 自分が数年前に検討してた問題，すっかりど忘れしてたことに気づいた．とりあえずそのあたりを連絡．
統計学授業準備で使う例題に関しては結論でないまま撤退． 2000 研究室発．晩飯． 2130 帰宅．
[今日の運動]
- うんどう休養日
[今日の食卓]
- 朝 (0800): 米麦 0.5 合．ニラ・ナメコ・豆腐・ワカメ・煮干の味噌汁．
- 昼 (1400): 研究室お茶部屋．食パン．リンゴ．
- 晩 (2040): グロビュールのハンバーグスープカレー．

本日 (kubolog20070111) | 次の日 | 1 日前 | 7 日前 | 31 日前 | 365 日前 | top

本日 (kubolog20070112) | 次の日 | 1 日前 | 7 日前 | 31 日前 | 365 日前 | top

2007 年 01 月 12 日 (金)

0900 起床．う．生活周期が …… 朝飯．コーヒー． 1010 自宅発．曇． 1025 研究室着．
昨日ぼけていて北大生協旅行部に日付のまちがった航空券発注をだしてしまった …… ということで，まずはそれを訂正．
アカマツ光合成補償論文原稿の図のつくりなおし …… たしかにちょっと良くなったような．
母子里林冠モデル共著者の皆様に，「作業が遅れてもうしわけございません」平身低頭年頭ごあいさつ．嗚呼．
昼飯調達の旅．なんか疲れぎみでふらふらと．お茶部屋にもどって昼飯．院生からいきなり，久保さんすごくやせてませんかっ? とのご指摘．そ，そうなのでしょうか ……
アカマツ原稿，モデリングまわりみなおし …… で，わーど原稿を OpenOffice.org (ver.2.0.1) でひねくっていたんだけど， MS 数式まわりはかなり呪われてしまうね．
…… などと手ぎわ悪く作文修正して，小林さんに連絡．その間， LBP-2810 トナーカートリッジ交換その他あれこれ．また不良再生トナーカートリッジをつかまされた …… まあ，無料で交換してくれるらしいので問題ないんだけど．
今日はいろいろとまたメイルが送られてきてるんだけど …… 全部は対応できぬまま 1600 から一時間弱ほど「助教」あれこれ説明会 …… まあ，たいした内容はなかったわけだが．なぜ「助教になります」申請書類を「2 回」だせと命じられているか，文書でなく口頭で説明あったな．何でも先月だしたやつは「助教にするかどうか」審査のためで，来週からのは「そいつに教育を分担させるかどうか」の審査のためらしい …… まあ，依然として意味不明とも言えるけど．そのあたりも含めて， 2/22 の審議委員会で決定され， 3/7 だか 8 だかの代議会で承認されてオワり，ということらしい．
よくわからぬ会議室軟禁から釈放されて，ぼーっと脱力 …… してる場合じゃないよな，と本日おくっていただいたメイルにぢりぢりと取りくんでみる．
アリ科研対策，昨日の「二の矢」策も大あたりというべき可能性が高まった．よーし，これで …… 時代に逆行する観念論的モデリングをおしつけられそうになってたアリ研究，そういうのはヤメにして「観測データにもとづくモデリング」という久保ふうの展開にもちこめそうだ．やっぱり研究者は得意わざで勝負せんといかんよね．そして今年は Gaussian Random Field + 群集モデル，の年になるのかな．
などと考えてたら，シウリザクラ方面で永光さんが大逆転わざを …… なんだなんだなんだ，結実成功確率のモデリングができるデータセットだったのか．ああ，われながら「そこにあるはずのデータ」追及捜査がぜんぜんぬるかった …… とまた脱力．でも解析は格段に改善されたみたいなので，よかったよかった．
さて，シウリザクラまわりのチェックはちょっと時間かかりそうなので …… 時間かせぎなメイルを書いてから，放浪アリ方面メイルかきをさっさと ……
しかしこちらも手こずり，ちからつきた． 2040 研究室発．北 12 生協で買いもの． 2100 帰宅．体重 69.4kg．げ，たしかに「やせて」ますね．まあ，なかなか過酷な一日でした，ということで …… 晩飯の準備．晩飯．
生活周期安定化への策そのいち: 2300 すぎたら計算機は使わない …… 2200 にすべきか?
[今日の運動]
- またうんどう休養日
[今日の食卓]
- 朝 (0940): ヨーグルト．リンゴ．
- 昼 (1320): 北大生協弁当． 498 円．
- 晩 (2200): 米麦 0.7 合．ネギ・ショウガいり麻婆豆腐．

本日 (kubolog20070112) | 次の日 | 1 日前 | 7 日前 | 31 日前 | 365 日前 | top

本日 (kubolog20070113) | 次の日 | 1 日前 | 7 日前 | 31 日前 | 365 日前 | top

2007 年 01 月 13 日 (土)

0640 起床．体力復旧中 …… 朝飯．コーヒー．
0900 すぎから洗濯．今日は洗濯ものがたくさんあるので時間かかりそう (この 9 年ものの洗濯機は軸うけがいかれつつあるので) …… わー，排水口まわりがゆるくなってて漏水．
なんとかなった．洗濯中は優雅に怠業 …… というわけにもいかず，シウリザクラ計算まわりの点検あれこれ．えーと， 2004-12-14 に命じられたパラメーター使って再計算してたんだよなあ …… ってのをこれまたすっかりど忘れしてた事実が発掘されたり．シウリザクラまわりはど忘れ多発地帯か? いやはや．
当家の脱ダンボール生活，すなわち，ダンボールによって奪われた人間の生活圏を奪還する作業 (作戦名 <レコンキスタ>) のつづき．ダンボール箱解体作業にはカッターナイフより包丁のほうがよいかも．ただし，作業後に包丁を研がんといかんけど．
昼飯．昼飯くってだらだらしてると …… 1328 地震．震度 2 ぐらい?
堆積したゴミの中から「発掘」されたジーンズ，ウェスト 78cm (たぶん 10 年以上前にサイズまちがって購入) だけどぎりぎり着用可能になってる．もひとつ見つかった 83cm のほうはよゆー．ふーむ，さいきん買ったのはどれも 86cm 以上だったんだよね …… まあ，来年の今ごろにはまたどうなってることやら，などと考えつつ 1430 自宅発．曇． 1445 研究室着．
大学にきたのはいいが，なぜか仕事がススまん．窓の外はいつのまにかそれなりの降雪．
関東に移られた苫小牧ボスから苫小牧樹木直径成長モデルの原稿いただいたので，つつしんで拝読 …… 気がつくと，私の身のまわりにはこの苫小牧デンドロだけでなく，シウリザクラ，アカマツ，トドマツ，母子里林冠 MCMC 計算といった「少なくとも半分以上は書けている (いくつかはほぼ完成)」原稿がみょーにとどこおっているような気がする ……
1945 研究室発．雪はやんでる． 2000 帰宅．体重 69.8kg．
[今日の運動]
- 腹筋運動 30 × 3 回．腕立ふせ 5 × 3 回．スクワット 100 回．
[今日の食卓]
- 朝 (0730): 米麦 0.5 合．ネギ・ショウガいり麻婆豆腐．
- 昼 (1300): 米麦 0.7 合．ネギ・ショウガいり麻婆豆腐．
- 晩 (2130): 米麦 0.7 合．ネギ・キムチ卵炒飯．ダイコン・ナメコ・ワカメ・煮干の味噌汁．

本日 (kubolog20070113) | 次の日 | 1 日前 | 7 日前 | 31 日前 | 365 日前 | top

本日 (kubolog20070114) | 次の日 | 1 日前 | 7 日前 | 31 日前 | 365 日前 | top

2007 年 01 月 14 日 (日)

0640 起床．コーヒー．朝飯．
ここ数日，統計学授業であつかう「例題」について考えているのだが …… うーむ，今回はいつもみたいな架空例じゃないほうが良いような気がしてきた．今朝，はやめに起床したのは，そのことが気になって眠れなくなってしまったから．
GLMM を紹介したときには GLM vs GLMM 勝負をやって，ほら混合モデルのほうが良いでしょう，というハナシにもっていけた．しかし，今回は「GLMM でもあつかえる問題を階層ベイズモデルで」という方針なので …… つまり階層ベイズモデル化したからといって推定結果がそれほど「改善」されるわけではないんだよね．
というのも，じつは GLMM にしちゃった時点でそれは すでに階層ベイズモデル化 されてしまってるんだよね． GLMM では「個体差」とかを正規分布なんかで表現しているんだけど，それは事前分布．そして事前分布のばらつきをあらわすパラメーター (下の図でいう α) の暗黙の超事前分布は一様分布，と． …… GLMM ではそれを経験ベイズ法 (つまり最尤推定法による点推定) であつかい， MCMC 計算つかった解法では α の明示的な超事前分布 (もっと一般的なやつも可) の導入によって事後分布の「直接」サンプリングを試みている，と．

ということで， glmmML() だの lmer() だの (あるいは nested ANOVA とか?) うっかり使ってしまった あなたはすでにして問答無用にて Bayesian なのです! いちどケガれてしまったら，もうあともどりはできません．
さて，状況がここまで整理されて単純化されてくると，ハナシは簡単になるわけで …… つまり階層ベイズモデルなんて「とっくに普及してしまった現状」がすでにあるわけだから，今さらこのあたりをくだくだしく説明するにはおよぶまいよ．それはもう前回の授業や前回の自由集会ですませてしまって解説記事まで書いてしまった，ということになるわけだからね．
では何を説明してみせればよいのかと言えば，ここまでの文脈にそって論旨を展開するのであれば，それは「このうえさらに，何のために (事後分布推定の) MCMC 計算なんぞやるのか?」ということになる．その答えは簡単で「glmmML() や lmer() ではあつかえない階層ベイズモデルがいろいろあるから」に他ならない．
で，「R の GLMM 推定関数で何とかなりそうだけど，一歩すすめると手も足もでない」問題である屋久島照葉樹シュート伸長休眠データの統計モデリングなんかが良いのではないか，と．はい，これは昨年修士課程を終えて卒業された牛原さんのデータ，そして今回の私の松山大会一般講演 (ポスター発表) で使わせていただくアレです．
とハナシがまとまったことにしてしまって，脱ダンボール <れこんきすた> 作業を 1 時間ほど．
昼飯． 1330 自宅発．晴．午前中はけっこう雪ふってたのにな． 1350 研究室着．
屋久島データとかちょっとひねってみたりしてたんだが …… やはり何だかこわいので苫小牧樹木成長論文の原稿よみ．
とりあえずこれを終了しないと他の何も進捗できない，と精神的においこんでから， (注意散漫な私としては) かなり集中して三十数ページの原稿を通読する．うーむ ……
いつもの感想なんですけど，これを読むたびにここであつかってる気象条件→直径成長問題の難しさを感じます (が，まだ現状では誰もうまいモデリングはできていないでしょう)．そしてこの原稿をまとめておられるときの鍋島さんの苦労 (?) が感じられるような気がします．難しい現状がよくまとめられているとも思います．
その他こまごまコメントなどつけてから送信．一件落着 …… なのだろうか? 逃げるが勝ちとばかりに撤退． 1825 研究室発．顔面がちょっとひきつる寒さ．といってもあとで調べたら -4°C だった．買いもの． 1855 帰宅．晩飯の準備．晩飯．
[今日の運動]
- うんどう休養日
[今日の食卓]
- 朝 (0730): パンケイキ．
- 昼 (1300): うどん．ダイコン・ナメコ・ワカメ・煮干の味噌汁．
- 晩 (2100): 米麦 0.7 合．鶏水炊き．アジすりみ揚げ．

本日 (kubolog20070114) | 次の日 | 1 日前 | 7 日前 | 31 日前 | 365 日前 | top

本日 (kubolog20070115) | 次の日 | 1 日前 | 7 日前 | 31 日前 | 365 日前 | top

2007 年 01 月 15 日 (月)

0815 起床．朝飯．コーヒー． 1000 自宅発．晴． 1015 研究室着．
なんだか甲山さんはあいかわらず出張・会議ばかりのお忙しい日々のよーで …… で，私が本日提出の修論要旨一件の最終チェックみたいなことを，と．
げ，じつに長い期間にわたって経験ベイズ法の定義をまちがったままサラしていた …… 前々から「何かオカしいような」とは思っていたんだが．われながらまぬけというか，ようやくわかった．えーと，下の定義はまちがいで (いやはや，われながら阿呆阿呆だ)，

正しくはこうなります．

ということで，これはこのように訂正．

来週の授業の準備がぜんぜんススんでないこととか，いろいろ気になるんだけど，本日午後の輪読会の予習． Introduction to Plant Population Biology はなかなかの難物で，直読直解できない部分がときどきあらわれるんで．来週の月曜日は欠席せんといかんかも …… いや，来週は輪読会が開催されるんだろうか?
1300 から輪読会，本日の担当は江川さんで第 9 章 The evolution of plant life history: breeding system …… は難しかろう，と思っていたんだけど江川さんがたいへん入念な準備をしていたので，とてもわかりやすい解説となった．雌雄異株への進化がハナシの核心．
甲山さんの代理で北村君要旨の最終チェックみたいなことを ……
これまた甲山さん代理で COE 雑用書類をかいて送信．
授業用の屋久島データの整理．屋久島シュート伸長の休眠・二度伸びデータ (牛原さんデータ) から必要な部分だけ取りだして CSV ファイル化．

とりあえず，「R の GLMM 推定関数でも計算できます」ということを示すために， lmer() で計算してみる …… というのも，この問題は単純であるにもかかわらず ``random effects'' 変数を三個所に設定する必要があり，これは面倒すぎて glmmML() では計算できないから．

library(lme4)
fit <- lmer(
	dormancy ~ (1 | spc) + (1 | id) + light + (0 + light | spc),
	family = binomial,
	data = d,
	method = "Laplace"
)

推定結果はこんなかんぢで．

Generalized linear mixed model fit using Laplace 
Formula: dormancy ~ (1 | spc) + (1 | id) + light + (0 + light | spc) 
   Data: d 
 Family: binomial(logit link)
 AIC BIC logLik deviance
 532 553   -261      522
Random effects:
 Groups Name        Variance Std.Dev.
 id     (Intercept) 2.66e-01 5.16e-01
 spc    light       5.00e-10 2.24e-05
 spc    (Intercept) 1.99e+00 1.41e+00
number of obs: 562, groups: id, 105; spc, 22; spc, 22

Estimated scale (compare to  1 )  0.8859 

Fixed effects:
            Estimate Std. Error z value Pr(>|z|)
(Intercept)   -0.636      0.354   -1.80    0.072
light         -1.668      0.301   -5.55  2.9e-08

Correlation of Fixed Effects:
      (Intr)
light -0.317

さらに library(lme4) mcmcsamp() を使って事後分布のサンプリング
```
m <- mcmcsamp(fit, n = 1000)
library(coda)
plot(m)
```
を試みてみると …… 意外にもというか，この mcmcsamp() の MCMC 計算 (おそらくこの挙動からみて Metropolis-Hastings 法) はへぼい場合がある，ということがわかった．

ということで今年初めて R2WinBUGS を動かしてみることに …… やっぱ， WinBUGS の Gibbs sampler は強力だわ ……

うーむ，すばらしい．こういうふうにきれいに収束してくれているし．結果一覧．

計算ばてしてきたので， 2000 研究室発．寒い．買いもの．あいかわらず納豆うりきれ状態． 2020 帰宅．体重 69.2kg …… うーむ，「ひさびさ MCMC 計算」やせか? 晩飯の準備．晩飯．
[今日の運動]
- うんどう休養日
[今日の食卓]
- 朝 (0845): 米麦 0.5 合．ダイコン・ワカメ・煮干の味噌汁．
- 昼 (1250): 研究室お茶部屋．食パン．
- 晩 (2140): 米麦 0.7 合．チンゲンサイ・ニンジン・ブナシメジ・豆腐のシチュー．

本日 (kubolog20070115) | 次の日 | 1 日前 | 7 日前 | 31 日前 | 365 日前 | top

本日 (kubolog20070116) | 次の日 | 1 日前 | 7 日前 | 31 日前 | 365 日前 | top

2007 年 01 月 16 日 (火)

0900 起床．朝飯．コーヒー． 1000 自宅発．曇． 1015 研究室着．
1030 より一時間ほど研究室セミナー，今日は井田君でエンレイソウの資源獲得と資源分配のハナシ．どうやら，まずは地下部に転流して，結実後期になってよーやく繁殖器管にまわしている? …… といったパターン．また Bayesian な資源分配モデルが必要とされていそうな状況だな．
地球研 ML に加入してる院生から，百瀬さんが昨日なくなられたという通知がきている，と教えてもらった．もう 10 年ぐらいお会いしてなかったんだけど …… 状況がよくわからない．私より一歳だけ年上だったのか．甲山さんは出張中なので，地環研からは岩熊さんが愛媛に行くことに．私も御香典をおねがいすることに． (後記: 御香典については 1/18 時点ではまだおわたしできてない状態)
昨日のつづきで，屋久島データ教材化のための作業をちょっと続ける．昼飯．
松田さんのところで線形 (混合) モデルの限界にいどむ下うけデータ解析． 6 タイプの「処理」での観測結果を説明するのに 6 パラメーター …… うん，まあ，いかなる意味においても線形性がないんです．いやいや，これもまた linear mixed model で表現できてる現象なンでしょう，ということで，またまた lmer() で得られた結果を mcmcsamp() で．これはパラメーターの信頼区間を得るため．このあたりの作業全自動化のプログラミング．
しかし却下された場合も検討している．世の中の「ANOVA なヒトたち」の少なくとも半分はそれが線形モデルであることを理解してないし，当然ながら，野外観測データをあつかう状況では random effects の考慮せざるをえないこともわかっていない．で，線形混合モデルで「ANOVA 的」な操作をやるとしたら「検定」法は何を使うべきかといえば，これは尤度比検定だろう．で，モデルひたすら列挙して尤度比検定ひたすらやって …… てなことやってるぐらいなら検定なんぞはやめちまって (そもそも検定力も計算せずにサンプリング計画とかたててるわけだから) モデル選択みたいにあらっぽくて手軽な方法のほうがよっぽどマシでは．
あと，この A 棟 8F 近辺とかでときどき見かける「N 個のグループを N (N - 1) / 2 回の総あたりの (いわば独立した) グループごとの平均値に関する対比較 & 多重検定やってキビしくゆーい差しらべましたよ，どんなもんです」ってやりくちはじつは根本的に多重検定の使いかたをまちがってるんじゃないか? これらの「ことごとく対比較」を統一的に説明できる統計モデルは何もないし，だとすると多重検定の familywise な帰無仮説をたてようがないんでは ……?
そういや 2004 年の自由集会で粕谷さんがそういったことを解説されていたなぁ …… ということで粕谷 PDF ファイルをひさびさに拝見してみる．「構造のない仮説」ね …… さすがに当時よりはよく理解できる．そうそう「ブロック差」といえば，粕谷さん馬車馬ぶろぐの多重検定? の回は (現実にあった) つくづくすごいハナシが紹介されてた．そしてその背景に関する考察:
多重比較や多重検定のときに有意確率の補正がなぜ必要になるのか、補正するならどういう状況ではどのように補正すべきなのかといったことには関係なく、” 複数の似たような検定ができるなら多重検定の補正をするものだ”という思い込みの方に重きを置く人はけっこう多いということであろう。葬式のときに黒いネクタイをしていかずにいろいろ言われた人（あるいは言われているの見聞きした人）がどこでも黒いネクタイで大威張りみたいなものだろうと思うのだが。
ホントに，この回に登場する「ブロックごとに検定 → 多重検定」なヒトたち，何のために苦労してわざわざぶろっくなんかを …… かーごかると統計学とでも命名してみようか?
ばててしまったんで撤退． 1850 研究室発． 1905 帰宅．体重 69.2kg．洗濯．晩飯．
[今日の運動]
- またまたうんどう休養日 ……
[今日の食卓]
- 朝 (0940): リンゴ．シリアル．
- 昼 (1345): 研究室お茶部屋．食パン．
- 晩 (2100): 米麦 0.7 合．チンゲンサイ・ニンジン・ブナシメジ・豆腐のシチュー．

本日 (kubolog20070116) | 次の日 | 1 日前 | 7 日前 | 31 日前 | 365 日前 | top

本日 (kubolog20070117) | 次の日 | 1 日前 | 7 日前 | 31 日前 | 365 日前 | top

2007 年 01 月 17 日 (水)

0650 起床．朝飯．コーヒー． 0850 自宅発．晴． 0905 研究室着．
屋久島データ教材化作業つづく．
(甲山さんとの会議にきてた) 地環研起学専攻の Y せんせーと 7F トイレ (この建物は奇数階が男性用) における会話．
「久保君，何才だっけ」
「37 です」
「もうそんなトシだったのか」
「すみません」
「いやいや，おたがいさまだ」
そろそろ昼飯でも …… というタイミングで雪野さん Mac とらぶるしゅーてぃんぐ依頼． GLP 事務書類 (例によって例のごとくわーどファイル) れたーへっどのロゴがばけます …… しょうがないので， NeoOffice をインストールしてその場をしのぐ．この NeoOffice，うわさどおりむちゃくちゃ挙動が重い．あとで考えてみたら，雪野さん PowerBook に入ってる MS おひすが古かったんだろうな．えーと Mac 版の「最新」は office2004 とかいうやつか．といったことも連絡．
そろそろ昼飯でも …… というタイミングで松田さんから random effects きわめて大かつ線形ならざる駒ヶ岳データ解析プログラム質問．やっぱモデル選択やっても同じのよーで，で一件落着?
へろへろと昼飯調達の旅． 1530 昼飯．ふう．食後の休憩と称して，粕谷さん馬車馬ぶろぐ［統計］なんでもノンパラメトリクスにコメントしてみる …… 「あらし」ではありません．
へー， Ecology and Ecological Modeling in R - A special volume of the Journal of Statistical Software か …… しかし何も貢献できそうにない私はまだまだ実力不足 ……
1800 よーやくにして，牛原さん屋久島データ教材化作業の一部， library(grid) わざ濫用の作図プログラム全面かきなおしが終了した ……

えー? またまたいつもと同じ図ぢゃん，などとあなどるなかれ．
- 自作 MCMC 計算 (Metropolis-Hastings 法) Perl コードではなく， R2WinBUGS 出力に対応
- ベイズモデルの改良 (以前のはよけーな「個体差」が含まれてた)
- nested 事後分布作図関数の汎用化 (以前はこのあたりつくづくヒドかった)
…… という，まあ「見た目」ではわからん改良あれこれだったんだが ……
つぎ．シュート伸長の休眠 (dormancy) と同時に二度伸び (lammas) を考慮する，つまり二項分布から三項分布に変えた統計モデル． WinBUGS だと何も考えずにあっさりと実現できる …… 初期パラメーターの調節とかは注意ぶかくやらんといかんけど．モデルを複雑にすると当然収束まで時間もかかる．これはステップ数で 400 → 1000，私の非力な Thinkpad X31 で計算させると 800 秒ぐらい．

へろへろと帰ろうとすると素早く院生に迎撃される．矢澤さんと「樹冠頂部の破損を考慮した樹高モデル (もちろん「破損」の事後分布を推定する Bayesian な)」の相談というか雑談．
そしてお茶部屋に入るとすでに原稿をかなり書きススめてる松田さんから統計モデルまわりの説明のかきかた質問．例文をでっちあげてからふらふらと撤退 …… しかし建物をでた瞬間に random effects の説明がまるっきりぬけてたことに気づいた．
2110 研究室発． 2125 帰宅．体重 69.6kg．晩飯の準備．晩飯．
梅干しとヨーグルトって意外と …… いいくみあわせ?
[今日の運動]
- 腹筋運動 30 × 3 回．腕立ふせ 10 × 3 回．スクワット 100 回．
[今日の食卓]
- 朝 (0810): 米麦 0.6 合．卵焼き．
- 昼 (1530): 研究室お茶部屋．北大生協のりまき．
- 晩 (2240): 米麦 0.7 合．チンゲンサイ・ショウガ・マイタケのカレー．

本日 (kubolog20070117) | 次の日 | 1 日前 | 7 日前 | 31 日前 | 365 日前 | top

本日 (kubolog20070118) | 次の日 | 1 日前 | 7 日前 | 31 日前 | 365 日前 | top

2007 年 01 月 18 日 (木)

0700 起床．朝飯．コーヒー． 0910 自宅発．曇． 0925 研究室着．
牛原さん屋久島データ教材化作業のつづき．ひたすら R プログラミング．えーい，なんだかぢりぢりたる進捗だな．
窓の外はまた雪．
A707 で配線工事せねばならぬことに．
午前中ついやしてまた屋久島 library(grid) graphics なぷろぐらみんぐ …… 22 樹種のシュート伸長休眠 (D) と二度伸び (L)，その明るさ依存性，と．

まぬけなことに，今回よーやく「わく (viewport) の中に図をとじこめる方法」がわかった (cf. help(viewport))． pushViewport(viewport(..., clip = "on")) と指示すればよい上の図では左右ははみだしてないけど，上下には貫通してもよいようにしている．

pushViewport(viewport(
	x = 0.5, y = 0.5, h = 1, w = 1,
	layout = grid.layout(1, 2)
))
	pushViewport(viewport(
		layout.pos.row = 1, layout.pos.col = 1,
		clip = "on" # ここが重要!
	))
		# ... 左側作図関数よびだし ...
	popViewport()
	pushViewport(viewport(
		layout.pos.row = 1, layout.pos.col = 2,
		clip = "on" # ここが重要!
	))
		# ... 右側作図関数よびだし ...
	popViewport()
popViewport()

昼飯．
2 時間ほど費して， library(grid) 作表プログラミング，牛原さんのシュート伸長に関する 562 シュート / 105 個体 / 22 樹種 全データ視覚化．休眠 (D), 通常 (N), 二度伸び (L) シュートを樹種ごと & 個体ごとに．樹種ごとの標本個体数，そして樹木個体ごとの標本シュート数が異なるので下のようになる．樹種によっては明暗両環境がそろっていない．参考のため休眠パラメーター図も再掲しとこう．

ふーむ， library(grid) の使いかたの勉強にはなったが …… (来週の授業にしろ 3 月の生態学会ポスター発表にしろ) LaTeX でモノを作るわけだから，こんなふうに「図な表」にしちまうとまずかったかしらん? ネット上に掲載するには png() 出力が便利なわけだが ……
あ，ぼけてた． LaTeX に取りこむ場合は png() ではなく postscript(..., paper = "special") で EPS ファイルと出力すればいいや．この「図な表」ならそんなにかさばらないし …… それに対して nested 事後分布図なんかは EPS にするとちょー巨大ファイルになるだろうから PNG 出力せざるをえない．
EPS ファイル出力 (29KB) した場合には，こんなかんぢで．

ばててきたのでお茶部屋でひとやすみ．本日のお茶部屋語録．「松山は何もないって? 瀬戸内があるじゃないですか．春の瀬戸内はいいですよー …… 瀬戸内は日本のオアシスだ」 …… たしかに調べてみると伊予灘はいちおー瀬戸内海の一部だとわかった．
事務からメイル．北大女性研究者支援室 website ができました，というもの．
さてさて授業準備のほうだが …… 新規追加すべき材料 (屋久島べいづまわり) の半分以上はそろってきたのでそろそろ投影資料のほうもひねくってみるか．今までの使いまわしがどれだけできるかよくわからんけど．
はかばかしくないまま撤退． 1900 研究室発．買いもの． 1920 帰宅．体重 69.6kg．晩飯の準備．晩飯．
アカマツ原稿よみをぢりぢりと．
[今日の運動]
- 腹筋運動 30 × 3 回．腕立ふせ 10 × 3 回．
[今日の食卓]
- 朝 (0810): 米麦 0.6 合．チンゲンサイ・ショウガ・マイタケのカレー．
- 昼 (1310): 研究室お茶部屋．食パン．
- 晩 (2100): 米麦 0.7 合．ニラ・キムチ卵炒飯．海藻スープ．

本日 (kubolog20070118) | 次の日 | 1 日前 | 7 日前 | 31 日前 | 365 日前 | top

本日 (kubolog20070119) | 次の日 | 1 日前 | 7 日前 | 31 日前 | 365 日前 | top

2007 年 01 月 19 日 (金)

0900 起床 …… 生活周期が．朝飯．コーヒー． 1015 自宅発．晴． 1030 研究室着．
ネット雑用あれこれ．
データ解析こんさる． R の中の文字列データに対して小文字→大文字あるいは大文字→小文字変換するには， toupper(), tolower() のたぐいを使えばよい．
```
> toupper("abc")
[1] "ABC"
> tolower("ABC")
[1] "abc"
> chartr("AB", "ab", "ABC") # AB だけを置換
[1] "abC"
```
それでは「最初の一文字だけ置換」やりたければどうすればよいか? たとえば最初の一文字だけがヘンな場合は簡単で
```
> tolower("Abc")
[1] "abc"
```
となる．それでは abc を Abc としたい場合には? これは残念ながら単純ではないらしく，さきほどの toupper(), tolower() のhelp() の Examples にあるような関数
```
capwords <- function(s, strict = FALSE) {
    cap <- function(s) paste(toupper(substring(s,1,1)),
                  {s <- substring(s,2); if(strict) tolower(s) else s},
                             sep = "", collapse = " " )
    sapply(strsplit(s, split = " "), cap, USE.NAMES = !is.null(names(s)))
}
```
なんかを定義して使わないとダメみたいだ．
```
> capwords(c("abc", "xyz"))
[1] "Abc" "Xyz"
```
アカマツ原稿みなおし．
修論発表会 (2/5-2/6) のプログラムとどく．ここ環境科学院とくに生物圏科学専攻はいわば「平成の市町村大合併」的な膨張によって院生数が増大，二日間びっしりと朝から晩まで発表がつづく．
わー，今日は何だか内外からたてつづけにデータ解析こんさる依頼が …… なんでこの時期に．この時期だから?
相談の間隙をついて 1410 北大生協 (中央) に昼飯調達の旅．明日はセンター試験なので高校生偵察隊が北大構内をうろうろと．へろへろと研究室お茶部屋に帰還して昼飯．あー，またメイルが．
昨年の一月は
屋久島 MCMC 計算 (莫大な量) / 「直前」データ解析こんさる / 東京出張 / センター試験監督 / 統計学授業準備
をこなせたのに，今年は
屋久島 MCMC 計算 (ちょっと) / 「直前」データ解析こんさる / 統計学授業準備
だけでへろへろしている．嗚呼 ……
なぜか突然のよーにこんさるストームが途切れたので，ここしばらく私のココロを圧迫しまくっている統計学授業問題について検討というか整理を試みる．今回の授業の一回目 (月曜日) は昨年の第 3 回「『数えられる』データの統計解析・統計モデリング」と同じよーな内容なんだけど，今年用にまたいろいろと改善せんといかんのでは，と危惧していた．しかしながら投影資料 PDF ファイルをつらつらとながめてみると，統計モデリング，最尤推定，カウントデータの GLM といった話題に関して広く浅く言及しており，これはほとんどそのまま使いまわせるような気がしてきた．
まあ，これが「M1 が環境科学院在学中に受講する 2 回だけの統計学授業，その第 1 回目」として最良の内容かどうかはともかく …… 意外と悪くはないように思いますよ．
ということで，全二回のうち二回目 (水曜日) の準備にかなり時間をさいてもよさそうだ．こちらも昨年と同じく「個体差」「ブロック差」といった現実にありがちなデータ解析上の問題を検討したいんだけど，今回の趣向としてはとりあえず glmmML() 紹介はヤメてみて，そのかわり牛原さん屋久島データ解析 (と言っても葉寿命ではなくシュート伸長まわりだけなんだけど) を最終到達地とするような Bayes なハナシにしてみたい，と考えているわけだが ……
もちろんこれまた昨年のごとく， 3 月の自由集会での使いまわしをネラったものである．
ともあれ月曜日・水曜日の授業準備のうち，月曜日に関してはかなり圧迫感がへった (しかも今週末のセンター試験監督からもまぬがれている!) …… ということで，本日は体力と気あいを必要とされる授業準備はナゲてしまって，アカマツ原稿対策とシウリザクラ密度の再計算といった (「来週の木曜日以降しか対応できません」とか言うのがもうしわけない) 仕事とかにゆるゆるとりくんでみよう．おそらくまた来信するであろうデータ解析こんさるメイルなどを迎撃しつつ ……
とよゆーをかましてるヒマなく，メイル来襲．
そして江川さんからややトリッキーな R の data.frame 操作問題だされる．江川さん Vaio 上の R で試行錯誤しつつ，いっしょに問題を考えてみる．
単純化すると以下のような状況だ．たとえば，こういうふうにまたてきとーなる data.frame をでっちあげて，例題用としてみよう．
```
> (d <- data.frame(group = c(rep("a", 5), rep("b", 5)), x = rpois(10, 3), y = rpois(10, 9)))
   group x  y
1      a 2  7
2      a 0  9
3      a 3 14
4      a 4 15
5      a 4 12
6      b 1  8
7      b 3  7
8      b 5 12
9      b 1 11
10     b 9  6
```
このときに，「group a, b ごとに y の最大値の行を抽出して新しい data.frame 作れ」という問題があったとしよう (x 列は操作に何の関係もない，しかし「捨ててはいけない」列である)．この例題だと見ればわかるように group a に関しては 4 行め， group b に関しては 8 行目をとってくればよい． R にどう命令してやればそういう作業をやってくれるだろうか?
私の回答例はかくのごとし．まず unlist(tapply(...)) 使うと
```
> (s <- unlist(tapply(d$y, d$group, function(gy) 1:length(gy) == which.max(gy))))
   a1    a2    a3    a4    a5    b1    b2    b3    b4    b5 
FALSE FALSE FALSE  TRUE FALSE FALSE FALSE  TRUE FALSE FALSE
```
このように「どこに group ごとの最大値があるのか」がわかるような vector を作り，あとはこれを
```
> d[s,]
  group x  y
4     a 4 15
8     b 5 12
```
とすれば「group ごとに y の最大値を含む行で構成された新しい data.frame」が生成できる．
ただし group の並び順に注意! あらかじめ sort しとく，といった工夫が必要．
…… といったことしてるうちに体力ぎれ & 洗濯のため撤退．うう，アカマツもシウリザクラもススまなかった． 1840 研究室発． 1855 帰宅．体重 69.6kg．洗濯．明日は朝から R こんさる (外来) なので，いつもの土曜日のごとく洗濯 & 怠業はできないので．晩飯の準備．晩飯．
[今日の運動]
- うんどう休養日
[今日の食卓]
- 朝 (0940): 米麦 0.5 合．豆腐がやたらと多すぎる豆腐ワカメ味噌汁．
- 昼 (1430): 研究室お茶部屋．北大生協のりまき．春雨鶏肉サラダ．
- 晩 (2120): 米麦 0.7 合．豆腐がやたらと多すぎる豆腐ワカメ味噌汁．ハクサイ・ニンジン・ネギ・ショウガの炒めもの．

本日 (kubolog20070119) | 次の日 | 1 日前 | 7 日前 | 31 日前 | 365 日前 | top

本日 (kubolog20070120) | 次の日 | 1 日前 | 7 日前 | 31 日前 | 365 日前 | top

2007 年 01 月 20 日 (土)

0750 起床．朝飯．コーヒー． 0930 自宅発．雪． 0945 研究室着．
1000 より北大フィールド科学センター上田研究室の石沢さんあいてに R 講習．とりあえず，研究データを R にとりこむところから． data.frame 操作の練習．うーむ，作図用にするためには reshape() が必要とわかり，ちょっとじたばたする．
昼飯にでる．北大生協の食堂，センター試験の日は「つきそいの人」控え室になるわけね．購買の食料はうりきれ．地環研最近傍のサンクスで昼飯調達．研究室お茶部屋にもどって昼飯．
午後は作図講習．測定機器に投入するまでの作業依存「えらー」らしきものが見えて，たいへん興味ぶかい．

[R 自動作図]

…… のウリはやはり「手作業ではやってらんない」グラフ列挙とか作図おぶぢぇくとの細かい属性指定みたいなところでしょうか．

正味 4 時間ほどの「R つめこみ教育」，本日は 1540 ごろ終了．水産系の研究室にも新たな「R 使い」誕生の予感．おつかれさまでした ……
またいろいろとメイルかきとか．
塩寺さんと熱帯山地林の葉の (虫とかによる) 食害モデリング …… なんべんやっても食害まわりは難しい．
1910 研究室発．晩飯． 2050 帰宅．
[今日の運動]
- うんどう休養日
[今日の食卓]
- 朝 (0830): 米麦 0.6 合．ハクサイ・ニンジン・ネギ・ショウガの炒めもの．
- 昼 (1310): 研究室お茶部屋．サンクスのりまき．
- 晩 (2010): 北 11 西 1 卯和のばんごはん．

本日 (kubolog20070120) | 次の日 | 1 日前 | 7 日前 | 31 日前 | 365 日前 | top

- 01/10 | 01/11 | 01/12 | 01/13 | 01/14 | 01/15 | 01/16 | 01/17 | 01/18 | 01/19 | 01/20 | 01/21 -

KuboLog | KuboWeb