ぎょーむ日誌 2005-07-(01-10)
2005 年 07 月 01 日 (金)
-
0740 起床.
朝飯.
コーヒー.
0905 自宅発.
曇.
0920 研究室着.
-
アカマツ原稿の英文校閲たのんだ Raymond 氏は 7/9 まで休暇だけど,
7/15 までに原稿かえすということなので,
おねがいすることに.
いまさら急いでもしょうがないし.
-
甲山さん授業の代講の統計学あれこれの準備のつづき.
ぢりぢりと進捗.
-
昼すぎになぜかしら甲山さんの奥様がかとーオフィスに見えたので雑談.
話題がなぜかしら,
魚の群れ
のシミュレイションだの,
ベイゼンドルファー
の値段だの.
-
昼飯.
今日はいよいよ人口密度ひくい.
-
本日は研究院ぢんぱとやらがあるんだけど
(一年前のぎょーむ日誌
にその写真があるな),
私は不参加予定
(明日はなにやら健康診断あるんで).
お茶部屋では
「道民以外のヒトたちは
ジンパ
を重視してない」
と立腹する道民女性大学院生が.
本日はぢんぱでアタマがいっぱいで勉強どころではない,
とのこと.
-
昼飯後も代打準備作業のつづき.
-
1600 すぎ,
とりあえず月曜日のつかうぶんの再編集終了.
ひとやすみ.
-
水曜日用の LaTeX file にも手をいれてみる.
検定のハナシ.
そのせいかしらん,
いまいちおもしろくない.
そして「コイン投げ」という具体例を
何か他のものにおきかえようとしたんだけど
……
これまたなかなか面倒なんで現状のまま放置.
[ニセ金な問題]
なンか字が小さいし.
でも,
ニセとかまがいものとかいんちきとか贋作とか
よさげなかんぢのコトバですよね.
-
てなかんぢで一区切りついたことにして,
1825 研究室発.
1840 帰宅.
1930 自宅発北大構内走.
2005 帰宅.
体重 74.8kg.
-
で,
人間ドック用の問診票とか書いてみたりする.
いまさらながらだけど,
めんどう.
-
[今日の運動]
-
[今日の食卓]
- 朝 (0830):
パン.
キャベツ・ナメタケ・干シイタケ・豆腐・コンブの味噌汁.
- 昼 (1310):
研究室お茶部屋.
米麦 0.5 合.
サバ酒蒸し.
キャベツ・ナメタケ・干シイタケ・豆腐・コンブの味噌汁.
- 晩 (2020):
米麦 0.7 合.
キャベツ・ナメタケ・干シイタケ・豆腐・コンブの味噌汁.
2005 年 07 月 02 日 (土)
-
0640 起床.
人間ドックなので「絶食絶飲」.
絶食はともかく絶飲とは斬新な表現だな.
0745 自宅発.
晴.
0810 JR 札幌駅南西のアスティ 45 ビル 5F の
フジクリニック
着.
[街路樹]
ちょっと早くついたかな,
と錯覚してたのでぶらぶらとそのへんの樹木を見物したり.
これはたぶんオオモミジかヤマモミジ.
-
0810 から受け付け,
と書いてあんのにすでに 40 人ぐらい待ってる.
しかも七割ぐらいが女性.
なんなんだ.
ともかく受けつけすませる.
この集団の中ではかなり順番うしろのほうになり,
何ごとにつけ待たされることになる.
-
午前の待ち時間は,
統計学問題を検討していた.
こういうときにアタマひとつで研究が進展するモデル屋は便利だ.
苫小牧 parasitoid の一般化線形混合モデル,
非線型な項を線形和におきかえて表現していいんぢゃないの,
とゆー以前からの懸案を考えてみた.
たぶん,
問題なさそうという結論を得た.
-
あしっくすのシャツ・パンツからなる診断着とやらに着替える.
採血,
胸部 X 線,
心電図,
聴力,
身長・体重・体脂肪,
内臓 (肝臓・胆臓・腎臓) 超音波検診,
視力,
眼底撮影 (緑内障チェック),
血圧,
バリウムのんで胃 X 線という順番だったかな.
人間どっくなるものは初めてなんだけど,
いつもの健康診断と比較すると,
採血・眼底・内臓まわりが追加されてるぐらいか?
-
バリウムも初めてなんだが
……
100ml ほど飲んだ.
甘味がつけられてる.
で,
自由自在に回転する
胃 X 線写真撮影台の上で
技師の指示どおりにごろごろ転がったり.
-
1045 午前の部,
ひととーり終了.
二時間ちょいのうち待ち時間は 1.5 時間以上あったような気がする.
お食事券 (900 円) とやらをもらい昼飯を
外で食ってこいとのこと.
着替えて外出.
-
この食事券つかえる店はこのちかくに
12 軒ばかりあるわけだが
……
なんかめんどうになったので紀伊國屋 (新店)
地下とでもいうべき位置にある喫茶店でサンドイッチセット.
バリウム,
というか胃を膨張させるために
その前に飲んだ炭酸発泡剤のせいであまり食欲なし.
朝飯くってないのに.
-
で,
昼飯後は
紀伊國屋札幌本店
で一時間ばかりぶらぶらと.
楽しくはあるけれど,
これでネット書店に勝てるのか?
[紀伊國屋札幌本店]
ごく最近に開店した店舗.
二階建て.
床面積,
たぶん北海道最大.
たしかに広い
……
というか天井がむやみに高い,
というのが札幌駅周辺の巨大書店とのちがいか?
自然科学書はそんなにない.
-
フジクリニックにもどってまた着替え.
10 分くりあがって 1250 から体力測定.
ストレッチングしてからエアロバイク 10 分間.
その他あれこれで 30 分弱で終了.
-
体力測定に関しては手元に結果あるので書き写してみよう:
-
形態データ:
ってのは私のあれこれ測定値だそーで.
身長 178.3cm,
体重 74.9kg
(標準体重 69.9kg; 肥満度 +7.15%),
胸囲 94.0cm,
ウエスト 86.0cm,
皮下脂肪厚 (腕+背中) 33.00mm,
体脂肪率 18.30%,
体脂肪量 13.71kg.
まあ,
なんか削る余地がいろいろあるよーで.
-
血圧データ:
最高 117mmHg,
最低 78mmHg,
安静心拍数 62 回/分.
-
全身持久力:
最大酸素摂取量 VO2MAX
50.5ml/kg/分.
北大構内走やってるから良い結果がでて当然
……
なんだけど,
思ったほど良くなかった.
どうもこの年齢別平均値なるもの
推定計算法アヤしいような気がするんだけど
(他の項目も),
平均 41.9 となってる.
-
瞬発力:
垂直とび 10.4 W/kg.
なぜかしら,
これは平均 (8.9) より良い.
-
筋力:
握力 39.7kgf,
腕力 24.9kgf,
脚力 82.8kgf,
腹筋回数 24 回/30 秒.
握力はいよーに低い (平均は 51.8).
これは意外だった.
あとは平均値とやらとかわらず.
-
敏捷性:
ランプがついたらジャンプするというテスト.
全身反応時間 0.34 秒.
意外なことに,
ふつー.
-
柔軟性:
前屈して腰の角度を測定.
関節角度 55 度.
これまた意外なことにふつー.
-
平衡性:
閉眼片足立ち 10 秒.
これは絶望的に悪い.
平均は 44 秒.
さいきん悪化したわけではなく,
小学生のときからそうなんだけど.
ということで,
私は 95 点満点の 65 点,
体力年齢 33.5 才
(きっとヘンてこな線形モデルから算出したにちがいない)
だそーです.
いやはや.
-
で,
また待ち時間.
着替えて休憩室のソファで読書.
さきほど紀伊國屋で買ってきた
「学習と情報の平均場理論」
(樺島洋介, 2002).
これは同しりーづの
「ベイズ統計と統計物理」
(伊庭幸人, 2003)
ほど易しくないけれど
(もっと物理学よりになっている),
ベイズ統計学のまわりに出現する
統計物理のみょーな概念あれこれの理解がススむ.
-
50 分間ほどしてから問診によびだされる.
老先生と対話.
しかしまあ幸いにも問題ナシばかりでとくに指摘なし.
と言いますか,
サケも飲んでないのに肝臓とかおかしかったら,
それこそオワってるわけだが.
-
ただし,
胸部 X 線写真みると,
私の心臓左下あたりがちょっと「太ってる」そーで.
「これは …… アブラじゃね」
「はあ」
「運動とかやってないでしょ」
「いや,運動はそれなりにやってるんですが」
「じゃ,食べすぎだ」
……
うーむ,
「今日の食卓」記載ばかりが
今日たべたものじゃねーんだよ,
とこの写真は語りかけているのだろうか.
上記の体脂肪率 (18.5%) はそれほどひどくないのになぁ.
-
最後に栄養指導なるのもあったんだが,
これまた特に指摘ナシで 3 分で終了.
なんかひとつぐらい食生活改善提案とかくれよ.
ともあれ,
やっと終わった.
総合健診料金 15700 円とやらを追加で支払う必要あった.
そういう相場なのか?
-
1440 フジクリニック発.
買いものなどして
1520 帰宅.
洗濯.
-
どうも,
硫酸バリウム
のせいなのか炭酸発泡剤のせいなのか,
胃のあたりが少しキモチわるい.
そういや,
「水分たくさんとっても便秘になったら」
のための
バリウム便秘対策とかで下剤
(ソルダナ)
もらったんだけど,
これは服用したくないなあ
……
ということで,
水を多量に飲んでる.
-
2100 自宅発北大構内走.
2150 帰宅.
体重 74.6kg.
晩飯.
-
[今日の運動]
-
[今日の食卓]
- 朝 :
食ってない
- 昼 (1110):
センチュリーロイヤルホテル地下の喫茶店
ブルーネン.
クラブカツサンド
(飲物・サラダつき).
750 円.
- 晩 (2215):
スパゲッティー.
トマト・タマネギ・レタスのサラダ.
キャベツ・ニラ・ニンニク・豚レバの炒めもの.
2005 年 07 月 03 日 (日)
-
0700 起床.
朝飯.
コーヒー.
怠業.
0925 自宅発.
晴.
暑い.
0940 研究室着.
-
大学にむかって歩きながら,
苫小牧 parasitoid の単純密度依存な混合モデルについて検討してみる.
昨日,
人間ドックの待ち時間に考えてたアレだ.
要点は距離加重行列を線形に分割して
(一般化線形混合)
線形モデルにくみこむ,
というだけのこと.
まあ,
なんだか例によって,
奇妙な考えかただけど.
-
つまり距離加重行列
の要素が距離依存なパラメーターどもに依存している,
というハナシで.
たぶん距離の問題についてはこういう分割による近似がよさそうそうだ
……
というのも,
これまでのやりかただと,
どれか特定の
だけ選ぶ
(ある
だけが正で他はゼロ),
というやりかたに該当するんだけど,
これよりはマシだろう.
-
……
ということを記述する「数式 png file」を生成する
Perl スクリプト作製のために一時間ちかく費してしまった.
texdiary
を参考にしつつ.
自動処理の手順は
(
tex → dvi → ps → png
):
-
プリアンブルなどつけた LaTeX ファイルを生成
-
platex
で
dvi
ファイルに変換
-
dvips
で
ps
ファイルに変換
-
pstoimg -antialias -scale 2 -transparent -crop a -out $file_out $file_in.ps
で
png
ファイルに変換
-
いやー,
google map っておもしろいねー.
とはいえ,
現在地
をリンクしてみたんだけど,
ずーむいんしないとどこにいるのかよくわからん
……
などと脈絡なく遊んでしまう.
-
小林さんにアカマツメイル,
とか.
-
昼飯.
昼飯後,
ゴミだし & 掃除.
いやはや,
ここしばらくかとーオフィスは 7-8F のゴミすてば状態になってたもんで.
二時間ほどかかる.
一人でやってるんで,
たいして進捗しなかったけど.
-
生態学研究者たちに
「あなたは研究で統計学的検定つかってますけど,
それってどういうしくみなのか教えてください」
と質問したら,
いったいどういう答えがかえってくるんだろうか?
-
という批判的な気分もあって,
明日の「代打」のデータ解析講義に紙芝居を追加.
[情報損失]
じつは第一段階の情報損失のほうが圧倒的にすごくて,
どれだけ失われたかもよくわからない
……
まあ,
われわれの認識能力の限界というやつで.
せいぜい第二段階でがんばりましょう
とゆー趣旨
-
1745 研究室発.
1800 帰宅.
あ,
いかんまた寝てしまった.
2145 自宅発北大構内走.
2230 帰宅.
体重 74.8kg.
晩飯.
-
[今日の運動]
-
[今日の食卓]
- 朝 (0800):
米麦 0.8 合.
キャベツ・ニラ・ニンニク・豚レバの炒めもの.
- 昼 (1255):
研究室お茶部屋.
米麦 0.8 合.
キャベツ・ニラ・ニンニク・豚レバの炒めもの.
- 晩 (2340):
米麦 0.8 合.
キャベツ・ニンジン・マイタケ・豆腐のカレー.
2005 年 07 月 04 日 (月)
-
0740 起床.
朝飯.
コーヒー.
統計学授業の準備少々.
0915 自宅発.
晴.
0930 研究室着.
-
代打授業たる統計学授業の準備.
-
1300 から代打授業,
今年度もまた
データ解析
のハナシ.
参加者は 10 名ほど.
-
1440 ごろ終了.
修士課程院生と思えぬほどスルどい質問がいろいろでて
ちょっと長びいてしまった.
昼飯.
しゃべりがちょっと速い,
と指摘される.
内容を限定してもっとゆっくり話さなくては.
-
1620 から 1900 すぎまで,
M2 実吉さん発芽実験
R
講習.
今日は
glm()
復習 / 尤度の説明 / stepAIC()
によるモデル選択.
あともうちょいで一区切り,
だ.
-
1940 研究室発.
2000 帰宅.
休憩.
2100 自宅発北大構内走.
2150 帰宅.
体重 74.4kg.
晩飯.
-
北大構内走しながら明後日の代打二日目の内容について再検討した.
大学院生から見ると在学中に
「二回だけしかない」
統計学授業なんで「検定」のハナシがあったほうがよいかもしれない.
検定ハナシはめんどくさいわりには面白くない.
-
2003 年度のときには正規分布にしたがう標本について,
2004 年度には二項分布にしたがう標本についての検定ハナシをした.
どちらも検定の何たるかは説明してるけど,
あまりわかりやすいかんぢがしない.
-
で,
今回も昨年の使いまわしで二項分布のハナシにしようか,
と考えてたわけだが
……
北大構内走中に思いついてポアソン分布とかに変更したほうがマシでは,
という気がしてきた.
そっちのほうが聞き手にはラクなのでは,
と.
-
ポアソン分布から得られた二集団の尤度比検定,
それをやるなら
parametric bootstrap 検定のほうがわかりやすいだろう,
と検討をススめてみたんだけど
……
尤度の説明に時間をくってしまいそうなんで,
「こりゃダメかも」という気になる.
尤度だの対数尤度だのべつに難しい概念ではないんだけど,
きちんと説明するには時間がかかるような気がする.
例をいろいろと提示せんと理解してもらえないからだ
(と今日の夕方の発芽データモデリング講習で実感した).
で,
それを残り一回で説明すんのは無理だよなぁ,
と.
-
しかしジョギングで脳をゆすってると奇妙なアイデアもでるわけで
……
尤度比検定ではない
parametric bootstrap 法ってのもアリだよなぁ,
と思いついた.
たとえば二標本集団間の標本平均値の差
(ポアソン乱数標本の!),
とかだ.
これなら尤度は説明しなくてすむ.
-
こういう問題はふつーは
non-parametric bootstrap 法で始末するわけだが,
parametric bootstrap 法でやってもいいぢゃん,
とゆー開きなおりはひとつの合理的な奇策になってはいる.
利点?
初心者にとってはたいへん「教育的」ではありませんか.
-
はてさて,
どうしようかなぁ
……
ともあれ本日は統計学勉強に終始した.
-
[今日の運動]
-
[今日の食卓]
- 朝 (0750):
米麦 0.7 合.
キャベツ・ニンジン・マイタケ・豆腐のカレー.
- 昼 (1600):
研究室お茶部屋.
米麦 0.5 合.
キャベツ・ニンジン・マイタケ・豆腐のカレー.
- 晩 (2240):
米麦 0.7 合.
キャベツ・ニンジン・マイタケ・豆腐のカレー.
チンゲンサイ・ピーマン・モヤシ・サバブシの炒めもの.
サバ電磁波酒蒸し.
2005 年 07 月 05 日 (火)
-
0720 起床.
朝飯.
コーヒー.
0910 自宅発.
雨.
0925 研究室着.
-
苫小牧研究林ペイジ
をひさしぶりにみたら,
ヒグマ出没のため林内立ち入り禁止になってた.
-
昨晩検討した,
ポアソン乱数グループ間の平均値の差に関する
「教育的」
parametric bootstrap 問題のつづき.
この計算じたいは,
すごく簡単な関数にて実装できる.
こういうかんぢで.
pb.diff.poisson <- function(n1, n2, mean, n.trial = 5000)
{
sapply(
1:n.trial,
function(i)
mean(rpois(n1, mean)) - mean(rpois(n2, mean))
)
}
-
で,
検定とやらをやりたければ,
左右両側のスソ 2.5% とかを見たりすればいいわけで.
> diff <- sort(pb.diff.poisson(10, 20, 3.3, 5000))
> diff[c(length(diff) * 0.025, length(diff) * 0.975)]
[1] -1.35 1.40
> 2 * (1 - ecdf(diff)(1.2)) # 差が +1.2 のときの p 値
[1] 0.0908
作図関数を工夫してみたり
……
しかし,
これってホントに理解をススめる例題になってんのかな?
ポアソンな小標本の難しさはよく理解できたりするわけだが.
-
1300 から
研究室セミナー,
本日は M1 松田さんで,
駒ヶ岳のミネヤナギファンの植物たちを調べます,
というもの.
いつもながら,
野外実験っぽいことは難しい.
そしてややこしいデータ構造になりそうな予感.
-
昼飯.
松田さんと駒ヶ岳ハナシなどしてるうちに,
その近辺で野外調査時の宿泊場所になりそーなところを調べるお手伝いを
……
どうやら北大の
臼尻水産実験所
かなぁ,
というような
(しかし調査地から移動に一時間ぐらいかかるかも,という懸念があるそーで).
七飯淡水実験所
ってのもあるんだけど,
ここでは宿泊できんそーで.
-
1630 から一時間ほど実吉さん発芽実験データ
R
自動処理講習.
今日は「第一部完結」篇で,
全 35 植物種について
glm() → stepAIC() → write.table()
という「出口」にいたる部分を.
さらさらと片づいた.
めでたしめでたし.
-
明日の代打授業,
やはりポアソン版も準備してみるか,
と作業をススめてみる.
どうして検定とか好きではない私が,
このあたりをわかりやすく説明する具体例の構築に
工夫をつみかさねていたりするのかねぇ
……
-
まだ終わらんけど
2035 研究室発.
雨.
2050 帰宅.
体重 74.0kg.
晩飯.
-
うーむ
……
-
[今日の運動]
-
[今日の食卓]
- 朝 (0740):
米麦 0.6 合.
チンゲンサイ・ピーマン・モヤシ・サバブシの炒めもの.
サバ電磁波酒蒸し.
- 昼 (1300):
研究室お茶部屋.
米麦 0.5 合.
チンゲンサイ・ピーマン・モヤシ・サバブシの炒めもの.
サバ電磁波酒蒸し.
- 晩 (2140):
米麦 0.8 合.
チンゲンサイ・ピーマン・モヤシ・ニラ・サバブシ・卵の炒めもの.
2005 年 07 月 06 日 (水)
-
0630 起床.
代打授業の準備.
例の「検定」例題さしかえ作業.
朝飯.
コーヒー.
0920 自宅発.
雨.
0935 研究室着.
-
統計学授業の準備.
とちゅう,
他授業の「ヴィデオデッキを液晶プロジェクターにつなぎたいんだけど」
問題に 20 分ほど費される.
A804 の VHS デッキは機械的な問題あるらしく,
カセットテイプはいってんのに「何も入ってない」
状態になったら電源再投入の必要あり,
とわかった.
-
…… 1240
どーにかこーにか授業準備が終了.
配布資料の印刷.
-
1300 代打授業の二回目 (今回で終了),
内容は
「検定はそんなにエラいのか」.
まず「検定って何?」を説明せんといかんわけだが,
これが昨晩から作業してさしかえた
「ポアソン分布の (ちょい変則的) parametric bootstrap 法」
使ったものになっており
……
たしかにこっちのほうがラクだわ.
少なくとも説明しているほうとしては.
本日は参加者 6 名.
-
1430 終了.
脱力して昼飯.
大学院生と「何がりっちな食生活か」雑談.
このあたり彼女たちの「りっち」定義を追求していくと,
つまるところぢつは
「まっくよりモスバーガー」
といった数十円よけーに支払うかどうか,
だけで「非りっち」の棄却域が構成される,
とわかってしまった.
-
9/12 (月) - 9/15 (木) の
統計関連学会連合大会
の事前もうしこみとかどうしよーかな.
うーむ.
シンポジウムの内容
などながめてみる.
-
ばてきり.
お茶部屋統計学雑談.
M1 女性大学院生からいきなりの質問.
「べいず推定ってどう使うんですか」
……
楽しい時代になりつつあるようです.
-
1920 研究室発.
小雨.
1950 帰宅.
体重 74.4kg.
晩飯.
-
[今日の運動]
-
腹筋運動 30 ×
3 回.
腕立ふせ 5 ×
3 回.
-
[今日の食卓]
- 朝 (0850):
米麦 0.7 合.
卵炒飯.
乾燥野菜海藻スープ.
- 昼 (1450):
研究室お茶部屋.
米麦 0.5 合.
チンゲンサイ・ピーマン・モヤシ・ニラ・サバブシの炒めもの.
- 晩 (2240):
米麦 0.8 合.
アイスランド産メヌケ粕漬電磁波蒸し.
タマネギ・ニンジン・ブナシメジ・豆腐・サバブシの味噌汁.
2005 年 07 月 07 日 (木)
-
0700 起床.
朝飯.
コーヒー.
洗濯.
全自動のはずが脱水機構半壊のため
半手動と化した騒音発生機械と格闘.
炊飯器も突然死して鍋炊飯の日々が続いているし
……
考えてみれば当家にはいわゆる「家電」
と呼べるものはこのふたつぐらいしかなく,
そのどちらもおかしくなってるわけか.
あ,
冷蔵庫 (小さいやつ) もあるけど,
これまた不調ぎみだ.
うーむ.
0930 自宅発.
曇.
0945 研究室着.
-
アカマツ原稿みなおしなど.
ぢりぢりとしてススまず.
代打授業脱力ぼけ的状態.
-
あまりにススまないので,
前からではなくうしろから読む,
という方針にきりかえてみる
……
すると,
トンでもない書きまちがいを見つけてしまった.
修正.
-
とちゅうでほうりだして昼飯.
-
昼飯後,
Cao さんのデータ解析こんさる.
参考にしているという論文 (2000 年出版) みると
……
なンか植物の性配分のデータ解析ってむちゃくちゃだな.
log(オスへの投資) = a
+ b × log(メスへの投資)
といった直線回帰で b が 1 からずれてるかどーかの
t 検定だってさ.
まあ,
性配分まわりが劣悪というより,
あろめとりーまわりの解析法が依然としてへぼいまま,
ということなんだろうけど.
-
アカマツ原稿 (シミュレイションのほう)
の見なおしに一区切りつけてまたファイルアップロードなど.
-
ひさしぶりに机のまわりの紙きれ類の整理整頓.
「あ,
こんなところにあったか」
とあれこれ「発掘」される.
-
で,
発掘された文献たちをながめつつ,
ひさびさに Gibbs 分布な統計学の勉強.
以前にこのへんの問題を検討してたときは,
「隠れ」変数 (hidden variables; 潜在変数)
うまく使えば生態学の空間データ解析に有用という理解に到達した.
ところで,
植生学研究者の (ごくごく一部)
では MCMC 法などつかって観察されるパターンを説明を試みていたんだけど
(なぜなら「空間相関ある分布」になってるからだ),
隠れた変数は必要としてないよーだ.
このへんの人たち,
順計算はともかくパラメーター推定をどうやってるのか,
よくわからん.
-
1830 研究室発.
1900 帰宅.
う.
また帰宅するなり寝てしまった.
2300 すぎにおきて晩飯.
-
なんだかヘンな RTF ファイルが
……
-
[今日の運動]
-
不規則生活の悪影響で
……
うーむ,
朝とかに走るようにしたほうがよいのかしらん?
-
[今日の食卓]
- 朝 (0740):
米麦 0.7 合.
タマネギ・ニンジン・ブナシメジ・豆腐・サバブシの味噌汁.
- 昼 (1250):
研究室お茶部屋.
米麦 0.5 合.
アイスランド産メヌケ粕漬電磁波蒸し.
タマネギ・ニンジン・ブナシメジ・豆腐・サバブシの味噌汁.
- 晩 (2340):
米麦 0.7 合.
タマネギ・ニラ・ショウガ・ホタテの炒めもの.
タマネギ・ニンジン・ブナシメジ・豆腐・サバブシの味噌汁.
2005 年 07 月 08 日 (金)
-
0800 起床.
朝飯.
コーヒー.
また昨日の
Markov Chain Monte Carlo (MCMC)
植生パターン問題にとらっぷされてしまう.
0920 自宅発.
晴.
0935 研究室着.
-
この日は結局一日中
「植生分布 MCMC」論文たちというか
空間統計学勉強に没頭してしまった.
-
MCMC な問題ってのは,
ようするに植物の分布で言えば
「場所 A とその近傍の場所 B での植物 X のいる・いないは独立ではない
(相関がある)」
という状況を Gibbs 分布であつかう,
ということだ.
「場所 A にいるんだから B にいても不思議なかろう」
「いやいや B にいるから A にもいるんだ」
と何が原因で結果なのか判然としなくなったときであっても,
A と B のあいだの「つながりの強さ」とかを
なんとかうまく推定しましょう,
というもの.
-
やはり,
というか,
じつは植生 MCMC 論文なるものはそれほどあるわけではなさそう.
おそらくその最初の論文は Wu & Huffer たちによるもので
-
Wu, H and Huffer, F.W.
1997.
Modelling the distribution of plant species
using the autologistic regression model.
Environmental and Ecological Statistics 4:49-64.
-
Huffer, F.W. and Wu, H.
1998.
Markov Chain Monte Carlo for autologistic
regression models with application to the
distribution of plant species.
Biometrics 54:509-524.
どちらも 1995 年に投稿された論文だ.
このあたり
Wu
の 1994 年の Florida State University での学位論文にもとづいており,
たぶん
Huffer
はその指導教官なのだろう.
どちらも統計学部なヒトたちである.
-
で,
やってることは
……
Maximum pseudo likelihood 推定値 (MPLE)
の MCMC による補正,
つまり
-
Geyer, C.J. and Thompson, E.A.
1992.
Constrained Monte Carlo maximum likelihood for
dependent data.
Journal of the Royal Statistical Society, Series B
54:657-699.
など Geyer たちの 1990 年代前半の研究によっている.
この計算方法は,
私がよくひきあいにだす
-
Hubbell, S., J. Ahumada, R. Condit and R. Foster.
2001.
Local neighborhood effects on long-term surivival
of individual trees in a neotropical forest.
Ecological Research 16:859-875.
での死亡率推定と同じである
(Hubbell たちも Geyer & Thompson (1992)
を引用して「こういう補正計算でいいんだ」と正当化している).
-
MCMC による MPLE の補正 (近似最尤推定値を得る),
という計算に関しては Ogata & Tanemura
の 1980 年代前半の計算その他とかもあるんだが,
なぜかこちらはあまり参照されないよーで
(マルコフ確率場ではなく点過程をあつかっていたためか?).
昨年末
に苦労して解読した
(と言いますか,
これが Gibbs な統計学勉強の出発点だったわけだが),
間瀬さんの林冠動態論文では Huang & Ogata (1999)
の MPLE 補正した推定量
(approximated maximum likelihood estimator; AMLE)
を計算している.
-
ともかく,
このへん 1970 年代の Besag のわくぐみ,
加えて MPLE 補正計算が 1990 年代なかごろの主軸になっていたよーだ
(今年 1 月ごろの
マルコフ確率場 (Markov Random Field; MRF) の検討も参照).
つまり Wu & Huffer 論文たちで整理・比較・検討されてるよーに,
-
coding 法 (Besag)
-
pseudo likelihood 法 (MPLE 計算; Besag)
-
MCMC を使った方法
-
MPLE 補正 (Geyer & Thompson)
となってるわけだ.
詳しくは
間瀬
・武田 (2001)
「空間データモデリング」
を参照.
-
さて,
私の理解ではこの最後の「MCMC を使った方法」
として現在あげられるものとしては
-
MPLE 補正 (Geyer & Thompson,
尾形たち)
-
EM アルゴリズムを使った最尤推定
-
ベイズ推定
となってるんではなかろーか.
最後のふたつはどちらも「隠れ」変数 (潜在変数)
をうまく使った hidden Markov model
(HMM)
で解決せんといかんのでは,
と考えて観測データに対応する尤度方程式をひねくっているわけだ.
-
というのも,
MPLE 補正は見かけは簡単だけど,
一種の近似計算なんでまあちょっと不安がある,
と言いますか.
さらに,
MPLE 補正で何でもかんでも推定すりゃあいいってもんでもあるまい.
この方式は植生分布みたいにとても「ゆっくり」
変化する現象にはむいているだろう.
つまり観測データとして一枚の「地図」しか得られないような場合だ.
-
……
と書いて「しかし MPLE 補正なんてへっぽこですよ」
と続けようとして,
「地図」が二枚以上ある場合でも,
MPLE 補正計算はできるなぁと気づいてしまった.
えーい.
(後記: 翌日になって冷静に考えてみると,
やはり「隠れ」変数つかわん pseudo likelihood
計算だとヘンになるかもしれん)
-
ともあれこのあたり,
空間がらみの問題に限定してもなお,
生態学まわりのいろいろな問題に連関するわけで.
たとえば,
生態学会大会の
「保全」 session の発表でよくみかける
「分布の推定」とか.
-
あとで調べてみたら,
そういう研究やはりすでにあった.
-
Argáez, J.A., Christen, J.A.,
Nakamura, M and Soberón, J.
2005.
Prediction of potential areas of species distributions
based on presence-only data.
Environmental and Ecological Statistics 12:27-44.
など.
上記のはいる・いないデータから空間相関あり potential 関数を推定,
というやりくちで私の考えてる方式に近いよーな気がする.
MCMC 法による Bayesian inference.
-
そして,
MCMC 法の応用は空間統計学に限定されるものではない,
と強調しておきたい.
-
あらら,
もう 1420 すぎか.
昼飯.
-
「助手各位」
なる紙きれがまわってくる.
北大でも「助手」なる職位を
「助教」 (assistant professor)と
「助手」 (research associcate) にわけることになるそーで.
粕谷さん
が以前に説明されてた
「助手が助教に」
というやつで,
「すでに「助教」の任期制が」
にあるがごとく,
北大では (その時期は不明ながら) 「新制度移行時」に採用される
助教は最大 5 年 + 再任 2 年という任期つきになるそーで
(助手は教育研究支援職員とくっつけて消滅していく).
じゃ,
私みたいなのはどうなるの,
ということなんだけど新制度移行時には「助教」
「助手」のどちらかに名前がかわって,
その後はどうなるか書いてないわけで.
-
なぜか昨日・今日と別の院生たち (赤坂君・森君)
に同じ
R
質問された.
ってことは,
同様の疑問を持ってる「隠れ」(潜在) 院生も多かろう
と最尤推定されるので,
ここにその回答を書いてみる.
たとえば,
こういうデータ
d
> d
spc treatment value
1 A x 3
2 B y 6
3 A z 6
4 B x 2
5 A y 5
6 B z 6
7 A x 3
8 B y 11
9 A z 7
10 B x 2
11 A y 3
12 B z 4
13 A x 3
14 B y 7
15 A z 4
16 B x 7
17 A y 2
18 B z 5
があったとする
(R 勉強にはこういう例をさっと作れることがすごく重要で,
たとえばこの場合だと
d <- data.frame("spc" = rep(c("A", "B"), 9), "treatment" = rep(c("x", "y", "z"), 6), "value" = rpois(18, 5))
などとすればよい).
これの spc
かつ treatment
ごとに value
の平均値を計算したければ
> tapply(d$value, d[, c("spc", "treatment")], mean)
treatment
spc x y z
A 3.0000 3.3333 5.6667
B 3.6667 8.0000 5.0000
というふうに tapply()
すればよい.
-
また空間統計学わーるどにはまりこんでしまう.
-
てゆーか,
以前に考えてた logistic モデルと
Gibbs 分布の対応がわからなくなってしまったんだよね
……
-
この問題は帰宅してからの深夜の北大構内走の最中にとけた.
ちょっととりっきーかもしれん.
というのも,
logistic モデルの側から考えるのではなく,
「はじめに Gibbs 分布ありき」
の方向から検討したほうがわかりやすいように思えるんで.
マルコフ確率場 (MRF) のある配置
k
での各点の値を
とする.
したがって配置 (configuration)
k
とは
といったパターンのことだ.
この配置が出現する確率は Gibbs 分布で与えられ,
ここで
は各場所
i
ごとの変数で
(あ vector だから太字にすべきだったか),
は隣接した場所
j
との相互作用の強さをあらわす.
分母はかの悪名たかき
「すべての可能な配置に関する和」
となっている.
-
さて,
ここで
(発想の飛躍というか,とーとつながら)
この Gibbs 分布の
Metropolis-Hastings
sampler を考えてみよう
……
いや,
ここは Gibbs sampler を考えるべきだな.
ある配置
k
のもとで場所
i
の値が
y
となる条件つき確率は
と書ける.
どうです?
だんだん logistic っぽくなってきたでしょ
(いうまでもなく exp(0) = 1).
そしてすべての場所に関する上の確率の積は
pseudo likelihood 方程式になっていて,
そこから MPLE が得られるわけだ.
なるほど.
-
では,
ここでもし場所間での相互作用がなければ?
これは
とすればよく,
そうすると配置
k
とは無関係となり,
と logistic model が得られるわけだ.
うーむ,
なんというつながりかた
……
たぶんこのあたりの専門家にとっては
「直観でわかるハナシ」
だから論文とか教科書にはのってないんだよね.
-
しかし大学にいるあいだは上の関係が理解できずに撤退.
1850 研究室発.
1900 帰宅.
北大構内走にでるまでうだうだと逡巡.
2240 自宅発北大構内走.
上述の Gibbs 分布 ⇔ logistic 問題はここで解けた.
金曜日の夜は北大構内走者が多いのか?
2335 帰宅.
体重 73.6kg.
晩飯.
-
[今日の運動]
-
[今日の食卓]
- 朝 (0900):
米麦 0.7 合.
タマネギ・ニラ・ショウガ・ホタテの炒めもの.
- 昼 (1430):
研究室お茶部屋.
米麦 0.5 合.
タマネギ・ニラ・ショウガ・ホタテの炒めもの.
- 晩 (2355):
米麦 0.7 合.
ネギ卵炒飯.
乾燥野菜海藻スープ.
2005 年 07 月 09 日 (土)
-
0810 起床.
朝飯.
コーヒー.
-
怠業,
とゆーか,
昨日のぎょーむ日誌の数式画像どもをてぎわよく生成するため
tex2png.pl
(自作 Perl スクリプト)
の改良.
-
日射はそれほど強くないんだけど
……
北大構内走にでる気にならず.
お,
すこし雲ってきたかな,
と
1430 自宅発北大構内走.
とおもったらまた晴れてきた.
1520 帰宅.
体重 73.8kg.
-
北大構内走中,
また統計学問題を考える.
昨日のつづき.
生物の「いる・いない」問題を検討するときに,
「場所 A とその近傍の場所 B での植物 X のいる・いないは独立ではない
(相関がある)」
といったたぐいの問題 (他にも同所的な群集の構成問題とか)
を考えるときにマルコフ連鎖モンテカルロ
(MCMC)
法を応用した解析が今後はどんどん使われるようになるだろう.
-
で,
昨日検討したよーに,
それには
-
MPLE 補正 (Geyer & Thompson,
尾形たち)
-
EM アルゴリズムを使った最尤推定 (MCEM)
-
ベイズ推定
といった手法が使えそうだ.
現在,
生態学まわりでしょぼしょぼと使われてるのは 1. だけで,
これすらほとんど知られていないだろう.
基本的には MPLE を計算し,
それでもって MCMC を生成,
さらにその結果を使って MPLE を「補正」するとう手法である.
ちょい難解なので,
あまり広まらないんではないかな.
-
とはいえ,
2. と 3. もそれほど簡単ではないかもしれん.
直射日光さけつつ北大構内を走りながらそのあたりを考える.
まず,
これらの方法で MCMC の使いかたがちょっと違うように思える.
くだんの Gibbs 分布
(昨日しめしたよーに)
で「いる・いない」問題を考え,
やはり昨日の Gibbs sampler を使うところまでは同じなんだけど,
ここから先が違ってくるよーな.
-
(ここで考えてる MCMC 援用型の)
EM アルゴリズム
は (全部かぞえてしまうと) 莫大な個数になる「可能な配置」に関する期待値を,
Gibbs 分布からのランダムサンプル
(条件つきランダムサンプルとでもいうべきか?)
の標本平均というか期待値に置き換えてしまう,
という計算方法だと理解している.
つまり配置あるいはパターンが random effects であるよーな
混合モデルを考えていて,
まぢになって積分するのは苦しいので MCMC で代用している,
と.
-
いっぽうで,
べいづな推定
では
β
だの
γ
だのといったパラメーターの確率分布 (事前分布) を分母・分子にかけて,
さらに分母ではこれをパラメーターに関して積分して「つぶして」
(つまり分母を完全に定数にしてしまって),
分子だけながめてその Gibbs 分布からの sampling やって,
パラメーターに関する確率分布 (事後分布) を生成させる,
という手ぐちだ.
-
そうですなぁ
……
将来は (とゆーかすでに現在?)
WinBUGS
みたいなソフトウェアが発展して,
「なんだかわかんないけど,
べーづ推定してみました」
という方向性なんだろうなぁ.
まー,
それはそれで楽しいかも
……
近ごろちょくちょく見かける
「なんだかわかんないけど,
glm()
してみました」
だって当方の想像力をいろいろと刺激してくれているしね.
-
1705 自宅発.
曇.
いまごろになって曇,
か.
1720 研究室着.
-
しかし研究室にいるとなぜか研究ススまず.
ということで A 棟 8F 闇ネットの久保製の劣悪配線の部分的な修理に着手.
これは私が作ったへっぽこケイブルが原因で,
10M なら OK だけど 100M では通信できんという状態になっている.
ケイブルの作りかた
を復習し
(まんなか 4 本のうち 2 本を「交叉」させるところがぽいんと),
とりあえずかとーオフィス内のそれを調べる
……
が意外にも,
このあたりはまともなケイブルばかりで (かとーさん作?)
一部の配線を組み換えるだけに.
[LAN ケイブルつくりなおし]
かしめ工具と先日購入したケイブルテスター.
-
お茶部屋は劣悪ケイブルばかりだったので全部つくりなおし.
闇ルーターまわりも,
意外にも OK か
(というか以前にこのあたり苦労させられた).
A801 室もたぶん大丈夫だろう.
A804 セミナー室のケイブル点検にいったら小菅せんせーの「隠し」 PowerBook
が無人の室内で稼働していて不気味だった.
本人によると A801 からアクセスすることで隠匿気分を楽しむ,
とのこと.
-
お茶部屋で院生とデータ構造雑談
……
してるはずが,
広島風お好み焼きにもやしをいれるかどーかとか,
オタフクソースの万能性とか,
東日本における塩味のつよさとか.
2200 研究室発.
2230 帰宅.
晩飯.
-
[今日の運動]
-
[今日の食卓]
- 朝 (0850):
クロワッサン.
- 昼 (1245):
蕎麦.
- 晩 (2255):
米麦 0.8 合.
コマツナ・ネギ・ショウガ・ニンニク・牛レバの炒めもの.
2005 年 07 月 10 日 (日)
-
0800 起床.
朝飯.
コーヒー.
怠業.
-
1140 自宅発北大構内走.
曇.
小雨ぱらつく.
今日は混合モデルの random effects
が一変量正規分布ではなく多変量正規分布である場合
の問題について検討してみる.
これまた Gibbs 分布なハナシになるわけで.
1250 帰宅.
体重 73.8kg.
昼飯.
-
洗濯.
こわれぎみ衣類の補修.
まさにつくろいものだ.
-
1520 自宅発.
雨.
1540 研究室着.
-
あまり研究に関係ない論文よみ,
というかあれこれながめる.
マルハナバチの訪花は前の訪問者に影響され,
しかもそれは反発だけでなく
誘引もありえる
(Leadbeater & Chittka. 2005. Current Biology 15(12):R447-R448)
ってハナシは面白いなぁ.
訪花実験
とかどうなるのかしらん
(ってもうだれもやってないんだけど).
-
Utah 州 (なのかどこかよくわからないところ)
にびぢねすなメイル書きおくってから
1850 研究室発.
まだちょい雨ふってる.
買いものなどしてから
1900 帰宅.
晩飯.
-
[今日の運動]
-
[今日の食卓]
- 朝 (0900):
米麦 0.6 合.
ネギ・ニンジン・豆腐・ホタテ・コンブの味噌汁.
- 昼 (1330):
米麦 0.6 合.
ネギ・ニンジン・豆腐・ホタテ・コンブの味噌汁.
- 晩 (2250):
米麦 0.8 合.
ネギ・ニンジン・豆腐・ホタテ・コンブの味噌汁.
チンゲンサイ・ニンジン・ピーマン・豚肉の炒めもの.