ぎょーむ日誌 2006-12-(01-10)
2006 年 12 月 01 日 (金)
-
0730 起床.
0745 自宅発.
晴.
歩道上はほとんど雪で被覆されている.
0800 研究室着.
朝飯.
コーヒー.
-
シウリザクラ下うけ作文,
TeX2Word
で変換してみる
……
が,
MathType
いれてない環境下では数式まわりがぼろぼろである.
そうだよな,
ここに流しこむ前にあれこれと工夫が必要であった.
-
とりあえず (たいへんまっとうな)
PDF 版と (あまりまともではない) 現時点の .doc 変換版,
ついでに Table 1 の CSV ファイルをアップロード
……
しました,
という時間かせぎメイルを永光さんに送る.
-
TeX2Word に食わせる LaTeX ファイル変換の Perl スクリプト書き.
そして A801 室のわーどで文字列置換したり
(わーど上で正規表現つかった文字列置換やってるヒトって
どれぐらいいるんだろうか?),
数式をかの劣悪なる Equation Editor で書き直したり.
合計 2 時間弱ついやす.
ファイルアップロード.
また連絡.
一件落着か?
ぜんぜんそういう気がしないんだけど.
まあ,
この件を suspend もーどに.
-
東京出張準備の文献よみ.
-
生態学会松山大会の自由集会,
ぜんぶ採択,
か.
何をどうやったら 30 件以上の
自由集会をあの日程・会場に押し込めたのか?
ひょっとして最終日も自由集会を?
ともあれ,
べいず自由集会やります
(集会要旨は今後また変更される予定).
==========================================
【登録番号】 W-031
【タイトル】 データ解析で出会う統計的問題 - ベイズ統計学の考えかた・使いかた
【略称】 ベイズ統計データ解析
【共同企画者】 粕谷英一 (九州大・理), 久保拓弥 (北海道大・地球環境)
【概要】 これまでこのデータ解析自由集会では一般化線形モデル (GLM)・モデル選
択・一般化線形混合モデル (GLMM) をあつかってきた.これらとの関連を検討しなが
ら,今回はデータ解析の強力な道具として近年普及しつつある「ベイズ統計学」を生
態学研究に役だてていく方法について参加者と議論したい.ベイズ統計学は事前分布
と呼ばれる確率モデルを導入することで観測対象を現実的かつ柔軟に表現する統計モ
デリング手法である.計算機のハードウェア・ソフトウェアの発達によって,事前分
布を「客観的」に規定できる階層ベイズモデルや経験ベイズ法が誰にでも手軽にあつ
かえるようになってきている.
この自由集会では「ベイズ統計,最初の一歩」となるような,階層ベイズモデルと経
験ベイズ法に関する入門的な話題を提供し議論の材料としたい.久保はごく簡単なデー
タ解析例題 (前回あつかった「架空植物の種子数の統計モデル」) を階層ベイズモデ
ル化していく過程を示し,その考えかたとマルコフ連鎖モンテカルロ (MCMC) 法によ
る推定計算を紹介する.粕谷は経験ベイズ法を使ったデータ解析の例を紹介する.
==========================================
1210 研究室発北大構内走.
雪がぱらぱらとふっている.
1245 研究室もどる.
昼飯.
1330 ごろから 2 時間ほど宮田さんとお茶部屋で
苫小牧シュートデータを教材に使った R 講習会.
いつものごとく,
まずは重要になる data.frame()
まわりの操作と plot()
まわり.
宮田さんのデータはデータ構造が単純で
(経時変化いっさいなし,1 個体 1 sample),
教えるのもたいへんラクだ.
そして次に来週のセミナーにむけて鋭意準備中の松田さん
のところで R の図出力まわりの試行錯誤.
pdf()
などで出力した図の ◯ が Illustrator 中では | となってしまう,
と.
とりあえず win.metafile()
とかでしのいでもらうことに.
そして上記問題は Illustrator の version 依存問題だと判明した.
Illustrator ver.10 はダメ,
CS1 (ver.11) 以降なら無問題.
シウリザクラ問題は
……
アブなそうな状況なれど静観,
かな.
専攻科の院生むけおしらせ web site が壊れる
……
ぶち壊したのは他ならぬ私自身なんだけど.
9 月の apache2 化で cgi プログラム挙動が変更されてしまい,
そのことと関連して数日前に
tDiary
をいれかえた.
ところがこのやりかたがマズくて,
かかる事態を招来してしまった次第.
2 時間ほど試行錯誤して判明した tDiary まわりの重要事項
……
「plugin ぱっく」をむやみにインストールするな
(必要最小限なものだけインストールせよ),
ということ.
tDiary は使う plugin を web 上の設定ペイジから取捨選択できるハズ
なんだが,
実際のところ「インストールしただけ」で動作してしまうものあり.
「plugin ぱっく」をそのままいれると,
挙動が理解不可能なほどにわやくちゃになる.
(後記:
plugin については
こちら
も参照)
もう一点.
安定版と開発版はまったく互換性ナシ
(設定ファイルとか),
と
……
などなどいろいろ苦闘しながら復旧に成功.
-
利用する人数がせいぜい数十人とはいえ,
こういう公共的なシステムの設定作業は心理的重圧があり,
やってるとけっこうへろへろになる
……
そして今宵は院生密度がたいへんに低く,
とても静謐な夜だ.
静かなお茶部屋雑談にとらっぷされる.
-
2030 研究室発.
雪.
買いもの.
2055 帰宅.
体重 71.2kg.
晩飯.
-
[今日の運動]
-
[今日の食卓]
- 朝 (0810):
研究室お茶部屋.
食パン.
- 昼 (1300):
研究室お茶部屋.
食パン.
- 晩 (2140):
米麦 0.7 合.
ニラショウガ麻婆豆腐.
2006 年 12 月 02 日 (土)
2006 年 12 月 03 日 (日)
-
0800 起床.
朝飯.
コーヒー.
怠業.
1100 自宅発.
晴れつつ雪.
1115 研究室着.
-
東京出張準備の文献よみ.
昼飯.
-
進捗しないのでネット雑用あれこれ.
専攻の掲示板
(例の私が壊して修理に苦闘したあの
tDiary を流用してるアレ),
プラグイン設定でまだコケている部分があったので修正.
00default.rb
みたいな「数字つき plugin ファイル」
は「休憩中」にいれとくのが正しい.
メモとるのがめんどくさいので,
現状の screenshot をとる.
-
東京出張の要件,
つまり
「R ユーザー会」
とでもいうべき場所での 40 分間発表について,
構成などまたうだうだと考えてみる.
-
ここでは R
をつかった R2WinBUGS
の「実演」など
(コードを見せる,
といったことも含めて)
をやってみせることが (おそらく) 趣旨に合致しており,
この壇上での実演はいくら準備してもてこずったりするものなので,
全 40 分間のうち 10-15 分間はこれに使われてしまうだろう.
-
ということで実演用のコードやデータはとうぜん準備しないといけないし,
練習だって必要だろう.
-
で,
残り 25-30 分をつかってハナシをしつつ示す投影資料のほうだが
……
こういう構成になるのかなあ
(検討中)
……
-
今日のハナシ (概要)
-
自己紹介 -- 「生態学の研究って統計学と何か関係あるの?」
と不思議におもう他分野からの参加者ばかりだろうから
-
「統計学の
エンドユーザー」
の世界
-
……
に階層ベイズモデル
はこれから普及していくだろう
-
まずは
GLM
→
GLMM
という流れがあって
-
たとえばこういう例題ならば
glmmML()
でも解けるんだけど
……
-
その例題をあえて階層ベイズモデル化
(解説のため)
-
一様な事前分布 (?):
GLMM は経験ベイズ法の一種
-
もうひとつの解法:
階層ベイズモデルを MCMC 計算であつかう
-
Metropolis-Hastings 法の解説
-
MCMCpack
について
……
これで階層ベイズモデルを計算させるのはしんどそう,
といった R だけで MCMC 計算
-
Gibbs sampler とは?
……
自分で作れるか問題
-
JAGS
について + demo
-
OpenBugs
について,
ちょこっと
-
R2WinBUGS
について + demo
-
今日はハナさなかったことについて一言:
空間統計学?
……
R だと
geoR
の
Langevin-Hastings
法とか?
内容としてはこんなところだろうなあ
……
これでも詰めこみすぎ,
という気がするけど.
-
などと検討したり文献ながめてるだけでオワってしまった.
2000 研究室発.
2015 帰宅.
晩飯の準備.
晩飯.
-
真夜中ちかくなってから輪読会の予習.
-
[今日の運動]
-
腹筋運動 30 ×
3 回.
腕立ふせ 5 ×
3 回.
-
[今日の食卓]
- 朝 (0820):
米麦 0.5 合.
モヤシ・ネギ・ナメコ・ブナシメジの味噌汁.
- 昼 (1320):
スリヨタイ
のグリーンカレー.
スパイスたくさんかつちょうどよい辛さでした.
「具」は豚汁的 (豚肉・ダイコンなど)
で楽しい.
- 晩 (2200):
米麦 0.7 合.
エノキダケ・ネギの卵とじ.
モヤシ・ネギ・ナメコ・ブナシメジの味噌汁.
2006 年 12 月 04 日 (月)
-
0800 起床.
朝飯.
コーヒー.
0925 自宅発.
晴.
もはや晴れても雪は消失しないぐらい積もっている.
0940 研究室着.
-
さーて,
さっさと
東京出張
(木曜日夜に千歳発) の準備をしなくては
……
と作業しようとしたら,
いきなり
R2WinBUGS
に関する難しい質問メイルいただいた.
要約すると
-
(WinBUGS の計算結果を受領する)
bugs
オブジェクトの plot メソッド
(plot.bugs
)
はカスタマイズ可能か?
-
bugs
からチェインごとに結果を取りだすには?
-
R2WinBUGS の
bugs()
関数で「さっきの続き」の計算やらせるには?
……
結果的に,
これに回答することで R2WinBUGS まわりの理解がススんだ.
-
こういう難問解決に関しては
中間栄治さん
の構築された
rgonzui
がたいへん役だつ.
いまさらながら,
ここはスゴいよ.
-
たとえば
……
R2WinBUGS の
R コード一覧
の中で,
plot.bugs.R
ながめると,
まああまり柔軟性とかなさそう,
とわかる.
ということで質問 1. の回答は
「
plot.bugs()
はあまり器用なことができそうにないので,
bugs.plot.inferences()
を部品に使ったりして自分で作るしかないでしょう」
あたりか.
-
質問 2. についても中間さんの rgonzui
に助けられる.
bugs.plot.inferences.R
などをよーく見ると,
計算結果が
bugs
オブジェクト中の
sims.array
であつかわれていることがわかる.
そのあたり,
R2WinBUGS ペイジ
に追記.
-
質問 3. に関しては,
こういう回答で
これも憶測の回答ですが,R2WinBUGS の bugs() 関数は WinBUGS を完全に終
了させるので WinBUGS GUI 上で実現するような (というか私は Linux なんで
WinBUGS GUI は使ったことないんですが) 「つづき計算」はできないのでしょ
う.
解決策としては bugs() に渡す inits() が前回の計算結果を初期値とするよ
うにせよ,ということなのではないかなあ,と考えているのですが……
たぶん,
これで「つづき計算」ができるだろう.
-
ぢりぢりと出張準備.
昼飯.
-
1300 から
IPPB 輪読会,
本日は庄山さん担当で,
第 7 章のメタ個体群.
著者たちのアタマの中で分集団内の個体数変動と,
分集団サイズ一定と考える集団遺伝学的なハナシが
よくわからぬ状況になってるような気もする.
-
1430 からたっぷりと二時間ほど,
研究院のセミナー.
演題:地球温暖化が生物に与える影響を調べる - 新しい情報源の発掘 -
Title: New data sources for studying the biological effects of global warming
Prof. Richard Primack (Boston University)
概要:
温暖化が植物の開花や鳥の渡り時期などに与える影響を、写真や博物館
の標本などをふくむいろいろな情報源にもとづいて調査した。その結果、
150年以上前からの変化を興味深い形で表すことに成功した。とくに、
一般市民を巻き込みながら情報収集する研究手法が注目されている。本
講演では、独自の研究手法をふくめて最新の成果を紹介する。
Abstract:
Global warming is already affecting biological communities, but the number
of examples is still limited. We are locating new sources of data on the
flowering time of plants and spring arrival time of migratorybirds,
including museum specimens and photographs. The journals of the famous
naturalist and philosopher Henry Thoreau are especially valuable. From
1851-1858, he observed the flowering time of over 500 species in Concord,
Massachusetts, and we observed the same species from 2004-2006. Together,
these sources demonstrate that birds now arrive earlier and plants flower
earlier, due to warming temperatures. However, species vary in their
response to warming. Species that cannot adapt to these climate changes may
decline and go extinct. We are also asking the general public to make
further observations and to recognize the importance of global climate
change.
[Primack さん]
保全生物学の大御所
……
なのに,
というべきかだからというべきなのか,
じつに楽しげに話を展開させていって聴衆をあきさせない.
そうそう,
終盤のほうで
「こういう空間相関のあるデータでは
ベイズ統計学が重要」
と明言されてましたよ.
皆さん,
勉強しましょうね.
-
ハナシ自体は素朴なんだけど素朴におもしろく思わせられる
(という方向性で本日は押し出してきたかんぢだ
……
他にも話芸のスタイルをいろいろと持っていそう).
「温暖化で渡り鳥の飛来時期や植物の開花が早まる証拠は
……
ほーら,
こんなにあちこちに」
「大学の近くに住んでる主婦の日記中の
40 年間のトリ観察記録にだって」
「アマチュアの鳥マニアたちの月刊ぢゃーなるの
『今年はボクが最初に見つけました』
報告だってこんなふうに使えて」
「これは大学の博物館に保管されてきた樹木の花の標本だけど
サンプル年月日が明記してある
……
そして 70 年たった今でもこの標本をとった個体が花をつけてるんだよね
……
何日ぐらい開花が早まってると思う?」
「ソローがね,
19 世紀中ごろにおけるマサチューセッツの植物の
開花時期を詳細に記録してるんだよ
……
どうしてソローの記載と現代の開花日データを比較するかって?
そりゃー,
ソローはアメリカで一番有名で
一般の人たちからも尊敬されてるナチュラリストだからさ
……
学者の論文なんて誰の気もひかないけど,
ソローの名前をもちだせばサイエンスライターたちだって
興味をもって喜んであれこれ書いてくれるんだよ」
-
データ解析ハナシはあまり前面におしださず
(実際には彼のグループには,
例によってというべきか敵国あどばんていじというべきか,
データ解析専門家がくわわっているんだが),
図表なんかも素朴なかんぢだったんだけど
……
要点はおさえていて
「集団サイズの変動が
『渡り鳥の初到来観測日』に甚大な影響を及ぼすので注意,
たとえば
……」
といった解説もあり,
また
「P < 0.05」
といったアホっぽい注記つきグラフは一個もなく,
センスよさげなかんぢだ.
そして最後は上述のごとく「ベイズ推定しよう」ですよ.
10 月末
にこちらに見えた John Silander さんといい,
にゅーいんぐらんど界隈ではベイズ統計学が大流行,
しかもいわゆる「エラい人」がちゃんと勉強している
……
本邦のエラい人たちも少しは勉強してください.
-
セミナーからもどって,
M1 仲間たちから「パンドラ」などと揶揄されてしまっている稲葉さん
石狩浜海浜植物
データをゑくせるファイルから「救出」する相談をお茶部屋で.
いやー,
私としては「東京出張の準備がまだまだで」
とか言って逃げようとしたんだけど,
そんな「どうでもよいこと」ごときを持ちだしてみたところで
「はい,そうだったのですか」
などとダマされてくれるような大学院生はこの A 棟 8F にはいないのである.
-
……
で,
私はゑくせる上の呪われデータばかりをもう何年もあつかってきたせいか,
稲葉さんデータを拝見してみても
「ああ,
よくあるアレね,アレ」
といった
「骨とびでてる複雑骨折なんかも見慣れてしまったぜとつぶやく外科医」
状態とでも言うべき心境であった.
というか今年はすでに 10 月後半に
某さろべつデータ変換
という
思わずぎょーむ日誌の記録からも目をそむけたくなる
悪夢としか表現しようのないキビしい試練くぐりぬけてきたんで
……
-
ともあれ「東京出張が」なる泣きごとは時間かせぎには有用だったらしく,
来週の火曜日までには変換作業しますとのお約束することによって,
無事に釈放された
……
と部屋にもどるとシウリザクラあれこれが.
-
とりあえずてきとーにすませて撤退.
1945 研究室発.
2000 帰宅.
晩飯.
-
だめだ.
夜は仕事がススまん.
-
[今日の運動]
-
腹筋運動 30 ×
3 回.
腕立ふせ 5 ×
3 回.
-
[今日の食卓]
- 朝 (0840):
米麦 0.5 合.
モヤシ・ネギ・ナメコ・ブナシメジの味噌汁.
- 昼 (1245):
研究室お茶部屋.
食パン.
- 晩 (2140):
米麦 0.7 合.
ニラ卵.
ワカメスープ.
2006 年 12 月 05 日 (火)
2006 年 12 月 06 日 (水)
-
0730 起床.
朝飯.
コーヒー.
0910 自宅発.
曇.
0925 研究室着.
-
出張準備がぐだぐだなので,
本日出席を命じられてた会議に
「参加できません」
メイルをだす.
まあ,
先方も会議開催そのものが目的なんだろうから
(つまり,べつに何かを議論したいわけではない),
当方なんぞが参加しなくても不都合はないだろう.
-
ここしばらく遠洋水研の岡村寛さんに
R2WinBUGS
まわりのことなどをいろいろと教えていただいている.
たとえば
library(coda)
の
mcmc.list
オブジェクトに計算結果を chain ごとに格納すれば
(一昨日のアレ),
これを plot()
するだけで chain ごとの遷移がわかる!
-
といったことなどを,
R2WinBUGS
や
Coda 雑
に追記.
-
それから
bugs()
が返す
bugs
オブジェクト中には
last.values
というデータも含まれていて,
これを使えば「つづきの計算」とかもできそう
……
といったご教示も.
こちらに転載してもよいとのことなので,
岡村さんの
bugs
オブエジェクトメモの一部を
bugs() の返り値
に掲載.
-
あと生態学まわりの文献も教えていただいた.
Wade, Paul R. 2000.
Bayesian Methods in Conservation Biology.
Conservation Biology 14: 1308-1316.
(url)
すでに 2000 年時点で Bayesian が保全生物学まわりで議論されていたとは!
-
生態学分野の Bayesian 初心者むけの解説って何が良いのか?
私は (内容がやや空間統計学よりだけど)
Latimer, A. M., S. Wu, A. E. Gelfand and J. A. Silander, Jr.
2006.
Building statistical models to analyze species distributions.
Ecological Applications 16: 33-50.
あたりがいいんでは,
という気がする.
著者のひとり
John Silander さんのペイジ
からもダウンロードできる.
-
ベイズと言えば
……
月曜日 (12/11) の夕方までに
自由集会
の要旨とか提出せんといかんよな,
ということで粕谷さんに連絡メイルさしあげる.
-
なぜか Clark 御大の種子散布論文などひっくりかえしつつ,
二変量 Student's t 分布
(bivariate Student's t distribution; 2Dt)
の下うけ計算.
k2dt <- function(r, p.a, p.b)
{
(p.b - 1) / (pi * p.a^2) * (1 + r^2 / p.a^2)^(-p.b)
}
density.2dt <- function(r, p.a, p.b) k2dt(r, p.a, p.b) * r * 2 * pi
w.2dt <- function(r, p.a, p.b) density.2dt(r, p.a, p.b) * r
print(
integrate(
#density.2dt,
w.2dt,
lower = 0.0,
upper = Inf,
subdivision = 200,
p.a = 13.6,
p.b = 1.6
)
)
期待値は 77?
まあ,
スソの長い分布だからねえ.
下の図は density.2dt()
(上のコードで定義されている).
-
なぜか本日はべいづ情報ばかりが集まる.
農学部の高橋さんから
Kiona Ogle さん
サイトに今年夏の ESA 大会の
Hierarchical Bayesian Modeling Workshop
の情報あります,
と教えていただく.
すごい内容だよねえ
……
しかも,
たいへんすばらしいことに発表者はすべて女性だったそうで
(われわれの
ベイズ自由集会
は野郎発表者ばかりで,
たいへんもうしわけないです).
-
じつは Kiona Ogle さんが女性の研究者だと知って,
ちょっと驚いた.
あの
植物地下部のベイズモデル
論文読んだときは,
ぜったいに
「こういう良くも悪くも正気ではない計算はアタマのへんな
『野郎 PD』
のしわざにちがいない」
と思っていたんだが
……
自分の浅薄な思いこみ
(女性研究者は「狂った」計算をしない)
をすごく反省し,
これからは
女性研究者にも内在している「狂気」に注意するようにしたいと思います.
-
まあ,
考えてみれば生態学のモデルまわりと分野をかなり限定してみても,
そもそも
Claudia Neuhauser
様とかスゴいひとはいくらでもいるわけで
……
-
Ogle さん,
なぜか甲山さんとの共著論文がある.
Norby, R.J., K. OGLE, P.S. Curtis, F.-W. Badeck, A. Huth, G.C. Hurtt, T.
Kohyama, J. Peñuelas. (2001) Aboveground growth and competition in forest
gap models: an analysis for studies of climatic change. Climatic Change
51:415-447.
まあ,
おたがい面識はまったくないだろうけど.
-
それはともかく
……
その ESA Bayesian workshop で Ogle さん本人は
Hierarchical Bayesian analysis of specific leaf area for
300+ tree species in the United States
なるこれまた素敵にスっとんだハナシをされたようで.
まだ論文になってないみたいだけど,
おそらく
publications
にある Tree Physiology 投稿中の論文がそれにあたるのだろうか
(2005 年 ESA 大会口頭発表にそれらしき
要旨
が).
そして,
この研究の共著者はよりにもよって,
またしても「あの」 Pacala 先生,
ですか
……
[いや,当方はまだ何もやってないんですが]
Ogle & Pacala 研究は昨日相談していた宮田さんの苫小牧シュートのハナシに
近いのかも (こちらはせいぜい十数種だけど),
という気がする.
というか,
この二人が組んだとなると,
ハナシはもう殲滅的に進展ずみかもという予感もある.
写真は昨日の議論に使われたお茶部屋ホワイトボード.
2006 年 12 月 07 日 (木)
-
0650 起床.
旅準備.
0710 自宅発.
曇.
0725 研究室着.
-
昨晩の停電に「巻き込まれて」で止められてしまった
サーヴァー群の復旧作業
……
調べてみると,
予想どおりというか「めちゃくちゃな停電後処置」のせいで,
サーヴァーの置いてある部屋の電力が止められたままになっていた.
web server 機は旧式なので復旧作業に 3 時間以上をついやす.
なんというか,
病弱な老犬をバカな小学生に蹴っとばされた気分だ.
-
e2fsck
待ち時間に出張準備もすすめる
……
が修復状況などが気になる.
教訓: A 棟 8F に徘徊するヒトたちの錯乱した行動も可能なかぎり考慮にいれて,
頑健なシステムを構築しなければならない.
-
そしてようやく boot した,
と思ったら
……
強制停止の衝撃でハードディスクが
(ファイルシステムが,というべきか)
壊れてしまっていて,
システム関連のファイルがかなり消失してしまった.
RPM つかってる Linux の場合,
rpm -e --justdb --nodeps
でデータベイスから情報を消して,
apt-get install
などでそれを再インストールする,
と.
今回は openssl
まわりとかもぶち壊れていたので,
ひさびさに ncftp
とかで手動取得を強要されてしまった.
-
1000 すぎ,
なんとか web server などを復旧.
まだまだぼろぼろだけど.
あまり効果ないかもしれないけど
「停電後の処理」
について説明した方法を
(これまた復旧したばかりの)
メイリングリストに流す.
いやはや.
まったく最悪だ.
-
かなり努力して気分をきりかえつつ,
出張 (先での発表) の準備作業つづく.
-
ぢりぢりと進捗中.
「今回の 40 分間で提示・実演できそうなこと」
がようやくなんとなくわかってきたような気がする.
という今回の集会の性質から,
どうしても「ソフトウェアの
使いかた」
にかなり時間をとられてしまいそう
……
じつはこの方針はあまり初心者むけではない.
というのも,
階層ベイズモデルのご利益とか
GLMM
との関係とかはあまり時間がとれなさそうなんで
……
-
雪ではなく雨のふる中,
昼飯調達のため北大生協へ.
もどって昼飯.
甲山さんは Kiona Ogle さんについては
「あの論文かき共同作業の場にいたかな?」
とかいうぐらいの記憶だそうで.
-
また準備のつづき.
-
札幌市の本日の日没時刻は 1600.
窓の外はいつのまにか雪.
-
R-help.
なンと
Ripley
先生
(今日は統数研で
Ripley 独演会),
東京からもちくちくコメントメイルを投稿しておられますよ.
しかも日本時間夕方という,
いつもの ``Ripley 時間'' で.
R-help 購読者のほとんどはまさか R 先生が極東にいるとは気づくまい
……
-
「出張中に計算機が大破」
しても何とかなる程度にはできたので出発するか.
午前の server 疲れがまだ残存してるよーな気分だし.
関係ファイルは server と USB メモリにこぴー.
東京にもっていく本えらんでると,
けっこう荷物がおもくなって,
ですね
……
-
1735 研究室発.
雪.
駅で航空券発券.
ひとつ早い飛行機に変更.
1755 快速エアポートに乗って JR 札幌駅発.
1040 円.
1832 新千歳空港着.
1845 ANA (AIRDO) 4724 の B737-400 搭乗.
なかなか動かないし,
離陸しない.
1910 ごろ離陸.
せまい機内,
ほぼ満席.
-
2045 羽田着陸.
東京暑い!
なんか季節が二ヶ月ぐらいもどってるよ.
2111 京急に乗って空港発.
2134 品川着.
JR 山手線に乗り換えて 2139 発.
2151 恵比寿着.
ここまで 550 円.
東京メトロ日比谷線に乗って 2154 発.
次の広尾で降りる.
160 円.
-
地上にあがって西麻生方面に歩く.
途中でこんびにとかよって
2210 宿着.
けっこうばてた.
三泊 28350 円?
思ってたよりは安い,
かな.
-
まあここは統数研から
至近距離
なのが利点.
明朝は 0930 からだけど,
30 分前にでてもよゆーで着くな.
根拠のない憶測だが,
Ripley 先生のぶりてぃっしゅ語は聞きとりにくそうな予感も
……
-
[今日の運動]
-
[今日の食卓]
- 朝 (0830):
研究室お茶部屋.
食パン.
- 昼 (1500):
研究室お茶部屋.
北大生協まきずし.
- 晩 (2230):
宿の近くのこんびにで買ったハムサンドイッチ.
じつは新千歳空港でメロンパン買って,
機内で食ってました.
2006 年 12 月 08 日 (金)
-
0700 起床.
朝飯.
準備のつづきにとりくむけど,
なかなかに進捗しないのですよ.
0850 宿発.
曇.
えーと,
どこかに有栖川宮公園方面に登っていく坂があるはずだ,
と左をみながら歩いていくと
……
昨日の地下鉄広尾駅までもどってしまった.
ということで,
いつものごとくドイツ大使館と有栖川宮公園の間の坂
(南部坂?)
を登攀する経路をとる.
0910 統計数理研究所着.
-
間瀬さん・中野さん・中間さんにごあいさつ.
中間さんに
「R
で算時間を要する code を」
(おそらく何かの性能評価用だと思うんだけど)
と
……
はい,
忘れてたわけではありませんが
……
どういうコードがいいのかな.
-
0930
「Rの整備と利用」研究会.
最初は ``Prof''
Brian Ripley
先生,
``Software for Statistical Developments''.
「私はここではソフトウェアそのものの話はしない,
それは本日の他の演者がやるから」
というでだしで始まったハナシだけど
……
私にはやや難解だった.
内容的にはぜんぜん難しくないはずのハナシだと思うんだが.
-
強調されていたのはこういったあたりだ.
これらは理解できたんだが
……
-
end-users が使う統計学的手法を新しくしていこう
(統計学の前線と end-user 世界を近くする).
そのためにはソフトウェアが重要.
-
あるデータ解析のやりかたを考えるのと同じぐらい,
そのデータ視覚化の方法の検討は重要であろう
(Finding ways to vizualize datasets can be as
important as ways to analyze the datasets).
例として
lattice trellis
package 使った作図による脳の MRI データ解析.
The results can be explained to non-statisticians.
-
混合モデル (mixed effecs model)
の重要性.
上の脳 MRI データの個体差を考慮して
library(nlme)
で解析.
-
GAM (一般化加法モデル) など
``semiparmetric''
解析のすすめ.
GCV など cross validation 技法とくみあわせて.
-
Classification Tree
を open にする過程.
1990 年代後半においてこの問題をあつかうときには
CART という
(いろいろな意味で)
閉鎖的なソフトウェアが支配的だったので,
Therneau たちが
rpart
という独立した S-plus 用の実装を作った
(そして Ripley 先生が R に移植).
独立に作ってみるともとの CART のバグなどわかった.
-
SPSS も SAS も S-plus
も多数の統計学者の verification は受けていない.
しかし R
は違う.
R は統計学専門家たち多数の目にさらされている.
ユーザーが bug を見つける
→
コードが修正される過程もすごく速い.
ややわかりにくかったのはこれらをつなげているハナシ,
とくにハナシの最初につながる導入部のあたり,
かな.
「もっとも使われている統計ソフトウェアは何か?
ゑくせるである」
といった指摘もあったんだが.
[Ripley 先生]
上の写真は BLAS の後藤さんと話していて,
下は Stefano Iacus さんと.
Ripley 先生の印象,
がっしりとした体格,
血色よく眉毛ふとく意志の強さがでているかんじ,
でかい声で明晰に話す
……
にもかかわらず,
講演は残念ながら 8 割ぐらいしか意味が取れなかった.
うーむ,
原因かもしれないと思えるものは,
r-help 投稿にも見られる「うまい Ripley 表現」
みたいなものに当方がついていけないとか?
これと関連してなんだけど,
投影資料
(「パラグラフごとはりつけ型」とでもいうべきスタイル)
ながめてると
「慣用句」
の使用頻度がふつーよりやや高くて難しい印象になってるのかも,
という気もした.
まあ,
私の訓練不足がなによりの原因ですが.
-
二番手はテキサス工科大学から来られた
後藤さん.
統計学のハナシではなく,
最適化 (optimization)
のハナシである.
「私は英語はそんなに得意ではないけど,
CPU のコトバ (アセンブラ)
ならどの CPU のものでも話せる」
というヒトによる CPU の「実験大脳生理学」とでも言うような内容.
-
午前の部は終わり.
谷村さん
と昼飯にいき,
空間統計学のハナシなど.
-
1330 から Stefano Iacus さん,
イタリアからきた
R core team
の一人.
また optimization ハナシなんだが,
こちらは R の中での話なんで
さすがに私でも応用手段が考えられる内容でした.
いわば ``Effective R 序章'' というような.
たとえば,
x <- x + i
という操作において何回のオブジェクトコピーが発生するか考えてみよ
とか,
R の関数は pass-by-value なんだからさあとか,
また「型変換」でメモリの使用量
(これは gc()
その他で調べられる)
がぜんぜん変わったり,
などなど.
ふーむ,
external pointer ワザだの,
garbage collector よけの PROTECT ワザだの
……
ふーむ.
これはちょっとふつーのユーザーの範囲をこえぎみですが.
-
で,
このあたりで「明日の準備がまだまだ不足」
というのが気になって撤退.
1445 宿にもどる.
今回は統数研の正面 (北側) にある公園の中を突破して戻る.
今朝みつけられなかった「公園に登っていく坂」は
北条坂
と名づけられていた.
-
しかしどうもばてぎみで進捗せず.
一時間ほど寝たらかなり復旧した.
作業つづける.
自己紹介の一枚を作るの忘れてた.
何しろ「生態学って何?」なヒトたちがほとんどなので.
これを「エンドユーザー」なる keyword の導入とするか.
-
2300 晩飯に出る.
この時間に開店してるところを探すのはめんどうなので,
ここと地下鉄広尾駅のあいだにある
ジョナサン
へ.
-
晩飯くいつつ R News と R2WinBUGS 論文 (Sturtz et al. 2005)
読んでよーやく理解できたんだけど,
WinBUGS は 2004 年に開発が停止し,
その正式な後継 project として OpenBUGS が始まった,
と.
OpenBUGS is also expected to run under Linux.
だそーだが,
現状では達成されておらず,
OpenBUGS is still in development and suffers frequent crashes.
これは現状でも維持されている,
と.
-
2410 宿にもどる.
2730 準備終了.
いやはやー
-
[今日の運動]
-
[今日の食卓]
- 朝 (0720):
バターロール.
- 昼 (1220):
(昨年
も行った)
統数研前坂くだったところにある
元
でゴマだれ鉄火丼.
1050 円.
コーヒーつき.
- 晩 (2320):
タラコスパゲッティー.
サラダ,
ハーブティーセット.
1304 円,
税 + 深夜料金 (118 円)
こみ.
[深夜の晩飯]
金曜日夜のぢょなさんは深夜でも客がたくさんいてやかましい.
若い女性も多いけど,
(酔っ払ってもいないのに)
みょーな説教してるおやぢなんかも.
その説教論法は私には「東京ふう」に思える
……
my ルールを他人に押しつける,
という点において.
これはどの地方でも共通なのか?
2006 年 12 月 09 日 (土)
-
0735 起床.
準備てなおしうだうだと.
よろよろと
0905 宿発.
雨.
今日は「北条坂」を行きなり登る.
0915 統計数理研究所着.
[雨の統計数理研究所]
この建物は有栖川宮公園前,
外国大使館に囲まれた丘の上にたたずむ.
昨年
と異なり土曜日閉鎖の鉄門が開いていた.
感銘うけて写真とってると
中間さんに
「アヤしげな写真とってますね」
とアヤしまれてしまった.
-
0930
「Rの整備と利用」研究会,
第二日目始まる.
最初は ``R-Tips''
舟尾さん
(本日の投影資料 PDF ファイルもすでにアップロードずみ)
による
data.frame()
チュートリアル.
特におもしろかったぽいんとは
-
library(RODBC)
の
odbcConnectExcel()
でゑくせるファイルをこじあけ,
R にデータをとりこむ
-
data.frame()
を
subset()
,
transform()
,
reshape()
といった
「プリミティブではない」
方法であつかう
2. に関して,
私の場合はこれらの関数と「ほぼ等価」で
よりプリミティブな方法 ([..., ...]
酷使,
tapply()
集計など)
を用いることにしている.
他のユーザーはどちらを好むだろうか.
-
次は私で「R から MCMC 計算」ハナシ.
JAGS
&
R2WinBUGS
「実演」なども含めて時間どーりにオワった
……
この会をシキる中野さんから命じられたので,
この投影資料 PDF ファイルは後日このへんに公開します.
[久保とーく]
どうして自分の写真ながら
「エラそう」
に見えるのかな
……
「D 論ぎょーむ」からめでたく釈放されてふらふらと
南麻布名所の統数研見物にみえた立教大の森本さんが撮影してくださった一枚.
-
午前の最後は
「統計学的データ解析商売で飯を食う」
鈴木了太さん
(ef-prime
の若き創業者にして代表取締役),
その独自なる戦略とココロザシについて具体例あげつつ.
同社開発によるツール Natto
(screenshot,
誰でもダウンロードできる)
はたいへんとっつきやすそうな見かけのウラで,
かなり巧妙かつ狡猾な
(と私などは見てしまう)
「相関計算」やってるとあとで丁寧に解説してくださった.
-
日本のとあるぎょー界 (広告業界?)
では「このデータを『正規分布』して」
という「正規分布する」用語法があるらしい.
この「正規分布して」とは「ヒストグラムを作って」
の意味なのである!
-
上掲写真をとってくださった森本さん,
そしてつくばからかとー先生がひやかしに来てくださったので,
いっしょに昼飯にでる.
-
午後はまず小笠原理さん・服部恵美さんによる
R graphical manual
(R
の
example
を可能なかぎり実行して作図出力つき)
の開発の経緯と使いかた紹介.
小笠原さんのハナシの半分以上は
mRNA 発現量の進化モデルと集団遺伝学的ハナシだったんで
(なかなか興味ぶかいものだったんだが)
聴衆一同ぼうぜんとしている.
-
次は長崎の
谷村晋さん
による R の空間データ共通基盤たる
sp クラス
(S4) の解説.
これは難しい.
階層的なクラス群の構造を理解するだけでなく,
測地系・投影法に関する知識も必要とされたりする
……
といった内容を専門家に解説していただけだので助かった.
自分一人では勉強する前に投げだしそう.
-
最後は間瀬さん.
R
初心者むけのチュートリアルで使った原稿の紹介で,
それが同時に日本の R ユーザーをここまでひっぱってきた間瀬さんの
「R 現状まとめ」になっていた.
この集会のボス.
スクリーンに投影されてるのは
Knoppix
(Linux)
の boot 画面で間瀬さんの発表前の恒例の「儀式」である
(起動後は愛用の
xdvi
起動).
そして
……
えー,
恐縮なことにと申しますか手前に後頭部だけ写ってる
白髪の老紳士はなンと渋谷政昭さん
(あの
「S 言語―データ解析とグラフィックスのためのプログラミング環境」
「S によるデータ解析」
ほか
著書多数,
ReaD)
……
とあとから間瀬さんに教えていただき驚愕した.
「日本の数理統計学のくさわけ」
「ぼくの先生の世代にあたる人」
「今でも東京近辺の研究集会によく見えるし,
論文も書いておられる」
「モノ知りなのはいいんだけど,
うんちく好きでときどき困る」
とうんちく好きの間瀬さんをして言わしめる
……
そういえば,
昨日の Stefano さんのまにあっくな講演にも
スルどく質問なげかけておられましたなあ.
-
1630 ごろ無事に終了.
今回もたいへんためになる集会でした.
中野さんに御挨拶してから
1700 統数研発.
広尾駅の近くのコーヒー屋でで間瀬さん・谷村さんと
小一時間ほど楽しく雑談.
-
宿に戻りつつ,
右手の丘の上,
夜の雨の中にたたずみこちらを睥睨するあの魁偉な円筒形超高層建造物は
何だろう,
といぶかしく思っていたのだが
……
ふと思いついてあとで調べてみたらやっぱり
六本木ヒルズ
だったか.
1800 宿にもどる.
-
おわったおわったー,
と脱力.
TV とか見るのは久しぶりだなあと 2 時間ほどうだうだと.
ネットで安い店をさがしてから晩飯にでかける.
晩飯.
小雨ふるなか,
ふらふらと散歩してから宿にもどる.
うだうだとぎょーむ日誌書き.
-
[今日の運動]
-
[今日の食卓]
- 朝 :
食ってない.
- 昼 (1215):
本日も
元.
豚キムチ炒め定食.
1050 円.
コーヒーつき.
- 晩 (0820):
宿から歩いて 5 分ほどのところの
めし処あいざわ西麻布店,
開きホッケとサラダの日替わり定食.
900 円.
2006 年 12 月 10 日 (日)
-
0755 起床.
今日は東京から札幌に戻るだけ.
0840 宿発.
曇.
0847 東京メトロ日比谷線に乗って広尾発.
160 円.
JR 山手線にのりかえて 0855 恵比寿発.
さすがに日曜日はぜんぜんすいているねえ.
京急にのりかえて 0910 品川発.
0932 羽田空港着,
550 円.
-
自動チェックイン機で早い便に変更する.
うしろの座席におしこまれることに.
この季節の日曜日のこの時間で満席なのかしらん?
ちょっと時間あるので空港内うろうろしてみる.
[B-777]
第二ターミナルからは ANA 機がカッコよく並んで見える.
とくにトリプルセヴンはカッコよい
(この写真はヘボいけど).
-
1020 搭乗.
1038 海ぞいの C 滑走路を南→北と離陸.
羽田ではいつものことながら離陸後すぐに上昇しながらの時計まわりの急旋回.
房総半島上空で高度をかせぐ.
機内のこみぐあいは
……
「後部だけスシづめ,前方座席の局所搭乗率は 50%」
といった状況だったので,
水平飛行になってシートベルトから釈放された時点で
前のほうに移動して
「三連あいてる座席」
を独占する.
[B-737-400]
ADO 15 便.
木曜日夜に搭乗した往路機と同じ機材.
AIRDO は第二ターミナルという「半島の岬の突端」とでもいうべき場所
(54-55 番搭乗口) が定位置のよーで.
到着便おくれで出発時間が先おくりされる.
本日の新千歳空港周辺は悪天で着陸まちあり,
か.
羽田空港は晴.
-
千歳まわり悪天とのことだったんだけど,
到着してみたら晴れてた.
1150 着陸.
冬の世界にもどった.
1219 快速エアポートに乗って新千歳空港発
……
あらら,
なぜかしらウィンドブレイカーなくした.
たぶん羽田空港.
うかつだ.
車内でひるめし.
なるほど,
恵庭から先は吹雪だ.
[千歳空港周辺]
かくのごとく晴.
地表はかくのごとし,
であまりヒトが住んでない.
右側の池だか沼だかは調べてみたけどどこなのかわからなかった.
あんがい,
ウトナイ湖?
-
1257 札幌着.
ここも吹雪.
とりあえず上に着るものと手袋を調達.
1330 研究室もどる.
[雪にうもれつつある地環研]
いつのまにこんなに
……
-
雑談・雑用のうちに
へろへろと時間はすぎていき
……
-
1855 研究室発.
雪.
1915 帰宅.
晩飯.
-
[今日の運動]
-
[今日の食卓]
- 朝 :
食ってない.
あ,
飛行機出発前に搭乗口横で
エスプレッソとカボチャパン.
- 昼 (1220):
快速エアポート車内で.
いなり寿司・巻きずし 290 円.
- 晩 (2030):
米麦 0.7 合.
卵焼き.
ダイコン・ネギ・ナメコ・昆布の味噌汁.