ぎょーむ日誌 2006-12-(11-20)
2006 年 12 月 11 日 (月)
-
0850 起床.
生活周期がずれてる
……
これは東京との時差だな,
例によって.
朝飯.
コーヒー.
0950 自宅発.
曇.
ちょっと雪.
1005 研究室着.
-
いろいろとメイル書きとか.
-
農学部の高橋さんが
Ogle さん
樹木生理生態な Bayesian modeling
の ESA ポスター発表ハンドアウトをくださった.
ありがとうございます.
内容は
……
いやー,
やっぱりというか
「植物生理生態の分野で Bayesian やるならこうだよな」
と想像していた方向性そのまま,
で.
こちらでやろうとしてたことと,
かなり重なっている.
しかも戦略家の
Pacala 先生がボスだったので,
これも「やはり」というべきか「殲滅戦略」的である
……
しかし,
私としては何だかわくわくしてきましたよ.
あえて言えば,
当方は,
「まずは防御,
そののちに反撃」
というスタイルなんで,
こういった状況には適合している,
とか?
まあ能力の限界から専守防衛的,
というだけのことなんだけど.
-
地環研会計からよくわからぬメイル.
この A 棟の地下で原子炉が暴走してるのかしらん?
現在、A棟地下機械室にて蒸気漏れが発生しています。
湿度が非常に高くなっておりますので、機械室に置いてある物品等に
湿気による不都合がありましたら、搬出等の対処をお願いいたします。
富良野の
後藤さん
から教えていただいたのだが
(さらにそのねた元は Sheffield 大の田中健太さん),
CRAN に
MasterBayes
という package が登録されている
(Jarrod Hadfield さん
作).
これは花粉親候補との距離などなどを考慮した花粉親推定を
Bayes モデルで定式化 & MCMC 計算するものである.
これをインストールして
R
を起動,
library(MasterBayes)
して
vignette("MasterBayes.Tutorial")
と命じると全 61 ペイジにおよぶ親切なる解説 PDF ファイルがひらく.
MasterBayes にもちょっと衝撃をウケたので,
集団遺伝学はもともと Bayes 統計学と相性がよいわけで,
といったことなどを亀山さんたちと雑談.
さて,
これからの生態遺伝学はどうなっていくのかね
……
ということで,
生態学データ解析に
生態学と遺伝学
ペイジを追加.
夜になってからお許しのメイルいただいたので,
田中さんの「宣伝メイル」を (体裁とか少し変えて) はりつけてみる.
土曜日に統数研で間瀬さんが boot しておられたのは
Knoppix だったと
書いたんだけど,
あれって
Kanotix
じゃないの,
というご指摘うける.
うーむ,
使うほうも見破るほうもまにあっくな
……
昼飯.
またメイル書きとかつづく.
研究室内雑用.
CRT 根絶作戦 & 研究費消化のため北大生協に
液晶ディスプレイをさがしてもらう
……
一個よさそうなものが見つかった.
しかし液晶ディスプレイも安くなったものですなぁ.
R
の
glm()
の offset()
わざミニ解説.
いま研究集団対象が 20 個あり,
そこにいる「親個体の個数」
x
が
> x
[1] 13 11 12 7 7 12 14 10 7 9 8 3 14 13 6 5 7 12 11 11
で,
ある年にこれらの 20 個の集団で新しく生まれた子供の数
y
は
(x
と順番おなじで)
> y
[1] 35 23 28 26 19 43 35 42 17 24 23 17 43 39 16 11 17 35 33 35
とする (どの親が何個体の子供を産んだ,
というのはわからないものとする).
[こういう架空データ]
いちばん簡単に,
子供 (新生児) の個体数がその集団の親の個体数に
「比例」
している状況.
-
このときに集団ごとに
「子供の数 / 親の数」
などとやるのはマズい.
この割算値がどういう分布に従うかわからないからだ.
そうではなく
(集団内の新生児の数) = (親の数 x) * (一親の平均産仔数)
とモデル化し,
(y の平均値) = x * exp(線形予測子)
として (線形予測子とはいつもの
b0 + b1 * x1 + b2 * x2 + ...
のこと),
さらに集団ごとの親の個数
x
を
offset 項
として
(y の平均値) = exp(線形予測子 + log(x))
とおけばよい
(offset 項である log(x)
には係数がない).
-
集団ごとの新生児の個数
y
は 0, 1, 2, 3, ... の値をとるので,
(一番簡単には) ポアソン分布
にしたがうと考えられる
((y の平均) = exp(...)
となっているので link 関数は log
).
これを offset 項いれて
R
の
glm()
で計算させるには,
glm(y ~ 1, offset = log(x), family = poisson)
としてもよいし,
glm(y ~ offset(log(x)), family = poisson)
でもよい.
-
もちろん実際にやりたいのはもっと複雑な解析で,
たとえば
すみ場所ごとの面積だのエサの量だのを考慮した
glm(y ~ area + food, offset = log(x), family = poisson)
といった定式化になるのだろう.
ともあれ,
特にカウントデータの解析には
割算いりません,
ということで.
-
1855 研究室発.
1910 帰宅.
体重 71.6kg.
晩飯の準備.
晩飯.
-
[今日の運動]
-
腹筋運動 30 ×
3 回.
腕立ふせ 5 ×
3 回.
-
[今日の食卓]
- 朝 (0920):
米麦 0.5 合.
ダイコン・ネギ・ナメコ・昆布の味噌汁.
- 昼 (1410):
研究室お茶部屋.
バゲット.
- 晩 (2030):
米麦 0.7 合.
卵焼き.
ダイコン・ネギ・ナメコ・昆布の味噌汁.
2006 年 12 月 12 日 (火)
-
0700 起床.
朝飯.
コーヒー.
おっとメイル書きとかやってたら
……
0920 自宅発.
晴.
0935 研究室着.
-
書くのを忘れていたけど,
昨日の昼すぎ,
自由集会の要旨
を提出.
はてさて,
どうなることやら
……
-
そして今ごろになって稲葉さんデータにとりくむ.
平身低頭状態.
-
1030 より
研究室セミナー,
本日は川合さん,
繁殖時シュート使い捨ての
常緑草本・地下部ナシ (ホントか?)・多年生の
ミヤマリンドウ
の葉数経年変化・繁殖サイズ・その他雑の報告.
解析しやすい
(そして結論を明確に述べやすい)
カウントデータがいろいろあるから,
そのあたりをまずはきちんと解析したら,
というような.
-
昼飯後は日没ごろまで稲葉さんと石狩浜データ変換
Perl プログラミング.
院生にこういうケガれ言語をみせるのは教育上よろしくないような
気もしたんだけど,
御本人の意向を確認しつつ作業すべき点がいろいろあって,
ですね.
途中でちょっと時間ぎれ.
-
庄山さんと知床のトドマツその他の高さ成長モデリング相談.
浦口さんカエデ成長モデルと同じく,
成長のばらつき + 観測誤差という二重のばらつきを考慮せんといかん問題.
カエデのときは数値積分を含む尤度方程式で最尤推定値を計算してたんだけど,
今回は
「モデル・計算がちょっとめんどうになったら
Bayes + MCMC 計算」
原則を適用して WinBUGS にめんどうを押しつける予定.
-
北大生協に昨日発注した液晶ディスプレイとどく.
EIZO FlexScan M1700,
北大生協価格 2.9 万円.
これを貸与される院生のところでとりつけ作業.
古ーい IBM ``Aptiva'' (!) 用 15inch CRT display は撤収.
これで研究室から CRT を根絶できた
……
いや,
私の机の横の床上においてある server 監視用モニターは
CRT だったか.
-
お茶部屋で川合さんとミヤマリンドウ相談.
種子定着 → genet 形成の過程のデータがないんで
(というか大雪山のフィールドでそんな事象を追跡できるのかどうか不明),
「個体」の生活史なるものの全貌は解明できないんだろうけど,
シュート (ramet) の消長を追えば
「いったん形成された genet がどのように維持もしくは拡大・衰退してるのか」
なんかはわかるんじゃないの,
というような.
-
2050 研究室発.
2110 帰宅.
体重 70.4kg!
……
まあこれはこんさるバテとかが原因で
カラダの水収支が平衡状態から一時的にずれて
(1kg ほど低下して) しまった結果だろうなあ.
晩飯.
-
脱力.
嗚呼,
母子里林冠とか,
いろいろやらねばならんことがあるわけだが
……
-
[今日の運動]
-
[今日の食卓]
- 朝 (0730):
米麦 0.7 合.
ダイコン・ネギ・ナメコ・昆布の味噌汁.
- 昼 (1310):
研究室お茶部屋.
バゲット.
- 晩 (2200):
スパゲッティー.
ニラ・豆腐のトマトソース.
2006 年 12 月 13 日 (水)
-
0700 起床.
朝飯.
コーヒー.
0810 自宅発.
曇.
今朝は気温高い.
現在
+2°C
ぐらい.
0825 研究室着.
お茶部屋かたづけ.
朝飯.
-
稲葉さん
石狩浜海浜植物
データをゑくせるファイルからサルベイジする作業
(Perl プログラミング),
つづく.
午前中ついやしてどーにかこーにかできたんだけど,
いまいち何かヘンだという気が.
-
洗濯のためいったん帰宅.
ついでに昼飯.
1320 研究室もどる.
-
そしてお茶部屋で夜までかかって稲葉さんとデータ救出
& R 作図
……
というのもゑくせるから正しく取りだせているかどうかを判定する
有効な手段のひとつは「図に描いてみること」
なのである.
すごく苦闘.
今年 6 月ごろは稲葉さんの気分がおちつかない時期だったらしく,
「週ごとにデータ記載のルールが変更される」
という苛酷なデータセットになっているんで
……
-
生態学では季節変化するデータのことをフェノロジーデータなどと
よんだりすることがあるんだけど,
こういった固着性生物
(すなわち「個体識別できてしまう」)
フェノロジーデータのような経時変化データってのは
……
ゑくせるでデータ管理をした場合,
過半数の大学院生はその管理システムの設計に失敗する,
という経験則が得られつつある
(とくに枝わかれなど形態構造変化や plot 内個体数の増減変動を含む場合).
-
来年度までにはデータベイスとかもっと勉強して,
こういう経時変化データをとる院生たちには
「データを取りはじめる前」
の段階から横ヤリをいれてみることにしよう
……
それで積雪期の苦労が少しは軽減されるはずだ.
-
ときどきかなりの熟考が必要とされるトリッキーな
サルベイジプログラミングすべき場面にぶつかる
……
そういうときは「ちょっと休憩しましょう」とお茶部屋内をうろうろと.
すると煮詰まりぎみな M2 なヒトたちの
R
作図問題,
すなわち,
自分で作図関数を書くのはめんどう
→
できあい package で何とかならないかとさがす
(これ自体は悪いことではない)
→
しかし必ずしもできのよい package ばかりではなく,
しかも自分で control できる範囲が限定されているので,
いろいろとフラストレイションがたまる,
というありがちなパターン.
-
「そんなの基本的わざだけの関数つくって
組み合わせてやれば解決できる問題でしょう」
と言っても
「そんなめんどうなことやってられるか」
とのことなので,
お茶部屋ホワイトボードに
「ぜんぜん難しくないでしょ」
を示すコード例かいて説明しなければならなかったり.
「関数」という概念は理解しているんだけど,
それがまだ自分の道具として使えていない,
という段階なのか?
-
R
のもっとも重要な機能のひとつは作図であり,
自分で思いどーりの図を描くためには
-
data.frame()
を自由に構成でき,
ここから自由にデータをとりだせる
-
plot()
で「わく」を作り
lines()
や
points()
などで線・点を追加できる
(par(new = T)
は使ってはいけない)
-
適切な粒度の自作関数群を準備し,
そのコンビネイションわざで
(いっけん複雑にみえる)
作図問題を簡単に始末する
ぐらいのことができないといけない.
-
院生にはご本人のデータにそって
1. と 2. については丁寧に教えることにしている.
3. に関してもコード例をいくつか作ってみせるんだけど
……
「こういうコード例を示せばあとは自分でどんどんやるだろう」
と考えてたわけだが
(とくに R における作図は試行 → 結果表示の
フィードバック自習がやりやすかろうということで),
まあ現状をみるに
関数こんびねいしょん攻撃で「いっけん複雑」作図問題を解決,
についても演習的なものが必要なのかしらん?
個体差がかなりあるのも事実だけど.
-
てなことでぢたばたしてみたり,
石狩浜の堅牢な複郭式の防御陣地を突破するトリックを考えたり,
を繰りかえし
……
夜になってようやくにして「ゑくせるからの救出」
作業は無事に終了した.
-
嗚呼,
しかしこれは石狩浜植物データ 4 種のうちの最初のひとつ
(ウンラン),
にすぎないのである.
そして他の 3 種はまたそれぞれ独自の
ゑくせるデータ構造という牢獄にとらわれていて,
ですね
……
-
とはいえ,
本日はもう帰ろうとしたんだけど,
バテるとお茶部屋雑談にとらっぷされやすい,
という経験則が今回も成立してしまって,
ですね
……
2200 研究室発.
2215 帰宅.
体重 71.0kg.
石狩浜やせ?
晩飯.
-
[今日の運動]
-
[今日の食卓]
- 朝 (0830):
研究室お茶部屋.
バゲット.
- 昼 (1250):
自宅.
スパゲッティー.
ニラ・豆腐のトマトソース.
- 晩 (2320):
米麦 0.7 合.
ニラ・豆腐のトマトソース.
2006 年 12 月 14 日 (木)
-
0650 起床.
0720 自宅発.
曇.
0735 研究室着.
お茶部屋ソファで横になって
一酸化炭素中毒による自殺を試みる院生一名.
まあ,
この地環研 A 棟 8F は (北海道の建築物ではありえぬほど)
「風とおし」がよいためガスストーヴつけっぱなしで
寝てても問題ないみたいなんだが.
朝飯.
コーヒー.
-
ここ 2-3 日のあいだ放置していた
メイル書き・ネット雑用で昼飯前の時間がオワってしまった.
ちょっとしたファイルあれこれをこちらに転送してもらう必要あるんだけど,
メイルとかにごちゃごちゃつけられるとたいへん不幸な気もちになるので,
CGI のファイルアップローダーを探してみる.
CGIToolbox
サイトの
uploader
が良さそうなかんぢ?
-
昼飯.
1130 (?) ごろから Gmail server コケたまま
……
これはけっこう長びき,
けっきょく復旧におよそ 3 時間を要した.
いやー,
Gmail が使えないと何もメイル連絡できないなあ
……
そうか,
送信は SMTP きりかえればいいんだ.
-
お茶部屋で夜まで
(というか院生たちの晩飯つくり時間になるまで)
宮田さんと苫小牧シュート作図と階層ベイズモデリングのとりかかり.
なンかパラメーター数がすごく多いよ.
-
1900 研究室発.
1915 帰宅.
体重 70.8kg.
晩飯.
-
夜中にまた Gmail server がコケてる.
-
[今日の運動]
-
[今日の食卓]
- 朝 (0800):
研究室お茶部屋.
食パン.
- 昼 (1340):
研究室お茶部屋.
食パン.
- 晩 (2000):
米麦 0.7 合.
ネギ卵炒飯.
ハクサイ・ブナシメジ・ホタテの味噌汁.
2006 年 12 月 15 日 (金)
-
0820 起床.
0850 自宅発.
晴.
歩いてるうちに昨日の苫小牧シュートの階層ベイズモデルはもっと簡単化できる,
と気づいた.
ただし技術的問題がいくつか残っていて,
そういうコードをあの
WinBUGS
が受けつけやがるかどうか,
とか.
そしてシュート内の stem vs 葉
というシュート重量分割問題を考えるのと同時に,
葉面積 vs 「厚さ」といった
葉内の重量分割問題も推定すべきだ,
とわかってきた.
latent variable もしくは「隠れ変数」
と呼ばれる変数を導入したモデリングでは
「問題を可能なかぎりコマぎれにしない」
原則のしばりが強くなるよな.
0905 研究室着.
朝飯.
コーヒー.
-
統計数理研究所共同研究「Rの整備と利用」研究会
(先週の東京出張のアレ)
での発表資料などの公開せよということになったので,
じつは昨日から
このあたり
に PDF ファイルなど置いてる.
今回はとりあえず
「どういうソフトウェアで MCMC 計算やるのがお手軽か?」
というハナシばかり.
-
お茶部屋で
宮田さんと苫小牧シュートの階層ベイズモデリング.
岩壁登攀的,
と申しますか,
確実に高度はかせぎつつあるんだけど,
安全確保をとりながらなので時間がかかる,
といった状況?
-
1220 昼飯前の作業は終了.
-
とあるソフトウェアを MacOS X にインストールする下うけぎょーむで苦闘.
MacOS X の場合,
「アプリケイション複合体をあらわすアイコン」
を copy するだけでインストール終了,
となることが多いわけだが
……
中にはヘンなインストーラーを準備している package もあって,
これは root 権限が必要だったりする,
と.
-
夕方までまた宮田さんと苫小牧シュート Bayes モデルで試行錯誤.
WinBUGS に計算をおしつけるしくみは作れたのだが
……
当方の定式化に何か問題あるらしく,
Gibbs sampler が走らない.
その過程で
WinBUGS のへっぽこな点をまた発見してしまったんだけど,
graphical model 化によるモデルチェックは完ペキではなく,
まずいモデルがここを突破するとあとは WinBUGS
が無限ループにおちこむ暴走状態におちいる,
と.
-
苫小牧シュートの階層ベイズモデル化の正しい定式化は
「宿題」
とさせていただくことにして本日は敗退.
-
雑用いろいろとか,
データ解析こんさるメイルかきとか,
ツガザクラ雑談とか
……
やりつつ本日の敗退問題を検討していたか,
というと今回はなぜかそういう状態にはなく,
いったんアタマからこの問題を
「アンインストール」
しようと試みているように思える.
-
1850 研究室発.
1905 帰宅.
体重 71.0kg.
晩飯.
-
[今日の運動]
-
腹筋運動 30 ×
3 回.
腕立ふせ 5 ×
3 回.
-
[今日の食卓]
- 朝 (0900):
研究室お茶部屋.
食パン.
- 昼 (1340):
研究室お茶部屋.
食パン.
- 晩 (2000):
米麦 0.7 合.
ハクサイ・ブナシメジ・ホタテの味噌汁.
2006 年 12 月 16 日 (土)
-
0825 起床.
朝飯.
コーヒー.
-
昨日敗退した苫小牧シュート内重量分配の階層ベイズモデル,
検討を再開してみる.
これってもっと簡単な定式化が可能だよな,
という気がしてきた.
そのあたり確かめるべく,
1020 自宅発.
雪.
1040 研究室着.
-
で,
また
R2WinBUGS
とかに取り組んでいるうちに,
どーにかこーにか MCMC 計算は動くようにはなってきた.
しかしこれでホントに正しいのか?
ぜんぜん収束してないし.
-
昼飯.
お茶部屋の読売新聞,
土曜日朝刊に一年間にわたって連載されてきた
ドナルド キーンさんのエッセイ
「私と20世紀のクロニクル」
(全 48 回) が完結した.
自分の人生を振り返ってみると,
私の人生を左右してきたのは明らかに幸運であって,
長い熟慮の末の決断ではなかった.
-
苫小牧シュート計算つづく.
サンプル数 500 個体 (13 樹種)
なので計算時間は比較的みじかい.
12000 MCMC step で 233 秒か.
DIC = 7581.
-
どうも収束よろしくないなあ,
ということで,
例によってあれこれとひねくってみる.
たとえば測定誤差を無情報事前分布からではなく,
「測定誤差は比較的ちいさい」
と仮定すると
……
うーむ,
chain 間の差は小さくなるが,
ぜんぜん混交してない.
-
やはりこのデータセットでは測定誤差と「個体差」を区別できんのか
……?
-
午後の後半は北大からもよりの小さな映画館
「蠍座」
で (なんと) あの
惑星ソラリス.
ポーランド人 SF 作家スタニスラフ レム原作,
ソ連のタルコフスキー監督による映画化
……
ただし上記 wikipedia リンク先にも記述されてるとーり
「レムとタルコフスキーとの間で大喧嘩が起きたことは有名」.
-
私もぜんぜん娯楽とか期待せずに
「SF 好き自称する者の教養のための古典観賞」
のつもりで初めてロシア語映画 (もちろん字幕つき,
ただし縦がき) 見ることに.
そう考えた SF 道民も少なからずいたのか,
68 席しかない蠍座はせまい通路上に補助椅子まで緊急設置されるちょー満員,
ただし上映開始 30 分後には場内あちこちからいびきが聞こえてくる
(ホントです),
そういう映画だ.
-
タルコフスキーの「SF 映画なんてイヤだ」というか
あんち「2001 年」みたいな方針が露骨というか
(まったく蛇足ながら,
私は「2001 年: 宇宙の旅」を
2001 年 4/18
に初めて見ました)
……
なにしろソラリスが
「太陽系ではないどこかの星系の海だけの惑星」
といった描写はどこにもない.
ソラリスの海は何だかごぼごぼと泡だつ排水処理場みたいな.
原作には登場した宇宙船もなし
(「室内で火を吹く ICBM もどき円柱」は出たな).
HAL9000 どころか計算機のたぐいもなし.
観測ステイションは内部がひたすら壊れてちらかってるだけ,
「『海』にむけて脳波を信号とする X 線照射」
も「実施する」という会話があるだけで描写なし
……
-
とにかくこれは「古典」なので
私の偏った趣味にもとづく文句は
ことごとく無意味だというのはよく承知しております.
いやー,
しかしホントに徹底している.
何しろ実際に登場したもっとも
「未来的なガジェット」
が車載 TV 電話だもんなぁ
(これすらもやや間接的に描写される)
……
-
165 分の長ーい映画なんだけど,
その時間の使いかたは,
「ロシア的」と言ってよいのかどうかわからないんだけど,
じつに悠久たるもので.
たとえばこのソ連映画の前半にはおそるべき唐突さで
(私にはソラリスの海よりこれのほうがよほど「しゅーる」に思えたんだけど)
当時 1971 年ごろの東京 (!)
の首都高速を登場人物がひたすら無言で車を走らせる
(日本では) たいへん有名なシーンがある.
何ゆえに「東京の首都高」なのかといえば,
もろもろの事情でタルコフスキーが
「未来都市」を表現するには同高速道で走る車内からの画像ながせばよい
と考えたためらしいんだけど
(それともこれは何かの皮肉なのか?),
これがじつに 1-2 分ほども延々とつづき,
さらにすばらしいのはハナシの展開なるもの
(もしそんなものがあると仮定できるならば,
だが)
とは徹頭徹尾にわたって完全削除しても何の影響もないほどに
まったくもう無関係 という一点であろう.
-
これと比べるとキューブリックの
「2001 年」
ですらだんぜん娯楽指向の SF 映画と言える.
-
とにかくふつーのヒトには絶対におススめできない映画なんだけど,
私としては「見てよかった」映画でしたねえ
(二度とは見たくないけど)
……
まあ教養と申しますか,
SF の歴史年表をうめるひとつのピースがはまったというか,
1970 年代初頭のソ連人が SF 作るとこうなるという歴史認識というか.
ああ,
主演女優
Natalya Bondarchuk
が動いてるのを見てたら,
20 年ぐらい前に読んでた
SF 総説だったか SF 映画解説なんかに掲載されてた
この映画のスチールあれこれを突然に思いだしてしまって,
これも「はまった」感ありました.
なんと,
この気品あるスラヴ美女は撮影当時 21 才ぐらいだったとはねえ ……
-
いまは亡きユーラシア帝国たるソヴィエト連邦っぽいところなんかも
あるかしらん,
とかみょーな期待なんかもしてたんだが
……
科学礼賛ではなくあんち科学・あんち宇宙開発だし,
唯物論的というよりオカルト的だったような
(中性微子 (Neutrino) がソラリスの「磁場」で人間のカタチになる,
とか?).
数すくないソ連的な描写らしきものとしては,
見まちがいかもしれないけど,
最初のほうのバートンの査問会の室内の壁 (というかパネル) に
コンスタンチン ツィオルコフスキー
らしき似顔絵が描かれていた.
ここには他にもいろいろな人物描かれていたんだけど,
もしかしたら
セルゲイ コロリョフ
(当時はすでに痛恨の医療過誤で死亡)
なんかもまじっていたのかも
……
-
[今日の運動]
-
[今日の食卓]
- 朝 (0900):
米麦 0.5 合.
ハクサイ・ブナシメジ・ホタテの味噌汁.
- 昼 (1330):
研究室お茶部屋.
食パン.
- 晩 (1820):
北 13 条の
ピカンティ
でスープカレー.
えーと,
注文体系
がやや複雑で,
スープは「大陸 X」
でチキンコンフィ,
辛さは「知覚の扉」 (中辛).
2006 年 12 月 17 日 (日)
[スクラップ置場ではなく]
修理現場です.
左のケイブルわさわさしてるのがこのペイジを提供してる
web server 機.
HDD 交換作業中でかかる状況でインストール作業中.
中央が床に置かれた CRT ディスプレイ.
左の鍵盤と電気鼠が置かれている緑のハコは
「サンプル保存用冷蔵庫」,
ここにある理由は,
この部屋は院生たちのサンプル置場に指定されてしまったため.
-
作業方針.
-
現在の
/dev/hda
は長年酷使されてきて円盤が物理的にぼろぼろなので,
これは廃棄する
-
現在の
/dev/hdb
をとりあえず新
/dev/hda
とする
-
現在の
/dev/hda1
以下の内容 (/home
をのぞく全部)
/dev/hdb1
に dd
したいところだが
先日の「強制停電」事件で
/dev/hda1
のファイルシステムがかなりぶち壊れているので
そのまま複写するのはまずかろう
-
ということで
/dev/hdb1
に Vine Linux 3.2 をインストールし,
必要なファイルあれこれを copy する,
という方式で
で,
Vine Linux Install CD-ROM をひさびさに動かしたわけだが
……
これって /dev/hdb
の MBR に情報かきこんでくれないわけね.
しょうがないので HDD の Master/Slave を交換
(というか IDE のこういうしくみをすっかり忘れていた).
-
時間がかかる
……
えーい,
何かよくないことがおこっているな.
mount: 間違ったファイルシステムタイプ、不正なオプション、
/dev/hdb1 のスーパーブロックが不正、或いはファイルシステムのマウント
が多すぎます
(could this be the IDE device where you in fact use
e2fsck 1.35 (28-Feb-2004)
/sbin/e2fsck: 無効な引数です while trying to open /dev/hdb1
The superblock could not be read or does not describe a correct ext2
filesystem. If the device is valid and it really contains an ext2
filesystem (and not swap or ufs or something else), then the superblock
is corrupt, and you might try running e2fsck with an alternate superblock:
e2fsck -b 8193
とにかくひととーりの機能だけ動くようにして
……
撤退.
2000 研究室発.
しかし明朝はいつになったら機能回復するのか?
2015 帰宅.
晩飯.
[今日の運動]
[今日の食卓]
- 朝 (0830):
クロワッサン.
- 昼 (1330):
スパゲッティー.
レトルトパウチド八宝菜.
- 晩 (2150):
米麦 0.7 合.
ハクサイ・ニンニク茎・アサリのカレー.
2006 年 12 月 18 日 (月)
-
0750 起床.
0800 自宅発.
雪.
0815 研究室着.
とりあえず北大ネット管理者の情報基盤センター
(内線 2944) に連絡.
web server 機の復旧作業つづけつつ朝飯.
ダメだ.
ネットにつながってないと何も進捗しない.
-
0850 ごろ地環研 A 棟がふたたびネットに接続される.
今回の経緯は
-
昨日 (日曜日)
に情報基盤センターで何やら機器更新の作業をしていた
(例によってこのみっともない
北大ネット
ペイジには何も掲載されていないが)
-
router の設定ミスをやって A 棟だけ TCP/IP
が通らない状況になった
……
つまりいつものごとく
人災
-
今朝までそれに気づいてなくて,
私が電話したので「業者」を呼んで修復させた
とのこと.
ここから得られる教訓としては:
-
土日にネット機器の作業することがあり,
ヘンな状況が生起する確率が高い
-
と同時に,
作業している土日はそこにネットワーク係がいる,
ということなので何か問題が生じたら
すぐに電話して問い合わせてみるべきである
(ふだんの土日祝日は誰もいない (!)
ので電話しても無駄なンだけど)
-
この「ネット途絶」に乗じた「web server 機の HDD 交換作業」
に関しては私がミスを連発をしつつもなんとかなりつつある,
という状況.
いやはや反省点多数.
-
旧 HDD の superblock 破損問題,
強引ながら
/sbin/fdisk
でテイブル書き換えて復旧させた
(今回はこれで問題なかったので)
……
いやはや
-
で,
mount
させた旧 HDD から
/var
を丸ごと copy すんな!
理由: /var/lib/rpm
すなわち rpm database
も copy されてしまうため
(これまた今回は幸運にも
20 分間ほどの手作業でだいたい何とかなった)
-
copy せんといかんのは
/var/qmail
のみ
-
Vine で Apache2 + PHP5 への以降は
このあたり
参照:
sudo /sbin/update-alternatives --config apache2
で 2!
まだやってない作業:
-
/home/
わりつけてる /dev/hda3
のファイルシステムを
ext2 → ext3
(tune2fs)
-
新しい HDD を買ってきて新しい自動
backup 体制を整備する
-
輪読会の予習をしつつ,
苫小牧シュート
hyper prior をせまい範囲
(Gamma 分布パラメーター 1.0 で)
……
DIC = 7066.3.
-
測定誤差のみ大きな variance を許容する,
とか?
……
DIC = 7421.7
だの
6612 だのとかわっていくが,
どうみてもまともな MCMC 計算になってない.
-
1300 から 2.5 時間ほど,
IPPB 輪読会.
今日は田辺さん担当で長くて難しい遺伝学の基礎,
これがじつに第 2 章などという最初のほうにあるわけだが
……
この ``Introduction to Plant Population Biology''
ってホントに Introduction か?
いや内容は基礎としてやるべきことなんだけど,
この章で紹介されてる量的遺伝学の簡単なモデルの説明なんかは
……
何か別の本で勉強したことある人でないと,
とうてい理解できないように思えるのだが.
この点,
Maynard-Smith の
``Evolutionary Genetics''
なんかは説明が (説明の順番からして) 巧妙だったよなぁ
……
お,
原田さん
翻訳本
もまだちゃんと出版されてる.
-
夕方は稲葉さんとふたたび
石狩浜
データをゑくせるファイルから救出する相談.
全 4 種のうちの二番目,
ハマエンドウ.
データ構造は前回のウンランより簡単だが
……
うーむ,
5 シートに散在するデータをうまくまとめないといかんね.
-
と二人してお茶部屋で苦闘していると,
マレイシアの Pasoh で調査していた矢澤さんが無事に帰ってきて,
お茶部屋はたいへんにぎやかになったので,
その混乱に乗じて逃亡
……
というわけでもないけど,
本日は終了.
-
1930 研究室発.
1945 帰宅.
晩飯.
-
なんだかメイルやりとりがあちこちと
……
-
[今日の運動]
-
[今日の食卓]
- 朝 (0830):
研究室お茶部屋.
食パン.
- 昼 (1250):
研究室お茶部屋.
食パン.
- 晩 (2010):
米麦 0.7 合.
ハクサイ・ニンニク茎・アサリのカレー.
2006 年 12 月 19 日 (火)
-
0700 起床.
朝飯.
コーヒー.
0855 自宅発.
雪.
0910 研究室着.
-
また苫小牧シュートデータの階層ベイズモデルにとりくむ
……
試行錯誤のすえに,
よーやくにして
(WinBUGS
でも理解できるという意味での)
「正しい」定式化がわかった!
そして結果が格段に「いかにも Bayes 的」になってくれた.
-
このモデリングの核心部をひとことで言えば
「(この場合の資源分割の「もと」である)
シュート総重量を無情報事前分布から生成される隠れ変数」
としてしまえばよいのである.
いやー,
何とも不思議な世界だなぁ.
-
1030 より
研究室セミナー,
本日は小林君で道南におけるブナ-ミズナラ林のせめぎあいのハナシ.
ミクロスケイルでみると「いいとこばかり」のブナが,
「良いところナシ」なミズナラを地域スケイルでは
なかなか浸透駆逐できてないかのように見える (かな?) 理由はなぜか,
がよくわからないんだよねえ.
セミナー後,
混合モデルの浸透布教.
-
また苫小牧シュートの重量分割ベイズモデル.
とりあえずの現状.
測定誤差と「個体差」の区別がみわけがつかないデータなので,
そのあたりのばらつきでかい.
計算時間は
n.iter
で約 500 秒.
DIC = 17180 ぐらい.
-
資源分配に「シュート重量そのもの」を加えてみる.
これで 1 + 13 個のパラメーター増えるわけだが
……
-
初期化とかでちょっとじたばたしてみる.
計算まち時間はメイルかきとか.
-
yuji_nk さん
から混合分布モデルに関する情報を教えていただく.
このあたり,
そのうち何か使うことになりそうな予感
……
Bayesian Statistics And Marketing (Wiley Series in Probability and
Statistics)の3.9を読んでいましたら,
Estimation of Finite Mixture Distributions through Bayesian Sampling
Jean Diebolt, Christian P. Robert
Journal of the Royal Statistical Society. Series B (Methodological), Vol.
56, No. 2 (1994), pp. 363-375
が参照されていまして,さらにwebを彷徨っていたら,著者Christian P. Robert
教授のHPにたどり着きました。
http://www.ceremade.dauphine.fr/%7Exian/
ベイズの本が出るようなのですが,そのサポートページ
http://www.ceremade.dauphine.fr/%7Exian/BCS/
にあった第6章Mixture models のスライドにGibbs Samplerが収束しない(ある
いは収束に時間が掛かる?)ケースがありました。
http://www.ceremade.dauphine.fr/%7Exian/BCS/Bmix.pdf
このファイルの25枚目です。
シュート重量こみの計算 750 秒.
DIC = 16672.
収束はややよくない.
なぜか
David Spiegelhalter
からメイルが来た!
と思ったら私個人あてではなく 20600 人ばかりいる
WinBUGS 登録ずみユーザーどもへの「2007 年の
(ゐんばぐす全機能発動のための)
key はこれだよ」メイルだった.
どうもシュートサイズそのもので変わる資源分配,
というのはうまく組み込めない (収束がよろしくない)
のでいったん外してみるか.
外してもまだよろしくない.
計算時間を長くしてみるか?
また計算まち時間メイルかき.
遅れている母子里林冠 MCMC 計算のおわび,
とか.
うーん,
なんだかいまいちな.
そりゃあ,
昨日までとは比べものにならんほどマシにはなっているが
……
分散パラメーターの超事前分布の
「無情報」
ぶりを下げてみるか?
-
無情報ぶりを下げると,
かえって chain 間の差がひろがる,
と.
じゃあ次の一策として,
測定誤差と「個体差」を強引に分離してみる,
とか?
-
……
で,
いろいろやってみたんだが,
なぜかしらこの方策はダメだ.
測定誤差 100mg ぐらい,
といったケタで設定するとパラメーターたちは
MCMC 計算の中で「ぴくり」とも動かない.
-
計算は改善されぬまま
1830 研究室発.
札幌駅すぐ北側で研究室の忘年会.
2055 帰宅.
-
[今日の運動]
-
[今日の食卓]
- 朝 (0730):
米麦 0.5 合.
ハクサイ・ニンニク茎・アサリのカレー.
- 昼 (1255):
研究室お茶部屋.
北大生協の海苔まき.
- 晩 (1830):
研究室の忘年会.
炭火居酒屋 喝.
四川ふう (?) 鍋ものとか.
2006 年 12 月 20 日 (水)
-
0830 起床.
朝飯.
コーヒー.
0930 自宅発.
晴.
0945 研究室着.
-
昨晩の帰宅前に走らせておいた苫小牧樹木シュート内の重量分配ベイズモデルの
60000 MCMC step 計算
(n.chains = 3,
n.iter = 60000,
n.burnin = 50000,
n.thin = 25),
2400 秒ほどで終了.
DIC = 16238.0.
収束はさすがによい,
と言いたいところだけど
樹種 / パラメーターによってはまだまだ.
定式化とかに何かまだ問題が残存しているんだろうなぁ
……
-
以前から気になっている MCMC 計算の小ワザに関する実験やってみた.
たとえば樹高を WinBUGS にあたえるときに
-
height <- d$height
-
height <- d$height - mean(d$height)
のどちらが良いか?
という問題.
このモデルの中で樹高は
(一般化) 線形モデル的にあつかっているので原理的にはどちらでも同じ,
ということになる.
しかしながら
「MCMC 計算の収束の速さ」
に関していうと 2. が有利だと言われている.
で,
実験してみると
……
うーむ,
やっぱり 2. の「中央化」わざを使ったほうが良いような気が……?
-
宮田さんや甲山さんに結果を見せたりして説明などしているうちに
……
どうもホオノキがアヤしいような気がしてきた.
[疑惑の樹種? ホオノキ]
左の図は宮田さんデータで作図した葉重量 vs stem 重量.
上の図で「!」をつけてるのは「ぜんぜん収束してない
(chain 間の差が大きい)」
をあらわしている.
結論からいうとホオノキを除くと MCMC 計算の収束がすごく良くなる.
さらにそのあとで判明したんだけど,
左の図中央上の「ヘンな一個体」を除くとホオノキをいれた計算でも
まあなんとか収束する.
-
で,
ホオノキを除外して全 12 樹種で計算してみると
……
やはり MCMC 計算の収束が良くなった.
こいつが原因だったのか.
-
昼飯.
-
ここまでの計算で「樹高が高いほど葉重量への傾斜配分」
といった傾向がみつかりつつある.
計算改良つづく.
-
ホオノキ問題:
じつは全 503 個体中のホオノキの「ヘンな一個体」
(非同化部は巨大なのに葉が少ない
---
葉っぱが脱落した?)
のせいで MCMC 計算がおかしくなってたみたいだ
……
おそるべし
-
次の一手をみすえて,
この「ヘンな一個体」だけでなく
葉面積が欠測になっている個体 (いろいろな樹種)
もデータから除く
-
シュート内重量問題がシュートの重量に依存するか
(つまりシュートの大小で重量分配が変わるか)?
……
これを組みこんでみると,
かなり明瞭に「小シュートほど葉重視」
とわかった
(12000 MCMC step 計算に 800 秒ぐらい)
-
この計算でためしたんだけど,
やはり線形予測子を構成する因子の
``
x - mean(x)
''
といった「中央化」小ワザは MCMC 計算
(の収束の速さ)
にとってやはり重要そうな
-
DIC 比較:
「樹高ぬきモデルはどうか?」
と調べてみると,
まあ DIC ってのもアヤしげなかんじだが,
どうやら説明変数として「樹高」は必要らしい
(DIC = 16350 vs 16937)
-
というかんぢで,
苫小牧 13 樹種のシュート内重量分配問題はだいたい解決してきた.
ちなみに樹高依存性に関してはほとんど「樹種差」は見つからない
……
というのも多少のずれは巨大な「個体差もしくは測定誤差」にうもれるからだ.
定数部分つまり葉重量に傾斜配分しがちかどうかといった
部分に関してはいくつか「樹種差」がみつかり,
13 樹種の事後分布をながめてみると,
キタコブシ・ホオノキは葉重視で,
シウリザクラは葉軽視である,
と.
-
ベイズモデル的,
もしくは
J.S. Clark
御大すろーがん的な
「ある現象の全データを単一のベイズ統計モデルで」
戦略にもとづいて,
このシュート内重量分配モデルに葉面積問題もくみこむ.
-
これは葉重量を葉面積と「厚さ」に分割する重量分割問題とみることもできるし,
もっと単純に
(測定値どうしの割算値なんぞを使わぬ)
specific leaf area (SLA) 事後分布の
「直接」推定とも考えることもできる.
さーて
……
-
パラメーター数が約 40 から 約 70 に増えたので
計算時間は 1670 秒 (約 28 分) に倍増.
収束は
……
よろしくない.
葉面積は対数正規分布にしたがうと考えたほうがよさそうだ.
計算やりなおし.
-
どうも良くない.
いったん葉重量 vs stem 重量分割にもどって,
それぞれが対数正規分布と仮定してみたらどうか?
これはこれで面倒を惹起しがちなモデリングなんだが
……
うん,
しかし結果をみると,
やはり収束とか「誤差」の事後分布はこちらのほうが妥当だよな.
-
ということで,
また葉面積 & SLA 組みこんで,
収束に時間かかるみたいだから長めの計算を命じておいて撤退.
1940 研究室発.
1955 帰宅.
ばてた.
体重 70.8kg.
苫小牧べいづ痩せ?
晩飯の準備.
晩飯.
-
[今日の運動]
-
[今日の食卓]
- 朝 (0850):
バゲット.
卵焼き.
- 昼 (1300):
研究室お茶部屋.
食パン.
- 晩 (2100):
米麦 0.7 合.
レトルトパウチド牛丼 (小).
ダイコン・ネギ・豆腐の味噌汁.