ぎょーむ日誌 2003-01-(21-31)
2003 年 01 月 21 日 (火)
- 0830 起床.
0840 自宅発.
晴.
0850 研究室着.
朝飯.
コーヒー.
- 昨日はほうりだしていたメイル書きなど.
- そして一日ずっと空間不均質性推定問題の改善.
焦点は sector もしくは super sector にわりつけている
パラメーター数をどう決めるか?
というところにある.
- 1230 北大構内走発.
晴.
1305 帰宅.
昼飯.
1340 自宅発.
大雪.
1350 研究室帰着.
- こういう単純な推定問題に関しては,
かなりマシな結果を出すようになってきた.
仮定の数も減らすことができたし.
|
[空間不均質性の推定]
上から,
試験問題として与えたパターン
(青区画が死亡確率 0.1 で緑が 0.3),
セクター分割だけで推定した不均質性,
分割につづいてセクター結合した推定結果.
ただしこれはかなりうまく推定できている事例である.
点の個数 (つまり Bernoulli 試行の回数)
6000 に対して
合計 Kullback-Leibler 距離は 10 ぐらい
(全個体が同じパラメーター,というモデルだと
合計 KL 距離は 180 ぐらい).
パラメーター数はセクターモデルあたり 3.4.
|
2130 研究室発.
あいかわらず降雪.
2150 帰宅.
体重 73.2kg.
晩飯.
- しばらくでれでれしてから,
「セクターモデルあたりのパラメーター数を
どれぐらいにすれば Kullback-Leibler 距離が小さくなるか」
問題を調べるプログラムを書く.
2430 計算開始.
私は寝る.
- [今日の運動]
-
北大構内走 1230-1305.
ストレッチング.
- [今日の食卓]
- 朝 (0900):
研究室お茶部屋.
パン.
コーヒー.
- 昼 (1330):
米麦 0.6 合.
豆腐・ワカメの雑炊.
- 晩 (2210):
米麦 0.6 合.
豆腐・ワカメの雑炊.
2003 年 01 月 22 日 (水)
- 0820 起床.
おお,
計算結果でている.
むしろサンプル依存か?
いや,
調べる範囲が適切ではなかったのかも.
朝飯.
コーヒー.
0910 自宅発.
晴.
0920 研究室着.
- どうせ聞かれるだろうから,
「死亡確率地図」
がこのようにもう少し複雑な場合についての
空間不均質性推定やってみる計算をやってみる.
|
[うねうね試験問題]
乱数と周期関数の組み合わせでそれっぽい
「うねうね不均質環境」
を生成するもの面倒だったんで,
小川群落保護林の地形データを借用して,
かんぺきに意味不明ながら高度を死亡速度
(赤マル発生確率)
と読みかえて問題を作ってみた.
|
- やはり格段に難しく,
試験的にモデル選択基準をかなり甘くしたりすると,
ごくまれにだけど
「一切の分割・結合操作やらないほうがマシ」
という結果すら出る.
あるいはセクター分割だけやって結合やらないほうがマシとか.
おもしろいなあ
……
と面白がってないで,
明後日しゃべる内容として整理していかねばならんわけだが.
|
[でてきた回答の例]
とゆーことで,
標本点数 6000 (うち赤マルは 1000 個ぐらい)
ではこの程度の推定しかできん,
というかんぢだ.
上がセクター分割だけの推定で,
下がそれに加えてセクター結合.
おもしろいのは上のほうが AIC は高い
(悪い)
のに Kullback-Leibler 距離は小さい
(真のモデルに近い)
ということだ.
試験問題として与えたパターンの複雑さが原因だろうな.
|
- で,
午前中おわる.
昼飯前にパラメーター数依存性を調べる反復試行計算を開始.
2-3 時間で終了するだろう.
昼飯.
今日は北大構内走なし.
- 1300 より名作
「チップス先生,じゃなくて Bazzaz 先生,……」
を読んで植民地パブリックスクールでの教育に尽くした
先生の功徳を讃える会.
生徒代表は M2 森君.
今日で最後ということで悲しみを隠せず
その朗読はとつとつとしたものであり,
場内は厳粛な沈黙が支配した.
まあ,
Bazzaz 先生はおいとくとして,
この本の真の主役たる一年草たち
Abutilon,
Amaranthus,
Ambrosia,
Setaria,
Polygonum
……
たちには
(実際にどういうカタチなのかよくわからぬままに)
なんだか愛着がわいてきましたよ.
1500 終了.
- 農学部の某秘密会議のために北海道に密入国してる
都立大の可知さんがなぜかしらこちらにあらわれる.
「(海外出張で) 甲山がいないのをみはからって
今日は雪野さんに会いに来ました」
だのと最初から絶好調のようで.
そのあとも可知さんトークとどまるところを知らづ,
甲山さんのふだんの透析スケジュールその他を雪野さんから探りだし
「ふーむ,ならばこの曜日は体調わるいはずだな」
と雑用おしつけあい攻防戦メイルやりとりにおける
優位を勝ち取る算段あれこれ
……
1600 すぎに風のごとく去っていった.
- 今回つかえそうな計算のつづき.
- かとーさんとこの推定方法に関して議論しているうちに,
どのあたりまでなら使えそうか,
といったことどもが整理されてくる.
- ばててきたので撤退.
1920 研究室発.
1930 帰宅.
体重 73.0kg.
晩飯.
- 発表準備がすすまん.
うう.
- [今日の素読]
- [今日の運動]
- [今日の食卓]
- 朝 (0840):
米麦 0.6 合.
ダイコンナ・マイタケの炒めもの.
- 昼 (1220):
弁当.
研究室お茶部屋.
米麦 0.6 合.
ダイコンナ・マイタケのあえもの.
- 晩 (2030):
米麦 0.8 合.
ニラ・卵の炒飯.
タマネギ・ジャガイモ・煮干の味噌汁.
2003 年 01 月 23 日 (木)
- 0810 起床.
ねむい.
朝飯.
コーヒー.
0850 自宅発.
晴.
0900 研究室着.
- お,
最適パラメーター数を評価する計算おわってるな.
まぁ,
だいたい予想どーりで.
あとは明日の発表準備なんだけど,
これがなかなかすすまぬ.
なんか「ああ,計算はもう終わった」ってかんぢで.
- すすまぬ作業で一日が終わる.
2020 研究室発.
2030 帰宅.
体重 73.0kg.
- そして作業は続く.
- [今日の運動]
-
北大構内走 1210-1245.
ストレッチング.
- [今日の食卓]
- 朝 (0830):
米麦 0.6 合.
ハクサイ・エノキダケの炒めもの.
タマネギ・ジャガイモ・煮干の味噌汁.
- 昼 (1255):
弁当.
研究室お茶部屋.
米麦 0.7 合.
ハクサイ・エノキダケの炒めもの.
- 晩 (2040):
米麦 0.6 合.
ハクサイ・エノキダケの炒めもの.
タマネギ・ジャガイモ・煮干の味噌汁.
2003 年 01 月 24 日 (金)
- 0520 起床.
3 時間ほど寝た.
朝飯.
コーヒー.
発表準備つづき.
0810 自宅発.
曇.
0820 研究室着.
- また発表の準備.
かなり内容をけずりつつ
……
まだ説明がでそろっていない.
- 図はぜんぶそろったか?
1110 かとーオフィス発.
晴.
1125 JR 札幌駅発.
快速エアポート.
1040 円.
1201 新千歳空港着.
お,
千歳基地には迷彩ファントム (F-4EJ) らしき機体が.
- 1220 ANA 58 便登場.
B-747SR.
1240 離陸.
離陸後 30 分間はいきなり昏睡してしまった.
その後は print out に直しを書き込みつづける.
1400 羽田空港着.
晴.
1417 東京モノレイルに乗って同発.
1443 JR 浜松町で乗り換え.
1448 JR 東京駅.
空港からここまで 620 円.
- 営団丸ノ内線に乗って本郷三丁目へ.
160 円.
時刻は 1505.
出頭時刻は 1 時間後だから
まだ時間あるよな.
この間にファイルを修正して,
と.
- ……
というときにかぎって道を間違えるんだよね.
しかもここは山手線内側すなわち東京深暗部というのに
地図もなければ GPS も持っていない.
えーい,
やはりばたばたしてると準備がなにもかもいいかげんになるな.
- で,
本郷通 (国道 17 号線) を東大のほうではなく
湯島のほうにいってしまって,
おかしいと思ってひきかえしたりしてた.
地下鉄の駅を出た時点で進行方向を冷静に考えていれば,
こんな失敗はしないはずなのに.
時間浪費 15 分.
やれやれ.
東大横の StarBucks 屋外席 (!) で 30 分間かけて
ファイルを修正.
もちろんこんな莫迦なことやる必要はなく,
出頭先の建物 1F にはいごこちよさそうなテイブル・椅子セットが
ならべられている,
という事実をあとから発見したりするわけだが.
- ファイル修正終わって (終わったことにして),
東大へ.
「赤門」突入 1710.
ここってたぶんもともとは大名屋敷かなんかだったんだろうな.
経済学部の建物内へ.
矢島美貫さん
(あの「自然科学の統計学」の「確率過程」の章を書いたひと)
の部屋へ.
そこで私なんぞを呼んでくださった
丸山祐造さん
にも会う.
どちらとも初対面.
とりあえず出張書類書きなど.
- 液晶プロジェクターにうまくつながらなくてあせる.
Reboot したらなんとかなった.
やれやれ.
1645 より経済学部のひとたち 10 数人あいて
(院生が半分ぐらい?),
生態学のハナシ
.
幸か不幸か生態学が専門ではない研究者あいてのハナシは
今まで何度かやっているので
準備で重視したことは
「ハナシをどこまで削れるか
(ただし,それほどつまらない内容にならぬように」
というあたりで.
- 先方はかなり統計学よりなヒトたちばかり.
統計学的なトピックとしては,
-
直径成長における複数のばらつきを
分離して最尤推定
-
生態学においても
「空間的に不均質な死亡率」
の推定に MCMC 法が使われるようになっている
-
しかし
MCMC 法つかわないで空間不均質性を推定したい
というあたりで.
1. については誤差構造のモデリングには他にもいろいろやりかたあって,
乗法的にしてみたら,
といったご指摘など.
2. は「へー,生態学データ解析でも使うんだ」
という反応.
あとで知ったんだがそちらの分野の時系列データ解析で
MCMC 法がかなり浸透しているらしい.
あるいはそういう問題は一般化線形混合モデルを使っては,
というような.
3. についてはモデル選択基準に関してあれこれ.
AIC で OK なのかとか GIC のほうがいいんではないかとか.
- 1750 終了.
やはり話すことを大量削除して正解だった.
いやー,
おわったおわった.
脱力.
建築学 (都市工学?) の分野で空間分割の研究やってるかたから
名刺いただいたり.
- そのあと丸山さんの研究室にうかがい,
それから丸山さんと院生二人のかたが晩飯にさそってくださる.
大学前の居酒屋.
経済学部における統計学研究というようなあたりを
いろいろと教えてもらう
……
Cauchy 分布 (!) の推定量の構築,
といったかなり経済学ばなれした問題をやっている
大学院生がいたり,
確率過程の研究とファイナンス理論が結びついていて,
デリヴァティブなどの金融商品の開発に関係してくる,
というような
(しかしそれで D 論書いている院生のかたは
「まだあまり現実とは関連してない」
というようなことを言っておられたけど).
- ということで,
ときどきぜんぜん他分野のヒトと話したりすると,
たいへんに勉強になる.
- 2120 おひらき.
皆様にお礼を言って,
教えられた道順にそって宿をめざす.
本郷キャンパス南端の春日通りを東に下っていく.
御徒町で北におれて JR 上野駅に到達.
そこからさらに浅草通りを東に
ふらふらとあるいていって,
田原町のサンホテル浅草に到達.
時刻は 2215.
- さっさと寝ればいいんだけど,
久しぶりに TV を見てみたら NHK が面白かったので,
そのまま遅くまで見ていたり.
- [今日の食卓]
- 朝 (0600):
パン.
コーヒー.
- 昼 (1215):
千歳空港.
パン.
牛乳.
- 晩 (1900):
本郷キャンパス前の居酒屋チムニーでごちそうになる.
ありがとうございました.
2003 年 01 月 25 日 (土)
- 0810 起床.
サンホテル浅草.
今日は札幌に帰るばかりである.
ホテルの食堂で朝飯.
0845 チェックアウト.
午前中の飛行機に乗るつもりだった.
ここから終わりのない迷走が始まるとは知る由もなかった
……
- 0854 営団銀座線に乗って田原町発.
おとなしく上野か新橋で降りればよいのに,
「ふと思いついて」
しまって
上野広小路で下車.
ここまで 160 円.
都営大江戸線に乗り換えてしまう.
たしかにそれで大門 (浜松町) まで到達できるけど,
時間的・運賃的は失敗している.
22 分かかって浜松町着.
ここまで 220 円.
- 0932 東京モノレイル浜松町発.
0954 羽田空港着.
ところが 1030 の札幌行には乗れなかった.
航空券がないんだよね.
なんというか,
過去 2 ヵ月の緊張から解放されて,
ぼけきっているというか.
- ぼけきっているという自覚があって,
かつ時間的によゆーのあるときには,
わりと冷静に対応できるよーで
……
「あ.これはたぶんホテルに置き忘れてきたな」
と昨晩の宿泊場所に電話して部屋を確認してもらう.
しばらくしてかけなおしてみると,
やはりありましたか.
えーい,
今日はもうひたすらのんびりやるぞ.
- またモノレイルに乗るのも芸がないので,
京急に乗って 1014 羽田空港発.
これは品川から先は都営浅草線に接続している.
1105 蔵前着.
ここまで 590 円.
帰宅してから地図で確認すると,
むしろ次の浅草で下車すべきだった
(料金が高くなるけど).
そうすれば雷門とかも見物できたんだけど.
- 「のんびりモード」で行動してると
地下鉄駅にある周辺地図などもよくアタマに入ってくる.
地上に出て脳内地図と太陽位置から方位を確認.
北にむかって歩いて 1110 ホテルに到着.
航空券うけとる.
- もはや「さっさと帰ろう」なる意志がまったくなくなったので,
ひたすらだらだらすることに.
このあたりを走る地下鉄
……
銀座線・浅草線・大江戸線にはぜんぶ乗ってしまったので,
地上を移動する.
浅草通りを西にむかいつつ左右の商店街に入り込んだりして
じぐざぐにあるく.
仏壇屋の出現頻度が高い.
荒物屋で木の食器を買ってみたり.
- 1145 JR 上野駅横を航過.
中央通り (国道 1 号線)
を南下していく.
さーて,
地図ナシ状態で東京深暗部を踏破できるか?
天気がよいので時刻を確認して太陽をみていれば
方位はわかるからね.
- 秋葉原では
ぷらっとホーム
に立ち寄ってみる.
あやうく鍵盤を何枚か買ってしまいそうになったけど,
何も買わずに去る.
さらに南下.
- 神田須田町で靖国通りと交叉している.
「たしか古書店街は靖国通りぞいにあるんだったな」
という記憶をたよりに,
西に進行方向を転じてみる.
めでたく神保町に到達したので,
そのあたりの本屋をうろうろする.
ここに来るのは実に 5-6 年ぶりのような気がする.
- 昼飯に東京ふうラーメン食ってから
神保町発.
皇居を右手にみながら旋回しつつ丸の内に到達.
なるほど皇居と JR 東京駅ってこんなに近かったんだ.
1355 JR 東京駅着.
よーし,
これで
浅草・上野・本郷・秋葉原・神田・丸の内
あたりの概念と距離感はかなり把握できた.
- モノレイル・京急以外の経路である
空港いきバスはないかと八重州口でさがしてみた.
あるはずだけど
……
見つからん.
めんどうになったのでやめ.
JR の 150 円の切符を買って山手線で浜松町へ.
1415 到着.
- ここの自動チェックイン機に券をくわせてみると
……
1600 発の席がとれた.
時間によゆーあるな,
とこれまたひさしぶりにすぐ下の階の書店
dan
へ.
しかし今日はもう本屋は神保町で堪能してしまったので,
そうそうに切り上げて
1452 東京モノレイルで発.
1514 羽田空港着.
470 円.
- 1538 ANA 69 便に登場.
おお,
今回は B-777 だ.
1615 羽田離陸.
あれこれ買ってしまった本など読んでるうちに
1740 新千歳空港着陸.
1804 JR 快速エアポートで同発.
1040 円.
1841 JR 札幌着.
1900 帰宅.
体重 73.6kg.
- ふう,
終わった終わった.
つぎの時限ぎょーむは 2ヵ月後の生態学会つくば大会の発表準備,
ということになるのだろうか.
ともあれ時間は大事に使わなくては
……
と思いつつも,
ひたすらでれでれと休む.
- [今日の運動]
-
東京深暗部の地図ナシ散歩.
15km ぐらい歩いたような気がする.
- [今日の食卓]
- 朝 (0830):
サンホテル浅草の朝食.
トースト,オムレツ,サラダ
……
といったありがちなもの.
- 昼 (1315):
神保町のラーメン屋
一六堂
の麺匠「表」ラーメン
(「表」は和風スープで「裏」はとんこつ).
630 円.
麺がおいしい.
かつおだしが効いてる
そばつゆみたいなスープでもかまわないんだけど
……
ああ,
あと少し塩味がうすければ.
たぶん店としてはこの塩分濃度で
「正しい」と思ってるんだろうな.
- 晩 (2000):
スパゲッティー.
レトルトパウチドのトマトソース.
2003 年 01 月 26 日 (日)
- 1000 起床.
朝飯.
コーヒー.
だらだらとぎょーむ日誌書きなど.
- 昼飯.
まただらだら.
- 1610 自宅発.
曇.
北 12 生協にセーターのクリーニングだす.
1630 研究室着.
おお,
牧さんが来ておられたのか
……
- 統計本などいろいろ調べてみるけど,
いまいちやる気がおこらず.
- 研究室お茶部屋で特に匿名を希望する料理人と下野さんが
中心になって準備した水炊きのおしょうばんにあずかる.
これは鶏ガラから白濁スープをとった本格的なもの.
うまい.
このスープとラーメンがまたよくあう.
- 2130 研究室発.
2150 帰宅.
- [今日の食卓]
- 朝 (1020):
パン.
コーヒー.
- 昼 (1320):
スパゲッティー.
ニンニク・トウガラシ・ケチャップのよくわからぬソース.
- 晩 (1900):
研究室お茶部屋で水炊きのおしょうばんにあずかる.
2003 年 01 月 27 日 (月)
- 0820 起床.
朝飯.
コーヒー.
0910 自宅発.
曇.
0920 研究室着.
- 手紙かきなど.
- 私が地図も持たずに東京深暗部をさまよってるあいだに,
世間ではワームさわぎがあったようで
……
例によってゲイツサーヴァーなわけだが.
ともあれ終息しつつあるのかな?
- 1030 より
講座セミナー
.
今日は D1 小菅せんせーだが
……
計画が壮大すぎてあれこれたたかれてた.
対 Bazzaz 戦に特殊化しすぎたのだろうか?
1210 終了.
- 1220 北大構内雪上走発.
曇.
1300 帰着.
ばてた.
昼飯.
- 午後から Nelder-Mead 式 Polytope 法を使った
汎用最尤推定プログラムを
Perl → C++ と移植する作業をやってみる.
あまりにも計算おそいんで.
- だいたい動くようになったけど,
計算結果がびみょーに合致していない.
移植ミスかそのたぐいだろう.
しかし今日はばてたのでここまで.
2050 研究室発.
猛烈なる吹雪.
2110 帰宅.
体重 73.6kg.
- 晩飯.
晩飯後は何もススまない.
- [今日の運動]
-
北大構内走 1220-1300.
ストレッチング.
- [今日の食卓]
- 朝 (0840):
米麦 0.7 合.
コマツナ・エノキダケの炒めもの.
- 昼 (1310):
弁当.
研究室お茶部屋.
米麦 0.7 合.
コマツナ・エノキダケの炒めもの.
- 晩 (2200):
米麦 0.7 合.
コマツナ・エノキダケの炒めもの.
ハクサイ・ジャガイモ・豆腐のシチュー.
2003 年 01 月 28 日 (火)
- 0820 起床.
朝飯.
コーヒー.
0900 自宅発.
曇.
気温が一時的に高くなって雨でも降ったのか
水たまりが多い.
0910 研究室着.
- そういや,
書くの忘れてたけど,
甲山さんが惑星周回出張
(日本→パリ→パタゴニア→日本)
を無事に終えて戻っておられます.
- C++ 版の新汎用推定プログラムのバグ取りのつづき.
移植もとの Perl 版推定モジュール,
さらにそのもとになったモジュールのコードを見くらべつつ
……
- Perl 版の「もと」になった CPAN モジュール
Math::Amoeba
(1995 年末に作成されて以来まったく改良されていない)
に間違いというか,
計算量を無意味に増大させる書き間違いを見つけた.
どうも原因は,
この
Math::Amoeba
のさらにもとになった
Numerical Recipes
(in C) の C コードにありそうだな
(第 10 章の 10.4).
やっぱこういう汚ならしい書きかただと,
うっかり間違えてしまうのも無理がない,
というか.
- 午前中の集中的な作業で Perl 版と C++ 版が
だいたい同じ結果を出すようになった.
計算速度に関しては,
4 個のパラメーターの最尤推定値を同時に計算させる問題において,
たとえば Perl 版だと 69 秒かかるところ
C++ 版だと 7 秒,
あるいは 79 秒 → 6 秒,
あるいは 69 秒 → 6 秒,
あるいは 24 秒 → 2 秒,
あるいは 68 秒 → 5 秒,
……
ということで 10 倍ほど速いのかなぁ.
計算時間ばらつくのは同じ確率分布から得られた
ランダム標本集団であっても,
パラメーター推定の「難易度」がかなり異なるため.
- Perl 版もまぁよくがんばっている,
ということで.
Perl モジュール内のサブルーチンよびだしの overhead
を減じる例の邪悪な手段を使えば,
もう少しは速くなるかもしれない.
- 結果が「だいたい同じ」というのは,
実用上では問題のない相違だと思うんだけど
……
有効数字の 5 ケタ目あたりから値が異なっている,
ということ.
浮動小数点数の取り扱いが異なっている,
というのが原因だと思う.
- 浮動小数点数といえば,
推定計算の収束判定が難しい.
いまのところ,
最良のセットと最悪のセットの尤度の差をみてるわけだが
……
- 北大構内走にでようとして挫折.
今日は水たまりだらけでジョギングシューズでは走れず,
ゴム長を着用したとしても周り歩いてるヒトたちに
迷惑かけそうなんで.
まぁ,
しばらくしたらまた全部凍結するだろう.
研究室にもどって昼飯.
- 午後は新しく作った汎用推定システム Perl/C++
版の入出力まわりの整備.
- かとーさんと R
に関する雑談をしているうちに,
なぜ一般化線形モデルの関数
glm()
で family = Gamma
としたときに,
デフォルトではリンク関数が
1/μ
で分散関数が
μ2
と設定されているかわかった.
これは指数分布だ!
R の
family
には指数分布がない
……
つまり Gamma
で代用しろってことなんだろう.
- 夕方すぎになって,
M2 森君が修論のデータ解析がどーのこーのと言ってくる
……
いまごろになって.
そして現状をかんがみるに,
事実上まったく何もデータ解析できていない.
いやはや.
- なかなか切り込むタイミングが難しい.
こういうふうにぎりぎりもイヤなんだけど,
かといって最初から「ああしろこうしろ」
とやると先方は何も自分では考えなくなる.
これは院生によって反応にすごく個人差があるけれど
……
とくに,もともと「自分では何も考えない」
ぽりしーを堅持しているヒト,
ならばということで.
また私じしんも先月・今月はひたすらばたばたしていた,
ということもあるし.
- で,
お茶部屋で
「そもそもどういうつもりでそういうデータとったの?」
というところから問診していく.
でないとモデルが作れないし,
モデルが作れないとデータ解析できない
……
現時点でこのあたりの説明があやふやなのがイタい.
苫小牧かつ樹木研究,
ということで浦口さんにもちょっと同席してもらって
助けていただく.
- とりあえずサブモデルに分解するところまではできたんだけど,
そういうのがどの程度まっとうなのか検討できる資料がない
……
ということで今日はおしまい.
うーむ.
はやくも
半自動機械状態か?
- いやはやと思いつつ
2100 研究室発.
2120 帰宅.
体重 73.6kg.
晩飯.
- とはいえ,
ああいうデータどうやって解析したもんか,
と考えてしまう.
考え代行業者の看板でも掲げてみるか?
- [今日の食卓]
- 朝 (0840):
米麦 0.6 合.
ハクサイ・ジャガイモ・豆腐のシチュー.
- 昼 (1250):
弁当.
研究室お茶部屋.
米麦 0.8 合.
ホウレンソウおひたし.
- 晩 (2140):
米麦 0.7 合.
ハクサイ・ジャガイモ・豆腐のシチュー.
2003 年 01 月 29 日 (水)
- 0820 起床.
朝飯.
コーヒー.
0900 自宅発.
曇.
0910 研究室着.
- 昨日の推定プログラムをちょっとだけなおす.
とりあえずはこれで使えるだろう.
- ヒトに「教えさせる」のがうまい M1 大澤君が統計学質問
……
ぶんさんぶんせきぃ?
私があまり好きでないというかあまり得意ではないハナシだな.
まぁ,
勉強のつもりで検討してみるか.
ついでながら,
私がこれに negative な印象をもってる理由としては
-
前提がへぼい
-
それなのにそれらの上に細かいお作法体系が構築されている
-
前二者をよく理解してないヒトにかぎって
盲従状態で使っている→ゆーい差決戦主義者になる
- Tukey が ANOVA とゆーコトバを使い始めたときに,
それは(いろいろななんらかのカタチの) 線形モデル一般を
取り調べる手法体系を意味してたのではなかろーか
……
と憶測してるんだけど,
これを「広義の分散分析」とよぶなら,
こんにちこのぎょーかいで「分散分析」
と称されているシロモノは狭義のそれをさしている,
と言えるのかもしれない.
平均値そのものがホントに線形であり,
ばらつきは等分散の正規分布
(これは「誤差」と呼ばれてるが
……
どういう意味で誤差と呼んでいるかはいまいち意味不明).
この手法を使っているヒトたちに
「どうして正規分布なのか?」
「検定に使ってる F 分布は何をあらわすのか?」
といった質問をしてまともな答弁が返ってくる確率は低い.
- それはともかく
……
大澤君のすとらてじーとしては,
青木 R ペイジ
の便利そうな関数を使って,
とりあえずアタリをつけよう,
というもののようで.
で,
それを解読してるとかとー先生から
「そんなの使うのやめたほうがいいですよ」
との助言なので,
ほうりだしてふつーに R を使ってみる.
青木さんのは自分で関数つくるときとか
かなり
参考になるんだけどね
……
- で,
ふつーにやってもごく簡単にできるわけで.
obs <- scan("data.txt", sep = ",", list(x0 = 0, x1 = 0, y = 0))
obs$x0 <- factor(obs$x0) # 名義変数に変換
obs$x1 <- factor(obs$x1)
model <- aov(y ~ x0 + x1, data = obs)
summary(model) # 結果の表示
- 少し Sokal & Rohlf 本など調べてみて,
大澤データの場合は交互作用とやらを考慮せんといかんようで.
その場合は
model <- aov(y ~ x0 * x1 , data = obs)
とすればよい.
ということで午前中終了.
- 1230 北大構内走発.
晴.
1305 研究室帰着.
昼飯.
- 昼からも呪われ正規分布モデル談義.
かとー先生から mixed model とか使ったら,
という助言.
- これまた分散分析なヒトたちが
モノごとをわかりにくくするためだけにでっちあげてる
じゃーごんなんだけど,
-
fixed effect:
観測値の分布の平均にだけ影響をおよぼす効果
-
random effect:
観測値の分布の分散にだけ影響をおよぼす効果
-
mixed model:
fixed と random effect の両方を同時に考えるモデル
とゆーことになる.
私などは
「そういう分類なんぞやめて,
観測値が従う確率論的モデルを明示的に書いてしまって,
データからそういう『効果』なるものが
直接的に推定できるかどうかチェックしてみろ」
そっちのほうがよほどすっきりすると思うわけだが,
「変数変換すれば
世の中なにもかも等分散の正規分布になるに決まっています,
なぜなら以前からそうに決まっているからです,
そうなっていないとしたら現実のほうが間違っています」
なるわくぐみにかじりついてるこの方法論の世界では,
分散パラメーターだけをわかりにくくいじったりして,
ホントに気分わるくなる計算やったり,
とか.
- ということで,
午後の前半はあまり楽しくない世界を
私なりに理解しなおしてみようと努力してみる
……
自分がよく使っている推定計算法と
旧来の手法との互換性がどうなっているのか,
という問題はたしかに重要かもしれない.
- で後半は来週に提出されるべき
修論のデータ解析がまだぜんぜんできてません,
という昨日の問題のつづき.
一日たってもあまり進歩してない.
あいかわらず
「なぜそういうふうにデータをとったのか?」
というのがよくわかってないまま,
いいかげんなことをやってるな.
- 研究開始時点で了解しているべきことをいまさら
いちいち確認していたら
……
Trendy セミナー
を逃してしまった.
やれやれ.
- 「ちょっとこういう図を作ってみたら」
と言ったら 1 時間ちかくもかけてようやく作図してくる.
いったい何がどうなってるのかと元データファイルをみると
……
はい,
いつものごとく人力操作がほとんど不可能な
超巨大すぷれっどしーと
(しかもすごく sparse で扱いにくい)
の英雄的な手作業で
ようよう作図してるという情景.
何の工夫すらないゑくせりあんの末路はこういうものだ.
- うんざり度が飽和したので,
データの一部についてはこっちで解析する,
という強権発動
(でないと永久に終了しない).
で,
その腐れたシートから必要なところ
(ごく一部)
を切り出してもらって,
それをテキストファイルとして解毒.
- 私の計算機に転送.
もちろん私は自分もしくは他人の手作業データ処理の正確さなんぞは
まるっきり信用していないので,
まずは簡単な整合性点検プログラムにほうりこんでみる
……
さっそく切り出し操作ミスによる間違い発見.
- そういう過失なんぞは無視しつつ解析・作図してしまう,
とゆーのがゑくせるな「目で見て手で操作」
の正調なお作法だというのは重々承知しているので,
今さら何とも思わない.
こことここが変なので直してくれ,
と再発注.
また時間がかかる.
- とりあえず「すぐに見つかる間違い」のたぐいは
なくなったようなんで今日のところは撤退.
2130 研究室発.
2150 帰宅.
体重 73.6kg.
晩飯.
- 時間はないけど,
今晩はデータ解析とかやらない.
現時点では体力温存につとめるべきだろう
……
とかもっともらしい理由をつけてでれでれする.
いやはや.
- [今日の素読]
- [今日の運動]
-
北大構内走 1230-1305.
ストレッチング.
- [今日の食卓]
- 朝 (0840):
米麦 0.7 合.
ホウレンソウおひたし.
- 昼 (1320):
弁当.
研究室お茶部屋.
米麦 0.7 合.
ホウレンソウおひたし.
- 晩 (2200):
米麦 0.7 合.
ホウレンソウおひたし.
ネギ・カレイの味噌汁.
2003 年 01 月 30 日 (木)
- 0800 起床.
ひさしぶりに 8 時間ほど寝た.
朝飯.
コーヒー.
0900 自宅発.
晴.
0910 研究室着.
- なぜかぎょーむ日誌書きに時間がかかったり.
さらに昨日
apt-get install
した vim-common-6.1.265-0vl1 の
日本語文字処理にかなりひどいバグある
(この vl1 は使わないほうがよい).
あれこれ復旧にてまどる.
- 修論破綻問題のつづき
……
に着手しようとしたら,
ゑくせる図を大量にもってきたのでお茶部屋で検討.
これまた良く見るとほとんどすべてに間違いが見つかる.
いや,
ぜんぜん高等なハナシではなくて
「この条件では 3 個体しか調べてないんだろ
……
なんで 7 個体も図示されてるの?」
というようなゑくせる人力操作ミス由来のものばかりで.
ゑくせりあんの自滅とはえてしてこういうものだ.
これまたまったく驚く気にもなれない.
- すこしデータハンドラー書く.
北大構内走に出るかどうか迷う.
外は風雪.
肩こり気味なのでとりあえず出てみる.
1230 北大構内雪上ゴム長走発.
顔面ゆきまみれ・よたよた車両が見えない・歩行者の邪魔,
ということで 15 分で挫折して
1245 研究室帰着.
昼飯.
- 午後からこの樹木データ構造に対応したハンドラーの
Perl モジュール書き上げる.
動作試験.
こういうのを作ってると,
同じ内容を意味もなく
(しかもときとして不完全に)
copy してるスプレッドシート形式のデータ管理というのが
つくづく無駄ばかりで非効率のきわみにある,
と実感できる.
- 1600 からユニさん本審の D 論練習につきあう.
すでに 4-5 回おなじハナシを聞いてるのでもはやコメントなし
……
と思っていたら,
litter turnover の計算が少し妙だと気づいた.
練習会後に長谷川宣教師が「自分の論文が accept されたお祝い会」
とてこれまた自分で買ってきたケイキをいただきつつ
turnover 計算検討
……
ところが直感的にはアヤしいこのやりかた
(甲山さんがこれ使えといったらしい)
が正しいかどうか式の導出をやってみると
……
あらら,
それでじつは正解とわかってしまった.
まぁ,
そもそも平衡常態とかいう前提からしていんちきなわけで,
とくやしがってみる.
- 修論破綻問題は私ではよくわからない問題などが出てきたので,
A 棟 8F のあちこちをまわって専門知識もってるヒトたちに
いろいろと教えていただく
……
ってなんで私がこういうふうにどたばたせんといかんわけ?
- ともかくいろいろとご教示をいただいた結論として,
幸か不幸か苫小牧トドマツで観測されたシュート長さ成長に
「明るさ」(これまたうさんくさい観測値なわけだが)
が与えた影響の方向・大きさは識別困難,
と判定してよさそうだ.
乱暴に言えば「明るさ」無視.
このやや奇妙な「今回は観測されなかった因果関係」のおかげで
……
何をやってるのかよく考えないまま 2 年間観測してた
半端なデータセットのうち「死んでた」
過半数がようやく使いものになるのである.
Predictor の個数を減らし使えるデータを増やして一石二鳥.
- 明日はそのあたりを計算するということにして,
その準備のデータやりとり.
時刻はすでに 2100 すぎ.
- 腹も減ったから帰ろうとすると
「R
の中では℃という記号が出せないんですか」
と谷さんの
「できないんですか」攻撃.
こちらも売り言葉に買い言葉で
「そんなのできるに決まっているでしょう」
と言下に断言しておいてからどうやればよいのか調べる.
もちろんどうすれば「できる」のか知らないからである.
- ところで周りの研究者でもけっこう無頓着なヒトが多いんだけど
……
このぎょーむ日誌などで読めてる「℃」という記号は
特定の文字コードで定義されているのを使っているのであって
(たとえばここだと
ISO-2022-jp
つまりいわゆる生 JIS),
その文字コードに対応するフォントをインストールしてない計算機では
読めない.
つまり敵国語論文などで「℃」とか入力して
それを外国のヒトに送ってもいわゆる「もじばけ」
になって読めない
(Unicode では℃が
定義
されているんで,
将来はそういう不注意な書きかたも
通用するようになるのかもしれない).
- 文字コードばなしのついでに書くと,
お役人もしくはお役人的な連中の好む丸数字などは
機種依存文字
というやつらでさらにタチが悪い.
さきほどの℃などは JIS に対応するフォントがあれば
どの機械でも読めるわけだが,
機種依存文字というのは (実は「機種」というより)
特定の処理系だけで読めるからである.
- さて,
R の軸ラベルとかで℃を使うハナシにもどる.
ここでは「℃」など特定の国だけで使われている
文字コード定義文字は避けたいところだ.
20 分ほどかけていろいろ調べてみたり
かとー先生に R の文字列処理について教えていただいたりして,
解決をみた.
xlabel <- expression("air temperature 12"*degree*"C")
plot(1, xlab = xlabel)
xlabel <- expression("air temperature ("*degree*"C)")
plot(1, xlab = xlabel)
という出力される.
文字列のはりあわせには paste()
関数を使ってもよい.
- 今日もばたばたするばかりであったなぁ.
2245 研究室発.
2300 帰宅.
体重 73.4kg.
晩飯.
- [今日の運動]
-
北大構内走 1230-1245.
15 分で挫折.
- [今日の食卓]
- 朝 (0840):
米麦 0.7 合.
ネギ・カレイの味噌汁.
- 昼 (1300):
弁当.
研究室お茶部屋.
米麦 0.7 合.
ハクサイ・タマネギ・エリンギの炒めもの.
- 晩 (2320):
米麦 0.7 合.
いろいろな残りもので雑炊.
2003 年 01 月 31 日 (金)
- 0820 起床.
飯を作る気分になれなかったので
0830 自宅発.
地下鉄北 12 条駅横の北欧
(この
表
の上から 6 番目)
でバゲットなど買う.
曇.
0850 研究室着.
朝飯.
コーヒー.
- なんとなくぎょーむ日誌書きなどに時間を費してしまう.
しかし研究迷走を回避するためには重要ではないか,
と正当化してみたり.
- 修論破綻処理問題のつづき.
ぢりぢりとデータハンドラー書き
……
って昨日もやってたんでは,
と言われそうだけど
……
昨日のは一部データ用.
今日やってるのは (ほぼ) 全データ用.
- 隣の部屋のプリンター (LP-8200PS) が猛烈なる紙づまりになった,
というんで修理を試みる.
解体して搬送系内奥にかんでる紙を取り出そうと苦闘してると,
かとー先生がピンセットで器用に取り出してくれた.
おお.
ばらばらにした部品を元にもどす過程で
細線を一本切って途方にくれていると,
長谷川宣教師殿がちょー微細結線わざで修理してくれた.
おおお.
|
[「医療活動」中の宣教師]
かつてばてれん宣教師が
医療活動
を行っていたように,
当代の宣教師殿は印刷機修理に
熟練の技術を示すのであった.
切れてしまった細線を器用につなぎなおしたり,
とかですね.
|
ということで,
近くにはっかーたちがいるとあれこれ便利です.
宣教師殿は夕方にも
Linux → (postscript) →
LPD 化した Widows98 機 → (ESC/PageS) →
LP-2000C (color laser printer)
と接続する経路を作り出して,
悪辣なるエプソンの裏をかくという
ばてれん黒魔術を披露してくれたり.
- 昼飯くって午後からも呪われゑくせるファイル解毒ハンドラーの
作成のつづき
……
ゑくせりあんたちってのはむやみやたらと copy&paste
なる危ない手法を使いたがるくせに,
じゃあそれを徹底してやるかというとそうではなく,
数千個ほどセルがあればそのうち数十箇所ほどに
copy し忘れとかあったりする.
ハンドラーにファイルを読ませながら
点検してるときにそういうのが次々と見つかる.
そこで周囲の状況を判断させて正しい値を得る
……
というような「間違いさがし&直し」機構を
事例ごとに作っていかないといけないわけで.
これはつくづくイヤになる疲れさせられる作業だ.
ゑくせりあんたちはそういうデータ欠落の存在にすら気づいていない,
というのに.
- もちろん「周囲をみて修正」のできない間違いもぼろぼろと見つかる.
「このミスはどうやっても直せないか」
と判断されたものに関してはデータ入力者に確認して
データファイルに手を加える.
おっと,
記録をとっておかないと
……
ってなんで私がそこまでやらんといかんわけ?
- だんだん作業の進捗がおそくなる.
- Gnuplot 作図機構の Perl モジュール化作業を少しやったところで撤退.
2050 研究室発.
2110 帰宅.
体重 73.8kg.
修論太り.
晩飯.
- [今日の運動]
-
北大構内走にでるかと思ったら,
視界 5m の強烈な風雪だったので撤退.
- [今日の食卓]
- 朝 (0850):
研究室お茶部屋.
バゲット.
コーヒー.
- 昼 (1340):
研究室お茶部屋.
ベイグルサンドイッチ.
コーヒー.
- 晩 (2200):
スパゲッティー.
ハクサイ・シイタケ・豆腐の
……
カレー.
われながらよくわからん.