ぎょーむ日誌 2002-08-(21-31)
2002 年 08 月 21 日 (水)
- 0740 起床.
ねむい.
朝飯・弁当の準備.
朝飯.
コーヒー.
0850 自宅発.
曇.
0900 研究室着.
- (自分自身の)
起動状態がいまいちよろしくないけど,
またにせアカマツドラフトに取り組む.
- いやーな部分を構成上マシな位置に押しこんだので,
それについて説明をかいてみる
……
材積と D2H の間に線型相関がある
(というヘンなモデルも使いたくないんだが),
というのは誰が言いだしたことなのか.
ネット上で検索してみると使用例はいくらでも出てくるけれど,
出典はどこにもない.
そのへんひっくりかえして,
とりあえず JIBP 由来とする.
- もうちょいなんだが昼飯.
- 昼飯食ってると下野さんの
統計学 freeware の R の一般化線型モデル
glm
で logistic 回帰した結果についてのご質問
……
これがなかなか難しく,
かとー先生にもいろいろと調べていただいて午後いっぱい費した
詳細はまたいづれ.
- 今年は北海道にはこないのかとも憶測されていた
牧さん
が見える.
皆で歓迎.
晩飯を食べに出る.
- 2540 研究室発.
2550 帰宅.
- [今日の素読]
- [今日の運動]
- [今日の食卓]
- 朝 (0750):
米麦 0.7 合.
いまだに食べてるカレーの残り.
- 昼 (1240):
弁当.
研究室お茶部屋.
米麦 0.7 合.
朝と同じ.
カレー終り.
- 晩 (1930):
牧さん・下野さん・谷さん・小菅君と
地環研前焼き鳥屋「おばちゃん」でいろいろと.
2002 年 08 月 22 日 (木)
- 0940 起床.
いやはや.
0950 自宅発.
曇.
1000 研究室着.
- 昨日調べた統計学 freeware R
の挙動に関して,
ネット上の文書をいろいろと眺めてみる.
同じ S 言語で動く S-Plus 用の文書も有効である.
- なんとなく
Math::MatrixReal
をインストールする
……
なんとなんと,
Perl で「演算子上書き」という悪夢のごときワザが使えるとは知らなかった
……!!
標準ライブラリ,
use overload
.
- 世の中には
CPAN-Mac
などというものもあるらしい.
これまたすごいワザだ.
- いやはや,
一昨日
の「ぎょーむ日誌」がトんでたことに気づく.
生成機構のバグというか操作ミスだった.
fool-proof になってないなぁ.
なんともはらだたしい.
いらいらさせられる.
とりあえず「間違いにくくする」応急処置.
そのうち機会をみて
このあたりのシステムの安全性を改善しないとだめだな.
バックアップから失われたデータを完全復旧する.
ついでに
hosho
バックアップスクリプトの小さなバグも修復.
- 空腹になったけど昼飯の弁当がないので,
北大生協に買いだしにいく.
1440 かとーオフィス発.
ついでに図書館に本を返却する.
北大生協書籍部をふらふら.
「樹に咲く花
(合弁花・単子葉・裸子植物の巻)」
という図鑑を買う.
表紙中央に我が宿敵たる Abies
の枝分かれ構造がはっきり写ってる写真があったんで
……
Abies にかぎらず樹冠全体像のカタチがわかる写真が多く掲載されている
(特に針葉樹に関して).
|
[その図鑑から勝手に引用]
石槌山のシラビソだそーで.
|
それから例の
「空間データモデリング」
も買う.
1520 かとーオフィスにもどる.
- お茶部屋雑談などやっててなかなか本業にかかれない.
- 苫小牧の田中健太さんからメイルいただき,
来月に富良野の
東大演習林
で LTER の研究会があるんで参加しませんか,
とのご案内いただく.
参加してみることにする.
- 牧さん (すでに道北に移動)・下野さんとロジスティック回帰メイルあれこれ.
- 夕方すぎになって,
にせアカマツどらふとの続きを再開する.
あいかわらずぢりぢりたる進捗なれど
構成転換によってこの対象に関する最善説明法は確立しているんで,
気分的にはひどく楽だ.
言うなれば,
地図なき山岳地帯の踏破を終えて,
あとはひたすらに林道をくだり歩いてふもとの町をめざすばかり.
- 以前に書いた結果説明を再利用できるところまで合流して本日は撤退.
2100 研究室発.
2115 帰宅.
体重 72.0kg.
- 晩飯前に運動.
晩飯.
- 一般化してみた logistic な二項分布最尤推定って,
ぢつは案外かんたんに数値計算できるんじゃないの?
という昼間ふと思いついたアイデアを検討
……
Ek
= exp(-Σibixi,k)
として数式をヒネってみる.
-
最大化する対数尤度:
log(L)
= Σk=1N-M
log(Ek)
- Σk=1N
log(1 + Ek)
+ (定数項)
-
その偏微分:
Fi = ∂log(L)/∂bi
= -Σk=1N-M
xi,k
+ Σk=1N
xi,kEk
/(1 + Ek)
-
そのまた偏微分:
Gi,j = ∂Fi/∂bj
= -Σk=1N
xi,kxj,kEk
/(1 + Ek)2
おお,
なんかイケてますよ,
これは.
- [今日の素読]
-
NHK ラジオ「ビジネス英会話」
Lesson 21 ``Pet Care'' (8/19-8/23).
- [今日の運動]
-
腹筋運動 30 × 3 回.
-
自宅空自転車.
2145 より 28 分間 300kcal.
ストレッチング.
- [今日の食卓]
- 朝 (1020):
研究室お茶部屋.
コーヒーだけ,
か.
- 昼 (1540):
研究室お茶部屋.
パン 2 枚.
ブルーベリージャム.
コーヒー.
- 晩 (2240):
米麦 0.7 合.
モロヘイヤ・ナス・マイタケの炒めもの.
2002 年 08 月 23 日 (金)
- 0810 起床.
0815 自宅発.
曇.
0825 研究室着.
朝飯.
コーヒー.
- 朝からすごく眠い.
- しかしにせアカマツどらふとに取り組む.
まずは全体のみなおし
……
小林さんのオリジナルの Table と比べると,
値がいくつか欠けていることに気づいたので
Perl モジュール群を直してみる.
具体的にはデータ読みこみ
otc_data.pm
,
樹木個体生成 tree_initialize.pm
,
テイブルレイアウト latex_table.pm
とそのドライヴァー.
- 午前中はそれで終った.
時間は多少かかったけど,
まったく無理のないすっきりした追加工事というかんぢで.
Table もきれいに生成されるし.
昼飯.
- お茶部屋で明日のお祝いパーティの贈答品に関する相談を一時間ほど.
私の出した案はことごとく自己本位的であるとして却下されてしまった
……
- 英辞郎
の CD-ROM 版買ってしまった
……
このバイナリ辞書の規格は Linux では読めんやつだな,
ということでテキスト版辞書をとりあえず
Mac 経由で (テキスト版は Mac 用しかない)
ThinkPad240Z にいれる.
検索方法はあとから考えることにしよう.
まぁ,
いざとなれば自分で作ればいいわけだし.
- 午後もドラフト全体みなおしが続く
……
おっとここでダ=ヴィンチ本を引用しなければならない.
本日 Amazon.co.jp から届いた
``The notebooks of Leonardo da Vinci''
なるペイパーバックをぱらぱらとめくって探索
(さくいんがあまりしっかりとは作られていないんで).
あった.
173 ペイジ.
All the branches of trees at every stage of their height,
united together, are equal to the thickness of their trunk.
All the ramifications of the waters at every stage of their
length being of equal movement are equal to the size of
their parent stream.
そのあとになんか樹冠形状観察みたいな記述もあるねえ.
- ダ=ヴィンチ則からの逸脱とその修正モデルに関する
説明が抜けてたので書き直す.
- 1630 より
Trendy セミナー,
今日は東北大の小口理一さん
(この夏は苫小牧研究林に常駐).
植物を暗いところから明るいところにもっていくと
光合成機能が「明るいところむけ」に変わる光順化のハナシ.
このへんぜんぜん知識がなかったんで勉強になった.
しかし最大光合成速度 (これはすごーく明るいところで実現する)
の優劣でもって可塑性うんぬんを判定する
Pmax
決戦主義というのがよくわからなかったので,
そのへんをいろいろと質問.
1800 ごろ終了.
- 1930 小口さんお疲れ様会ということで 10 名ばかりで
札幌駅ちかくの飲み屋
魚魚丸
に.
大学から近いのはいいんだけど,
ここは値段が高い
……
- その後に研究室にもどったけど,
なんかバテた.
2220 研究室発.
2230 帰宅.
今日はこれでおしまい.
- [今日の素読]
-
NHK ラジオ「ビジネス英会話」
Lesson 21 ``Pet Care'' (8/19-8/23).
- [今日の運動]
- [今日の食卓]
- 朝 (0840):
研究室お茶部屋.
昨日の昼飯用に買ったパン.
コーヒー.
- 昼 (1240):
弁当.
研究室お茶部屋.
米麦 0.7 合.
モロヘイヤ・ナス・マイタケの炒めもの.
- 晩 (1950):
魚魚丸.
2002 年 08 月 24 日 (土)
- 0910 起床.
10 時間以上寝ちまった.
なぜかしらばててますなぁ.
シャワー.
朝飯.
コーヒー.
1010 自宅発.
今日も雨.
1020 研究室着.
- まだ眠くて起動状態よろしくない.
- にせアカマツドラフト,
また最初から読み直して説明欠落部をさぐって直していく.
- 1410 昼飯で一休み.
その後に明日の停電に備えて 5 台ある講座内共有 Linux マシンに
時限 shutdown 命令を出しておく.
明朝 0700 にいっせいに動作停止する設定.
- ドラフトの説明ギャップをうめていく作業を続ける.
書くのが遅いんで進捗は速くはない.
とはいえ
説明構造上の袋小路に入り込んでるわけではないんで,
書けばそのぶんススむのは有難いことだ.
- 1610 研究室発.
JR 札幌駅南,
西武地下の菓子屋
「六花亭」
で手土産となる品を購入.
1730 かとーオフィスにもどる.
かとー先生が来ておられるんで,
停電対策事項の確認をしてすぐに研究室発.
1745 帰宅.
むさくるしい風体をしてるような気がしたんで
シャワー使ってざっと体洗う.
- 1805 自宅発.
今宵は染色体研の長谷川さん・黒岩さんの結婚お祝いパーティが
下野亭で開催される
……
下野亭とは三人の女性大学院生,
下野さん・浦口さん・宮崎さん (演習林)
が仲良く暮らしている某マンション内一区画.
- 1815 下野亭着.
個室入口「じろじろのぞくな!」という貼紙におびえさせられる
……
1800 に集合ということだったんだけど,
やはりまだまだ準備の途中.
そもそも
明日の全北大停電対策のドライアイス
(試薬・標本などの冷蔵用) の配達が遅れに遅れていて,
ここの亭主も主賓たちもまだ研究室から帰れない状態で.
- ともあれ生春巻を作る手伝いなど.
そのうちに人々が集まりはじめる.
[とくに匿名希望する料理人]
|
[生春巻とか]
|
[海苔巻と鯛のカルパッチョ]
|
[宮崎さん作ケイキ&タルト]
|
- 1920 ごろ十余名が参集したので開会
……
楽しいおしゃべりはじつに 2400 すぎまで続いて,
まぁこんなところにはとうてい書けないことばかりだったんだが
……
あえて言えば「本日の絶好調」はかとー先生でしょうか.
という二条件が満たされた状況における
この著名なるはっかーの挙動はもー
……
やっぱり書けないな.
- 2510 下野亭を辞す.
2520 帰宅.
- [今日の素読]
- [今日の運動]
- [今日の食卓]
- 朝 (1030):
パン.
- 昼 (1430):
研究室お茶部屋.
パン.
- 晩 (1920):
下野亭パーティ.
2002 年 08 月 25 日 (日)
- 1100 起床.
なんかどんどん時差が生じているような.
本日は北大停電.
貧乏なので電気代が支払えないんだろう.
- でれでれして昼飯のそうめん食ってからようやく仕事にとりくむ.
外は雨.
- まぁ,
いまさらあわててもしょうがないか,
ということで結果説明をゼロから書き直していく.
- 雨もやんできたようなんで
1830 自宅発北大構内走.
ちょっと小雨ぱらつく.
北大内は電力回復してるもよう.
走ると上半身もけっこう動かすんで肩こりが治る.
1930 帰宅.
脚冷却.
シャワー.
体重 72.2kg.
む,
金曜土曜のごちそう太りか?
- 1950 自宅発.
2000 研究室着.
ルーター・DNS サーヴァー・Web サーヴァー起動.
いちおうネットは北大の外につながっている.
研究科のメイルサーヴァーはまだ寝たまま.
- 空腹.
ぎょーむススまん.
2220 研究室撤退.
2230 帰宅.
- お,
寒天よせうまくできたな.
晩飯の準備.
晩飯.
寒天.
|
[パイナップル寒天よせ]
パイナップルは缶詰もの.
成形には炊飯器釜を使った.
高さ約 10cm.
巨大.
材料代約 200 円.
|
- [今日の素読]
-
NHK ラジオ「ビジネス英会話」
Lesson 22 ``Volunteer Families'' (8/26-8/31).
- [今日の運動]
-
腹筋運動 30 × 3 回.
-
自宅発北大構内走 1830-1930.
ストレッチング.
- [今日の食卓]
- 昼 (1345):
そうめん.
- 晩 (2330):
米麦 0.7 合.
モロヘイヤ・ナス・タマネギ・ニンニク・卵の炒めもの.
2002 年 08 月 26 日 (月)
- 0715 起床.
0720 自宅発.
晴.
あ,
ゴミ出すの忘れてた.
引き返す.
0730 も一度自宅発.
0740 研究室着.
朝飯.
- やはり (主観尺度で) 早起きすると眠い.
にせアカマツどらふとの pruning サブモデルの説明を部分的に修正.
計算結果説明書き直しの続き.
- 書き直しはぢりぢりとススむけど,
1030 ごろには早くもすでに体力切れ.
眠い.
お茶飲んで一休み.
- 計算結果説明の最後で詰まる.
8 個体の挙動は個体ごとに推定された
growth_rate
なる値によっておおむね決まっているんだけど,
曝露実験個体の中に
growth_rate
はとても高いのに成長がとてもヘボい個体がある.
観測データをながめてみると,
その問題個体 (実験処理区二号)
だけがえらく寸づまりな stem
ばかりを作ってるので (これは遺伝的な何かではないのかなぁ),
ま,
そのあたりで説明つくだろうと考えていた.
- ところが重量変化をもうちょっと定量的に調べてみると,
これはそれほどもっともらしくない説明だとわかった.
なにしろ寸づまりなのをむやみに大量に作っていやがるんで.
えーい.
- 打開策もないので昼飯.
- 昼飯後に北大生協に買い物にいく.
道中,
にせアカマツ図表を眺めつつ考える
……
あ,
わかった.
実験処理区二号は寸づまりな
stem
をたくさん作っているけれど,
それら個々の stem
の
成長速度 stem.growth_rate
もすごくヘタれているように見える.
買い物すませてかとーオフィスにもどって,
個々の stem
の成長速度の図にその平均値 (いやはや)
をいっしょに表示するように作図機構を修正
……
正解.
- やはり実験処理区二号を構成する
stem
の
stem.growh_rate
は遅いものばかりで,
全 8 個体 (ってのもサビしいところだが) の中でも最悪.
つまりにせアカマツの基本部品たる stem
を粗製乱造してみても個体重量の増大にはつながらないという計算結果だ.
- ということで,
私だけで書いていける部分はひととーり終った.
make pdf
して小林さんに見ていただくことにする.
時刻は 1430.
ふう.
- なンか正気とは思えぬポスターが郵送されてきたのですぐに捨てる.
- アカマツどらふとに関する応答を待つあいだに,
先日考えた (線形の範囲で) 一般化した logistic 関数の
二項分布最尤推定問題を Perl スクリプトで解かせる問題,
というのに取り組んでみる.
- 前後よく考えずに,
とりあえず
logistic.pm
という Perl モジュールを書き始めてみる.
- やはりすぐに行き詰まってしまったので,
そのへんをのそのそ歩き回ったりソファにひっくりかえったりしてるうちに
アタマの中が整理される.
計算部分だけを package 化するのではなく,
データ格納する部品を class として定義
(といっても依然として package に他ならないんだが)
してやると計算量が節約できるとわかった.
- もう一度とりくんでみる.
- ぢりぢりと書きすすめて
偏微分ヴェクトル・偏微分逆行列の計算するところまでは書けた.
つまり Newton-Raphson 法の 1step 内だけができたということ.
- ここから先に行くにはまず
Math::MatrixReal
の
マニュアル
を読まねばならない.
今日のところは撤退.
1910 研究室発.
北 12 生協で買い物.
1930 帰宅.
- それほど空腹ではないんで自宅空自転車運動 30 分間.
発汗.
シャワー.
体重 72.4kg.
うーむ,
体重はまったく変化してない.
食べる量を減らさないとダメなのかなぁ.
なかなかそれは難しそうだ.
- 晩飯が炊けるのを待ちつつ上記
Math::MatrixReal
のマニュアル読む.
これはなかなかうまく作られている.
ふーむ.
- 晩飯.
- [今日の素読]
-
NHK ラジオ「ビジネス英会話」
Lesson 22 ``Volunteer Families'' (8/26-8/31).
-
同テキスト今日の``Quote ... Unquote'':
Ask, and it shall be given you;
seek, and ye shall find;
knock, and it shall be opened unto you.
--- The Bible (New Testament, Matthew 7:7)
- [今日の運動]
-
腹筋運動 30 × 3 回.
-
自宅空自転車.
1950 より 30 分間 300kcal.
ストレッチング.
- [今日の食卓]
- 朝 (0750):
研究室お茶部屋.
パン.
コーヒー.
- 昼 (1210):
弁当.
研究室お茶部屋.
米麦 0.7 合.
モロヘイヤ・ナス・タマネギ・ニンニク・卵の炒めもの.
- 晩 (2120):
米麦 0.7 合.
コマツナ・ピーマン・エノキダケの炒めもの.
2002 年 08 月 27 日 (火)
- 0715 起床.
0720 自宅発.
曇.
0730 研究室着.
朝飯.
コーヒー.
- CPAN Perl モジュール
Math::MatrixReal
(version 1.8)
の性質を調べる.
こいつのリファレンスは
[ 無名行列のリファレンス, raw 数, column 数]
として保持されている.
- 来月初頭の苫小牧毎木調査案内をいただく.
たまには野外勤労奉仕しますかね.
- 一般化線型 logist 関数の二項分布最尤推定モジュール
logistic.pm
書いてそのテストドライヴァーも書く.
う.
やはり,というか計算してくれん.
時刻は 1020.
- 1200,
少なくとも 2 パラメーターモデルに関しては
推定試験がだいたいうまくいくようになった
……
しかし,
意外と推定誤差が大きいなぁ.
- 試験運転あれこれ.
|
[標本数 100 の場合]
赤線がホントの曲線で,
青線たちがそれぞれ独立同分布な二項試行の標本から
最尤推定されたもの.
標本は [-5, 5] に等間隔に配置されてる
(ひじょーに理想化された標本).
けっこうばらつくようだ,
ということで.
憶測するに「両端」におけるふらつきに
敏感なんだろうな.
|
./test_logistic.pl
0: log_likelihood = -6.9315e+01, parameters = 0.00e+00 0.00e+00
1: log_likelihood = -3.5367e+01, parameters = 1.32e-02 5.35e-01
2: log_likelihood = -3.0535e+01, parameters = 3.38e-02 8.33e-01
3: log_likelihood = -2.9666e+01, parameters = 4.98e-02 1.02e+00
4: log_likelihood = -2.9614e+01, parameters = 5.50e-02 1.08e+00
5: log_likelihood = -2.9613e+01, parameters = 5.54e-02 1.09e+00
6: log_likelihood = -2.9613e+01, parameters = 5.54e-02 1.09e+00
真の値 = (0, 1)
- Newton-Raphson 法つかってる.
Perl で計算やらせてるんだけどけっこう速い.
標本数 100 の 2 パラメーター問題なら 0.5 秒ぐらいか
(Celeron 500MHz).
パラメーター数を N 倍にすると計算時間は
N2 倍になってしまいそうだけど.
- とゆーことで,
Perl スクリプト中から
use logistic
でお手軽に最尤推定できるよーになった.
事象の生起する確率
Prob = 1/(1+exp(-Z))
(これは上の図みたいな曲線),
この Z
は
Z =
b0 x0
+ b1 x1
+ b2 x2
+ …
+ bi xi
+ …
とゆー線形の式であればどんなものでもよい
(上の図は Z = b0 + b1 x
).
- 昼飯.
- 昼飯後に
logistic.pm
の入出力を手直ししたり対数尤度を計算させるようにしたり.
ところで,
このモジュールってあの面倒な
MacJPerl
で動くんだろうか?
- 1500 次に進む準備として
binset.pm
なる二進数を取り扱う Perl モジュールを作ってその試験運転終了.
./test_binset.pl
0 0 0 0 0 (total: 0)
0 0 0 0 1 (total: 1)
0 0 0 1 0 (total: 1)
0 0 0 1 1 (total: 2)
0 0 1 0 0 (total: 1)
0 0 1 0 1 (total: 2)
0 0 1 1 0 (total: 2)
0 0 1 1 1 (total: 3)
0 1 0 0 0 (total: 1)
...
というかんぢで.
- これを使って処理の組み合わせを
生成するようなプログラムを書き始めてから
……
いやはや二進数による組み合わせ生成ではダメだと気づく.
{{1, 3, 5}, 2, 4}
とかいうのだけならいいけど
{{1, 3}, {2, 4}, 5}
ってのもありうるからなぁ.
うーむ.
時刻は 1600.
- しばらく考えてみる
……
計算量を最小化した「総あたり戦」しかなさそうだ.
比較すべき処理群は 5 つで 1 曲線あたりのパラメーター数は 2 個なんで
……
最良の 10 パラメーターモデル v.s.
最良の 8 パラメーターモデル v.s.
最良の 6 パラメーターモデル v.s.
……
と比較していくほかあるまい.
「単純化」可能なところまで.
- 尤度バトルをやらせるデータ構造を定義していく
……
とりあえず,
最良の 10 パラメーターモデルを生成させるところで息切れ.
- 土曜日の下野亭パーティの主賓たる長谷川夫妻がかとーオフィスに見える.
皆さんと話していていろいろと判明したんだが
……
たとえば
当日絶好調だったかとー先生はあまりにも激しく酔っ払ってしまって
何も覚えていないとのこと.
あるいは
この大先生も主賓長谷川さんも翌日曜日はずっと倒れていたとか
……
- モデル屋・計算業者ばかりが暴走してもしょうがない,
というのは常に正しい教訓であるので,
いったんコード書きを打ち切り,
お茶部屋で発注者・下野さんに現状報告を行い,
計算のやりかたと全体の構想を説明してみる.
その場でかとー先生もコメントをいろいろと.
おかげで「総あたり戦」計算法の考えが整理されてきた.
- 今日はここまで.
おっと,
小林さんからにせアカマツどらふとに関する素早いコメントが.
大量にあるのでこれも明日だ.
2020 研究室発.
2030 帰宅.
体重 72.4kg.
うーむ.
- 運動.晩飯の準備.晩飯.
- [今日の素読]
-
NHK ラジオ「ビジネス英会話」
Lesson 22 ``Volunteer Families'' (8/26-8/31).
-
同テキスト今日の``Quote ... Unquote'':
Be daring, be first, be different.
--- Ralph Waldo Emerson
(U.S. philosophier, poet and essayist, 1803-82)
- [今日の運動]
-
腹筋運動 30 × 3 回.
-
自宅空自転車.
2020 より 30 分間 300kcal.
ストレッチング.
- [今日の食卓]
- 朝 (0745):
研究室お茶部屋.
パン.
コーヒー.
モロヘイヤ・ナス・タマネギ・ニンニク・卵の炒めもの.
- 昼 (1240):
弁当.
研究室お茶部屋.
米麦 0.7 合.
コマツナ・ピーマン・エノキダケの炒めもの.
- 晩 (2210):
米麦 0.7 合.
ピーマン・ニラ・タマネギ・鶏レバの炒めもの.
たまには鉄その他補給ということで鶏レバ.
2002 年 08 月 28 日 (水)
- 0720 起床.
シャワー.
0735 自宅発.
曇.
0745 研究室着.
朝飯.
コーヒー.
- 昨晩に小林さんから詳細なるコメントいただいたんで,
それにしたがってにせアカマツドラフト直す.
作図・作表が自動化しておくとこういうときにラクだ.
1120 ひとまず終了.
- すでにややばて.
Amazon.co.jp から本がとどく.
- あらら,
弁当を持って来るの忘れてた.
食べに帰る.
1245 かとーオフィス発.
1255 帰宅.
洗濯物干す.
昼飯.
1315 自宅発.
いきなり雨.
1325 研究室着.
- 来週月曜日から 2-3 日ほど苫小牧研究林で
毎木調査の下働き要員の辞令を
調査隊長・浦口さんから拝命する.
- logistic 関数をもちいた二項分布最尤推定,
その組み合わせモデル選択という計算問題解決の追撃戦にとりかかる.
各処理群の 2 (あるいは 3) パラメーター最尤推定値を計算し,
つぎにこれらの群のいくつまでを共通のパラメーターセットで
「くくって」
いけるかを自動的に調べあげる機構を作ってしまえばよい.
- 各処理群 N パラメーターの最尤推定を行い,
群は
{A, B, C, D, E}
の 5 コあるとすると,
たとえば
5 N 個パラメーターモデル |
{A} {B} {C} {D} {E} |
→ あてはまりの良さ I5N |
| ↓ |
最良の 4 N 個パラメーターモデル |
{A+C} {B} {D} {E} |
→ あてはまりの良さ I4N |
| ↓ |
最良の 3 N 個パラメーターモデル |
{A+C} {B} {D+E} |
→ あてはまりの良さ I3N |
| ↓ |
| …… |
……
というふうにどこまでパラメーター数を減らしていけるのだろーか,
というのを「あてはまりの良さ」を評価しつつ進む・止まるを決める.
- 昨日作った推定 Perl モジュール
logistic.pm
を呼び出しつつ
上のような逐次的な探索を行う group_combination.pm
という Perl モジュール (の原型となるもの)
を作る.
以前に似たよーな
問題
やったときは,
この「組み合わせ自動生成」が作れなかったんだよね.
問題解決力,
少し強まった.
- 1630 パラメーター 10 個問題できた.
数値計算そのものは「同じ計算は二度とやらない」
という方針を徹底させてるんで
完全なる「総あたり戦」をやらせてるんだけど遅くはない.
おあずかりした観測データ 5 群に対して
それぞれ 2 パラメーターを使用,
AIC をモデル選択基準とする選抜を重ねてみると
……
この場合は,
とあるパラメーター 8 個セット
がこの基準に照らして「最良」ということになった.
で,
この計算に要する時間も 1-2 秒ぐらいか?
-----------------------------------------------------------------
# model_group = F1,F2,S1,S2,S3
number_of_parameter = 10
log_likelihood = -9.0332e+01
AIC = 2.0066e+02
[F1]
log_likelihood = -1.5421e+01, parameters = -7.28e+00 3.98e-01
[F2]
log_likelihood = -1.9849e+01, parameters = -7.19e+00 3.47e-01
[S1]
log_likelihood = -1.7984e+01, parameters = -6.66e+00 3.26e-01
[S2]
log_likelihood = -2.0512e+01, parameters = -5.88e+00 2.73e-01
[S3]
log_likelihood = -1.6566e+01, parameters = -1.13e+01 5.20e-01
-----------------------------------------------------------------
…… (中略) ……
-----------------------------------------------------------------
# model_group = F1,F2+S1,S2+S3
number_of_parameter = 6
log_likelihood = -1.0459e+02
AIC = 2.2117e+02
[F1]
log_likelihood = -1.5421e+01, parameters = -7.28e+00 3.98e-01
[F2+S1]
log_likelihood = -3.8082e+01, parameters = -6.92e+00 3.36e-01
[S2+S3]
log_likelihood = -5.1083e+01, parameters = -7.68e+00 3.56e-01
-----------------------------------------------------------------
#the best model set is
-----------------------------------------------------------------
# model_group = F1,F2+S1,S2,S3
number_of_parameter = 8
log_likelihood = -9.0581e+01
AIC = 1.9716e+02
[F1]
log_likelihood = -1.5421e+01, parameters = -7.28e+00 3.98e-01
[F2+S1]
log_likelihood = -3.8082e+01, parameters = -6.92e+00 3.36e-01
[S2]
log_likelihood = -2.0512e+01, parameters = -5.88e+00 2.73e-01
[S3]
log_likelihood = -1.6566e+01, parameters = -1.13e+01 5.20e-01
-----------------------------------------------------------------
- 発注者・下野さんに計算結果のご説明
……
するとこんどはパラメーター 15 個問題の追加注文.
- 1720 パラメーター 15 個問題できた.
逐次探索の部分
group_combination.pm
は完全にモジュール化させるて汎用性を付与する.
- 読みにくい部分を書き直したり,
ネット上から Perl コード読めるようにしたり.
2020 研究室発.
雨はやんでいる.
北 12 生協で買い物.
2040 帰宅.
体重 72.2kg.
- 運動.
晩飯の準備.
晩飯.
- [今日の素読]
-
NHK ラジオ「ビジネス英会話」
Lesson 22 ``Volunteer Families'' (8/26-8/31).
-
同テキスト今日の``Quote ... Unquote'':
Control your own destiny or someone else will.
--- Jack Welch (U.S. business executive, 1935-)
- [今日の運動]
-
腹筋運動 30 × 3 回.
-
自宅空自転車.
2150 より 28 分間 300kcal.
ストレッチング.
- [今日の食卓]
- 朝 (0800):
研究室お茶部屋.
パン.
コーヒー.
- 昼 (1300):
自宅で弁当.
米麦 0.7 合.
ピーマン・ニラ・タマネギ・鶏レバの炒めもの.
- 晩 (2230):
米麦 0.7 合.
コマツナ・ピーマン・エノキダケの炒めもの.
2002 年 08 月 29 日 (木)
- 0710 起床.
0715 自宅発.
曇.
0730 研究室着.
朝飯.
コーヒー.
- 眠くて眠くて起動状態よろしくない.
ふちょーなので果てしない
literate programming
議論などでれでれと追跡する.
- 昨日ひととーり片づいた問題用の
Perl モジュール
logistic.pm
と group_combination.pm
の内容をちょっと整理する.
- 早めの昼飯.
1215 かとーオフィス発.
曇.
1225 北大・高等教育機能開発総合センター
(とたいそうな名前がつけられてるけれど
これは旧教養部のお役所的別名)
着.
今日はここで大学院入試のカントクやらねばならんのだよね.
- 準備室で回答用紙など点検.
大げさなことに時計あわせまでやらされる.
1245 あれこれ一式もって試験会場に移動.
生態環境科学専攻の受験者 48 名,
欠席者 1 名.
- カントク用の腐れ手引書に書かれている注意事項を伝達してるとちょーど時間に.
1300 専門科目試験開始.
細胞生物学・分子遺伝学……植物生態学・一般統計学などなど
13 科目ある中からふたつ選んで回答せよということになっている.
これが 1600 まで延々と続く.
- 3 時間もカントクやってたら退屈でしょうがないだろう,
と思ってたんだけど
……
これが意外と忙しいような気がした.
しょっちゅう手があがって
「この問題文の意味わかりません」
「回答用紙もう一枚ください」
「試験は何時まででしょうか」
「途中退出可能でしょうか」
などなどと質問・要請が次々と出るんだよね.
- 時間つぶし内職用の紙切れを準備していたんだけど,
専念できそうになかったので,
専門科目の試験問題の脳内回答を試みる
……
生態学とかあるいは統計学その他 (知識を問うとゆーより)
考えれば回答できるのは,
まぁ何とかなる.
分子生物学・生理学はもはやかなり怪しい
(私はいちおー生物学専攻の理学博士のはずなんだが).
化学はまるでわからん.
- などと考えつつも 10 秒おきぐらいに会場みまわして
誰か挙手してないか点検しないといけないんで
……
考えごとは 10 秒未満で断ち切られるわけだ.
- 体感時間経過速度としてはおそらく受験生と同じ尺度で
3 時間が経って 1600 試験終了.
回答用紙・問題用紙・草稿用紙を回収して
受験生には退出してもらう.
準備室で回答用紙を科目ごとに束ねて,
受験者名・受験番号が見えないように表紙をつけてヒモでくくって
封印を押す
(つまり採点者には回答内容しか見えない).
これでカントクぎょーむおしまい.
- 1640 なんちゃらセンター発.
もうひとりのカントク野水さん (資源化学) と雑談しながら
地環研までもどる.
- で,
このあとなんだが
……
カントクばてというべき状態で仕事はススまなかった.
体力的にばててるんではなく
脳内ホワイトアウト的なばて.
なんというか口頭発表を一時間ぶっとおしでやったよーなかんぢで.
- 今日は撤退.
1840 研究室発.
JR 札幌駅南に行って ATM で現金を下ろす.
そのへんふらふらと歩いて
2000 帰宅.
体重 72.2kg.
- 晩飯など.
- ばてから復旧しないのでさっさと寝ようとするんだけど,
なぜかなかなか眠れない.
- まぁ,
私などは大学雑用が少なくて助かってるわけだが
……
ともあれ試験カントクというのは今後も押しつけられるぎょーむだろうから,
何かばてない工夫が必要ではあるな.
- [今日の素読]
-
NHK ラジオ「ビジネス英会話」
Lesson 22 ``Volunteer Families'' (8/26-8/31).
-
同テキスト今日の``Quote ... Unquote'':
The harder you work, the luckier you get.
--- Gary Player (South African professional golfer,
1935)
- [今日の運動]
- [今日の食卓]
- 朝 (0740):
研究室お茶部屋.
パン.
コーヒー.
- 昼 (1145):
弁当.
研究室お茶部屋.
米麦 0.7 合.
コマツナおひたし.
- 晩 (2130):
米麦 0.7 合.
ホウレンソウ・タマネギ・シイタケの炒めもの.
2002 年 08 月 30 日 (金)
- 0830 起床.
どうもいまいち.
シャワー.
0840 自宅発.
曇.
0850 研究室着.
朝飯.
コーヒー.
- 昨日のぎょーむ日誌をほとんど書いてなかったんで,
でれでれと書く.
今日の午前中は口頭試問あるんだけど,
下っぱは出なくてよいでしょうという理由で怠業する予定.
その準備だけは昨日のうちにあれこれと.
- 0955 やはり雪野さんがその件に関してかとーオフィスに来られたんだけど,
あーだこーだ言って難を逃れる.
- 1030 から 1230 まで某あやしげ財団に金をせびる紙切れを準備する.
金額としは 20-30 万円だし使えるのは来年度からだけど,
9 月中に採否が決まるんで今後の見通しがたちやすいだろう,
というようなかんぢで.
- ひとまず片づいたので昼飯.
PD 石井さんの研究費に余剰が生じつつある公算大,
との情報に接したので,
無一文な私としてはそれを横取りしようという計画を考える.
- 午前中に書いたあやしげ作文には研究科長 (ま,学部長ごときもの)
のハンコが必要らしいんで,
雪野さんのお手をわずらわせて取ってきていただく.
封筒の宛名がきで漢字が手書きでは書けなくて苦労する.
- かとー先生と相談しつつ,
石井さんに無心する本の一覧というのを作っていく.
- 1500-1830,
お茶部屋で下野さんと (言うところの)
logistic 回帰の問答.
いろいろと自分で調べた下野さんのココロの中にある
logistic モデル像の説明とそれへの質問でナゾの部分を解明していこう
とゆー試み.
「わからない」という状況からも逃げ出さない下野さんの粘り,
かとー先生・石井さん・谷さんたちの
適切な合いの手によって当方はたいへんに勉強になった.
そう,
おそらく私がもっともトクをしている.
- で,色々なことがわかってきたんだが
……
たとえば統計学ソフトウェアに「ロジスティック回帰」をやらせると,
尤度比検定による帰無仮説との比較があるのは当然として,
個々の推定値にもイヤらしい p 値が計算されている.
これは何の計算しているのか?
……
皆で調べてみると Wald 検定だということがわかった.
- これは何らかの方法で推定値の誤差を評価してやり,
それで標準化した最尤推定値は
これまたイヤらしい標準正規分布に漸近する
(帰無仮説のもとでは),
という性質を使ってるんだね.
ということで,
ある仮定のもとで個々のパラメーターが N(0,1)
からの標本になってそうかどうかを見ている.
他のパラメーターとは完全に独立であると仮定してるわけね.
- さらに面白いのは,
この Wald 検定は
尤度方程式全体を評価している尤度比検定と漸近的に一致
……
ふーむ.
- S 言語つかった S-Plus だの R だのでは,
対比行列 (contrast matrix)
という概念が重要になってくる
……
というところまでわかったんだけど,
この対比行列なるものの全容は解明しきれなかった.
今後の課題とゆーことで.
- SAS 系ソフトウェアでは飽和モデル (saturated model)
との尤度比が計算される
……
これは,
言わば「これ以上パラメーター数を増やせない」
というところまでパラメーターを増やしたモデルで,
ここからどこまで減じていけるかを見るわけだ.
- ……
というような問答で午後が終ってしまった.
統計学問答ばて.
1850 研究室発.
1900 帰宅.
体重 72.4kg.
うーむ.
- ばて.
- [今日の素読]
-
NHK ラジオ「ビジネス英会話」
Lesson 22 ``Volunteer Families'' (8/26-8/31).
- [今日の運動]
- [今日の食卓]
- 朝 (0900):
研究室お茶部屋.
パン.
コーヒー.
- 昼 (1240):
弁当.
研究室お茶部屋.
米麦 0.7 合.
- 晩 (2130):
パン.
2002 年 08 月 31 日 (土)
- 1030 起床.
ばて.
シャワー.
1120 自宅発.
曇.
1130 研究室着.
朝飯.
コーヒー.
- 1210 かとーオフィス発.
北大図書館.
北大生協書籍部 (土曜日は 1400 まで).
クラーク館地下の理髪店でひさしぶりにというか
よーやくというかぼさぼさの髪の毛を切る.
この店はみょーに時間をかけて丁寧にやるんだよね.
50 分ぐらいか?
2650 円.
- とはいえ,
うっとうしい髪が短くなったのですっきり.
1450 研究室帰着.
- とくに匿名希望する料理人氏がなんちゃら海産食材財団とかに
食材購入助成金を申請する書類を書いたんで添削してくれ,
なるメイル送ってきたんで読んでみる
……
これは金よこしやがれ作文としては
「即座にゴミ箱行き」
の水準だ.
- そういう順当な結果になるのも自業自得,
おおいにけっこうという気もするんだが,
北大周辺にたむろする嘘つきの嘘つき能力が
この程度だと思われるのもしゃくだ.
職業的な虚言創作者としては看過しがたい.
- ということで,
どうやってウケを取るのか,
金づるをどうやっておだてあげるのか,
先方がぎょーむ上必要としてる作文はどういうものか
……
といったあたり修正例をあげて解説するメイルを書く.
- あとでとある大学院生に,
料理人氏がこんなまぬけ作文をよこしたんで,
金せびり虚言はこうやって創作しろと説明しましたよ,
というのを話したら
……
かかる嘘つき作法の骨格なす発想をただちに喝破されてしまった.
かなり驚く.
- 夕方になってから昼飯など.
- ぎょーむ日誌など書いててぎょーむ進まず.
2140 研究室発.
2150 帰宅.
体重 72.2kg.
- 明後日から苫小牧野外勤労奉仕なんで,
さっさと仕事しないといけないんだが
……
進捗よろしくない.
- [今日の素読]
-
A.C. Clark. 1982. Transit of Jupiter,
in ``2010: Odyssey two''.
Del Rey Book.
- [今日の運動]
-
腹筋運動 30 × 3 回.
-
自宅空自転車.
2400 より 40 分間 400kcal.
ストレッチング.
- [今日の食卓]
- 朝 (1140):
研究室お茶部屋.
パン.
ハクサイ・ピーマン・シイタケ・マイタケの炒めもの.
- 昼 (1630):
朝と同じ.
- 晩 (2230):
米麦 0.8 合.
朝と同じ.