ぎょーむ日誌 2003-06-(01-10)
2003 年 06 月 01 日 (日)
-
0900 起床.
雨か.
朝飯.
コーヒー.
-
午前中は何ゴトもなく
1200 自宅発.
雨.
1210 研究室着.
-
粕谷さんメモへのコメント作成にとりくむ
……
1430 とりあえず思いついたことを列挙できたんで,
そのまま送信してみる.
ふう.
ひと休みして昼飯.
-
次.
小川さん
のカテゴリカル統計学問題にとりくむべく,
どろなわで
Alan Agresti
の教科書をよんでみる.
この方面にはかなりうといもんで.
-
このヒトの教科書としては
-
カテゴリカルデータ解析入門
(2003;
原著は
An introduction to categorical data analysis, 1996)
-
Categorical Data Analysis, 2nd edition
(2002)
1. の (ICDA) は自分ではもってないので,かとーさんに借りた.
2. の (CDA) は買ったんだけどまだ読んでない.
で,両者を比較してみると
-
ICDA は CDA 1st edition の数式部分などを簡単にして,
例や歴史的経緯を追加したもの
-
CDA 2nd edition は ICDA で追加した内容を
CDA に反映させたもの
という関係にあるようだ.
たいていのヒトにはとりあえず ICDA があれば十分だろう.
-
A 棟 8F にはなぜかソファ
(あちこちから拾われてきたもの)
が 3 脚もあるので,
それのうちひとつにひっくりかえって ICDA を読んでいく.
-
なかなか良く書けている教科書
……
アタマから読んでいくと,
あのナゾにみちた分割表 (contingency table)
がどのような統計モデルを仮定しているのか,
というのがうまく説明されている.
そうそう,
こういうふうに「何がどういう確率で」
ってのを説明してくれれば理解しやすいんだよなあ.
一般的な推定方法との対応もつく.
-
伝統的なる分割表を用いた検定とかは
意味不明な儀式的操作ばかりやってるように思っていた
……
Fisher の正確確率検定とか
「なんで可能な table が全て等確率で出現しうるの」
とかいうあたりがよくわかっていなかった.
じつは周辺分布の制約のもとで
「等確率で出現するような」
table についてだけ調べていたわけね.
で,
あとは
小サイズ標本における確率計算と
大サイズ標本における近似計算の対応をつけて,
と.
-
カテゴリカルデータ解析の歴史について
ごく簡単に述べた最終章は必読である.
Pearson-Yule 論争,Pearson-Fisher 論争といった
もめごとの経緯を通してこの分野において何が重要なのかが
うきぼりになってくる.
大 Pearson (つまり親父のほう)
が今から 100 年ほど昔にところかまわぬ
大人げないケンカにはげんでいたのはじつに歴史的偉業だったんだなぁ
……
ケンカ売られたり恫喝されたりしたヒトたちにとっては
ひたすらにはた迷惑であったんだろうけど.
-
Pearson のケンカに興味あるヒトは
統計学けんか物語
(1989, 安藤洋美, 海鳴社)
をどうぞ.
すでに絶版のようだけど.
-
ようやく基本がわかったばかりではあるが今日はもう帰りますかね.
2000 研究室発.
雨.
2020 帰宅.
晩飯.
-
[今日の運動]
-
[今日の食卓]
- 朝 (0920):
スパゲッティー.
タマネギ・ニンニク茎・ホタテのトマトソース.
- 昼 (1440):
研究室お茶部屋.
「北欧」バゲット.
- 晩 (2150):
米麦 0.9 合.
コンブ納豆.
ネギ・ブナシメジ・豆腐・煮干の味噌汁.
2003 年 06 月 02 日 (月)
-
0800 起床.
朝飯.
コーヒー.
0900 自宅発.
曇.
0910 研究室着.
-
うるしかぶれはすっかりよくなりました.
おかげさまで.
-
粕谷さんメモを昨日読んでたときに
「overdispersion をモデル化する
ベータ二項分布ってのがアリなら,
logit 正規分布ってのも存在するんでは
……
混合モデルっちゅーのはそういう計算やってんでしょ」
とぼんやり考えてたんだけど,
やはりそんな概念は誰でも思いつくようで,
検索してみたらたくさん
見つかった.
ほかならぬ
Alan Agresti
御大もそういう論文を書いてる.
-
で,
カテゴリカルデータ解析の勉強をつづけたいんだけど
……
ふと思いついて呪われ CSS 問題にとりくむ.
-
どうも最大多数派の IE6 での「見えかた」
がかなりヘンなんだよね.
まずは講座の
セミナーペイジ
とその下.
これはよく知られた
IE6 阿呆バグ
で
text-align: center
という無意味指定で切りぬける.
それから W3C の CSS2 に関する勧告の第 10 章
Visual formatting model details
読んでわかったんだけど,
IE6 って ``containing block''
と ``width'' の計算がむちゃくちゃなんじゃない?
そういう前提で修正すると Mozilla や Opera での表示と
同じようになる.
-
上記リンクペイジの下のほうにもあるように
Windows版のIE は CSSに対する性能は
他のブラウザに比べてかなり見劣りするようになってきました
……
Windows版IEはシェア的には大多数のブラウザですが、
数あるグラフィカルブラウザの中では少数派の表示を行っている
と言い換えることができます
……
ってことなんだよね.
これって,
わかってて修繕してないんだろうなあ.
やれやれ.
-
もひとつの表示修正問題は他ならぬこの「ぎょーむ日誌」
の list item
<li>
のマーカー位置が「下のほう」についてしまう嫌らしい問題だ
……
で,
これはマイナーであまり知られていないらしく,
孤独なる試行錯誤のすえに IE6 の表示バグをつきとめた.
<li>
で width
を指定しているとマーカーが「下」についてしまう.
これまた完ペキに意味不明.
とりあえず width
指定をやめる.
-
などとぢたばたしていたら時刻はすでに 1245.
昼飯はセミナー後にしますか.
-
1300 より
講座セミナー
(このペイジも修正ずみ).
今日は M1 平林さん.
自然には存在しないような花序をつくって
マルハナバチを混乱させわけのわからなくなった極限的な絶望の境地で
ハチがどうふるまうのかを観察する,
というもの.
ふーむ.
-
独占企業の強みで Adobe 社が Acrobat を 6.0 にしろ,
という通知をよこしてきた.
値段は 21000 円強.
高いので update はやめ.
-
カテゴリカルデータ解析の勉強のつづき.
-
1845 研究室発.
1855 帰宅.
1905 自宅発北大構内走.
1945 帰宅.
体重 71.8kg.
買物.
晩飯.
-
[今日の運動]
-
北大構内走 1905-1945.
ストレッチング.
-
腹筋運動 30 × 3 回.
-
[今日の食卓]
- 朝 (0830):
米麦 0.6 合.
コンブ納豆.
ネギ・ブナシメジ・豆腐・煮干の味噌汁.
- 昼 (1420):
弁当.
研究室お茶部屋.
米麦 0.7 合.
コマツナゆでたもの.
- 晩 (2100):
米麦 0.9 合.
コンブ納豆.
チンゲンサイ・タマネギ・マイタケの炒めもの.
ネギ・ブナシメジ・豆腐・煮干の味噌汁.
2003 年 06 月 03 日 (火)
-
0730 起床.
朝飯.
コーヒー.
0810 自宅発.
晴.
0820 研究室着.
-
朝からまたカテゴリカルデータ解析勉強
……
小標本数で使われる「近似ぬき」計算と
大標本数で使われる「近似あり」計算のミゾはけっこう深いんでは,
という気がしてきた.
というか別モノですな.
-
お茶部屋ででれでれしてると,
大澤君が
Gnumeric
(ゑくせるもどき)
で作った表もってくる.
こないだの苫小牧実習で調べたシウリザクラ (小調査区内) 全数調査
であるんだが
……
ちょっとデータ解析しようがないか.
ということで,
Perl + pLaTeX 連携ワザによる自動作表技法を伝授.
-
北大構内走.
よく晴れてますなぁ.
昼飯.
院生のみなさん調査に出てしまっているので,
人口密度ひくい.
-
午後から甲山モデリングコンサルタント.
また不必要な複雑化をやってるんで,
上下競争アリの
甲山さんふうモデリングを極限まで単純化すると
どうなるかを示す.
-
かてごりかる……勉強.
-
ひととーり読んでみてわかったことは,
やはりこういう「線形からなんらかのカタチでずれた世界」
では面倒を回避するすべはなさそう,
ということ.
実際のデータを直視しない時代は幸せだった,
ってことかな.
-
この本が推しているのはモデルごとの尤度を計算し,
それを比較する方策である (尤度比検定).
それにたいして Χ2 値→χ2
近似とか Wald statistics を用いる方法はあまり推していない
(とくに後者).
まあ,
近似のよしあしと汎用性のかねあいだろうな.
そして「近似ぬき」であれこれと確率を計算するやりかたは
今後は発展してくるんだろうけど,
現時点では尤度比をもちいたそれほど他のやりかたとの
互換性が大きくない,
と.
さて.
-
統計学的失敗を避けたければ,
いろいろなモデルに関して愚直に
あてはまりの良さを調べなければならない.
さらに,
あてはまりがよかったからといって
それを採用するのも慎重でなければならない.
可能であれば確率論的モデルの段階にたちかえって
検討をやりなおさないといけない
……
-
今後,
統計学というのは利用者にとってはわかりやすくはなるだろう
(ブラックボックスは少なくなる)
けど,
手間は増えるようになるのかもしれない.
-
ともあれ当面の問題に関して作文して,
小川さんに送信.
2020 研究室発.
2040 帰宅.
体重 71.8kg.
晩飯.
-
[今日の運動]
-
北大構内走 1250-1325.
ストレッチング.
-
腹筋運動 30 × 3 回.
-
[今日の食卓]
- 朝 (0740):
米麦 0.7 合.
コンブ納豆.
ネギ・ブナシメジ・豆腐・煮干の味噌汁.
- 昼 (1335):
弁当.
研究室お茶部屋.
米麦 0.7 合.
チンゲンサイ・タマネギ・マイタケの炒めもの.
- 晩 (2130):
蕎麦.
チンゲンサイ・タマネギ・マイタケの炒めもの.
2003 年 06 月 04 日 (水)
-
0810 起床.
朝飯.
コーヒー.
0900 自宅発.
曇.
0910 研究室着.
-
さて,
統計学問題あれこれも一区切りついた.
現状は
- にせアカマツは共著者のひとりである中谷さんの修正まち
- 院生との仕事は先方の野外調査日程をにらみつつ待機
- PipeTree はさっさとやってしまいたいけど,
いったんはじめるとまた時間がかかりそう
ということで,
以前から気になってる雑用ひとつに着手しますかね.
すなわち A 棟 8F の粗大ゴミ処分.
主たる対象は陰極線管式表示機 (CRT display) と
だれも使いそうにない古計算機.
-
めんどうなのは,
備品番号がついてたりついてなかったりすることだ.
さて
……
うん?
たいはんの廃棄予定機器には番号ついてない?
値段安いから備品ではなく消耗品なのか?
雪野さんにうかがうと「番号シールはりわすれ」
の可能性アリとのこと.
いちおう捨てるもの一覧を作りますかね.
-
と準備していたら,
中谷さんから修正パラグラフ送っていただく.
えーい,
これはあとまわしだ.
-
一覧のもととなるテキストファイルを作りつつ,
「近日中に廃棄予定」
なる紙切れをはってまわる.
1320 ひとまず終了.
これが廃棄予定物一覧
(Perl で HTML table を生成).
まあ,
だいたい予想してたぐらいの項目数だな.
やや遅めの昼飯.
-
昼飯後もいくつか古機材みつかったんでリストに追加.
-
カテゴリカルデータ解析コンサルタント業つづき
……
Agresti の教科書では
非類似性指数 dissimilarity index (Gini, 1914)
なる距離でもって分割表な観測データに対する
モデルのあてはまりの良さをあらわせ,
としていたりする
……
この,
差の絶対量の合計,
ってのもシンプルすぎるような気もするんだけど.
-
にせアカマツ原稿.
午前中にいただいた中谷さん変更を反映させてみる.
-
札幌市長まぬけ再選挙ということで,
ときどきやかましい騒音散布車が近くをとおる.
こういうはた迷惑な人物にだけは絶対に投票しないでおこう,
名前をよく聞こうとするんだけど,
なんだかろれつのまわらない連呼なんで,
なんと言ってるのか聞き取れない.
-
いろいろメイルやりとりしてるうちに腹へったので撤退.
1840 研究室発.
しかし財布の中に現金がほとんどないことを思い出したので南下.
ついでに本屋をハシゴしてたので
2000 帰宅.
-
[今日の運動]
-
[今日の食卓]
- 朝 (0820):
米麦 0.7 合.
コマツナ.
- 昼 (1340):
弁当.
研究室お茶部屋.
米麦 0.7 合.
コマツナ.
- 晩 (2100):
蕎麦.
2003 年 06 月 05 日 (木)
-
0800 起床.
朝飯.
コーヒー.
0840 自宅発.
晴.
0850 研究室着.
-
お茶部屋タオルかけの再とりつけはうまくいったようだ.
接着剤
サイレックス
(北大生協で 20ml 400円),
なかなか強力だ
(スリッパの修繕とかにも使った).
-
朝からメイル書き.
擬似尤度法 (quasi-likelihood method)
はモーメント法だ,
とか.
ホントか.
-
もうそろそろ出してよさそうなにせアカマツ原稿みなおす.
しかし見直し進捗しない.
-
北大構内走.
快晴.
大学祭が近づいてるので路上混雑してる.
いつもとは走る経路を変えて北大農場内をうろうろする.
研究室にもどって昼飯.
-
現時点では何の関係もない計算問題がアタマの中に居すわってしまって,
追い出すのに 1 時間以上を費してしまった.
-
ようやくにせアカマツ原稿読み直しに没頭できる.
新しく書き足したところって,
ホントに蛇足だな.
しかし蛇足をありがたがるヒトもいるので,
とりあえず残す.
消すのはすぐにできることだし.
-
LaTeX マクロ
lineno.sty
が 3.08 → 3.09 とヴァージョンアップ
……
しかし「番号ずれ」バグは改善されてないな.
これを直す方法として現時点で判明してるのは
ただひとつ,
\textheight
をミリ単位 (もっと小さくても OK だろう)
で大小しつつ全ペイジにおいてフレイムシフトしない値を探索する,
といういやはやな技法.
ちょっとずらすだけで簡単に正常化されるのが,
まぁすくいではある.
ただし文章を書き足したりするとまたずれたりすることもある.
-
私の憶測では,
上の現象は数式をたくさんふくむ原稿で発生する可能性が高い.
-
昨日,
捨てたいモノ一覧
を作ったんだけど,
雪野さんによると事務室会計では地環研発学術廃棄物の
処分作業が遅滞していて,
当面の置き場所すら確保できないかも
……
というような.
たしかに,
地下の公用車車庫とか計算機がらくたの墓場と化していたもんなぁ.
どうなることやら.
-
にせアカマツは上で書いたように変更点が少ない・どうでもよい,
ということからこのまま投稿することに.
make pdf && make upload
してから,
小林さん以外に 6 人もいる共著者諸氏にまとめてメイルを送る.
手紙もすでに書けてるし
わけのわからん名前ラベルも作ってある.
200 枚超になってしまう紙切れを航空便として発送する
(すげーばかばかしい)
のは来週の月曜日にでもしますか.
-
ということにしてしまって,
1630 この作業ひとくぎり.
-
ユキザサ解析に関しては某院生が
新たなるデータ隠匿にいそがしそうなので,
しばらく放置.
-
ということで,
ひさしぶりにシウリザクラ (作りかけの)
解析用プログラムをながめてみる
……
そうか,
自動解毒機構を動かすには Perl モジュール
Spreadsheet::ParseExcel
が必要だったな.
あ,
Unicode::Map
も必要だったか.
それから CP932Excel
問題も解決しとかんといかん
(2002.12.12 のぎょーむ日誌).
-
にせアカマツ原稿修正つづいていたり.
-
最後はこれまた無関係な統計学問題にトラップされる
……
信頼区間
の解釈とは玄妙なものですなあ.
いまさらながら.
使いどころが難しいぞ.
-
1930 研究室発.
1950 帰宅.
体重 71.4kg.
晩飯.
-
過去一年間の支出がみょーに多い,
と思って調べてみたらかなり amazon.co.jp に消えていた
……
つまり本代に費されていた.
食費より本代のほうが大である月がけっこうありそう.
-
[今日の運動]
-
北大構内走 1225-1255.
ストレッチング.
-
腹筋運動 30 × 3 回.
-
[今日の食卓]
- 朝 (0810):
米麦 0.7 合.
納豆.
チンゲンサイ・タマネギ・エリンギの炒めもの.
- 昼 (1310):
弁当.
研究室お茶部屋.
米麦 0.7 合.
チンゲンサイ・タマネギ・エリンギの炒めもの.
- 晩 (2100):
スパゲッティー.
ホウレンソウ・トマトのソース.
2003 年 06 月 06 日 (金)
-
0740 起床.
朝飯.
コーヒー.
0840 自宅発.
快晴.
0850 研究室着.
-
Matthew Potts がみょーな
(implicit 空間分布 + 確率論的モデル)
保全生態学の論文原稿を甲山さん経由で送ってきたんで,
とりあえず読む.
現時点ですぐに片づけるべきぎょーむがなく,
将来の面倒に発展しそうな問題を
まずはアタマに格納しておくことが重要だと思われるからだ.
-
今日は地環研のソフトボール大会とやらで
A 棟 8F の人口密度は低い.
徴兵されそうになったんだけど,
私の肩は左右とも「ボールを投げる」
というような複雑きわまりない運動をすると,
ばきっと外れてしまうんだよね.
-
で,
Matt 保全計算のほうは図と数式をみると何をやってるかだいたいわかった.
が意図がわからんので本文をアタマから読んでみる.
なるほど冗長作文を書き慣れてるやつは
あたかも冗長でないかのように書くなぁ
……
ということで読むのに時間がかかる.
-
モデルの説明ならすらすら読めるだろうと思いきや,
ここにも問題が.
OpenOffice
(OOo)
は優秀なる解毒剤ではあるけれど,
れどもんどソフトウェアの凶悪さはそれをしばしば超えてるわけで
……
-
ともあれ趣旨はわかってきたんで,
それにそって計算内容を検討してみる
……
ちーっとマズいような気がする.
樹種ごとに完全に独立に分布してると仮定して式をたててるからなぁ.
これは「ある面積に存在する樹木個体数は一定」
なる自分ででっちあげた前提と合致してないぞ.
自爆というか自殺点というか.
-
つまりですね,
ここで重要な教訓は
「確率論がからんでくるモデルはなんであれ難しい
-- うっかりミスを誘発しやすい」
ということだ.
理由は,
確率というのはじつはあまり日常的な概念ではないから.
たとえば,
「明日の降水確率 50%」とは
「明日という日が無限の個数だけ存在するならば,
その無限個ある明日のうち半数では雨が降っていて
残り半数では降っていない」
という非日常感覚的なけったいな状態を表現している.
-
私もしょっちゅう確率にまつわる錯覚→間違いにおちいるんで,
「やばいかも」
と思ったら
ただちに計算機で乱数を発生させて実験することにしている.
ということで,
しつこく主張
……
確率・統計の理解に計算機実験は不可欠.
多くのふつーのヒトにとっては.
-
ちょうど昼なんで北大構内走にでる.
快晴.
北大祭で混んでるので構内大通りは避けて走る.
走りながらくだんの「間違い」を検討してみるけれど,
やはりあの計算は間違い.
もどって昼飯.
-
送られてきた原稿のうち「文字化け」(と言えるのだろうか?)
してる何文字かが気になるんで,
甲山さんのところまで原稿をみにいく
……
ほほー,
Mac 用おひすでもくだんの文字どもは表示されませんか.
-
院生用のゐいんどうづおひす (おひす98 という古いやつ)
で開いてみると
……
あ,
見えた.
s のうえに ^ がついてるのとか →
って呪われゐいんどうづ 「国際的な OS 依存文字」
ってこと?
数式部分は OOo でも解毒できてるんで
数式オブジェクトの問題でもなければ,
丸数字 (別名: 役人ナンバリング文字)
とかみたいな日本ローカルな問題ではないよね.
謎.
数式オブジェクトとやらが完全には浄化されてないのかな?
-
まあ,
それはともかく内容チェックのつづき.
「そりゃーまずいんでは」
指摘のアイデアは上のとーりでよさそうなんだけど,
本人もそれについて言及してるかもということで,
長々しい残りの部分も読んでみる.
いや,
じつはぜんぜん短い原稿なんですけどね.
-
どうも気づいてないようなんで,
そのあたりを指摘する作文.
いつもながら時間がかかってしまう
……
なんとか書きあげてメイル送信.
時刻はすでに 1710.
やれやれ.
ほぼ一日これに費してしまったか.
うう.
-
そのメイルだして数分後に
(これまたいつものごとき)
敵国語まちがいに気づく.
``negative correlated'' (Google 検索で 416 件該当)
ではなく
``negatively correlated'' (Google 検索で 56180 件該当)
だった
……
いいぢゃん,
少なからぬやつらがそういう間違いして
ネット上で文書さらしてるわけだし.
私の場合,日本語だって怪しいもんだし.
うう.
-
1720 地環研ソフトボール大会の選手たちが帰ってくる
……
なンと全試合敗北,
でしたか.
これは小菅監督が地元の球団ベイスターズの成績に
殉じてしまったんでしょうなぁ.
かとー先生
「ヨワかったですよ」
-
地環研前の芝生地でソフトボール大会うちあげの
ジンギスカン party.
シベリア大火災の中にとびこみ生還した城田さんも
ちらっと現れたんだけど宣教師殿とどこかに消えてしまった.
ふーむ,
怪しい.
-
A 棟 5 F
付近に出没する
「
大統領
の手下」
と自称する自称大学院生が面白いハナシ少々と
すげー怪しげなハナシをいろいろと.
-
雪野さん旦那の Tom 氏とはじめて雑談.
なかなかヘンなカナダ人だ.
さらに先ほどの自称手下が横からわりこんできて,
なぜかしら
(生態学者でもないふつーのヒトである)
Tom に何やら社会性昆虫のハナシを聞かせようと努力してるんだけど,
聞かされてるほうは徹頭徹尾まぜっかえしていく.
横から聞いてるとひじょーに面白い.
「よーし,
じゃあキミはそういう社会性が良いものと信じているんだな」
「昆虫では社会性は進化した.適応度,高い
(といかにも教科書的なことなどを)」
「(あいかわらず真面目そうな表情を作って)
OK,
人間社会もまたそのように制度化されるべきだろうか?
(いちおー No という回答を期待してるような)」
「(しかし,いきなりぶっトんだふざけた内容の質問に追随できずに)
う? …… Yes」
「(おおはしゃぎして)
おおー,
そうか!
人々が特定の機能にだけ専門化されてしまった機械のような社会だ
(といったたぐいのあれこれを誇張して述べたてる),
キミは共産主義者 (communist) なんだー!」
「(Tom が社会性昆虫生態学に関して何か傾聴すべき意見を
述べたものとカンちがいして深刻に考え込む)
…… (行き詰まったので日本語で) 久保さん,communist って何ですか?」
-
いやはや
「こっちが真面目なハナシをしてるんだから
(しかも敵国語を用いて),
相手もそれにあわせてくれるハズだ」
という思いこみにトラップされているから,
わけわからなくなるんだよ.
そういうやつはちゃかされるべきなんだろうし,
そもそも
大統領
の手下を自称してるんだから,
これぐらいは修行のうちだろう.
-
2200 研究室発.
2210 帰宅.
-
お茶部屋で続行している飲み会現場の
特派員大澤記者から,
また例によって例のごとく本日の殊勲者たる
「監督」
の酩酊→騒乱→泥酔昏睡→顔面らくがき
の遷移過程をあらわす写真がけーたい→ネット経由で
送られてきたんだけど,
まあいつものとーりなんで写真掲載は略.
-
[今日の運動]
-
北大構内走 1225-1255.
ストレッチング.
-
[今日の食卓]
- 朝 (0750):
米麦 0.7 合.
煮干飯.
チンゲンサイ・タマネギ・エリンギの炒めもの.
- 昼 (1310):
弁当.
研究室お茶部屋.
米麦 0.7 合.
煮干飯.
コンブ.
- 晩 (1830):
野外ジンギスカン.
たべすぎて苦しい.
2003 年 06 月 07 日 (土)
-
0920 起床.
コーヒー.
昨晩のジンギスカンのせいで食欲なし.
どうも羊肉はぱくぱく食いすぎると,
翌日なかなか苦しい.
-
でれでれしたり,
洗濯したり,
アイロンがけしたり,
ぼろぼろになったジーンズパンツ補修したり.
-
1320 自宅発.
晴.
北 9 東 5 の Homac へ.
木綿糸だのモンキーレンチだの購入.
1420 研究室着.
-
シウリザクラ問題にとりくむ.
うう.
はかどらん.
-
はかどらんので撤退.
1940 研究室発.
2000 帰宅.
晩飯.
-
[今日の運動]
-
[今日の食卓]
- 朝 :
食ってない.
- 昼 (1230):
玄米シリアル.
- 晩 (2030):
スパゲッティー.
ホウレンソウ・トマト・ニシンのソース.
ニシンは昨晩の残りもの.
2003 年 06 月 08 日 (日)
-
0930 起床.
朝飯.
コーヒー.
-
でれでれしてるわけだが.
-
昨日 Homac で買ったモンキーレンチでテイブルを修繕.
といってもナットをしめるだけなんだが.
-
すごーく久しぶりに室内に掃除機をかけてみる.
さすがに少しすっきりする.
-
昨日 Homac で買ったモンキーレンチでテイブルを修繕.
-
1230 自宅発北大構内走.
今日も晴.
そして北大祭は継続中.
ヒトどーりのすくないところを走る.
1310 帰宅.
体重 71.6kg.
-
昼飯.
1430 自宅発.
1440 研究室着.
-
にせアカマツ再投稿前の最後のみなおし
……
最初から最後まで一語ずつトレイスしたんだけど,
やや惰性モードぎみなんで数ヶ所の改善しか思いつかず.
-
「まあいいや」
ということで印刷.
Postscript ファイルから特定のペイジをぬきだす
psselect
(psutils-p17-3
)
にきみょーなバグあり.
EPS 図を部分的に破壊する.
うまくいかないときは
psselect
の使用をやめる.
-
複写.
「新しい D 論ですか」
と揶揄されるほどペイジ数があるので,
それを 4 倍に増やすと
……
総重量 2.5kg ぐらいか?
うーむ.
こんな紙束をやりとりする阿呆らしさからいつになったら
釈放されるのだろうか.
それとも,
かかる資源・輸送コスト・時間の無駄無駄をいまだにやってるのは
理系の中で生態学周辺分野だけではなかろーか?
-
M2 大澤君とシウリザクラデータ解析のハナシを少しばかりやってから,
2300 研究室発.
2310 帰宅.
晩飯.
-
[今日の運動]
-
北大構内走 1230-1340.
ストレッチング.
-
[今日の食卓]
- 朝 (0950):
スパゲッティー.
ホウレンソウ・トマト・ニシンのソース.
- 昼 (1330):
蕎麦.
- 晩 (2340):
蕎麦.
2003 年 06 月 09 日 (月)
-
0740 起床.
朝飯.
コーヒー.
0840 自宅発.
晴.
0850 研究室着.
-
朝からシウリザクラ問題にとりくむ
……
つもりだったんだけど,
cprn
という印刷ユーティリティの改造に没頭してしまう.
-
2 時間ちかくかけて (時間かかりすぎ)
cprn
に Perl 予約語をハイライトさせる機能を追加できた
……
しかしハイライトさせても実はそんなに読みやすくなるわけでもない,
と気づいた.
いやいや,
無いよりよほどマシか.
-
紙束 220 枚を航空便で発送.
いやはや.
-
1205 北大構内走発.
あいかわらず晴.
北大祭は昨日で終了したんで,
いつものコースを走る.
暑い.
1240 かとーオフィスにもどる.
-
1300 より
講座セミナー,
今日は M1 堀端君.
林床植物の葉っぱだの花だのつみとってその応答見ます,
ってのはいいんだが
……
みょーにグラフ上の点々が偏ってない?
と思って質問してみると恐るべき事実が明らかになった
……
無作為化やってないんで,
ある処理をした個体たちが同じ場所にかたまっている!
-
……
うう,
やばすぎる.
野外実験するヒトはそういうことに気をつけないと,
かなりマズいです.
どうなることやら.
-
昼飯.
-
苫小牧にいる宣教師殿から電話による遠隔操作をうけて,
京大内の計算機に対するクラッキングの片棒かつがされる.
標的にされたマシンが (すでにその時点において)
完全にダウンしてたので,
不法侵入者の汚名はきせられずにすんだわけだが
……
-
シウリザクラ,
解毒されたデータとデータハンドラーのつなぎかたをこうしよう!
とゆーのがどういう構想だったのか,
どうしても思い出せない.
半年弱放置したむくいか.
イチから作り直しだという自暴自棄をこらえる.
-
こらえるだけで終了.
阿呆だねえ.
1735 研究室発.
とある用事があって,
札幌市東区東苗穂にある中古用品店をめざす.
東区は「札幌市内の辺境」と言われるところで,
残念ながら人力では本日中に到達できるところではない.
なんとならば
東苗穂は辺境東区の中のさらに辺境なのだ.
-
ということで市営バスに乗ろうと思うんだけど,
バス停がまた遠い.
北大から距離 1300m ほど離れた
北9 東11 の東保健センターのバス亭まで行かねばならん.
走る.
北海道住人でありながら車を所持できない貧乏人は走るしかない.
なぜ急ぐのか?
札幌市内のバスは一時間に一本
というのがちっとも珍しくないから.
そして残り時間 12 分!
-
茨城県茎崎町とかならともかく,
なにゆえに 184 万人都市内のバスの流量が
そこまで貧弱貧弱ゥなんだろ,
といぶかしく思われるむきもあるかもしれない.
答えは簡単で誰もバスなんぞ乗らないから
(私も今回が初めて).
やたらと広い北海道だの札幌市だので車もたずに暮らしていると
life of quality なるものが著しく悪化するってんで,
自家用車が時間とともにどんどん普及するわけ.
で,
そうするとバス乗る人がずずーっと減って,
札幌市交通局のこの自虐的なるデータ公開
「ほろびゆく公共バス」
というふうになる.
-
ともあれ,
一朝あるごとにかような
「×分以内に○○まで到達せよ」
事態がシュッタイするので,
私は生活の必要上ふだんから北大構内走などで
市内踏破走力を鍛えているわけだが
……
力走あと一歩およばず
(街なかは信号待ちがたくさんあって,ですね),
気のきかんバス運転手が目の前でドアをぶしゅーと閉めて
さっさと去りやがった
……
えーい.
-
もちろん最悪の中にあって最善をつくす私が
かかる事態に備えていないハズもなし.
札幌市公共交通情報提供システム
(これは意外とよくできてる)
で事前に別ルートを調べておいた
……
地図を確認する.
第二目標,
地下鉄東豊線「環状通東」付近バス停.
方位確認.
進出距離いっせんにひゃーく.
残り時間 10 分
……
いやはや東区内踏破走はまだ続くのか.
-
えっさえっさと走ってようやく間に合った.
札幌市営バス辺境行きに乗って
1806 環状通東バスターミナル発.
1830 目標到達「店」到着.
ちなみにバスは市内一律 200 円
(これはよろしい).
それから私が乗ったバスは座席が
全部うまるぐらいはヒトが乗ってた.
しかし帰宅時間帯でこの乗車率ってのも.
-
で,
受け取ったのはこの中古品店が Yahoo!
オークションに出品して私が落札した
「Asics ランニング用トレイニングシューズ」
2500 円ナリ
(検索してもどうしても見つからんけど原価はおそらく 10000 円級
……
使用された形跡がないので倒産スポーツ店からの回収品か?).
ああ,
これでまた市内走破能力を鍛錬することができるんだね.
もはや何がなにやら.
-
帰路は歩いてみるか
……
しかし行けども行けども茫漠たる無人の曠野が続く
札幌市東区の荒涼とした風景にバテてしまい,
やはり市営バスに乗る
(一時間一本のバスが運よく来てくれたんで).
1855 北15 東9 バス停で下車.
ここもまだ東区内.
北12 西1 の我が家まで 800m ちょい.
ついでなので,
我が家から近いのに大学とは反対方向にあるというので
全然たちよりもしなかったこの近辺を探索する.
安値がウリらしいスーパー
BigHouse
とかもあるんだよね.
-
で,
その BigHouse だけど,
たしかに私が食糧調達してる北 12 生協よりは多少安いけど,
そんなに差は大きくない.
しかし,
まとめ買いするとどんどん累積値引きが大になるように設定されてる
……
つまり「車で来てまとめ買いしろ」ってことで.
これって郊外の店なんかではなく,
JR 札幌駅から直線距離ならば 1200m ちょいのところなんだよね.
-
買いものをすませて
創成川をざぶざぶと渡渉して北区にもどり 1950 帰宅.
体重 72.0kg.
晩飯.
ばてた.
-
[今日の運動]
-
北大構内走 1205-1240.
ストレッチング.
-
札幌市内踏破走
……
3000m ちかく走ったか?
デイパック荷重つき.
-
腹筋運動 30 × 3 回.
-
[今日の食卓]
- 朝 (0810):
米麦 0.7 合.
チンゲンサイ・シロナの炒めもの.
- 昼 (1410):
弁当.
研究室お茶部屋.
米麦 0.7 合.
チンゲンサイ・シロナの炒めもの.
- 晩 (2030):
蕎麦.
納豆.
どうも私のココロの中で
一時的な蕎麦ブームなのかも.
まあ,
もうすぐあきるでしょう.
2003 年 06 月 10 日 (火)
-
0800 起床.
朝飯.
コーヒー.
0850 自宅発.
今日も晴.
0900 研究室着.
なんか眠い.
-
先週に「それってヘンじゃない」
とコメントしたハナシに関してまたメイルが来たので,
それに対応
……
でまる一日が終わってしまった.
これまた阿呆だ.
まあ勉強にはなったけどね.
-
解くべき問題を簡単に述べてみると
-
最大 S 種の生物からなる n 個体の群集を生成する
-
種それぞれに出現確率が与えられている
--
生成すべき群集はそこからの標本である
(標本サイズは所与)
-
ただし各生物種ごとに集中分布している
というところか.
-
で,
これに関する私の解答を要約すると
「『Polya の壺』を使え」
ってこと.
-
George Polya
(正しくは Pólya と書くべきなんだろうな)
は数学者をたくさん輩出する伝統の国ハンガリーの
確率論・組み合せ数学の研究者.
日本では
「いかにして問題をとくか」
の著者としてよく知られているのかもしれない.
「Polya のつぼ (Polya's urn また Polya urn)」
とは
こういうもの.
この壺から得られる赤玉・黒玉のうち,
どちらか一方の玉の個数は Polya 分布
(あるいは負の超幾何分布)
として表現され,
これの極限をとる (ある条件のもとで壺のサイズを無限大にする)
と,
負の二項分布
になる.
-
私がこういうこと思いついたのは
-
以前に粕谷さんに
「
負の超幾何分布
(negative hypergeometric distribution)
の極限が負の二項分布」
と教えてもらった
-
ずーっと以前に
筑波大の徳永さんが
「Polya の壺,というモデルがあって……」
と話していたのがアタマに残っていた
この二つは実は同一のものでは,
と思ったのでほぼ一日を費してあれこれ調べていた.
いや,
たしかに時間かかりすぎなんだけど.
-
このあたりについて詳しく書かれているのは
W. Feller の「確率論とその応用
(An introduction to probability theory and its application)」.
どこの大学の図書館にも蔵書されているちょー有名なる教科書である.
で,
「おそらくこれでいいんだろう」とわかったことは
(まだ間違ってるかもしれない)
-
Polya の壺からの標本の分布は Polya 分布
であらわされる.
これは負の超幾何分布と同じ (ややこしい).
これを一般化したものが
Polya-Eggenberger 分布
である.
-
Polya 分布の極限形は負の二項分布.
-
Polya つぼからの取り出しの n 回目の試行において
赤玉が x → x+1 となる確率は
(p + x c / N) / (1 + n c / N),
ただし p は赤玉の初期頻度 (操作する前の出現確率)
N は赤・黒玉の初期個数,
c はいわば「集中度」で負の二項分布の係数を k
とすると c = M / (k N) という関係にある,
と考えてよさそう.
-
この確率過程において壺のサイズを無限大にした極限が
Polya 過程である.
ひとつ気になるのは,
Polya 分布と呼ばれるものが,
もしかしたら複数あるかもということ.
-
というあたりをメイルにまとめてみる
……
翌日みなおすと書きまちがい・敵国語まちがいが多々あって
うんざりさせられる.
-
2040 研究室発.
2105 帰宅.
体重 71.6kg.
晩飯.
-
ばてばてー
-
[今日の運動]
-
北大構内走 1255-1325.
ストレッチング.
-
腹筋運動 30 × 3 回.
-
[今日の食卓]
- 朝 (0830):
米麦 0.7 合.
チンゲンサイ・ピーマン・タマネギ・マイタケの炒めもの.
- 昼 (1340):
弁当.
研究室お茶部屋.
米麦 0.7 合.
チンゲンサイ・ピーマン・タマネギ・マイタケの炒めもの.
- 晩 (2150):
蕎麦.
納豆.