ぎょーむ日誌 2004-04-(11-20)
2004 年 04 月 11 日 (日)
-
0840 起床.
朝飯.
コーヒー.
-
釧路大会雑用,
公募シンポジウム & 自由集会要旨入力管理インターフェイス篇.
とりあえず基本データ構造と,
目次を生成するところまで.
-
北大構内走 1355-1445.
晴.
雪はだいぶとけた.
体重 72.6kg.
そして気温が上昇すると体重もおちる.
昼飯.
-
1540 自宅発.
1550 研究室着.
-
公募シンポジウム & 自由集会要旨入力管理インターフェイスの構築
……
1745 ひととーりできた.
いちおうメイリングリストに流してみる.
-
A801 にあるゐんどーづ機 (
niseko
)
の IE6 でちょっとながめてみる
……
まーた,
CSS 解釈で阿呆なことになってしまってる.
この現象に説明をつけるなら
……
親ブロック要素内でブロック要素が連続してないと,
そこが「ブロック切れ目」判断してるんぢゃなかろーか.
と非常識きわまりない仮定のもとで
不本意なタグうちにすると「見た目」は改善された.
やはりダメだ,
こりゃ.
-
どうでもいいことだが,
かかる腐れたぶらうざーでみるとぎょーむ日誌の
<ol>
がヘンだ.
いやはやー
……
昔 Netscape Navigator4.x (まだしぶとく生き残ってるが),
今 MSIE6,
どうして「一番よく使われてしまっている」
web browser は CSS 解釈がめちゃくちゃなのか?
こういう状態は永久に解決されないわけ?
理不尽なる現実にあらがうすべもなく,
少しだけ CSS に手をいれる.
-
要旨編集用 CGI プログラムの動作チェックをもすこし継続して,
残存してた小バグをとる.
よーし,
これでもう来週末まで釧路大会雑用とか絶対にやらんぞ.
次の週末はいよいよ一般講演 allocation
の準備にかからんといかんわけだが
……
本日構築したようないいかげんな
データベイス & インターフェイスでもって,
「遺漏ナシ・重複ナシ」のポスター & 口頭発表の
session 構成はできるだろう,
という策はある.
これをしばらく検討することにして,
と.
-
とはいえ,
釧路大会実行委員会雑用はひとまず片づいたとしても,
じつは今回また粕谷さんと共同で開催する自由集会のペイジとかは
準備がまだまだでやんしてね
……
まだ内容もカタまってないんで,
とりあえずのすけるとんのみ設置しとく.
さーて,
たぢう比較と言われましても
……
多分,
粕谷さんがごく正統的な多重比較・多重検定と
その誤用についてびしばしと明晰なる整理を開陳し,
いっぽうで
私の話題提供はモデル選択方面からのぬるいハナシとなるだろう.
-
そして,
よーやく研究が再開できる.
苫小牧直径成長モデリングとアカマツ論文書き,
か.
まるちたすくはできそうにないけど,
ぼちぼちススめるほかあるまい.
-
2030 研究室発.
2050 帰宅.
晩飯.
-
どうも何もススまんなぁ.
-
[今日の素読]
-
Salsburg, D. 2001.
``
The Lady Tasting Tea
-- How statistics revolutionized science
in the twentieth century''.
Owl Book.
-
Chapter 23. Dealing with Contamination
- Box in the United States
- Box and Cox
-
Then in the late 1960s, John Tukey at
Princeton and a group of his fellow faculty
members and students attacked the prbolem of
what to do with measurements that are
apparently wrong. The result of this was the
Priceton Robustness Study, published in
1972. The basic idea behind this study is
that of contaminated distribution. The
measurements taken are assumed to come, most
of them, from the probability distribution
whose parameters we wish to estimate. But
the measurements have been contaminated by a
few values that come from another
distribution.
-
[今日の運動]
-
北大構内走 1355-1445.
ストレッチング.
-
腹筋運動 30 ×
3 回.
腕立ふせ 3 ×
3 回.
-
[今日の食卓]
- 朝 (0920):
材料がまだ残ってるんで
……
鶏肉・ニンジン・キュウリの炒めもの残飯を利用した焼きそば.
- 昼 (1500):
米麦 0.7 合.
コンブあえもの.
- 晩 (2140):
米麦 1.0 合.
ハクサイ・タマネギ・ブナシメジ・豆腐のカレー.
2004 年 04 月 12 日 (月)
2004 年 04 月 13 日 (火)
-
0720 起床.
朝飯.
コーヒー.
0840 自宅発.
晴.
0850 研究室着.
-
今週の平日は釧路大会雑用やらない,
という決心は早くも挫折してしまった
……
まだ申しこみ者は 60 人弱なのにすでに二人も
「非日本語インターフェイス」
ペイジ経由で申しこんできた人たちがいて,
ですね.
このペイジの「でき」はちょーへぼへぼで
……
たとえばお金の請求とか誰か (おそらく私) が計算せんといかん
(日本語インターフェイス経由の場合はプログラムが自動的にやってくれる).
12 月にこのへん作ったときには時間がなかったんで
……
多少めんどい改造が必要なんだよね.
-
しかし,
このちょーしでいくと最終的には
非日本語インターフェイス使うやつが数十人になるのは明らかだ.
いちいち応対してられん
……
というか,
私としてはすでに「二人」で忍耐の限界に達した
(というかその二人ぶんもまだ応対してない)
……
自動化だ!
何もかも自動化だ!!
-
作業の手順:
-
J-STAGE とかいう
ヘンてこなサイトで要旨入力しろ説明をふくむ
2nd circular の要点を敵国語化してアップロード
(「ここ読め」通知をつけるため)
……
蛇足ながらこれはホントに最小限の案内だ;
学会事務局が入魂の入力案内を作るはず
なのでそれにハゲしく期待しましょう
(たぶん少なくとも六ヶ国語ぐらいには対応してるだろう)
-
自作 Perl スクリプト
jesplit.pl
(tag 内の Japanese↔Enemy 語分離プログラム)
完全対応の registration テンプレイトを作る
--
「対応のある」
申しこみペイジ群を自動生成させていく
(一ヶ所だけ手抜きした;
公募シンポジウム発表者用に関しては本朝版しかない;
すでに確定してる公募シンポジウムの内容みると,
それで問題なさそうだったんで)
-
CGI プログラムを書き換える
---
すげーすっげー汚くなる
-
いろいろな集計プログラムも書き換える
-
すでに登録されてるデータを全部書き換える
(もちろんこれは書き換えプログラムを使って)
-
まだ応対してなかった二人分のデータを
この改造されたシステム経由で登録する
(すると先方にメイルがとどく)
……
ここまでひととーり片づけ終ったのが 1420.
ぜいぜい.
こっちが書き換えたプログラムを
(「本番サーヴァー」で!)
試験運転やってる
その横でふつーの参加申込者のヒトが登録とかやったりして,
ぢつにはらはらさせられる仕様変更であった.
-
昼飯.
昼飯後にも動作チェックを少々.
とくに問題なさそう.
よーし,
これでホントに週末まで釧路大会雑用とは手を切るぞ.
もう何もやりませんったら
や_り_ま_せ_ん.
-
ユーザーインターフェイスのからむような
やくざ仕事ばっかりやってると,
本来の職務たる計算下請け業者の静かなるココロが
なかなか取りもどせない
……
うー,
うまくとりかかれん.
-
新 M1 たち (4 名)
のメイルアカウントがそろったんで,
講座内メイリングリストとかへの追加,
など.
-
うーむと思いつつ
1850 研究室発.
1900 帰宅.
体重 74.0kg.
いやはや.
晩飯.
-
[今日の素読]
-
Salsburg, D. 2001.
``
The Lady Tasting Tea
-- How statistics revolutionized science
in the twentieth century''.
Owl Book.
-
Chapter 24. The Man Who Remade Industry
- The nature of quality control
-
To improve the quality of a product, the
product's quality has to be measured. To
measure a property of a product requires
that the property (roundness in this case)
be well defined. Because all measurements
are, by nature, variable, the manufacturing
process needs to address the parameters of
the distributions of those measurements.
Just as Karl Pearson sought to find evidence
of evolution in changes in the parameters,
Deming insisted that management had the
responsibility of monitoring the parameters
of these measurement distributions and
changing fundamental aspects fo the
manufacturing process in order to improve
those parameters
-
[今日の運動]
-
腹筋運動 30 ×
3 回.
腕立ふせ 3 ×
3 回.
-
[今日の食卓]
- 朝 (0740):
米麦 0.7 合.
コンブあえもの.
- 昼 (1440):
弁当.
研究室お茶部屋.
米麦 0.7 合.
コンブあえもの.
- 晩 (1940):
米麦 1.2 合.
ハクサイ・タマネギ・ブナシメジ・豆腐のカレー.
2004 年 04 月 14 日 (水)
-
0720 起床.
朝飯.
コーヒー.
ほーら,
きましたよ.
釧路大会 fee,
クレジットカードで支払いたいとゆーメイルが.
どうなることやら.
0850 自宅発.
晴.
0900 研究室着.
-
釧路大会アナウンスに使うかも,
ということでメイリングリスト
jeconet
に加入しなおす.
以前には入会してたんだけど,
いつのまにか登録削除されてたんで
(長期間 off にしていたためか).
-
クレジットカード問題は国内代理人に支払ってもらうことで結着.
ふーむ
……
問題はまたさきのばしされた.
-
う.
起動状態わるい.
じぶんじしんの.
-
ぢりぢりと気象フィルターどもをまとめて取り扱う
R
プログラムを書く
……
もちろん苫小牧直径モデリング用だ.
R でちょいややこしいデータ構造,
というとひたすら
list(list(list(...)))
となってしまう.
まぁ,
これはこれで単純化された世界ではあるが.
-
1335-1415 北大構内走.
晴.
-
郵便局で
釧路大会
のテラ銭 + 懇親会費 11500 円をしはらう.
手数料 120 円.
懇親会費 6000 円ってのは絶対にモトがとれないことが確定してる金額.
後ほど会計担当の高田さんにうかがったところでは,
懇親会については集客に応じて内容を調節するとのこと
(赤字にならないように).
さらに要旨集代金ってのは 300 円どころか,
もっと高額だそうで.
さーて,
郵送料とかも考えると要旨集販売なるいんちき商売の利益は
いよいよウスいな.
-
苫小牧直径モデリング,
気象値計算法改良の続き.
降雨量のあつかいが難しい
……
が,
策を思いつく.
毎度毎度のことながら,
計算を速くしたいのであればメモリを浪費すればよい.
それだけのことだ.
概念的にはこゆかんぢ.
rain.0 <- c(3, 1, 4, 1, 5, 9, 2)
rain.1 <- c(0, 3, 1, 4, 1, 5, 9)
rain.2 <- c(0, 0, 3, 1, 4, 1, 5)
...
rain.weighted <- w0 * rain.0 + w1 * rain.1 + w2 * rain.2 + ...
R 的には上のような冗長っぽいのがむしろ正しい演算手順なんだろう.
もちろん実際にはこうは書かないよ
……
と注釈してみると,
この計算方法でも
ちっともメモリを浪費しないアルゴリズムが存在することに気づいた.
最終的に rain.weighted
が得られさえすれば OK ってことは,
途中では一個の vector でもって
ひたすら「ずらす→加重してたす」を繰りかえしてればよい.
このデータ解析のボスたる鍋嶋さんから,
苫小牧でススめられた計算報告と今後の展開についてのメイルいただく
……
6-7-8 月でけっこう変わるわけで,
しかもその動きはなかなかに奇妙だ.
各月においてひじょーに特殊というか.
次の一手に関しては,
この大量データからわかること,
というのが限定されてきましたなぁ.
当方の作業はあまりススまず.
お茶部屋で釧路大会会計担当の高田さんと
その子分をやってる谷さんの事務処理議論にトラップされる
……
ってこれは「やりません」宣言してる釧路大会雑用ではないか.
ともかく金だけ払ってまだ申し込んでないヒトたちは
早めに申し込んでください.
1940 研究室発.
1950 帰宅.
晩飯.
どうもお役所的な研究機関では Linux 機にも
Anti-Virus のたぐいをインストールしろ,
といったほぼ無意味なお達しがでまわってるよーで
……
H+BEDV
なる free の virus scan ソフトウェアがあるな.
これを free であることは隠して
「インストールしました」
と申告すればよろしいのではなかろーか
(有料ソフトウェア信仰にアタマが汚染されてる連中あいてには
free であることは肯定的評価につながらんだろうから)
……
てなことをぐずぐずと調べてたらすでに真夜中すぎ.
[今日の運動]
-
北大構内走 1315-1350.
ストレッチング.
-
腹筋運動 30 ×
3 回.
腕立ふせ 3 ×
3 回.
[今日の食卓]
- 朝 (0750):
米麦 0.7 合.
ハクサイ・タマネギ・ショウガの炒めもの.
- 昼 (1440):
弁当.
研究室お茶部屋.
米麦 0.7 合.
ハクサイ・タマネギ・ショウガの炒めもの.
- 晩 (2030):
米麦 1.2 合.
モヤシ・ニラの炒めもの.
2004 年 04 月 15 日 (木)
-
0910 起床.
いやはや.
朝飯.
コーヒー.
1000 自宅発.
晴.
1010 研究室着.
-
なンかわけのわからん計算問題にひっかかる.
えーい
そして講座関係のコマかい雑用があれこれと.
-
R をもちいたデータ変換わざについて質問があったんで,
例となるプログラムを書いてみる
……
こういう目的のプログラムはじつにコメントが多くなる.
やはり自分自身ぐらいしか見ないようなやつだと
「変数名・関数名をかなり説明的になるように選んでいるんだから,
コメントが少なくても後からみてわかるだろう」
という予断があるというか.
経験上はこれはそれほど間違いではない,
という気がするんだけど,
実際のところ「自分で書いたコードを再読」
するのにどれぐらい時間を費してるのだろうか.
それはコメント増量によって短縮されるのか.
-
どーも仕事すすまん.
体調も不調っぽいので北大構内走やめ.
しかし腹はへるので昼飯調達にでかけてはみる.
本日は弁当つくってなかったもんで.
いやはや.
時刻は 1438.
-
1600 から 1.5 時間ほど D3 赤坂君の
駒ヶ岳カラマツ分布拡大モデリングのこんさるたんと.
航空写真ながめる
……
ここらではカラマツ植林が 1954 年に始まったということなんだけど,
50 年でこんなに分布が拡大するもんだねぇ.
とりあえず
「もしこういう情報が読み取れたら,
こういうモデルは作れる」
というような検討.
ということで,
あとは
以前に同様の解析をおこなった露崎さんや
写真読み取り専門家なんかの返事まちだな.
-
苫小牧直径成長モデルのプログラム改造,
なかなかススまず.
-
1830 研究室発.
なぜか手持ち現金が尽きたので駅南の ATM へ.
空腹でさっさと帰りたいと思ってるのに,
本屋から脱出できないのはなぜなのだろうか.
2030 帰宅.
体重 74.0kg.
-
釧路大会のシンポジウムに私的な「招待講演者」
を呼びたいので,
申し込みペイジをそれに対応しやがれという無法な要求が実行委員会
ML で回覧される.
それに対する私のコメント.
「変えろ」要求ってのは
……
これはおそらく Z さん流の冗談でしょう.
釧路までわざわざ頼みこんで来てくださる人に対して,
あの繁雑なる申し込み web page にアクセスしろ,
というハナシもないと思います.
家に客人を呼んでおいて
「この電話帳にのってる○○寿司に電話して
あんたに出すための出前をとれ (金は私が払うから)」
と命じるようなものです.
礼儀正しいことで知られる Z さんがさような無礼をなされるとは思えません.
御自分で招待講演者の申し込みをやって,
しかるべく対処されるのでしょう.
他の企画責任者の中には
Z さんほどには礼儀正しくないかたもおられるかもしれません.
その場合は,
企画責任者が責任をもって招待講演者の申し込みをやる,
という手続きにしておけばよろしいのではないでしょうか.
-
[今日の運動]
-
腹筋運動 30 ×
3 回.
腕立ふせ 3 ×
3 回.
-
[今日の食卓]
- 朝 (0920):
米麦 0.4 合.
卵焼.
- 昼 (1500):
北大生協野菜ポテトサンドイッチ.
- 晩 (2130):
米麦 1.2 合.
タマネギ・モヤシ・エノキダケ・豆腐の炒めもの.
2004 年 04 月 16 日 (金)
-
0840 起床.
だめだねえ.
朝飯.
コーヒー.
0930 自宅発.
晴.
0940 研究室着.
-
そしてなぜか朝から M2 平林さんの統計学質問
……
Peter Dalgaard の
Introductory Statistics with R
(2002)
に掲載されてる分散分析 (!)
とゆーか共分散分析 (!!)
とゆー私があまり好きではない (婉曲表現)
手法に関するもの.
で,
即答できん.
うう
-
計算手順は丁寧に説明されてるのでそれを追ってみる
……
あ,
間違いみっけ.
P.175 の二つめの
plot(...)
は log="xy"
とやらで両対数変換 (!)
やってることになってるが,
Figure 10.5 をみるとそうななっていない.
で,
これは著者ペイジの ``Errata and Notes''
にのってないな.
その後に列挙されてる結果みると,
おそらくこの解析は「タテ軸対数変換」
とかやらないほうがマシだと思う.
-
ともあれ,
流れをおっていくとどういう計算やってんのかよくわかったので,
質問に回答できた.
そしてこの呪われ検定技法についての理解も深まった.
いつものことながら,
大学院生たちにいろいろと教育される
……
-
なぜか大阪市大の
GRASSを用いた地理情報システム入門
をながめてしまう.
GRASS
ってのは freeware の GIS.
-
苫小牧気象モデルの降水量フィルター,
以前よりぐっと簡単になった
……
試験運転してみると,
計算も速い.
なんで最初からこういう算法おもいつかないのか.
まだまだ
R
になれてないもんで,
と言いわけしてみる.
-
1345-1420 北大構内走.
曇.
昼飯.
-
粕谷さんからメイルいただく.
前にも何回か書いたけど,
粕谷さんは九大の生物学科の
計算機ネットの管理者なんかも命じられておられてですね,
この時期はとくにたいへんというような.
なんかひどくもったいないよーな.
-
R プログラミングのあちこちでツマる
……
えーと,
いったん
factor
になってしまった値を numeric
に直すためにはいったん character
経由せんといかんのか?
とゆーのも,
factor ってのは
(character(tag)=integer(level), ...)
というカタチになってるからだ.
-
かなり苦闘したすえに,
気象フィルターごとに filtered value
を全組み合わせで生成するシステムができた.
これはまだ第一段階だ.
つぎにこいつらを組み合わせて最終的な「気象値」
の計算にもちこまねばならん.
-
どうでもいいが,
コマンドラインやプログラム中では
options(width=as.integer(Sys.getenv("COLUMNS")))
といった命令は有効であるけれど
(bash 環境のみで有効?),
$HOME/.Rprofile
では error となる.
-
気象値生成まではもちこめずに撤退.
腹へった.
2010 研究室発.
2020 帰宅.
体重 74.2kg.
晩飯.
-
[今日の素読]
-
Salsburg, D. 2001.
``
The Lady Tasting Tea
-- How statistics revolutionized science
in the twentieth century''.
Owl Book.
-
Chapter 24. The Man Who Remade Industry
- Deming on hypothesis testing
-
In chapter 11, we saw the development of hypothesis testing by
Neyman and Pearson, and how it came to dominate much of modern
statistical analysis. Deming was highly critical of hypothesis
testing. He ridiculed its widespread use because, he claimed, it
focused on the wrong questions. As he pointed out: ``The question
in practice is never whether a difference between two treatments
A and B is significant. Given a difference ... however small between
[them] ... one can find a ... number of repetitions of the experiment
... that will [produce significance].'' Thus, to Deming, a finding of
a significant difference means nothing. It is degree
of difference found that is important. Furthermore, Deming pointed
out, the degree of difference found in one experimental situation
may not be same as that found in another setting. To Deming,
the standard methods of statistics could not be used, by themselves,
to solve problems. These limitations of statistical methods are
important. As Deming put it, ``Statisticians need to become interested
in problems and to learn and teach statistical inference and
the limitations thereof. The better we understand the limitations
of an inference ... from a set of resutls, the more useful becomes
the inference.''
-
In the final chapter of this book, we shall look at these limitations
of statistical inference that Deming warned about.
-
[今日の運動]
-
北大構内走 1345-1420.
ストレッチング.
-
腹筋運動 30 ×
3 回.
腕立ふせ 3 ×
3 回.
-
[今日の食卓]
- 朝 (0900):
米麦 0.7 合.
タマネギ・モヤシ・エノキダケ・豆腐の炒めもの.
- 昼 (1440):
弁当.
研究室お茶部屋.
米麦 0.7 合.
タマネギ・モヤシ・エノキダケ・豆腐の炒めもの.
- 晩 (2140):
米麦 1.2 合.
チンゲンサイ・タマネギの炒飯.
2004 年 04 月 17 日 (土)
-
0900 起床.
朝飯.
コーヒー.
-
お,
雪というか霙 (みぞれ) のよーで.
-
釧路大会雑用少々.
1245 自宅発北大構内走.
晴.
1330 帰宅.
体重 74.2kg.
重い.
昼飯.
-
1450 自宅発.
またみぞれ.
1500 研究室着.
-
この土日は釧路大会雑用・事前参加申込者データをあつかう
プログラムでも作るか,
と予定してたんだけど,
ヤメ.
苫小牧直径成長モデリングのほうがススんでいないためだ.
どっちを優先すべきかは明白だし.
それから来週の月-水は何かよろしくない予感が.
-
どうでもいーが,
土曜日だというのにまたしても学内→学外方向で通信途絶ぎみ.
-
1730 とりあえず,
ある気象フィルターパラメーターセットに対して,
必要となりそうな気象値テイブルを生成する関数群はできた.
よーやくにして.
あとは
temp.selector: best=17.8/width=3.0
rain: factor=0.10/time=0.30
ppfd: factor=0.01
temp: factor=0.05
ps ct6 ct7 ct8
1997 0.28732 14.329 18.521 18.143
1998 0.43252 13.392 17.803 18.788
1999 0.16923 15.298 18.793 20.552
2000 0.95831 15.217 18.872 19.962
2001 0.68466 14.570 18.024 18.310
2002 0.79378 14.052 17.774 18.121
2003 0.46765 14.552 15.992 18.388
こーゆーのを数千とーり生成すればよい.
で,
あえてわざと迂遠なコトやってるんだけど,
いったん
テキストファイルに保存する,
と.
いや,
待て.
list()
に格納してから
.RData
データファイルに
save()
したほうがいいのかな?
……
ま,
その前に休憩しますかね.
しっかし,
R におけるデータ型ってのはなかなか注意深くなければならんね
(正確には型ではなくクラス).
言語設計者がどういう意図でもっていろいろな
「型」じみたものを準備したり,
似たようなデータ構造を継承 & 派生させてるのか
……
あたりはぢりぢりとは理解できるようにはなってきたけど.
私の場合,
呪われ言語 C++ とケガれ言語 Perl
での経験にいくらか助けられているような気がする.
プログラミングの経験とかない人が,
いきなりこれつきつけられたらどう対応するんだろう?
あるいは
「助けられてる」
ってのは錯覚で単にジャマになってるだけかもしれんけどね.
よけーな経験してないヒトのほうが,
つまづくことなく取り組める
……
というわけもないような気がする,
このひねくれ言語は.
けっきょくあれこれを .RData
に保存することにした.
というのも,
read.table()
は header 読みこむときに勝手に文字列変換しやがるからだ.
ともかく新しい計算方式にするために,
数日間を費してしまったけど,
そういう時間投資は多少はむくわれるかんぢだ.
以前なら数時間かかった気象値 (数千とーり) の計算を
5-10 分ほどですませられるんで.
以前がひどすぎで,
いまなお無駄計算は残存してはいるんだけど.
こいつらを省くためにはさらにややこしいプログラミングが必要.
ということで放置.
本日の計算プログラム書きはここまで.
鍋嶋さんによる推定計算・作図部分を web page 化.
ひさびさにちょっとした bash 小わざコンボで切りぬける
……
で,
eps → png 変換した図群
ならべて眺めてみると夏季の成長といっても,
たしかに単純ではないのかもしれないなぁ.
ともかく現状報告してから
2110 研究室発.
2130 帰宅.
晩飯.
[今日の素読]
-
Salsburg, D. 2001.
``
The Lady Tasting Tea
-- How statistics revolutionized science
in the twentieth century''.
Owl Book.
-
Chapter 25. Advice from the Lady in Black
-
Stella Cunliffe studied statistics at the London School of Economics
in the late 1930s. It was an exciting time to be there. Many
of the students and some of the faculty had volunteered to serve in
the Spanish Civil War against the fascists. Prominent economists,
mathematicians, and other scientists who had escaped Nazi Germany
were given temporary positions at the school. When she
emerged from school with her degree, the entire world was still suffering
from the Great Depression. The only job she could find was
with the Danish Bacon Company, ``where the use of mathematical
statistics was minimal and I, as a statistician, in particular a female
statistician, was looked upon as something very odd.'' With the
coming of World War II, Cunliffe became involved in food allocation
problems, where her mathematical skills proved very useful.
[今日の運動]
-
北大構内走 1250-1330.
ストレッチング.
-
腹筋運動 30 ×
3 回.
腕立ふせ 3 ×
3 回.
[今日の食卓]
- 朝 (0930):
パンケイキ.
- 昼 (1350):
蕎麦.
- 晩 (2210):
ニラ・モヤシ・ピーマン・ショウガの焼きそば.
2004 年 04 月 18 日 (日)
-
0900 起床.
朝飯.
コーヒー.
-
昨日,
北大構内走しながら,
いまやってる苫小牧直径モデル
(ややむりやり離散化)
で使ってる確率分布すなわち Poisson
分布のいくつかの特徴について考えていた:
-
異なるパラメーターをもつ Poisson 乱数たち
(それぞれ独立)
の和もやはり Poisson 乱数である
(再生性; reproductive property)
-
Poisson 分布のパラメーターが Gamma
乱数であるとき
(Poisson 分布の混合),
分布は負の二項分布になる
……
これらよく知られたふたつの基本的な性質を組み合わせて
悪用すれば,
現在の問題解決につながるのではなかろーか,
という手がかりを得た.
-
すなわち,
成長のよしあしが樹木個体ごとによって異なる
(個体は自分のおかれてる「個別に特殊な境遇を記憶」しつづける;
かつ,
これが人間には観測されてない要因である),
という状況を混合 & 再生 Poisson 分布,
つまりごちゃごちゃとややこしいパラメーターの積にて表現される
負の二項分布でモデリング可能では,
という奇策だ.
しかも,
ごくまれに生じるマイナス成長もうやむやのうちに「帳消し」にされる,
というオマケつき.
こういうモデリング & 推定計算技法が通用するのかしないのか
……
職業的うそつきたる私の欺瞞能力が問われるところだ.
「バレなきゃイカサマじゃあねえんだぜ……」
(空条承太郎, 1989)
-
一番重要なのは,
自分で創作したうそに自分自身がだまされないことである.
次に重要なのは,
他人をだます手間を最小化することだ.
-
分布の平均に関しては首尾一貫してるので問題なさそうだ.
分散に関しては (1 + 1/c) 倍になる
(overdispersion を表現).
この c ってのは
R ふう
にいうと Gamma 分布の rate == 1/scale のことで,
私がよくもちいる α & β notation だと 1/β のことだ
……
これも極限をとると,
つまり Gamma 分布の分散をゼロにもっていくと
ふつーの Poisson 分布に「もどる」ので
(あたりまえか),
問題ないように見える.
ということで,
このように混合してしまって基本的に不都合なかろう.
-
とすると,
次は推定方法の手順か
……
のろのろと考えてるうちに難点に気づいてしまいましたよ.
えーい.
じつは安直に
glm.nb(MASS)
あたりで始末できるんでは,
と楽観していたんだが
……
Poisson 乱数の和が Poisson 乱数になる,
という再生性なる性質を悪用するためには,
年ごとに特定される
パラメーターの和が必要になっちまうよな.
積なんかではないぞ.
マズいねえ.
-
ちょっと打つ手ナシ.
1250 北大構内走にでかける.
晴.
1340 帰宅.
体重 74.0kg.
昼飯.
-
で,
走りながら検討してみたんだけど,
上述のモデルは
-
基本アイデアは問題なさそう;
パラメーター推定可能
-
ただし一般化線形モデルのたぐいには帰着できない;
安直計算に逃げこめない
ということが理解できた.
結論として,
この考えかたは数式とその演算を簡単にするけれど,
やはり optim()
など力わざでごりごりと推定計算
(尤度最大化)
するところは避けられない
……
まあ,
いいか.
この直径成長モデリングの難所たる
「観測してない個体差」&「測定誤差」
どもを一撃で同時にツブせた
(あるいはじゅーたんの下に隠しこめた)
わけだし.
定式化に関してはとうとう決着ついた,
とゆーことで.
-
1520 自宅発.
晴.
1535 研究室着.
-
数式など紙にうだうだと書いてみて検討する
……
しかし Poisson 分布のパラメーター
(すなわちここでは成長量の平均値)
が Gamma 分布にしたがうってのも,
なかなかにとりっきーな捉えかたかも.
つじつまはあってるけどね.
Poisson * Gamma → 負の二項分布,
などという関係に気づいた奴って,
そうとうにヘンな注意力の持ち主だったんではなかろーか
……
-
進捗しない.
すでに夜.
-
さて,
実際の推定計算の手順なんだけど
……
どうも今までみたいに
data.frame()
で成長データぽんと渡して,
みたいにはいかないような気がするのですよ.
私は.
格納するデータ構造を定義すべきか.
それとも data.frame()
でなんとかすべきなのか.
-
よーわからんのでこのへんに書き散らしてみますかね
(in R ふう疑似コード)
……
-
パラメーター値がわたされる
-
全個体に共通して適用:
定数項,
month(?),
気象値項
lp.common <- function(...)
(1, month, (weather terms ...)) * p.common
-
各個体ごとに適用:
サイズ依存項,
サイズ-気象値「交互作用」項
lp.size <- function(tree, ...)
(tree$dbh.log, tree$dbh.log.sq, (d-w cross terms ...)) * p.size
-
個体の平均成長量 (数年ぶん) =
Σyears exp(線形予測子)
mu <- function(...)
sum(
sapply(
years,
function(y)
exp(sum(lp.common$y) + sum(lp.size$y))
)
)
-
全個体の対数尤度の合計
(負の二項分布)
log.likelihood <- sum(
sapply(
trees,
function(t)
log(dnbinom(t$growth, size = theta, mu = mu(t, ...)))
)
)
-
うう,
ややこしー
……
どうすれば計算コストが減らせるのかわからん.
いっそ R やめるか?
-
さらにこまごまとした問題とかがあるし.
たとえば
optim()
とのやりとりだな.
c(1:4)[c(0, 1, 0, 1) %in% 1]
とすると 2 4
と答える.
このへんの性質を使って mapping,
とかせんといかんのでしょうなぁ.
-
かなり整理整頓してやったというのに,
それでもなおとうてい簡単には片づいてくれそうにもない,
なる見とおし得られただけで
本日はすごすごと撤退.
2045 研究室発.
2055 帰宅.
晩飯.
-
[今日の素読]
-
Salsburg, D. 2001.
``
The Lady Tasting Tea
-- How statistics revolutionized science
in the twentieth century''.
Owl Book.
-
Chapter 25. Advice from the Lady in Black
- Statistics at Guinness
- Unexpected variability
-
The list of types of collabiration is typical of the
work of a statistician in industry. In my own
expericence, I have had interacations with chemists,
pharmacologists, toxicologists, economists,
clinicians, and management (for whom we developed
operations research models for decision making).
This is one of the things that make the work day of
a statistician fascinating. The methods of
mathematical statistics are ubiquitous, and the
statistician, as the expert in mathematical
modeling, is able to collaborate in almost every
area in activity.
-
[今日の運動]
-
北大構内走 1250-1340.
ストレッチング.
-
[今日の食卓]
- 朝 (0920):
パンケイキ.
- 昼 (1410):
スパゲッティー.
S&B バジリコソースなる
面妖なる半固形物.
- 晩 (2140):
米麦 0.9 合.
チンゲンサイ・モヤシ・ピーマン・ショウガ・エノキダケの炒めもの.
2004 年 04 月 19 日 (月)
2004 年 04 月 20 日 (火)
-
0820 起床.
朝飯.
コーヒー.
0900 自宅発.
曇.
0910 研究室着.
-
しばらく使ってなかった ThinkPad X31
の赤外線通信能力を回復.
Palm とのあいだでようやく同期がとれるようになった.
-
平林さんのハチ訪花データ構造質問
(in R)
……
やはり
list()
ってヘンなデータ構造なんですかね.
-
なぜか左ひじと机の接点が少々「摩滅」しつつあるので
(むろん人間側),
これまたなぜか引きだしの中にあった
アトリックス メディケイティッド
つけとく.
-
一日中,
明日の講義代行でオワる.
-
1500-1630
講座セミナー,
甲山さんの樹木「共存」モデル.
いつものごとく無限集団・無限時間を考えるもの.
まあ,
上下二層モデルで以前よりは見とおしよくなってるんだが
……
平均場近似とかやらなくてもいい計算方法がある,
と以前に指摘してたのにねえ
(密度共分散の式が閉じるタイプのモデル).
まあ,
どうなることやら.
-
2010 研究室発.
雨.
2020 帰宅.
体重 73.2kg.
晩飯.
晩飯後も準備のつづき.
-
[今日の運動]
-
腹筋運動 30 ×
3 回.
腕立ふせ 3 ×
3 回.
-
[今日の食卓]
- 朝 (0840):
米麦 0.8 合.
タマネギ・ニンジン・マイタケ・豆腐のシチュー.
- 昼 (1310):
米麦 0.8 合.
タマネギ・ニンジン・マイタケ・豆腐のシチュー.
- 晩 (2100):
米麦 0.8 合.
タマネギ・ニンジン・マイタケ・豆腐のシチュー.