ぎょーむ日誌 2003-06-03
2003 年 06 月 03 日 (火)
-
0730 起床.
朝飯.
コーヒー.
0810 自宅発.
晴.
0820 研究室着.
-
朝からまたカテゴリカルデータ解析勉強
……
小標本数で使われる「近似ぬき」計算と
大標本数で使われる「近似あり」計算のミゾはけっこう深いんでは,
という気がしてきた.
というか別モノですな.
-
お茶部屋ででれでれしてると,
大澤君が
Gnumeric
(ゑくせるもどき)
で作った表もってくる.
こないだの苫小牧実習で調べたシウリザクラ (小調査区内) 全数調査
であるんだが
……
ちょっとデータ解析しようがないか.
ということで,
Perl + pLaTeX 連携ワザによる自動作表技法を伝授.
-
北大構内走.
よく晴れてますなぁ.
昼飯.
院生のみなさん調査に出てしまっているので,
人口密度ひくい.
-
午後から甲山モデリングコンサルタント.
また不必要な複雑化をやってるんで,
上下競争アリの
甲山さんふうモデリングを極限まで単純化すると
どうなるかを示す.
-
かてごりかる……勉強.
-
ひととーり読んでみてわかったことは,
やはりこういう「線形からなんらかのカタチでずれた世界」
では面倒を回避するすべはなさそう,
ということ.
実際のデータを直視しない時代は幸せだった,
ってことかな.
-
この本が推しているのはモデルごとの尤度を計算し,
それを比較する方策である (尤度比検定).
それにたいして Χ2 値→χ2
近似とか Wald statistics を用いる方法はあまり推していない
(とくに後者).
まあ,
近似のよしあしと汎用性のかねあいだろうな.
そして「近似ぬき」であれこれと確率を計算するやりかたは
今後は発展してくるんだろうけど,
現時点では尤度比をもちいたそれほど他のやりかたとの
互換性が大きくない,
と.
さて.
-
統計学的失敗を避けたければ,
いろいろなモデルに関して愚直に
あてはまりの良さを調べなければならない.
さらに,
あてはまりがよかったからといって
それを採用するのも慎重でなければならない.
可能であれば確率論的モデルの段階にたちかえって
検討をやりなおさないといけない
……
-
今後,
統計学というのは利用者にとってはわかりやすくはなるだろう
(ブラックボックスは少なくなる)
けど,
手間は増えるようになるのかもしれない.
-
ともあれ当面の問題に関して作文して,
小川さんに送信.
2020 研究室発.
2040 帰宅.
体重 71.8kg.
晩飯.
-
[今日の運動]
-
北大構内走 1250-1325.
ストレッチング.
-
腹筋運動 30 × 3 回.
-
[今日の食卓]
- 朝 (0740):
米麦 0.7 合.
コンブ納豆.
ネギ・ブナシメジ・豆腐・煮干の味噌汁.
- 昼 (1335):
弁当.
研究室お茶部屋.
米麦 0.7 合.
チンゲンサイ・タマネギ・マイタケの炒めもの.
- 晩 (2130):
蕎麦.
チンゲンサイ・タマネギ・マイタケの炒めもの.