ぎょーむ日誌 2003-10-27
2003 年 10 月 27 日 (月)
-
0700 起床.
朝飯.
コーヒー.
0820 自宅発.
曇.
0830 研究室着.
-
三中さん日録
10/23
の Dirichlet 分布と Gamma 分布に関するおもしろい記述
……
私のアタマの中ではこの二つの分布はまったく無関係だったんだけど,
じつは (ガンマ乱数) / Σ (ガンマ乱数) が Dirichlet 分布になる,
というような関係あるそうだ.
-
これは何の役にたつのか?
三中さんがこの関係を composition data analysis
がらみで紹介でしてることからわかるよーに,
これは生態学で瀕出する呪われ割算値,
とくに扱いのわけわからん (連続値) / (連続値)
を統計モデルで取り扱うときの出発点になりうる.
たとえば,
C-N コーダーなる割算値ばかりを吐きだしやがる
イヤらしい成分分析機がある.
私の偏見によれば金と時間と手間を食いつぶしてるばかりで
生態学研究には何も貢献していない
(まあ,このへんでは,としておきますか).
役にたたん理由のひとつは,
出力値に関する解析は根拠 free,
つまりおおむねでたらめってことがある.
かかるひねくれ値がどういうひねくれ確率分布に従うか,
というのを特定していくスジみちをつけられるなら,
多少はまっとうな議論が構成しうるかも
……
どうなんだろうね.
-
あ,
あと Dirichlet 分布がなんで Bayes 推定における
多項分布の共役事前分布 (conjugate prior distribution)
として使えるのか,
よーやっと理解できた.
つまり今まで Dirichlet 分布の直感的な描像が構成できてなかったわけで.
-
で,
蓑谷統計分布本とかながめると,
この分子分母を構成するのが標準 Gamma 分布
(scale parameter は 1 …… すなわち平均と分散がつねに等しい)
でなきゃいけません,
という仮定があるよーで.
うーん,
そうなんだろうか?
紹介されてる Kendall 本とか調べるべきなんだけど,
その前に
「平均と分散が比例関係であってもいいんでは」
というような
てきとーな思いつきを三中さんにメイルで出してしまった.
Kendall 本でも標準 Gamma 分布を仮定,
というご教示をいただく.
-
また釧路大会案内原稿問題
……
編集部のある信州大学から連絡.
土倉は情報をまったく転送しとらんようで.
なにやってんだか.
-
てなかんぢで午前終了.
1240 かとーオフィス発.
図書館で standardized 値について調べた統計学本を返却する.
1300 北大国際交流会館着.
「国際交流会館ではネット接続はゆるさん」
とか趣旨不明なことばかりほざいてる
北大事務
(とくに留学生課),
貧弱なる学内計算機網を放置したままの
情報基盤センター,
手前の都合ばかりを押しつけてくる NTT,
といった連中に対する意地というか negative な感情だけで継続してる
光ファイバーひきこみ作戦,
本日はいよいよファイバー設置.
その立ち会い.
-
工事会社つうけん
から総勢 7 名の部隊が 3 台の車両にて派遣されてきて
45 分ほどで作業を終えてしまった.
-
交流会館裏庭を縦断する全長 75m の FEP 管
エフレックス
にファイバーを通す
-
FEP 管末端処理
(写真下段左端)
-
ファイバーをアンテナ柱に持ち上げる
(写真上段右端,下段中央)
-
アンテナ柱-石山通電柱間約 20m にファイバー架橋
(写真上段)
-
歩道をいったん通行止めにして
(歩行者のみなさんすんません),
電柱上部にファイバー固定
(写真上段右端,下段中央)
なかなか面白かった.
-
帰路にまた図書館に寄る.
1410 研究室帰着.
昼飯.
-
あー,
また釧路大会案内原稿どたばた.
旅行代理店かえたんなら,
ちゃんと先方にこれまでのやりかたとか説明しとけよ
……
なんでネット雑用下請けである私があちこちに
問い合わせをせんといかんのだろうか?
-
Matt とよーわからん森林モデリング談義.
計算方法はわかるが何をやりたいのかがいまいち明らかでない.
というか,
計算方法を制約してるものが何なのかわからん.
-
まぬけなことに図書館から間違った統計学本を借りてきてしまった.
とゆーか,
ややこしい.
Kendall には
The advanced theory of statistics
(5th ed., 1952)
なる本があるんだけど,
これは三中さんご指定のそれではなかった.
再編本とでもいうのか,
Kendall's advanced theory of statistics
(6th ed, Alan Stuart & J. Keith Ord eds., 1994)
の volume 1 ``Distribution theory''
が正解だった.
図書館にかりなおしにいく.
-
三中さんの日録では 5th edition に関して
「ここを見よ」
というのが示されている
……
最新版である 6th edition ではなぜか構成が変更されていて,
``The Dirichlet distributions''
は §7.26 にある.
Exercises は 7.12 と 7.13.
-
で,
かんぢんの Gamma 分布だが
……
ここでも蓑谷分布本と同じく,
標準 Gamma 分布で終止してますなぁ.
すなわち平均 == 分散.
たぶん誰かがすでに generalized Dirichlet distribution
とか調べてるんだろーけど
……
と思って,
Google で検索するとぼろぼろ出てくる.
-
昨年度の M2 で今は某大手コンサルタント会社札幌支社に勤める
井田君が 1800 すぎにやってくる.
いんちきになりがちな土建系環境あせすデータ解析を
多少はまっとうなものにしたい,
という統計モデリング相談.
本人いわく自分の「趣味」ですとのこと.
じゃあ,
当方としては来年 4 月の独法化とやらまでは無料ご奉仕期間,
てことで.
某市の莫大なる税金が投入されて得られた観測データ,
なかなか興味深いものである.
井田君が担当しなければ,
これもまたいいかげんな報告に変じてしまったんだろうなぁ
……
-
2030 研究室発.
2040 帰宅.
体重 72.0kg.
-
[今日の素読]
-
Salsburg, D. 2001.
``
The Lady Tasting Tea
-- How statistics revolutionized science
in the twentieth century''.
Owl Book.
-
Chapter 17. When Part Is Better Than The Whole
- The new deal and sampling
-
The mathematics of sampling theory developed rapidly
during the 1930s, some of it at the Indian Statistical
Institute under Mahalanobis, some of it from two papers by
Neyman in the late 1930s,aome of it by a group of eager
young university graduates who gathered in Washington
D.C., during the early days of the New Deal. Many of the
practical problems of how to sample from a large
population of people were addressed and solved by these
young New Dealers at the Commerce and Labor Departments of
the federal government.
-
[今日の運動]
-
[今日の食卓]
- 朝 (0740):
米麦 0.7 合.
ハクサイ・タマネギ・エノキダケ・豆腐の炒めもの.
- 昼 (1430):
弁当.
研究室お茶部屋.
米麦 0.7 合.
ハクサイ・タマネギ・エノキダケ・豆腐の炒めもの.
- 晩 (2130):
米麦 0.7 合.
ハクサイ・タマネギ・エノキダケ・豆腐の炒めもの.