ぎょーむ日誌 2002-06-26
2002 年 06 月 26 日 (水)
- 0850 起床.
いやぱや.
朝飯・弁当の準備.
朝飯.
コーヒー.
0930 自宅発.
晴.
0940 研究室着.
- 午前中は統計学本読んで終る.
昨日の「検定論 vs モデル選択」統計学問答に関して
……
「帰無仮説が棄却されなかったときに『帰無仮説が正しい』
と言えない理由は何か?」
について.
私のまわりにある 10 冊以上の統計学本でこのあたりを
明確に述べているモノはどうも無さそうなんで
(むろん読みと考察が不充分ではあるんだけど),
私自身によるとりあえずのとりまとめの試み.
-
統計学的検定は
「比較してる二群に違いがある
(一定の不確からしさを伴いつつ)」
と言明するために構成されている.
-
帰無仮説・対立仮説はともに命題である.
すなわち真または偽といえる.
しかし統計学的検定法では必ずしも
「帰無仮説が真→比較している二群は同等」
とはしない.
-
帰無仮説は対立仮説が統計学的に真である
と言明する統計学的な背理法のために
設定される.
-
いかなる検定法
(統計学的な背理法)
のもとでも
第一種過誤 (帰無仮説を間違えて偽とする) 確率α
と
第二種過誤 (帰無仮説を間違えて真とする) 確率β
の間に拮抗関係がある.
つまりαを減らせば必ずβが増える.
(この部分,
最初は第一種と第二種をとりちがえて書いていて,
竹中さんのご指摘をうけて修正)
- あるαの値のもとでβが最小化されるように設定されている検定は
最良検定
(あるいは最強力検定 most powerful test
…… こっちのほうがよく使われるか?)
と呼ばれる.
-
Neyman-Pearson の補題によって,
ふつーの検定
(単純仮説,
かつおそらく尤度比検定に変換しうるモノ)
で選ばれた任意のαは最良棄却域
になっている.
つまりβが最小化されている.
-
ふつーの検定においてはβは無視される.
ふつーにやれば最良検定なんだから
「βは最小化されている」というハナシだけを受け入れる.
-
対立確率の実現確率 p がαを下まわれば,
統計学的な背理法でもって
(αの危険を伴いつつ)
「帰無仮説の棄却→対立仮説の採択」
となる.
βはαと拮抗関係にあり,
かつ最良検定ではそのα値のもとでは
βをさらに小さくできないので
βの大きさは考えない.
最良検定でありさえすれば
第二種過誤の確率βの大きさは
どうでもよい,
ということになっている.
-
それが許されるのは,
検定の目的は対立仮説の採択にあり,
第一種過誤の確率αさえ小さければ
それでヨシとしているため.
-
いっぽうで
帰無仮説は統計学的な背理法の操作の過程で
でっちあげた仮説で,
そもそも真でありえるはずがない,
という位置づけだったから.
-
帰無仮説は棄却されたときにだけ役目を果たす,
つまり
「二群に違いアリ」
と言うためだけに構築される.
なお,
この「棄却→違いアリ」を導出する論理の妥当性は
統計学の世界では決めることができない.
それが応用される各分野で検討されるべき問題である.
-
逆に p がαより大きい場合は
帰無仮説を棄却できなかった,
と控えめに述べる
(「帰無仮説が真」という言い方はあまり聞かない).
「帰無仮説が真→比較している二群は同等」
といった強い主張にできないのは
βを評価してないから
――
すなわち
「帰無仮説を間違えて真とする」
失敗の不確からしさの度合いがわからない.
-
それではαを大きくしてβを小さくしようとする
操作は許されるか?
これによって
第一種過誤
の確率が高くなる
(違いがあるとは言えないのに
「違いアリ」としてしまう)
ので本来の目的にそぐわない.
-
検定論には非対称性があり,
第二種過誤は許容できても
第一種過誤は許容できない,
としている.
-
同等性を一定の危険率βのもとで言明する
統計学的手法はない
(「同等性の検定」とやらにおいてもαだけが評価される).
帰無仮説が棄却されなかったら,
「なんとなく同等,かも」
とかしてみたり
(誰かからケチをつけられないかぎりは).
- ……
ちょっと強引かなあ.
- これとは別によく言われてる正当化としては,
「帰無仮説を棄却するにはサンプル数さえ増やせばよい」
とゆーもの.
たしかに,
サンプル数増やすにつれ帰無仮説が棄却できる確率は高くなる.
では,
逆に帰無仮説を棄却されないようにサンプル数減らすか?
そんなコトしないよね.
- モデル選択の世界はさらに魑魅魍魎.
しかしモデル選択しなければならぬ,
という局面は意外と多い.
帰無仮説 (みたいなヤツ) の採択もできるしね.
- 統計学はやはり難しいと思いつつ昼飯.
- いかん,
アタマが統計学からにせアカマツに切り替わらない.
- 書くの忘れてたけど,
先週末またレイザープリンターが故障して
(コーティング紙を喰わせた強烈なるジャミング)
生協に修理に出していた.
修理見積りの電話.
6800 円.
しょうがないんで修理おねがいする.
いやはや.
- にせアカマツドラフトを直していく.
- 1630
Trendy セミナー
.
今日は
大原研
の PD 亀山さん.
広島大時代に調べておられた中国山地・鎌倉寺山の
ホンシャクナゲの遺伝学的構造に関するもの.
調査区内個体の遺伝子型は個別に同定
(6-12 個のマイクロサテライト配列に着目して)
できたんで,
さて何をやりましょうか,
というハナシ.
調査区の外から花粉・種子のカタチで遺伝子がけっこう流れ込んでいる.
さらに距離-近縁関係の相関,
と樹木密度の関係が把握できない
……
難しい.
- 1730 終了.
皆して亀山さんとりかこんでお茶部屋でたむろしてると,
日曜日までやってた計算に関して,
発注者・笠木さんから植物の種類ごとに
推定をやってほしいという要望.
うーむ,
そうきたか.
- そーいうこと言われそう,
と思ってたんで
……
計算プログラムの修正は一時間ちょいですんだ.
計算手順メモを直すのに意外と時間をくう.
2000 作業終了.
あれこれ一式をアップロード.
- 2040 研究室発.
北 12 生協で買い物して
2110 帰宅.
ハラへったので今日は北大構内走やめ.
いやはや.
- [今日の運動]
- [今日の食卓]
- 朝 (0910):
米 0.7 合.
ゴーヤ・シシトウ・コマツナ・シイタケ・卵の炒めもの.
- 昼 (1310):
弁当.
研究室お茶部屋.
米 0.7 合.
朝と同じ.
- 晩 (2200):
米 0.8 合.
コマツナ・マイタケ・豆腐の炒めもの.