【提案受け付け番号】:XW-022 【提案者お名前】: 久保拓弥 様 【所属】: 北海道大学・地球環境 【タイトル】: データ解析で出会う統計的問題 - 「何かが選ばれる」統計モデル 【提案内容】: 動物や植物が「何かを選んでいる」かのように見える現象のデータ解析に使われる統計 モデルについて検討する.たとえば動物個体間のあらそいを解析する Bradley-Terry モデルはずっと以前に提唱されたものであるが,データにあてはめる方法があまり知ら れていないので普及していない.このモデルを拡張すれば,植物の花粉親としての成功 要因を特定する Burczyk モデルになる.また「以前の挫折をひきずっている」といった 個体内部状態を反映した意思決定のモデルも使われるようになってきている.このよう な決定・選択のデータ解析はGLMによる解析が困難な場合も多い.しかし,R の package やベイズモデルを導入することで,うまく現象の背後のプロセスを解明できる場合がある.
help.start()
とかやると (私はこの browser が起動させる関数は好きではないのだが),
http://127.0.0.1:15573/doc/html/index.html
とかに接続するんだよね
……
つまり port 15573 にあるもの,
それはいま起動している R 自身が web server になっている,
とゆーことで
(で,request に応じて新しく HTML なペイジを生成する).
make.packages.html()
わざとかが,
正しく動作してないような気がする.
options()
指定とかのせいかな?
library(R2WinBUGS)
はへなちょこぎみなんだけど,
生成される
bugs オブジェクト
ってのがすごく冗長なんだけど,
まあ何かとおてがるなので使いたいんだよね
……
以下は,うまい流れの説明になっていませんが,まずは,とりあえず考慮すべ き点をいくつか列挙しています. じつは第一種の過誤・第二種の過誤は独立に設定できるわけではありません. トレードオフ,つまり一方をきびしくすれば他方は甘くなるという関係にある ります.そしてこれらの値は実験計画の段階で実験者がこれら過誤の確率の有 意水準を設定するのだけど,第一種の過誤については 0.05 より小さいほうが いいんじゃないといった合意はあるけれど,第二種についてはそういう合意が ありません. 上述のトレードオフについて整理しておくと,「帰無仮説が正しいのに,誤っ て棄却する確率」の規準として設定するのが有意水準αですが,これに対応し て「対立仮説が正しいのに誤って棄却する確率」はβとなります.検定ではα を事前に決めることになっていて,しかも (逸脱度の差の分布についての図を 描いてもらうとわかるのですが) αが決まると自動的にβも決まるようになっ ています.これらは独立ではなく,αを小さくするとβは大きくなり,βを小 さくするとαは大きくなります. さらに抑えておくべきは,ネイマン-ピアソンなわくぐみの検定では P 値の大 小そのものが問題ではなく (P 値が小さいほどよいといったものではない),有 意水準の領域に入っているか否かが問題になります.つまり P 値がいくら小さ くても 5% 有意水準のもとでなされた検定は,第一種の過誤をおかす確率はつ ねに 5% です. 以上の諸点をおさえたうえで,教科書的には正しい (ただし検定濫用者ほど ないがしろにしがちな?) ネイマン-ピアソンな検定の手順をおってみましょう. 1. 実験前にαを決める 2. そのαのもとでβについてはできるだけ小さくなるように努力する. 具体的には検定の方式を吟味したり,標本数と研究費の関係について 検討したり,1. にもどってαを修正したりしてβができるだけ小さく なるようにする 3. 実験し,データにもとづいて P 値を得る 4. P < αであれば,十分に小さいβのもと,有意水準αの検定によって 帰無仮説が棄却されたといえる 5. P >= αであれば,第 1, 2種の過誤の確率がそれぞれ α, βのもと での検定で帰無仮説が棄却できなかったが,第二種の過誤に関しては 対立仮説を棄却するためにβをきめたわけではないので,これによって 対立仮説を棄却できない つまり,ネイマン-ピアソンの検定のもとでは, ・αは帰無仮説を棄却するために,それっぽい値を設定しておけばよい ・βについては,対立仮説を棄却するためではなく,対立仮説を誤棄却しない ように (各実験を実施する有限の手間・予算のもとで) 可能なかぎりβを小 さくなるよう努力することになっているので,「βをこれだけ小さくしたん だから,対立仮説を棄却してもいいだろ」といった合意が作りようがない (蛇足ながら,実際にβを事前にきちんと見積もる研究者はまれ) となっていると考えればよさそうです.じつは,教科書内の説明では検定の非 対称性について注意しておきながら,その要点はこういうα・βの決めかたの ちがいにある,とは明確には理解してませんでした……
久保です.箱ヒゲ図については,とりあえず, 日本語版の Wikipedia の記述 http://ja.wikipedia.org/wiki/%E7%AE%B1%E3%81%B2%E3%81%92%E5%9B%B3 と英語版の記述 http://en.wikipedia.org/wiki/Box_plot をよく読み,それでも足りなければ英語版にあげられている文献にあたってください.じつは R の箱ヒゲ図の「ひげ」は, これらのペイジに記述されている方法とはちょっと異なるやりかたで位置がきめられている. help file にあるとーり,
+/-1.58 IQR/sqrt(n)
.
sudo apt-get install ibus-mozc
だの
im-setup -c
で ibus
に変えるだの,
$HOME/.bash_profile
を
export XMODIFIERS="@im=ibus" export GTK_IM_MODULE="ibus" export QT_IM_MODULE="ibus" export XIM_PROGRAM="ibus-daemon -d"と試してみたのだが …… たしかに使えるようになったんだけど, 「いまは日本語もーどでーす」 といった表示がでないので (Gnome でないとダメなのか?), いやはやとおもいつつ scim-anthy にもどしてしまった. うーむ ……
options(browser = "/usr/bin/wget")
と指定しておいて,
help(なんちゃら, help_type = "html")
すると help の HTML ファイルが生成される.
/home/kubo
直下のいくつかの PDF ファイル,
なぜか .bash_profile
がかきかわってる
Ctrl+Alt+F1
で gdm からコンソールに移動,
root でログインして umount -f /home
して fsck.ext3 -f -y /dev/sda3
……
やはり EXT3 ファイルシステムこわれてる
……
これって SSD の寿命とかのせいか?
/dev/sda3
に限定されてるもよう.
rsync
で復旧
……
これでだいじょうぶかな?
二重にバックアップしといてよかった.
order()
による最小値・最大値探索わざをコメントしてみる.