ぎょーむ日誌 2014-10-13
2014 年 10 月 13 日 (月)
-
風邪.
ねたきりでした.
twitter だけやってた,
みたいな
……
また芸もなく
Twilog
はりつけ
……
- 熱があまりさがらないので、家の中ひとりで寝たきり状態です…少しはマシになってきたかな?まあ、今日はのんびり休もう…
12:22:41
-
@TJO_datasci
おみまいありがとうございます。かぜには気をつけましょう…
12:27:53
-
@TJO_datasci
なが患いでしたね…さっさと回復するべく今日はひたすら寝ます。
12:34:19
-
RT
@mas__yamazaki
: マレーシア航空17便の撃墜事件で、オランダのティマーマンス外相と同国の検察当局は、乗客1人の遺体が酸素吸入マスクを装着していた状態で発見されたことを明らかに(CNN)
bit.ly/1vVLIQg
「マスクを着ける時間があったことを意味し、即死しなかったことを示唆」
13:18:28
-
RT
@ibaibabaibai
: 「信頼区間」というのは「データを入れると信頼区間が出てくるルール」なんです.アルゴリズムとか関数といってもいい.推定値ってのはみんなそうじゃないか,っていわれそうだけど,信頼区間については特にそれを強調する価値があると思う.
14:47:19
-
RT
@ibaibabaibai
: 点推定値のまわりに「誤差棒」をつけるのなら,その推定値をモデルに入れて,何回もデータを発生させたと考えればよい.実際にそうやっても良いし,解析的な近似も可能かもしれない.これが私が「なんちゃって誤差棒」と呼んでいるもので普通はこれで十分なことも多い.
14:47:42
-
RT
@ibaibabaibai
: 本当は点推定値にも誤差があるので,「真の値」を入れたモデルからデータを発生させたい.でもわからない.大げさにいうと,自分の誤差を自分で評価できるのかという自己言及めいた問題になる.
14:49:48
- 「信頼区間」というのは「データを入れると信頼区間が出てくるルール」 …という baibai さん指摘、生態学分野の glm() 使っている人はほぼ理解してない。むしろ事後分布みたいな脳内モデルが受容的で、そのセンに沿って説明すると直感にあうみたい…私の説明のしかたが悪いのかな?
15:07:50
-
RT
@ibaibabaibai
: 信頼区間についてはベイズ信頼区間(確信区間)のほうがわかりやすいと思う.なんちゃって誤差棒ですませばそれほど難しくはないように思うが,それでも多少は心理的抵抗がありそう.そもそも「調査」「抜き取り」とかでないのにサンプリング誤差とは何かというより根本的な疑問も出そうだし.
15:31:39
-
RT
@ibaibabaibai
: 検定を重視する分野だと有意性と誤差のサイズ・エフェクトの大きさが同時に表示できるのはありがたいだろうと思う.「なんちゃって誤差棒」だとそうはならない.
15:35:29
- 生態学分野の場合、信頼区間生成プログラムを与えてもエフェクトサイズなんぞ気にかけてくれるかどうか…?95%区間内にゼロあるや否や、統計学は丁半バクチと心得、単純明快が信条のゆーい差決戦主義えころぢすとあなどれませんね…「ゆーいじゃない?もっとデータ取ろう」という往生際の悪さもあり
15:58:44
-
RT
@ibaibabaibai
: ただ「仮説検定など日常の論理ではない」となるとどうでしょう. 「この空の様子は普通ではありえない」という人は「いま見ている空が,私が「普通の空」と呼ぶ帰無仮説から生成された確率は大変小さい.よってこれは正常な空ではない」と言ってるんじゃないかな.
16:04:44
-
RT
@ibaibabaibai
: 確信区間でなく信用区間なのかな.覚えられないので「ベイズ信頼区間」でいいような気がしてきた.
16:33:12
- それなりにこみいっていて日常感覚になじまない Neyman-Pearson な検定のわくぐみが生態学分野で普及したのは不思議…たぶん「p < 0.05 ならあんたのハナシは正しいと主張可能」なる誤解が集団内に固定し、p だけ見てればいいという「安心感が共有」されているんだろうね…
16:33:37
- エフェクトサイズの検討が不人気な理由は、解釈にあたって使用している統計モデルの理解が必要とされるからかな?…p 値のみ重視するゆーい差決戦主義なら「キいてる」「キいてない(誤解釈)」だけで議論終了。かんたん。
17:28:43
- .
@TJO_datasci
そうですね…主語は必要なので「○○はキいてる」と表現されてはいます。ただし、ごくまれには、解析者の意図と推定値の正負の符合が逆であることに気づいてないことも…
17:54:37
- マイスターとら師匠の
#今日のレゴ
作品 、作品名は「カバとヘリコプター」、みぎの緑・青のブロックがカバ、その他はヘリコプターだそうです。
pic.twitter.com/C4N76BRHPs
19:58:34
-
-
RT
@TJO_datasci
: 「彼女ができるデータマイニング」をお願いします — 彼女ぐらいデータマイニングなしで作れよ
ask.fm/a/bc590qhj
20:03:23
- これ、かなりおもしろいハナシでした。データベイスあるところデータ解析あり⁈ 私がオンラインデートを攻略した方法
www.ted.com/talks/amy_webb…
20:06:57
- 生態学ゆーい差決戦主義史観ざつだん…10-20年ぐらい前(かしら?),順位統計量をつかった検定いわゆるノンパラメトリック検定がはやり,これはある意味では「(人間に解釈可能な)統計モデルなし,検定だけ」だったので,「p<0.05 だけを確認すればヨシ」というナガレが加速したのかも?
21:40:02
- 分散分析はいまだに生態学でよく使われるデータ解析,これは線形・正規分布モデルに特殊化した尤度比検定みたいなものとみなせる.ソフトウェアの出力は分散分析表なるもので,伝統的には「効果の大きさ」表示なし,分散比とF分布で算出されたpが示されるのみ.これまた統計モデル理解が不要の世界?
21:49:41
- .
@ibaibabaibai
うーむ,粕谷さんはかなり早い時期から順位統計量検定の「万能ではない」論文を出したり,何しろ柔軟な勉強家なので一般化線形モデルの本
www.kyoritsu-pub.co.jp/bookdetail/978…
も出しておられて…「のんぱら信仰」は安きに流れる解析者たちの暴走ですかね…
22:00:32
-
@ibaibabaibai
改訂されてないみたいですね.私の勝手な憶測ですが,たぶん改訂する必要なしと考えておられるのかも……ぴんく本目次
www.kinokuniya.co.jp/f/dsg-01-97848…
をみても「のんぱらあおり本」というかんじでもないわけですし……
22:11:53
-
@ibaibabaibai
私も目次をひさしぶりにみて「あれっ? こんな構成だったっけ?」と意外に思いました.あした研究室にいったら,ぴんく本をながめてみることにします……
22:17:50
- とりあえず,おかげさまで風邪気味状態を脱出しつつあり,ざつだん tweet をあれこれかけるぐらいになりました.明日も6時おきなので,さっさと寝ることにしよう……ふちょーぎみだと眠りも浅くなりがちだし.
22:19:55
-
@ibaibabaibai
……ということで,「順位統計量の確率分布」を使った次第に衰退しつつある(しかし絶滅しない)手法ではないかと思います.ならびかえや bootstrap を使った手法は発展していくと思いますが.
22:27:25
- 歴史的ぢゃーごん補筆: かつてある時代において生態学をふくむいくつかの分野で以下のよーな用語が使われていた……ぱらめとりっく統計: 正規分布を使った検定のこと,のんぱらとりっく統計: 正規分布を使用しないで順位統計量を使った検定のこと.「統計」と「検定」はほぼ同義.
22:34:17
-
RT
@ibaibabaibai
:
@KuboBook
考えてみると,ならびかえやサロゲーションは帰無仮説の作り方で,順位は検定統計量なので,論理的には独立でした.尤も,順位検定が好きな人というのは自分が「なにをランダム・意味なし」とするかをデザインしようとはあまり思わない傾向かな,という気はします.
22:36:37
- 統計連合大会のチュートリアル「マッチングと統計解析」聞いてかなり勉強になったんだけど,「傾向スコアを使ってマッチングさせると p 値が0.06 から 0.04 になりました」みたいなオチの説明がわりとあって,「p 値好きな学問分野」は広大なのかもしれない,とゆー気分になりました.
22:48:17
-
[今日の運動]
-
ラジオ体操: 1 回
……
たしか,
とらにあやつられて一回やったような?
-
[今日の食卓]
- 朝 (???):
たしか,
くってない
- 昼 (???):
シリアルすこしずつ,
時間不定
- 晩 (1830):
米 0.7 合.
コマツナ・豆腐の味噌汁.
鶏肉・サツマイモのショウガ炒め.
ニンジンサラダ
……
おかげさまで,
だいぶ回復しました