ぎょーむ日誌 2011-01-07
2011 年 01 月 07 日 (金)
-
東京出張二日目.
0640 起床.
朝飯.
-
生態学会雑用.
-
今日の発表内容のみなおし作業
……
-
0905 宿発.
曇.
0930 統数研着.
-
10 時より
研究会
はじまる.
午前の部は
「説明変数に誤差のある回帰をめぐる話題」
なるもので最初は伊庭さん.
説明変数 x の誤差のおよぼす影響は,
線形ではなく非線形の問題で重要になるんでは,
といったご指摘でカーネル回帰 + MCMC の工夫とか.
-
で,
次が私で
2010 年 3 月の自由集会
の自分のハナシ
(回帰はヤメて統計モデルをかえましょう)
などでごまかす
……
じつはこれが失敗で,
粕谷さん・伊東さんがされた直線回帰の例をくわしく説明すべきだった
(いいわけ: 伊庭さん「線形の場合はそんなにおもしろくない」とのご指摘だったので)
……
-
どうもいろいろな意味でハズしたハナシでしたな.
しかしたまにはこういう居心地のワルい発表をすると,
自分が何モノなのか少し理解がススむような気がする.
-
で,
午前の部のメインである
の「セミパラメトリック統計数理の情報幾何」
(「セミパラメトリック」なのは各 x に対応する真の値がパラメーターになるから).
直線回帰 (しかも傾きを推定するだけのやつ)
でもバイアスのない推定はそれなりに難しい,
といったことを数学的に示すもの.
つまり
2010 年 3 月の自由集会
で伊東さんが実例で示されたあれこれで,
当時は「何かヘンだな?」と思っていたんだけど,
じつはあのように「バイアスがなかなか解消されない」
というのは正しい結果なのだとわかった.
-
単純なスコア関数 (対数尤度をパラメーターで微分したもの)
を使うと必ずバイアスが生じるという指摘があり,
これを解消するためには nuisance parameter の軸に直交するような
スコア関数を使って最尤推定しなさい,ということに
……
-
で,
これをやるために推定関数法というやりかたでスコア関数を作るわけだが
(このあたりからよくわからなくなるわけだが)
……
尤度がわりと簡単なかたちでないと,
直交 (projected) スコア関数が explicit に導出できない,
といったハナシになったりしてですね.
-
ともかく,
切片ナシの傾き推定の場合,
ある場合には TLS (直交最小二乗法の尤度) がよく,
またある場合には (全 y の和) / (全 x の和) といった推定量がよく,
一般にはその中間に
……
といった結果の例が示されたりですね.
x について複数の観測が得られている場合にも
(この状況は伊東さんの実験にもあり),
ひとつひとつの x に対する観測回数が少ない場合は
ダメといったご指摘なども
(n - 1 で割る不偏分散にすればよい?).
-
甘利さんのハナシをきくのは今回が初めてなのだが,
内容だけでなく話しかたもたいへんよいものでした.
ああいう軽妙なかんじで内容のあるハナシができるようになればよいのだけど
……
-
昼飯.
-
午後は「仮想データとその周辺」
というまた別の研究会です,
という伊庭さんの紹介からはじまる.
関連きーわーど:
逆像問題,サロゲイション,データ秘匿,
……
-
最初は津田さん.
graph kernel と pre-image (これの訳が逆像?) 問題,
例題は
drug discovery
である構造の化合物の特徴空間に写像する問題の逆問題,
特徴空間内のある位置にくるような化合物の構造を決める問題.
-
次は坂野さん.
手書き文字認識,
GA で切りはりして,
さらに
ソフトウェアに質問を作らせる
(そのソフトウェアが自分の能力を高めるための),
といった手法.
-
休憩.
-
星野さんによるデータ秘匿の review.
お役所とかがもっているデータ,
公開したいけれど個人情報が特定されないようにしたい,
といった状況でどういう統計学的な工夫が必要か,
といったハナシ.
-
伊庭さんのレアイベントをサンプリングする MCMC 工夫のハナシ.
私はいままでレプリカ交換法とマルチカノニカルの区別がついて
いなかった,
と判明した
……
-
最後は平田さんで,
「ならびかえ」を駆使して「帰無仮説的な」
時系列データを生成するわざの解説.
いったんフーリエ変換したりとか
……
しかしこれとて「ならびかえ」に援用するためなのだが.
-
ということで,
1745 ごろ終了.
たいへん勉強になる,
しかも元気のでる研究会でした.
-
さて,
本日中に札幌に帰れるか?
1755 統数研発.
1805 多摩モノレイルで高松発.
1808 立川着.
500 円よぶんにはらって
1815 特急あずさに乗ってみたけど
……
1844 新宿.
そんなに速くなかった?
1846 同発.
1906 品川.
京急にのりかえて
1907 同発.
1920 蒲田着.
空港いき急行にのりかえて
1928 同発.
1942 羽田.
-
ちょっとぼーっとしてたら 20 時にいきなり
あちこちの食べもの屋が閉店してしまった.
売店でベイグルサンドイッチを買って,
2020 晩飯.
-
2050 ANA4727 B-737-500 (AIR DO の機体)
に搭乗.
ほぼ満席.
これが一番おそい便なんだけど,
こっちにしといてたすかった.
とゆーのも,
ひとつ前のやつは機材がとどいてなくて,
これよりも遅くなってしまったよーで.
2110 離陸.
2230 新千歳空港着.
しかし空港内が大雪で混乱していて,
なかなか降機できない.
空港内を走ったのだけど
……
しかし雪のため最終の快速エアポートの到着も遅れていて
2250 発のはずが 2259 発.
吹雪.
のろのろ運転.
2355 札幌.
56 分もかかった
……
いつもより 20 分ぐらい遅い.
-
このあたりで 1/7 (金) 終了,
桑園いき普通列車も遅れまくり.
ホーム寒い.
2406 JR 札幌駅発.
2408 桑園着.
2420 帰宅.
[桑園からの帰路]
こんなかんじで積雪してた.
-
[今日の運動]
-
[今日の食卓]
- 朝 (0730):
ハムサンドイッチ.
バナナ.
- 昼 (1230):
こんびににぎり飯.
- 晩 (2030):
羽田空港のベイグルサンドイッチ.