DATE: 2010-12-29 21:47

HUSCAP レター: 私の研究

久保拓弥
地球環境科学研究院助教

huscap17

「ゆーい差」なヒトたち

「とにかくゆーい差だす検定おしえてください,ゆーい差」
「いや,そもそもデータをこんなふうに切りきざんでは……」
「だって,この分野ではみんなそれでゆーい差だしてるんですよ!」
「えーと,それはみなさんが」
「ともかく他の人も全員こうやってるんです!」
ときには, データ解析の相談に来る人たちとの間で, こういったすれちがいぎみの対話 を楽しむことなども私のぎょーむの一部です. そのぎょーむなるものは何か, HUSCAP とはどう関係するのか?

データとモデルを結びつける統計学

生態学という生物学の一分野の中で, もともとは理論みたいなものをヒネっていました. しかし, 空想的な数式と現場で観測されたり測定されることが, 概念の上ですらどうやってもつじつまがあわない. こりゃーだめだと投げました.

そうではなくて, 現実の観測データにもっと密着して, そこから特徴的なパターンを抽出し, その背後のプロセスを言いあてる (図 1) --- そういったことを可能にするのが現代的な, つまり計算機集約的な統計学的手法というものにちがいない. よし, これを生態学にもちこんで何もかもひっくりかえしてやろう …… あとから考えると, これは若き高揚した反逆院生の独創などではなく, 1990 年代以降に科学の諸分野をまきこんでいった巨大な竜巻, それから派生したごく小さなつむじ風にすぎなかったのですが.

仲間うちのブラックボックス統計学

いろいろ勉強していくうちに …… かつて私に「もっとデータを重視しろ!」 とご忠告くださった「現場で研究する人」たちの所業ってのは, データ虐待とでもいいますか, データ切りきざんでひねりつぶして混ぜ混ぜしてどろどろ, それをぽいっとブラックボックスな (つまり挙動をよく理解していない) 統計ソフトウェアに流しこむ, そういった一連の不思議な儀式のように見えてきました.

「仲間うち」ではこれでも以心伝心でハナシが通じる. しかし, そのミクロな分野ごとに特殊化奇形化した「ブラックボックス文化」 を共有しないヨソものにはさっぱりわからない. なんでこのデータ解析でそう結論できるの? その統計学的な有意差が,生物学的に重要な差と言えるの? そもそも,このブラックボックスなヒトたち, 「ゆーい差」ってどういう意味か理解してるの?

統計モデリング解説記事を HUSCAP で配信

データをとっている人たちのデータ解析をお手伝いするのが, 私の現在の「ぎょーむ」です. しかし「ブラックボックス」「ゆーい差」決戦主義なヒトを相手にするのはしんどい. ふむふむそれならば, ここはひとつ新しめの統計モデリングの解説記事を書いてやろう. 生態学会誌なんぞに掲載しただけでは誰も読まないから, HUSCAP でネット配信して大いに扇動してやろうと画策しました.

HUSCAP の強みは学術文献の検索エンジンと連動しているところなんでしょうね. たとえば,とある解説記事のダウンロード数は一年ちょっとで 900 をこえました. HUSCAP に記録されたダウンロードもとを見ると, 生物学だけでなく多くの分野のかたが読んでくださったとわかります.

ネット配信のおかげで, とくに若い大学院生たちは こういう解説記事なんか読んで勉強してくれるので助かります. もちろん冒頭みたいな人もいるわけですが …… まあ, 何ごとも楽しまなくては, やくざなデータ解析傭兵稼業はつとまりません.
「久保さんの書かれた解説記事でベイズ統計モデルがわかりました」
「うれしいですね」
「ところでベイズでゆーい差はどうやって出せばいいのでしょう?」


(図をまとめてダウンロード: kubofig.zip)


KuboWeb