ぎょーむ日誌 2013-12-20
2013 年 12 月 20 日 (金)
-
3 時にとら泣き.
エルゴでおんぶうろうろ
……
23 時のときと同様に,
寝かしつけ「寝わざ」の
あらて
が今回も通用して,
20分ほどで寝てくれた.
しかしながら,
今晩 3 度目のねかしつけなので,
当方ばてばて.
背筋いたい.
なぜか足もかゆい
……
-
0600 起床.
朝飯・弁当の準備.
朝飯.
とらめし.
コーヒー.
0815 自宅発.
路面,
やや「つるつる」ぎみ.
0825 保育所着.
朝の保育園におけるとらの様子は
……
ここしばらく「ごきげん」であるように見える.
0900 研究室着.
-
例によってあまりさえないわけだが
……
昨日のつづきでアリけんか論文の修正をすこしだけススめてみた.
-
昼飯.
-
植生学的な発想でいろいろ研究をすすめてがんばっている院生に,
ちょっとそのあたりの方法についての私の感想じみたものをまとめてみる.
まあ,
そんなに「一方的なだめだし」みたいなことは言ってないつもりなんですが
……
一部抜粋:
どうも私は植生学の考えかたとデータ解析手法が何かうさんくさいものだと考えているようで,例の野外実験の経過観察データを植生学的な発想・手法であつかうことに疑問をもっているという状況なのでしょう.
私自身は植生学は勉強したことがなく,露崎さんの大学院生たちがときどき植生学的な多変量解析とかをやるので,その手法あれこれ関連性や妥当性を検討してみたり,手法の背後にある「考えかた」について文献を少し読んでみたぐらいです.
とりあえず,私自身の理解としては「植生なヒトたちはいくつかのれ環境傾度 (連続的・一次元的で単純な尺度が前提?) の単純な組み合わせ (直交性みたいな) 植物群集の構成 (つまり群落構造) が決まると考えている」ので,ああいう多変量解析をやっているのだろうといったところです.釜野さんがいろいろな方法をあげていますが,
-
多変量解析あれこれは本当に上のような考えかたにそったものなのか
-
そもそも上のような考えかたは現代の生態学で妥当なものだろうか
といった疑問がつらつらとわいてくるんですよね.とりあえず,環境傾度の組み合わせ→群落構造というのあまり「実証」されていないような気もします.
-
以下は,
別便にわけた,
おもに「多変量解析」よりのハナシ
(私もかなり不勉強なので書いてあることに一部はおかしいかも),
いくつかのパラグラプをぱらぱらと抜粋:
さきほどのメイルで書かなかった,植生学的な多変量解析についてのいくつかのコメント,みたいなものを書いてみます.これまた私が本とかをぱらぱらながめただけの独学にもとづくもので,自分自身でソフトウェアを使ってみた経験もないような状態なのですが,以前から気になっていたので,ちょっとそのあたりを……
植生学的な多変量解析は基本的にどれも古いものが多く (つまり現在よりずーっと性能の悪い計算機で動作しなければならないという制約条件のもとで開発されたものです),現代的なデータ解析の考えかた (たとえばデータのばらつきみたいなものを考慮する,など) がうまく組みこまれていなくて,その結果として「データセットをちょっと変えると,結果ががらっとかわる」みたなことがおこりやすいかもしれません.
露崎さん雑談 (半分冗談?) のひとつとして「都合のいい ordination できなかったらどうするか? いくつかの調査地をぬいてみたりすると,それっぽくなったりすることもあるんだよね〜」といったハナシもあります (もちろん現代的な統計モデリングでもこういった種類の操作は不可能ではありませんが).
TWINSPAN と DCA には共通点があります.それはどちらも reciprocal averaging (RA) あるいはその別名 corresponding analysis (CA) による ordination をやっていることです (と小林本に書いてあるけど,ホントなのだろうか?).
TWINSPAN は,そのあと指標種 (私にはこのあたりよくわかりません) をにらみながら,さらに並び替えをやって,その後「分割」するわけですね.いっぽうで DCA というのは D こと detlended なる凶悪な操作をやって第 2 軸の方向に生じている「歪み」を強制的に無くしてしまうという……私はいろいろな数理的手法を勉強しましたが,これは現用されている方法の中では,かなりひどいものです……ともあれ,どちらも CA なる操作をしているので,理論的に考えると,似たような結果になっていても不思議ではありません.ただし TWINSPAN は最後にナゾの並び替えをやるのでその効果がよくわからない,あるいは,PC-ORD と R の library(vegan)
では CA なんかの計算方法が違っていて,両者がうまく対応しないという可能性はあります.
nMDS は上とはまた異なる方法で,何らかの群集類似度で測られた plot 間の「距離」にうまく対応するように,plot ごとの多変量データをこねあげてつくった統計量を作りましょう,というものですよね.
この「対応」づけにおいて,nMDS の n こと non-parametric な方法で並べる,つまり私が前のメイルで書いた「尺度」の問題が気になるので,「plot ごとの値の大きさ」そのものではなく大小関係だけをみて序列化しましょう,といった方法です……これまた,私はぜんぜん使った経験がないので,良いのか悪いのかいまいちぴんとこないです.
たとえば library(vegan)
で nMDS をするときには vegedist()
関数で群集間距離を決めるようですが,この群集間距離みたいなものがいろいろ選べるようになっていますよね……距離計算の方式を変えると結果がどう変わるんだろうといったことも気になります.
-
1720 研究室発.
買いもの.
1750 帰宅.
とらめし.
晩飯.
-
[今日の運動]
-
[今日の食卓]
- 朝 (0650):
米 0.7 合.
ネギ・アサリの味噌汁.
- 昼 (1200):
研究室.
米 0.7 合.
めざし.
タマネギ天.
ブロッコリー.
ミニトマト.
- 晩 (1840):
焼き鳥.
シュウマイ・ギョウザあれこれ.