ぎょーむ日誌 2005-04-16
2005 年 04 月 16 日 (土)
-
0700 起床.
朝飯.
コーヒー.
洗濯.
怠業.
いやはやー
-
galeon
まわりで少し苦闘
……
なーんだ,
半年前に
ぎょーむ日誌
に対処法が書いてあるじゃないか.
-
1730 自宅発北大構内走.
曇.
1840 帰宅.
体重 74.6kg.
-
走ってるあいだに,
昨日わからなくなった種間比較問題を整理してみようとしてみる
……
が,
やはりよくわからん.
連中がやってることは
-
分類群の階層構造を系統関係とみたてる
-
まず種ごとの平均値をだす
(このあたりからそもそもいいかげんで
……
一種あたりの標本数なんかも示されてないし)
-
高次分類群ごとに平均値 (また平均値かよ!)
を出す
---
とゆーことで複数の低次分類群をもつグループ
(例: 二種以上の種をもつ属)
だけでこの計算やる,
ということにしている
-
各階層で
(いま興味のある)
「相関」を計算する
---
たとえば科 (family) 内で属 (genus)
ごとに形質 X と形質 Y
の線形相関係数を計算する
(これって高次分類群ごとに推定値の「おもみ」
がまるっきり違うんだけど,
それを無視してる
---
たとえば属内の種数が 2 だろうが 10 だろうが,
どちらも一個の線形相関係数の推定値にしてしまう)
-
このように各階層で計算された
線形相関係数のうち正の値をとった分類群数をカウントする
-
5. で得られた「カウントデータ」
(らしきモノ)
に関して,
よくわからない自由度 1 のカイ二乗検定を行う
……
なんだこりゃ.
やはりよくわからんな.
-
1. から順にまぢに考えるとわけわからんので,
逆に 5.-6. あたりから考えてみよう.
おそらく,
ここでやってることは
……
「線形相関係数推定値がプラスだった分類群 vs マイナスだった分類群」
の関係が目 - 科 - 属のあいだのどの階層においても一定である,
というような帰無仮説を考えた検定をやってんだろう
……
なんじゃこりゃ?
これも少なくとも現時点の私にとっては意味不明な手つづきなんだけど,
このわくぐみにおいて
「自由度 1 のカイ二乗検定」
にもっていけそうな計算を他に思いつかないんで.
-
推定値の信頼区間のばらつき,
といった重要なことは無視 (!) できるとして
……
うーむ,
すごく「理想的」な標本セットがあったとして,
さらに
線形相関係数推定値が
-
ひとつの目内の 5 科のうち正だったのは 3 科
-
その 5 科内の 20 属
(科ごとに 4 属)
のうち正だったのは 12 属
-
その 20 属内の 100 種
(属ごとに 5 種)
のうち正だったのは 60 種
こういうのが観測されたパターンだったとして,
何が言えるんだろうか?
これって階層構造になってんだから,
それぞれの対比は独立ではないように思えるし,
だったらカイ二乗検定なんかはできないよな
……
-
しかし,
それではハナシがすすまんので,
階層が異なれば標本は独立という乱暴な仮定をおける状況がある,
としてみませう.
で,
これでカイ二乗検定において
「帰無仮説すてられん」
ということになったとしよう
……
何か展望がひらけるだろうか?
……
うーむ,
ここで強引なこじつけ説明を生成するために,
上の仮定「分類群は系統関係」に一階層間の
「枝の長さ」
はどこも等しい
(つまり目-科,科-属,属-種の「枝」の長さがどれも同じ)
ってのを加えると
……
この分類群の生物において低次分類群の生成過程,
たとえば「属→種」てな分化
(上の「理想」例だと属ごとに 5 回の「種分化」)
するときに,
ある一定の確率で形質 X-Y 間の相関が正になるかもよ,
というようなことを考えてるわけですなぁ
……
-
いぜんとして意味不明である.
しかしながら,
上のとーりだとすると,
このヒトたちの種分化モデルはなんとなくおもしろいよーな
……
つまり「属 G」の開祖である「G 祖先種」とでもいうべきやつがいて,
そこから「ランダム性」のある種分化によって現存の「属 G の種たち」
が生成された,
と.
で,
この属 G 祖先種も (属 G を含む) 科 F の開祖たる「科 F の祖先種」
から何やら確率論的に生みだされた,
と
……
いうことなのかしらん?
すごく現実ばなれしてるような気はするけど.
-
ここまでの私の理解が正しいとすると
(必ずしも正しいとは思ってないんだが)
……
ここでやってるカイ二乗検定の帰無仮説は
「形質 X-Y 間の相関に関して系統関係に依存した偏りは無い」
ということになってしまう.
つまり上記「理想」分類群内の 100 種が誕生するまでのあいだ,
-
ひとつの目 (の祖先種) から「科の祖先種」 5 個が分化
(5 科の誕生)
-
5 科 (の祖先種) からそれぞれ「属の祖先種」 4 個が分化
(20 属の誕生)
-
20 属 (の祖先種) からそれぞれ「現存種」 5 個が分化
(100 種の誕生)
という合計 125 回の
(現在から「見える」)
「種分化」イヴェントにおいて
「祖先種の状態いかんをとわず
各子孫種では独立に確率 p
(上の例だと 0.6)
で形質 X-Y 間に正の相関が生じる」
てなことを言いたいわけ?
-
書いててアタマがヘンになりそうだけど,
この論文原稿の著者たちがやってることを説明できている
……
よーな気がするのでこわい.
たとえば,
分類群ごとに「平均値」ばかり計算しやがるのは,
その平均値が「祖先種」の形質値だと思っているんだろーね
……
ああ,
つまり中立もしくはほぼ中立な
形質値 (連続値) の進化ってこと?
こういう中立性を仮定しないと平均値が祖先種の形質値にならないもんね.
しかしながら,
たいへん都合よいことに
形質値 X-Y 間の相関に関しては selection みたいなモノが働く,
と
(したがって相関がゼロでなくなる).
-
さらにこの
「平均値が祖先種の形質値となる」
計算を正当化するために必要な条件は中立性だけではない.
たとえばある属の中で,
祖先種→子孫種という種分化は許されても,
祖先種→子孫種→子孫種という
「二段階種分化」
は許されない.
つまりある高次分類群内では常に「星型」の系統樹になるわけで.
-
いやはや.
「系統関係を考慮した (しかし系統樹は用いない) 種間比較」
ってじつはこういうモノだったりするのかなぁ.
なんかすごくアブない気がする.
ともあれ,
要再検討.
-
[今日の運動]
-
[今日の食卓]
- 朝 (1000):
パン.
- 昼 (1430):
うどん.
乾燥野菜海草・豆腐・コンブの味噌汁.
- 晩 (2030):
マカロニ.
ジャガイモ・タマネギ・ニンジン・キャベツのカレー.