本日午後から北大外への webアクセスに遅延が発生しております。 原因は学内にある複数台の端末が ウィルスなどに感染しているものと思われます。…… だってさ. 今さら言われるまでもなく, 北大構内 LAN は virus の一大繁殖地になってしまっている. virus 保全運動でもやってるつもりなのかね.
名字の分布はごく単純に考えると佐藤・瀬野本 (じつは未読) のごとく branching process でモデル化してよさそうです.しかし,もし名字の分布が 幾何分布ではなくべき乗分布になるのでしたら,どういう確率論的モデルでこ れが生成・維持されているのか興味ぶかいところです.日本人を増殖・移動・ 死亡する動物個体の集団と考えると,これらの各過程がどうなっていたら,名 字 (動物個体の中立的な遺伝子マーカーのごときものですね) の分布がこうなっ てしまうのか,まず生態学的にはここが興味ぶかいところです. 突然,森林生態学に話がうつります.Steve Hubbell (「あの」Hubbell です!) は生態学業界では「熱帯多雨林では樹種間に優劣がない→だからあんなに多数 の樹木種がいるのだ」理論の提唱者として有名です (熱帯多雨林の中立説). 樹種間に優劣がない(中立である) と言うのは,つまり「樹種名」というのは 樹木個体にはりつけられた無益・無害なラベルにすぎない,ということです. そしてこの樹種 (あるいは樹種名) の分布は (じつは熱帯にかぎらず) 幾何分布には 「ならない」ということが知られています.私のいいかげんな記憶では,たしかべき 乗分布にむしろ近かったはずです. Hubbell たちはこのような分布を生成する確率モデルを以下のように過程しま した. ・森林はいくつもの小森林に分割できる. ・各小森林には有限個 (数百ぐらい?) の樹木個体が占拠できる場所がある. ・各小森林内ではときどき樹木が死に空き地が生じる. ・この場所とりに関して,樹種間では能力的な差はない (中立). ・生じた空き地を樹種 x が占める確率はその小森林内での樹種 x の頻度に比 例する (小集団での branching process). ・小森林間では「ときどき」樹木個体の行き来がある (「空き地」が生じたときに,その小森林の「外」から樹木が侵入する) といったものです.これで,現実に近い「樹種」分布が生成・維持できる,と いうのが Hubbell の近著 The Unified Neutral Theory of Biodiversity and Biogeography Princeton Univ Pr; ISBN: 0691021287 ; (2001/05/01) で使われているモデルです (じつはこの本も未読なのですが……).ただし, このモデルと分布の対応関係は,「こういうパラメーターでシミュレイトした ら,このような分布がでた」ぐらいのことしか調べていないのではないか,と 思います (それで十分なので).しかし,他のべき乗分布を生成するシステム との対応も知りたいところです. 話を日本人の名字にもどしますと,いくつかの地域に分割できる,地域内の人 口収容力はそれほど大きくない,名前は「中立」 (たとえば久保という名字だ からといってたくさん子供を産んだりするわけではない),(近ごろはともかく 昔は) 人の行き来はそれほど頻繁ではなかった,というふうに,上の森林モデ ルと符合している部分があるのかもしれません.あるいは,非常に単純なモデ ルですから,名字分布モデルに関してもすでに誰かが Hubbell 的なモデルを 提案しているかもしれませんね.