ぎょーむ日誌 2005-07-(11-20)
2005 年 07 月 11 日 (月)
-
0710 起床.
朝飯.
コーヒー.
0830 自宅発.
雨.
0845 研究室着.
-
転進作業というか
……
ディレクトリの整理整頓.
このあたり何かやりかたを考えるべきか?
しかし
CVS とか Subversion あまり好きではないんだよね.
[計算機内だけでなく]
かとーオフィス内の
机まわりも一時的に整理整頓されてしまい,
おもわず感動をおぼえてしまったので写真記録した.
-
で,
苫小牧ぱらしといど.tgz を
archive/
から取りだしてほどく.
松田モデル
……
2003 年初頭
に苦闘してたアレなんだけど,
こいつを mixed model 化して一件落着させる,
というハナシですね.
ホントは先月には着手してるつもりだったんだが,
予定はいつものごとく破綻したのであった.
-
先週末ごろからうだうだとアタマの中でめんどうな問題を検討してたのは,
この準備運動である.
ただし,
今回は MCMC もべいづも使わない.
くらしかるな混合モデルである
……
あー,
しかし「樹種差」みたいなわけわからんものを推定するときには,
べいづでケリをつけてしまいたい,
という願望あるわけですが.
-
しかしべいづだろうが何だろうが,
標本数の差が「種差」を左右してしまうんだよねえ
(むろん Bayesian ならマシになる可能性あるんだけど).
うう
……
今回はいつものごとく「(樹)種」ごとにやるか.
信頼区間とかきちんと計算すれば,
このあたりのいんちきが明示できてよいのかもしれんけど.
-
えー,
まぬけなことに
研究院
のサーヴァーがくらっくされちゃったよーで.
何やってんだか.
で,
当方の
/var/log/secure
調べてみると,
たしかに昨日あれこれと「侵入しようとする試み」
が記録されてるな:
Jul 10 10:36:20 hosho sshd[18887]: Did not receive identification string from 195.184.111.23
Jul 10 10:51:20 hosho sshd[18902]: Failed password for root from 195.184.111.23 port 3803 ssh2
Jul 10 10:51:22 hosho sshd[18904]: Illegal user fluffy from 195.184.111.23
Jul 10 10:51:25 hosho sshd[18904]: Failed password for illegal user fluffy from 195.184.111.23 port 3951 ssh2
Jul 10 10:51:27 hosho sshd[18906]: Illegal user admin from 195.184.111.23
Jul 10 10:51:30 hosho sshd[18906]: Failed password for illegal user admin from 195.184.111.23 port 4102 ssh2
Jul 10 10:51:32 hosho sshd[18908]: Illegal user test from 195.184.111.23
Jul 10 10:51:35 hosho sshd[18908]: Failed password for illegal user test from 195.184.111.23 port 4249 ssh2
Jul 10 10:51:37 hosho sshd[18910]: Illegal user guest from 195.184.111.23
Jul 10 10:51:39 hosho sshd[18910]: Failed password for illegal user guest from 195.184.111.23 port 4396 ssh2
Jul 10 10:51:42 hosho sshd[18912]: Illegal user webmaster from 195.184.111.23
Jul 10 10:51:44 hosho sshd[18912]: Failed password for illegal user webmaster from 195.184.111.23 port 4534 ssh2
Jul 10 10:51:47 hosho sshd[18914]: Illegal user mysql from 195.184.111.23
Jul 10 10:51:49 hosho sshd[18914]: Failed password for illegal user mysql from 195.184.111.23 port 4675 ssh2
Jul 10 10:51:52 hosho sshd[18916]: Illegal user oracle from 195.184.111.23
Jul 10 10:51:54 hosho sshd[18916]: Failed password for illegal user oracle from 195.184.111.23 port 4820 ssh2
... (昨日のアヤしげ侵入の試みの全記録)
ことごとく防がれている.
とうぜんながら,
root
がしつこく狙われているな.
まあ,
この程度の原始的な手法では入り込めないんだけど.
ふつーはね.
-
……
と思って,
さらにそれ以前の記録を調べてみたら
……
なーんだ,
こういうふうに
ssh
経由で侵入口をさがしまわるってのは
ごく日常的であたりまえのこと
とわかってしまった.
毎日毎日,
こういう攻撃をくらってるわけか.
-
で,
そのあたり調べていくと,
先週の金曜日深夜までにくだんの研究院 server
がのっとられて,
「近傍」のマシンへの侵入可能性をさぐりはじめた,
とわかった:
Jul 8 23:21:47 hosho sshd[10786]: Did not receive identification string from 133.50.218.18
Jul 9 00:12:24 hosho sshd[10850]: Failed password for root from 133.50.218.18 port 2004 ssh2
Jul 9 00:12:28 hosho sshd[10852]: Failed password for root from 133.50.218.18 port 2144 ssh2
Jul 9 00:12:31 hosho sshd[10854]: Failed password for root from 133.50.218.18 port 2263 ssh2
Jul 9 00:12:34 hosho sshd[10856]: Failed password for root from 133.50.218.18 port 2345 ssh2
Jul 9 00:12:37 hosho sshd[10858]: Failed password for root from 133.50.218.18 port 2462 ssh2
Jul 9 00:12:39 hosho sshd[10860]: Failed password for root from 133.50.218.18 port 2535 ssh2
Jul 9 00:12:42 hosho sshd[10862]: Failed password for root from 133.50.218.18 port 2611 ssh2
Jul 9 00:12:44 hosho sshd[10864]: Failed password for root from 133.50.218.18 port 2695 ssh2
Jul 9 00:12:45 hosho sshd[10866]: Illegal user carol from 133.50.218.18
Jul 9 00:12:47 hosho sshd[10866]: Failed password for illegal user carol from 133.50.218.18 port 2773 ssh2
... (研究院内からの攻撃全記録)
これまた,
この程度の試行錯誤ではこちらには login できないわけだが.
しかし世の中,
こういう安っぽい Unix virus が広まってるわけね
……
で,
上記の研究院 server はわりとすみやかに復旧した.
どうやったんだろう?
-
お茶部屋でくらっきんぐその他雑談
昼飯.
-
1300 から
フィールド科学センター
M2 大澤君のデータ解析こんさる.
母子里のネズミ数の変動
……
で,
これがワナ (50 コ × 3 日間)
につかまったやつらなんで,
それほど大きな数ではなく,
どうみても正規分布っぽくない.
つまりふつーの時系列データ解析
(R
の
ar()
とか)
がうまく適用できそうにない.
ということで,
Poission 回帰 (glm()
),
そして負の二項分布の回帰 (glm.nb()
)
を試みる.
-
とりあえずデータ量相応の結果が得られたんで,
1600 ごろ終了.
-
うーむ,
アタマがきりかわらん.
-
1820 研究室発.
雨あがってる.
1840 帰宅.
1910 自宅発北大構内走.
ゆっくり走る.
空腹ぎみなんでどうも本日は晩飯のことしかアタマにうかばない.
あ,
しかし
「じつは個体差はこの場合『種差』みたいなもんで」
とか狂ったことも考えていた.
2000 帰宅.
体重 74.0kg.
晩飯.
残念ながらとゆーか,
(樹木) 個体差と「種差」は分離推定可能なわけで.
-
[今日の運動]
-
[今日の食卓]
- 朝 (0750):
米麦 0.6 合.
チンゲンサイ・ニンジン・ピーマン・豚肉の炒めもの.
- 昼 (1230):
研究室お茶部屋.
米麦 0.5 合.
チンゲンサイ・ニンジン・ピーマン・豚肉の炒めもの.
- 晩 (2140):
米麦 0.8 合.
コンブあえもの.
サバ電磁波酒蒸し.
乾燥野菜海藻スープ.
2005 年 07 月 12 日 (火)
-
0730 起床.
朝飯.
コーヒー.
混合モデルあれこれについて検討してしまう.
0910 自宅発.
曇.
0925 研究室着.
-
雑用少々.
うーむ,
おーぷん大学の
ポスター
は「各コース」一枚か.
植物生態学コース
ってけっこうヒトがいるんですけど
……
-
セミナー予習の文献よみ.
-
またしても,
確率論・統計学では説明できん事象が
……
1300 から
研究室セミナー
のはず,
だったんだけど
……
先々月,
いやいやそれ以前と同じく,
北村君がセミナーで発表しようとする → 何か事故が発生して中止になる,
という
(わかっているだけでも 5 回以上発生してる)
怪現象がまた
……
いやー,
もう何がなんだか.
ともあれ,
本人は電話連絡できるていどには無事.
-
さすがにぼうぜんとする.
-
ぼうぜんとしたまま雑用.
A802 の CANON のプリンター (LBP2810) を修理.
これヒドいよ.
2004 年に製造されたトナーカートリッジ使ってるかたは要注意です.
-
昼飯.
-
大統領命令メイル.
げ,
アリ会議って 7/30 だったか.
われながらうかつだ.
まあ,
ここ朝でれば琉球大学に 1400 までにはなんとか到着しそうだけど.
-
なぜかおーぷん大学ポスター雑用あれこれ.
「コース」
なるわけのわからんもののせいで,
あちこちメイルを書かねばならぬ仕儀に.
すると生態学会がらみの雑用までもが
……
-
なんか生態学会がらみの PukiWiki みてると,
ちょうど一年前の釧路雑用な日々が思い出されて,
ウツになるな.
-
また北大の mail gateway とやらが腐っているな.
-
なぜか研究はススまず
……
寄生率の混合モデルぐらい,
さっさとカタづけてしまいたいんだが.
1850 研究室発.
1905 帰宅.
晩飯.
-
[今日の運動]
-
腹筋運動 30 ×
3 回.
腕立ふせ 5 ×
3 回.
-
[今日の食卓]
- 朝 (0800):
米麦 0.7 合.
コンブあえもの.
サバ電磁波酒蒸し.
乾燥野菜海藻スープ.
- 昼 (1350):
研究室お茶部屋.
米麦 0.5 合.
コンブあえもの.
サバ電磁波酒蒸し.
- 晩 (2240):
米麦 0.8 合.
ミズナ・豆腐・サバブシの味噌汁.
ニラ卵.
2005 年 07 月 13 日 (水)
-
0700 起床.
朝飯.
コーヒー.
なぜか
MCMCpack
の解読を少々.
これ,
C++ で書かれた extension
(
MCMCpack/src/MCMClogit.cc
とか)
読まんと何やってるかよくわからん,
ということがわかった
……
といっても,
Metropolis やってるだけなんだが.
そして MCMCpack 開発者は ``Effective C++''
などを熟読せざるをえなかったよーな,
不幸な過去はもたなかったよーで.
0840 自宅発.
晴.
0855 研究室着.
-
つまり MCMCpack というのは,
かかる extension 開発環境なのだ,
と理解すべきなんだろな.
Dirichlet 分布とか Wishart 分布とか使えるし.
-
しかしだとすると,
BUGS
なんかとはちょっとおもむきの異なる道具,
ということになる.
開発者たちの書いた
``Applied Bayesian Inference in R using MCMCpack''
読むと,
The design philosophy of MCMCpack is quite different
from that of the BUGS language.
だの
... we emphasize that we view BUGS and MCMCpack as
complimentary tools for the applied researcher.
だのと書かれてるな.
どうなることやら.
-
おーぷん大学雑用.
研究室メイリングリストに「分担してね」投稿.
そのめんどくささはこんなかんぢで.
久保です.今年も Open University
http://www.hokudai.ac.jp/bureau/nyu/open/
なるものが 8/1 (月) に開催され,ここの環境科学院もそれにあわせていろい
ろ展示やります.われわれはポスターを作ってはりだすだけです.
このポスター作りとそれと連動してる Web 上の研究室紹介
http://hosho.ees.hokudai.ac.jp/introduction/index.html
を更新するので,皆さんの手助けが必要です.以下に説明しますので,よろし
くお願いいたします.
そもそも A 棟 7-8F には
1. 「起学」 (高田さん・露崎さん)
2. 「生物圏・生物多様性科学コース」 (工藤さん,院生:川合さん,井田君)
3. 「生物圏・植物生態学コース (と旧地域生態系学)」 (その他)
なヒトたちがいることになってます.私が作ろうとしてるのは 3. 用です.
生物多様性についてはすでに工藤さんたちがポスター作られました.しかし
Web 版案内は更新するべきかと考えてます (後述).起学は何がどうなってる
のかよくわかりません.
さて,「植物生態学コース」といった場合,春木さんの研究室と低温研の原・
隅田・小野研究室の紹介もふくみます.
8F エレヴェイター横にはりだされている (昨年の) ポスターみてもらうとわ
かりますように,紙のポスター上で紹介できる話題の数は 12 個です.春木さ
ん・隅田さんと相談して,各研究室の話題数は
春木研: 2,低温研: 3,その他: 7
という配分になりました.ここでは最後の「その他: 7」について,皆さんに
仕事の分担していただきたい,と考えています.当方で勝手に分担きめました
ので,あたってしまった人たちは周りと相談して作業を進めてください.
以下,Web 版
http://hosho.ees.hokudai.ac.jp/introduction/index.html
を参照しつつ,
====================================================================
[昨年の使いまわし,ほとんど改訂する必要なし (改訂してもよい)]
「阿寒」 (担当: 北村君)
「苫小牧・樹木」 (担当: 石橋君)
「苫小牧・草本」 (担当: 小菅君)
「シミュレイション」 (担当: 長谷川さん)
「大雪山」 (担当: 川合さん)
川合さん・亀山さんの研究を反映して作りなおしてもらってもいいです
(「生物多様性」に含まれる研究になるんで紙のポスターには掲載しないか
もしれないけれど Web 版には掲載します)
====================================================================
[改訂してほしいもの]
「サロベツ」 (担当: 西村さん)
小山さんの研究も反映して文章・画像を変更してください
「駒ヶ岳」 (担当: 松田さん)
松田さんの研究を反映して改訂ください
「ポリネイター」 (担当: 井田君)
井田君の研究を反映してください (ほとんど新規作成?)
(「生物多様性」に含まれる研究になるんで紙のポスターには掲載しないか
もしれないけれど Web 版には掲載します)
「シウリザクラ」 (担当: 森君)
森君・小林君の研究を反映したものにしてください
(「父親樹木の推定」とでもする?)
「インドネシア」 (担当: 塩寺さん)
二案あります: いそがしければ現状のまま;
もしよろしければ,牛原さん・高田さんの研究も反映して
「葉寿命」のハナシにしてください
====================================================================
[新しく作る]
「知床」 (担当: 庄山さん)
「(高田さんの研究?)」 (担当: 高田さん)
====================================================================
以上です.「その他」の個数として「7」を超えていますので,紙のポスター
に掲載するのは上記の中から 7 個えらびます (「その他」かつ修士課程院生
の研究を優先).Web 版にはぜんぶ掲載する予定です.
とりあえず 7/25 ごろまでに準備していただけるでしょうか.準備していただ
きたいのは,ひとつの話題につき,
・画像ファイル (写真など) 横:縦 = 4:3 で 640x480 以上の解像度のもの
・ボックスの題名 (20-40 字ぐらい)
・画像ファイルの説明文 (120-160 字ぐらい)
です.不明な点がありましたら,久保までお尋ねください.
いやはや,
どーなることやら
8/28 (日) 0800-1800 全学停電の通知.
沖縄アリ会議の旅程の自滅的ごたごた.
結局 7/30 (土) の移動は不可能.
最初の予定どおり 7/29 (金) に移動.
キャンセル料発生かつ
Trendy セミナー
参加は不可能,
と.
7/27 (水) 千歳空港に客をむかえにいかねばならんことに.
甲山さん主宰 (?) 7/28 (木) IGBP な会議のため
(この日も helper 的雑用).
てことは
……
-
7/27 (水) 千歳往復
-
7/28 (木) IGBP 会議 helper (worker?)
-
7/29 (金) 札幌 → 羽田 → 那覇
-
7/30 (土) アリ会議
-
7/31 (日) アリえくすかーしょん?
-
8/1 (月) 琉大でアリ雑談?
北大ではおーぷん大学
(誰かにポスターはってもらう)
-
8/2 (火) 那覇 → 羽田 → 札幌
うう,
7/27 (水)
ごろにはおーぷん大学のポスターを完成させとかんといかんわけね.
科研費で買った本 8 冊ばかり,
北大生協からとどく.
何冊かぱらぱらとみると
……
-
「経済・経営のための統計学」
(共著者多数, 2005).
よさげなところは,
こんぱくとで
R
based で最尤法 (基本と logit モデルとの対応)
・簡単な Bayes 推定・MCMC (MCMCpack 使用)・Gibbs sampler
解説あること.
たしかに Amazon 書評にあるようにハンパなのかもしれないし,
また経営学・会計学・経済学の章など
あまり自然科学系には有用そうでないところもあるんだけど
……
しかしマーケティング章「多項ロジット・モデル」の解説などは
多くの生態学研究者が道具にしたいところだろう.
-
「ベイズ計量経済分析―マルコフ連鎖モンテカルロ法とその応用」
(和合肇編著, 2005).
これまた経済方面の解析例ばっかりなんだけど,
MCMC 法の説明がかなりていねいに見える.
-
「状態空間モデリングによる時系列分析入門」
(ダービン & クープマン, 原書は 2001; 訳書は 2004).
状態空間モデリング,
とはここらへんで言うところの
「隠れ」変数モデルの別名と考えてよいのだろう
(ただし必ずしも Markov ではない).
EM アルゴリズムによる反復最尤推定法の解説などもある.
というようなあれこれとメイル書きとかで昼飯前はオワってしまった.
昼飯.
みなさん,
調査とかにでかけてしまって人口密度ひくい.
ぽすたー分担,
だいじょうぶなのだろうか.
なんだかまたデータ解析こんさるメイル書き.
すると広島から生態学会雑用.
事務局用メイルアカウントいくつか作れ,
か.
ぱすわーど考えるのがめんどうになったんで,
R でぱすわーど生成関数を書く.
R って生態学会雑用にも有用なんですね.
> passwd <- function() {
+ moji <-c(letters, LETTERS, 1:9) # 0 は使わないことにした
+ paste(moji[ceiling(runif(12) * length(moji))], collapse = "")
+ }
> passwd()
[1] "vgTpeHPo2RAE"
> passwd()
[1] "OX7FYatvtizH"
> passwd()
[1] "wX4mQgT3oA12"
これが用ずみになってから
paste(moji[ceiling(runif(12) * length(moji))], collapse = "")
ってのは
paste(sample(moji, 12, replace = TRUE), collapse = "")
と書いたほうがすっきりする,
と気づいた.
まぬけだ.
甲山さん (AppleMail) から UTF8 なメイルが来る.
これは私の Mew-1.94
では読めなくて
……
どうやって解毒すればいいのかド忘れしてしまった.
ぎょーむ日誌にも記録してない.
かとーさんに相談してよーやく思い出した.
Sylpheed
使えばいいんだ.
で,
その内容というのがくだんの 7/28 IGBP 会議の
こんなの
であンまりおもしろそうでは
……
1600 から一時間ほど
フィールド科学センター
M2 大澤君のデータ解析こんさる.
えー,
問題は supervisor たる齋藤さんの統計モデル観にあるんぢゃねーの,
という気がしてきた.
ともかく統計解析をわけわからん
「ぶらっくぼっくす」の集積としてとらえるのはやめたほうがよい.
そして,
ナゾの R コードを見せられたわけだが
……
なるほどコレは苫小牧の平尾君作.
見た瞬間に気づくべきであったなぁ
……
ってのも,
平尾君をおいて他に誰がかかる R コード書くというのだろうか?
今日も進捗せんかったなぁ,
と反省しつつ撤退.
いや,
「こんさる」とかはこっちもかなり勉強になるんだけどね.
1820 研究室発.
1900 帰宅.
2110 自宅発北大構内走.
2155 帰宅.
体重 74.0kg.
晩飯.
[今日の運動]
[今日の食卓]
- 朝 (0730):
米麦 0.7 合.
ミズナ・豆腐・サバブシの味噌汁.
コマツナあえもの.
- 昼 (1350):
研究室お茶部屋.
米麦 0.5 合.
コマツナあえもの.
- 晩 (2240):
米麦 0.7 合.
ピーマン・ニンニク茎・ネギ・ショウガ・砂肝の炒めもの.
ミズナ・豆腐・サバブシの味噌汁.
2005 年 07 月 14 日 (木)
-
0740 起床.
朝飯.
コーヒー.
半壊洗濯機あいてに苦闘しつつ,
混合モデル検討.
0940 自宅発.
曇.
0955 研究室着.
-
今朝の混合モデル検討,
ひょっとすると
mixed logistic 回帰なんてのはわりと簡単に
Newton 法にもっていけるんじゃないか,
と気づいた.
しかし計算してみると
……
うーん,
やっぱダメか.
勾配行列はめんどうなまま.
mixed Poisson の場合であっても簡単にならん.
すなわち,
二次収束な計算がつかえん.
-
某メイリングリストに
``標本数少ないんですけどゆーい差でる検定のやりかた教えて''
(意訳)
投稿が.
ばかだ
……
しかし午後になって,
粕谷さんがたいへん丁寧なる返信を.
-
低温研の隅田さんからさっそく
おーぷん大学
対策ポスター用の素材が.
カムチャツカ・小野さん実験・母子里,
の三点せっとということで.
-
とりあえず,
おーぷん大学ポスター & 研究紹介ペイジ更新の体制を整える.
上記三件を
追加
してみる.
-
このあたりいろいろ調節してるうちに午前オワってしまった.
やれやれ.
昼飯.
長谷川宣教師と話してるうちにおそるべきことがわかった.
今月末の
とれんでぃ,
わざわざ道外から木村さんが来てくださるのに
ヒトがいない.
私は大統領召集令によって沖縄へ
(昨日のどたばた参照; 高田さんも),
宣教師殿は立山-剱岳宣教の旅,
工藤さんチームは Harder さんとサロベツに
(亀山さんはいるのか?),
他の院生も調査とかにでかけてそーだし,
繁殖生態学の大家たる小菅せんせーはいるんだろうけど
(門外不出の研究成果が露見せぬよう)
どこかに隠れてしまいそうだし
……
どうなることやら.
-
そして今日も人口密度がひくい.
-
寄生混合モデルにぢりぢりと着手.
まづは局所密度の計算なンだが
……
まあ,
あまり互換性とか考えなくてもいいか.
-
非線形なかーねるの線形和って,
どうよ?
……
たとえば,
近・中・遠のカーネルを加重和したり
stepAIC()
したりって世界ですね.
別の分野の誰かアタマのおかしいヒトが
すでに発表してそうな手口だと思うんだけど,
生態学まわりでは使われてないような気がする.
-
これを式で書くと
の11 日前
(から何も進捗してない!)
のアレ
になるわけですね.
-
お茶部屋で M2 実吉さんあいてに
logistic 回帰復習篇.
ひととーり片づいて雑談してると,
実吉さんは StarWars 旧作の TV 放映
(がまとめて近ごろあったらしい)
みても「全体のながれ」とか親子・師弟関係がいまいちわからなかったと判明.
こりゃ logistic どころのハナシではない,
と Episode III 予習になるような StarWars 講釈
……
に一時間以上も費してしまった.
嗚呼,
なにやってんだか.
-
おーぷん大学素材,
西村さん・小山さんのサロベツ研究のを準備してもらったんで,
Web 版に追加.
「やちぼうず」ですよ.
-
2000 研究室発.
2015 帰宅.
晩飯.
-
[今日の運動]
-
[今日の食卓]
- 朝 (0820):
米麦 0.7 合.
ピーマン・ニンニク茎・ネギ・ショウガ・砂肝の炒めもの.
- 昼 (1250):
研究室お茶部屋.
米麦 0.5 合.
ピーマン・ニンニク茎・ネギ・ショウガ・砂肝の炒めもの.
- 晩 (2250):
米麦 0.8 合.
ホッケ電磁波蒸し.
タマネギ・ニンニク茎・マイタケ・卵の炒めもの.
乾燥野菜海藻のスープ.
2005 年 07 月 15 日 (金)
-
0810 起床.
朝飯.
コーヒー.
計算手順とかについて,
しだいにアタマの中が整理されてくる.
いまさらながら,
だけど.
0940 自宅発.
晴.
0955 研究室着.
-
ぱらしといど混合モデル,
距離カーネルの計算にむちゃくちゃ時間かかるんで
(edge effect を normalize するため),
どうにか計算量をへらしたいところなんだけど
……
-
う.
やはり苫小牧寄生データ,
しーづんによってデータのサイズがちがっていたか.
ある樹木から虫がとれるかどうかは,
しーづんによって変わるからだっけ.
そもそも sampling してない,
ってことこはないはずだよな.
-
えーい,
どうしたもんかのう
……
と困っていると,
ふと思いついた.
今年 3 月中ごろ
の苫小牧 parasitoid 師弟の下うけぎょーむのときに,
村上さん用に構築したデータってのがあったはずで
……
と見てみると,
全樹木 (つまり虫の居場所) がひとつの data.frame
におさまるように作ってある.
このあたり流用すべきかな.
-
で,
そのへんの関数を改造して,
データ再結合関数を作った.
こんなかんぢで,
やはり
NA
(not available; 欠測)
が多い.
時刻は 1310.
> source("prepare.R"); generate.df.all(); load("df.all.RData")
# reading data/data1.txt ...
# reading data/data2.txt ...
# reading data/data3.txt ...
# reading data/data4.txt ...
# combining all tables ...
# save to df.all.RData ...
> df.all[1:20,]
x y H.m TreeID plot Sp N1 P1 Nw1 N2 P2 Nw2 N3 P3 Nw3 N4 P4 Nw4
1 2.8 0.1 1.8 601 0 Ap 5 0 9 NA NA NA NA NA NA NA NA NA
2 5.4 0.0 1.8 602 0 Ap NA NA NA NA NA NA 1 0 2 NA NA NA
3 2.4 2.5 16.8 604 0 Qc 20 3 2155.3 20 9 878.1 20 0 1357.1 12 3 479
4 3.4 4.8 2.0 605 0 Am NA NA NA NA NA NA NA NA NA 3 1 3
5 4.2 3.7 1.3 606 0 Ap 1 0 2 NA NA NA NA NA NA NA NA NA
6 6.5 3.4 2.0 607 0 Am 2 2 3 NA NA NA NA NA NA NA NA NA
7 8.0 2.4 1.5 608 0 Am 1 0 1 NA NA NA NA NA NA NA NA NA
8 10.7 4.5 15.6 609 0 Qc 20 11 769.7 10 0 202.6 20 0 810.2 10 2 202.6
9 29.9 17.5 9.4 612 0 Qc 12 10 27.4 NA NA NA 14 5 32 NA NA NA
10 9.6 6.8 2.9 613 0 Ap 3 0 6 NA NA NA NA NA NA NA NA NA
11 7.3 7.9 11.0 615 0 Ap 3 2 26.6 NA NA NA 3 1 26.6 5 0 44.3
12 5.3 8.4 9.7 616 0 Tj NA NA NA NA NA NA 1 0 4.7 NA NA NA
13 5.3 7.5 5.7 617 0 Am NA NA NA NA NA NA NA NA NA 3 0 3
14 4.7 5.7 15.5 618 0 Tj 2 0 75.9 NA NA NA 5 2 189.8 1 0 38
15 4.2 5.3 1.5 619 0 Ap 1 0 2 NA NA NA 2 2 2 NA NA NA
16 2.4 4.9 15.3 620 0 Tj NA NA NA 2 0 67.7 2 0 67.7 1 1 33.9
17 0.0 10.9 4.1 622 0 Am NA NA NA 1 0 1 NA NA NA NA NA NA
18 0.9 10.8 15.0 623 0 Qc 1 1 16 20 5 320.9 9 1 144.4 18 2 288.8
19 0.9 10.8 15.8 624 0 Qc 20 12 1146.8 NA NA NA NA NA NA NA NA NA
20 2.8 11.3 13.7 625 0 Am 2 0 28 1 1 14 1 1 14 2 0 28
なんとまあ
「フリーソフトウェアRによる統計的品質管理入門」
てな本まで出版されてるよーで
(2005.06).
さすがにこれは買わないけど.
昼飯.
先月末の阿寒実習のときの
雌阿寒登山
の写真 CD-ROM を
田代さん
が送ってくださった.
田代さんが一眼レフでぢかめで接写した植物の写真ながめてると,
どうも私のような植物観察のどしろーとの場合,
現物をみるよりうまく撮影された写真みてるほうが
構造とかがよくアタマにはいるような気がしてきた.
女性大学院生が
ロト6 なる宝くじの「あたりやすい番号」
の何やらオカルトな発見方法を信じこんでしまってるので,
そんなのあるわけないぢゃんと指摘.
ネット上で調べるとこれまたアヤしげな「傾向」
なんかも示されてるんで
……
とりあえず
R
一行作図で「そんなのはありがちなことで」と示してみる.
> hist(c(sapply(1:247, function(i) sample(1:43, 6))), seq(0.5, 43.5, 1))
[これぐらいばらつく]
毎回 1:43 の 6 個の整数を非復元抽出のこれまで
247 回の独立なくりかえしで,
これぐらいのばらつきは生じて,
それがあたかも「傾向」に見えたりする,
とゆーこと
(そして毎回ランダムに選ばれるのでこれまでの「目」は次回に影響しない)
……
理系院生がこんなのにダマされちゃいけません.
-
北米からアカマツ原稿もどりつつある.
-
セミナーの予習.
湿原 (mire) 論文.
これってかなり莫大な労力が費されてるのはわかるんだが
……
-
1830 より
Trendy
セミナー,
本日は Stefan さんの北海道の湿原あれこれ.
道内あちこちから湿原のひとたちが 10 人以上あつまる.
方法論は明確で
(きちんとした科学教育うけるってのはこういうことなのか,
と),
何をやってるのかはよくわかるんだけど
……
火山活動 (17-18 世紀の樽前山とか)
が道内の湿原形成になンか影響あるんぢゃないの,
というハナシは地面コアぬきでもテフラまき実験でも
示されてないかんぢ.
-
データ解析でちょっとアヤしげだけど
おもしろい空間相関のあつかいがあった.
plot の座標 (の多項式) でもって三次元曲面を推定して,
「場所」の効果をモデリングする,
というもの.
おしいのは (生態学データ解析でありがちなことに)
すぷらったー式解析というかデータを無意味に切りきざんでるんだよね.
空間の効果と処理の効果を「同時に」推定すべきなんだけど.
-
そして「世の中なんでもかんでも正規分布」
なヒトたちのあいだでも mixed model
がブロック効果をうまく扱えることなんかが知られていない,
とわかった.
``pseudo replication が問題なので……''
というところまではよく理解しておられるのに.
-
2100 研究室発.
たまたまかとーさんと同時刻に研究室をでたので,
車で迎えにこられた奥様にごあいさつする光栄に浴したのであった.
2125 帰宅.
晩飯.
-
[今日の運動]
-
[今日の食卓]
- 朝 (0850):
米麦 0.7 合.
タマネギ・ニンニク茎・マイタケ・卵の炒めもの.
- 昼 (1320):
研究室お茶部屋.
米麦 0.5 合.
ホッケ電磁波蒸し.
タマネギ・ニンニク茎・マイタケ・卵の炒めもの.
- 晩 (2220):
スパゲッティー.
「今晩はきっとぢゃんくなものを食べます」
と (「伝染るんです。」
のかわうそに敬意を表しつつ)
院生たちに「約束」してしまったので,
レトルトパウチドカレー
(北 12 条生協 78 円もの).
2005 年 07 月 16 日 (土)
-
0810 起床.
朝飯.
コーヒー.
怠業.
-
1110 自宅発北大構内走.
晴.
ややうすぐもり.
1210 帰宅.
体重 73.4kg.
暑さ脱水やせ,
か.
昼飯.
洗濯.
-
いかん,
怠業してる場合じゃない.
1515 自宅発.
曇.
1530 研究室着.
しかしまずは雑用少々.
-
アカマツ原稿 (シミュレイションのほう)
の修正作業
……
ススまん.
アタマの中がきりかわらん,
とゆーか.
-
2020 研究室発.
2045 帰宅.
晩飯.
-
[今日の運動]
-
[今日の食卓]
- 朝 (0830):
パンの耳.
- 昼 (1250):
ざるうどん.
- 晩 (2230):
米麦 0.8 合.
タマネギ・モヤシ・ニンニク・豚ハツの炒めもの.
2005 年 07 月 17 日 (日)
-
0840 起床.
朝飯.
コーヒー.
怠業.
-
1100 自宅発北大構内走.
曇
……
をネラったつもりが,
どんどん晴れてきた.
1145 帰宅.
直射日光ばて.
体重 74.0kg.
昼飯.
-
1405 自宅発.
曇.
1420 研究室着.
-
アカマツ原稿修正ぢりぢり.
-
院生の研究紹介を web に転記するネット雑用.
この buzz pollination って何だろと思ったら
WikiPedia
にあった.
なるほど振動で花粉をふりだすわけか.
-
なぜかしら原稿修正ススまず撤退.
不調だ.
1850 研究室発.
1905 帰宅.
晩飯.
-
[今日の運動]
-
[今日の食卓]
- 朝 (0910):
パン.
- 昼 (1310):
米麦 0.5 合.
タマネギ・モヤシ・ニンニク・豚ハツの炒めもの.
- 晩 (1940):
米麦 0.7 合.
ニラ卵炒飯.
麻婆豆腐.
2005 年 07 月 18 日 (月)
-
0810 起床.
朝飯.
コーヒー.
雨か?
1045 自宅発.
雨はあがりつつある.
1100 研究室着.
-
アカマツ原稿 (シミュレイションのほう)
修正.
ほぼ全文修正とゆーか
……
なかなか不幸な気分になる.
-
昼飯後も同じ作業つづく.
-
1750 ひとまづ作業終了.
まだ分量としては半分ぐらいだな.
-
なぜか今晩,
院生たちと StarWars III (EP3) を見にいくことに.
パン屋で晩飯でも調達するか,
と 1835 研究室発.
しかし「北欧」は閉店だったので,
1850 そのまま帰宅.
晩飯.
1915 自宅発.
1930 研究室着.
-
ぱらしといど混合モデルの計算関数の手なおし少々.
三月ごろにぢたばたしてたアレ
---
pseudo likelihood 分布の parametric bootstrap わざ,
とゆーへんたい的なアレ
---
のための関数をうまく再利用できるかどうか,
なる試行錯誤を.
それほど問題なさそうだ.
しかし,
計算にはアホみたいに時間かかることだろう.
どうしたもんかのう.
-
2005 院生たち (森君・実吉さん) と研究室発.
2020 JR 札幌駅ビル内の映画館
札幌シネマフロンティア
着.
全席予約制なんだけど森君がすでにチケットをあらかじめ入手してくれてた.
レイトショーなので 1200 円.
しかし本日この時間は一割ぐらいの入り.
「久保さんの期待はいかがですか?」
「僕は R2-D2 とヨーダさえ活躍してくれれば,
それでもう」
2045 から 2300 まで上映.
いったん研究室お茶部屋にもどる.
思わずパンフレット (800 円) を熟読してしまった.
2405 研究室発.
2420 帰宅.
[暗黒卿と記念撮影]
ヘルメットもふくめると身長 2m こえてるな.
-
いやー,
1977 年以来つづいたハナシもよーやく片づいたというか
……
めでたいことです.
ハナシもだいたいつじつまあって完結したことだし,
これで終わればいいよね.
旧三部作は小中学生のころに見て
……
えーと,
新三部作は 1999 年 9 月に
EP1,
2002 年 9 月に
EP2
見たわけか.
-
全体に EP4 へのつじつまあわせに終始していた
……
まあ,
やや強引で,
それは EP1-3 全体がそうなんだろうけど,
そうならざるをえないのだけど,
旧三部作みてきた連中がウケることねらいすぎ,
というか
……
-
典型的には,
オルデラーンがらみで
ブロッケード・ランナー
(タンティヴィIV って名前なのか?)
が頻出して,
その白くて角が丸い回廊がなつかしすぎ,
とか
-
Jedi starfighter がなぜかわざわざ帝国軍 TIE fighther
っぽくなるとか
-
何の必然性もなくウーキーの惑星をもちだしてみる,
とか
-
そういう消化作業にハナシのすじがふりまわされるわけで
-
まあ StarWars なんて
むしろ細部への叡知と努力を楽しむ動画作品ともいえるわけで
-
はい,
今回も ILM なヒトたちは恐るべき創意工夫と
丁寧というか忍耐づよい仕事ぶりでした
……
まさにこれを見るために映画館まできたわけで
-
今まであまり注目してなかったけど,
lightsaber 剣舞の様式美も発展してきた,
というか
……
かなり考えられてる
-
StarWars のあくしょんといえばやたらと
「落ちる」「ぶらさがる」
なんだけど
(うん? アクション映画って
どれでもそういうものなのかしらん?),
今回もそういう場面にたいへんすごくチカラはいってました
-
パンフレットにあるように,
たしかにコルサント大気圏上層
「亜宇宙」
戦闘の表現ってのは新しいよな
-
で,
ここで StarWars 史上空前絶後の
「宇宙は真空であります」と明示的に示す表現が
……
自然と同様 StarWars は真空を嫌っており,
宇宙活劇でありながらたとえば「気密服」
なんかは登場しないんだよね
(EP5 小惑星洞窟で苦しい表現あり)
-
ともあれ R2 とヨーダはどちらも大活躍だったのでヨシ
……
思えば StarWars とは冒険心あふるる
「真の主役」
R2 の豪胆と機転
を楽しむしりーづであった
-
[今日の運動]
-
[今日の食卓]
- 朝 (0850):
米麦 0.7 合.
ニンニク茎・卵の炒めもの.
麻婆豆腐.
- 昼 (1350):
研究室お茶部屋.
米麦 0.5 合.
ニンニク茎・卵の炒めもの.
麻婆豆腐.
- 晩 (1900):
米麦 0.8 合.
コマツナ卵炒飯.
ワカメあえもの.
2005 年 07 月 19 日 (火)
-
0830 起床.
0845 自宅発.
晴れ.
暑い.
0900 研究室着.
朝飯.
コーヒー.
-
また苫小牧ぱらしといど混合モデル用の計算関数の準備.
以前のやつを改造しては試験運転し,
のくりかえし.
なぜかしら,
今回は以前との互換性に注意してるんで,
なかなか進捗しない.
-
東北大の木村さんにおねがいしてた
Trendy seminar,
今回はヒトがいないので延期してまた九月以降におねがいすることに
……
-
めんどう距離カーネル計算に必要な関数の改装作業は終りつつあるな
……
さて,
つぎの計算の手順の確認だが:
-
get.df.combined()
で全シーズンの統合 data.frame を生成
-
get.list.matrix.WD()
で近・中・遠それぞれの補正ずみ距離加重行列を計算する
(list.matrix.WD
)
---
むちゃくちゃ時間かかりそう
-
全シーズン (4)・全距離 (3?) のくみあわせ
(12 とーり?)
で局所宿主密度の計算
(同種・他種べつ)
-
ここまででいったん
save()
というところか.
-
うーむ,
計算量は減らしたいところなんだが
……
たとえば近・中・遠はヤメて,
その樹木個体 (零距離)・近・遠にするか?
零距離なら「同種」にきまってるんで.
-
同種 vs 他種,
か
……
ちょっと待て.
この件に関しては同種 vs 全種
(同種+他種)
とすべきだろうな.
一般化線形モデル系における「説明変数」に関する汎用ごまかし技法だ.
「独立変数」ってのは死語とは言わんけど,
まあ昔の一般ではない線形モデルに必要とされた
ある種の解析技法の必要条件を表現してるだけ,
と理解してんだけどね
……
当世風の,
変数そのものを取捨選択していちいち再推定していく技法では
(いんちきくさい)
「独立」とやらはぜんぜん重視されてない,
というか.
そもそも厳密に独立な説明変数なんてめったに選べるもんじゃないよ.
-
あと,
いつものことながら憶測な「密度」のあつかいだよな
……
これけっこうアタマが痛い.
線形予測子 (linear predictor)
つかう logistic モデルやめりゃーいいだけなんだけど.
linear predictor ヤメるんなら,
遠近カーネルの線形結合といった小細工を工夫する必要もないよな
……
-
いや,
空間のあつかいに関しては
「カーネル変形 → 再計算」
の絶望的めんどくささを考えると
カーネル線形結合というごまかしがいまだ有効な策なのか?
……
というか,
linear predictor やめると計算のあちこちが
突然のごとくにイヤなものになってくる,
という罠になってるわけか.
-
さらにいえば,
樹種ごと季節ごとにいちいち個別に推定するのもイヤなわけだが
(標本数のばらつきが大きい)
……
Bayesian とかもちだすのは飛躍しすぎかも,
という懸念もある.
-
昼飯.
-
昼飯後もひたすらばぐとり.
単なる空間カーネルだけで,
どうしてこう面倒になるのかねえ
……
下手に「使いまわし」を考えすぎてるのか?
-
統計こんさる.
「なんでもかんでも正規分布」
もの.
このあたりに関しては理解度がさまざまなんだけど,
本邦の生態学まわりでは以下のような「よくわかっていない」
タイプが多いように観察される:
-
ぢつは正規分布から得られる標本とはどのようなものか,
という理論的・実感的理解がない
-
得られたデータのばらつきは見ない・見たくない
-
とうぜん 1. と 2. の対応,
つまり理論と現実の乖離は検討しない
まあ,
いまさら,
ですが.
-
今日みたのは某国外 journal の査読者からかかる修正要求が,
というもので.
先方はなにやら毛色が違うというか,
正規分布まわりの理論はよくわかってるかんぢだ.
ただし,
それこそ森羅万象は正規分布で説明可能というか,
視野がせまいとゆーか
(「データよく見ない」ぽりしーは上と同じだ),
戯画化された演繹主義みたいな主張にも聞こえる.
なぜこの立場がけったいなのかと言えば,
正規分布は「ばらつきある現象」の近似として最良たりえてることはまれで,
統計学の中核概念になりえてないってことで.
たんに,
計算するときに便利だったとゆー
歴史的惰性のおかげでエラそーにしてるだけなのである.
それに気づかないのは
……
人間は幸福な錯覚の世界からなかなか脱出できないからだ.
-
研究室のネット雑用ふたつほど.
院生たちの御協力で
研究紹介
はぢりぢりと更新中.
その他,
IGBP よくわからん会議の道案内とか.
Adobe Illustrator って version 間互換性が欠落してるのか?
なんかオカしい.
-
計算問題についてはばぐ残存したまま撤退.
1915 研究室発.
1930 帰宅.
いやはや,
またいきなり寝てしまった.
-
[今日の運動]
-
[今日の食卓]
- 朝 (0920):
研究室お茶部屋.
「北欧」
ドーナツ.
- 昼 (1250):
研究室お茶部屋.
「北欧」
ベイグルサンドイッチ.
- 晩 (2300):
米麦 0.8 合.
コマツナあえもの.
キャベツ・モヤシ・ナメコ・サケあら・コンブの味噌汁.
2005 年 07 月 20 日 (水)
-
0810 起床.
朝飯.
コーヒー.
0920 自宅発.
曇.
今日は一日曇天がつづくかな?
0935 研究室着.
-
現在やってる計算そのものの見なおし
……
うーむ,
これもまたいつものごとく,
ごまかしと計算めんどくささのトレイドオフ,
なのか?
-
などと考えてると,
なぜかしら,
この脈絡からはやや逸脱している,
距離加重カーネル計算の高速化の技法おもいついた.
これまたいつものごとく,
メモリと速度のトレイドオフで,
カーネル格納する行列のサイズを 4 倍弱にすることで
少なくとも 10 倍は計算が速くなる.
精度オチは無し.
今まで気づかなかったほうが阿呆なんだけど.
さて,
実装してみますかね
……
-
ばぐと戦いつつ
R
プログラミングぢりぢり進捗中.
-
1330 終了.
計算は
……
むちゃくちゃ速くなった.
なにしろ 262.4 秒を費していた処理を
5.9 秒に短縮できてしまったんで.
44 倍以上の高速化
……
いやはや,
これっていままでがマヌケすぎたんだろーね.
-
そのトリックは簡単なもので,
下の図のごとし.
二次元離散空間カーネルについて考える.
調査地のサイズが小さい正方形わくと同じだとすると,
その二倍 (弱) の「サイズ」の行列を用意する
(図全体をしめる正方形).
この行列の中央を中心とする距離加重カーネルを「設置」する
(カーネルの値は
gray()
で示されている).
あとは,
「調査地わく」のほうを動かしてやって,
このカーネルを切り取り,
edge effect 勘案するため規準化してやればよい.
[逆転の発想とゆーか]
正方形 (長方形でもいいんだけど) の調査地内に点在する
樹木個体それぞれについて edge effect を考慮した距離加重カーネルを与えたい.
上述のごとくカーネルを準備し (外枠の正方形におさまる),
個体の位置にあわせて切り取り & 規準化すればよい.
(上が北だとすると)
調査地の東端に樹木個体 A があれば,
赤線で示した範囲,
また調査地の北西にある樹木個体 B なら青灰線で示した範囲を切り取る.
-
うん,
これはいろいろと応用のきく計算ワザだ.
-
以前は調査地内の樹木個体ごとにカーネルを生成
やっていたんだよね
……
時間かかるはずだわ.
-
1350 北大構内走.
いーぐあいの曇天.
1440 もどる.
昼飯くってるとまだ 1500 でないのに
「昼ごはんなんか食べてる場合じゃないですよ!」
と大学院生におこられる.
さっさと片づける.
-
1500 A 棟 7F 「夜逃げ」退官あと地のかたづけ手伝い.
三浦さんが英雄的努力でもって,
「図書室」と称されていた部屋の
本棚から合計 1 トンぐらいありそうな本どもを箱づめしてくれたんで,
それらを 2F の地環研図書室に移動せよ,
という内容.
10 人ばかり & 台車三台を回転させて 30 分ほどで作業終了.
[箱づめ書籍]
大半は捨てても誰も困らないしろものだ
……
図書館はこれをどうするつもりだろうか?
-
お茶部屋でうちあげと称して,
ビールだのお茶だの.
-
昨日のばぐ取りの続き.
これは結局のところ空間の切りかたの問題とわかった.
粗く切りすぎるとカーネルが規格化できん.
このあたりのエラーチェックを追加.
-
2120 研究室発.
2140 帰宅.
晩飯.
-
[今日の運動]
-
[今日の食卓]
- 朝 (0850):
米麦 0.7 合.
コマツナあえもの.
キャベツ・モヤシ・ナメコ・サケあら・コンブの味噌汁.
- 昼 (1445):
研究室お茶部屋.
米麦 0.5 合.
キャベツ・モヤシ・ナメコ・サケあら・コンブの味噌汁.
- 晩 (2240):
パン.
コンブサラダ.
ニンジン・タマネギ・セロリ・豆腐のカレー.
研究室お茶部屋に残置されてたローズマリーどかっと入れたら,
かなりキビしい味になってしまった.