ぎょーむ日誌 2000-07-12
2000 年 07 月 12 日 (水)
- 0810 起床.
曇り時々雨.
- 1000 ぐらいから晴れてくる.
- 昨晩から引きつづき,
トチノキデーター処理問題に取り組む.
うーむ,
奇怪な 1995 年データーめ.
いや
……
97 年も同じようにだめだ.
くそ.
なぜだ.
- 午後になっても問題は解決せず.
- 気晴らしにお茶部屋計算機
<Nexas> 強化をあれこれと画策してみる.
なにしろ Pentium 100 MHz マシンだからなあ.
- 台湾の気鋭の MotherBoard メイカー
Giga-Byte 社のみょーに重たい web page を熟読してみる.
BIOS は交換したんだけど
……
ああ,
こんなことやっても,
この GA-586ATM/P なる基板では
Pentium 100MHz より良い CPU は積めないようだ.
- 結論としては,
MotherBoard と CPU を合計 1.5 万円ぐらいで買って,
筐体・その他ボード類は今までのものを使う,
というパワーアップがもっとも安上がりで現実的かなあ
……
- 眠い.
北大では夜遅くまで起きてるんで,
毎日寝る時間が 6 時間ぐらい,
であるからだ.
夕方,
一時間ほど講義室で寝る.
なんかすごく熟睡してしまった.
- ImageMagick に identify なるコマンドあることを発見.
こりゃあ便利だ.
- 清野さんに「ぎょーむ日誌」のハイパーリンクがおかしい,
と教えていただく.
調べてみるとたしかに「目次」にとぶはずのリンクが
英語ペイジにとんだりする.
元ファイルから「日付順」「日付逆順」ファイルを
生成するところにバグが見つかったんで
直す.
- いろいろと後ろぐらいので特に匿名希望している
講座専属料理人氏
(他講座の大学院生であるかのように偽装している)
が
「熱砂の死闘 北アフリカ (1)(2)」
なる写真集貸してくれた.
うーむ,
料理人氏が軍事おたくとは知らなかった.
私自身は軍事おたくというより
むしろずっと軟派な
……
いうならば,
一般向け読みものとしては高踏的なまでに実証主義
もしくは
そういうふうに妙にマジメすぎて
ある種の狂気に染まりつつあるとも言える
「歴史群像」(学研の季刊雑誌) などを
毎号買う程度の
いい加減な歴史ものファンにすぎないんだけど.
- トチノキ問題.
ようやく原因がわかった.
全体の「流れ作業」の最初のほうで
年ごとに
location なんちゃらという種子の所在を表すファイルと
status なんちゃらという種子の状態を記したファイルを
読み込むんだが,
この二つで種子個体の並びかたがまったく一致していなかった
のが原因と判明した.
くそー,
阿呆なことだ.
気づかなかった.
- こうなった原因は,
私の手元にくるまでに
M$-E*cel の中を「ぶっく形式」とやらで
通過しちゃってるからである.
このデーター構造は
(以前にも書いたけど)
諸悪の根源なのである.
- いかなる生態学的測定の結果であっても,
必ずそれを
E*cel のスプレッドシートの縦横を埋める数値にしてしまう,
という方法は広く受け入れられてしまっている.
ああ,
しかしながら対象がなんであれ,
それは必ずしもこういった
二次元格子状のデーター構造 (二次元配列) に
格納できるとは限らない.
それなのに二次元の配列に帰着させてしまう.
あれこれと無理が生じる.
- 二次元データー構造が破綻しそうになると,
こんどはそれをいくつかのシートに分割する
「ぶっく形式」
なるものが採用されてしまう.
E*cel におけるデーター処理は
「目で見て手で操作する」
を大前提としているので,
こういう「見通し」のわるい
「三次元以上の配列」
データー構造を採用したとたん,
間違い (とくにシート間の不整合) が
混入する危険がとたんに増大してしまう.
二次元より大きな配列 (ごときもの) は
人間の手で直接操作するには複雑すぎるのである.
- それなのに,
保守的にもというか
以前からの惰性で
「二次元配列 (一枚のスプレッドシート) で
うまくいかくなったら多次元配列 (らしきもの)」
という方法が採用されちゃって,
手作業の間違いを「目」で発見できなくなると,
間違い不整合データーファイルが次々と生成されるわけだ.
- ある程度ややこしいデーターは自分でよくそのデーター構造を考えて,
それを入出力・操作できるようにするべきなのだろう.
結局,
プログラムを書かねばなるまい.
何か一般的なプログラム言語を採用してもよいだろうし,
あるいはデーターベイスソフトウェアを使ったほうがよい場合
もあるだろう.
ややこしいデーター構造の実装とその操作が可能になる.
- とはいえ,
少なくとも日本の生態学研究者の間では E*cel なんかが
浸透しちゃって,
しかも使ってるヒトたちは「これでうまくいってる」
と信じてるもんだから,
とうぶんはまともなデーター構造は採用されないだろう.
データー解析専門家にしてモデル屋たる
こちら側からあれこれと言うほかあるまい.
- 私自身としては Perl とか C++ なんかによる
複雑というか言うところの「現実的な」データー構造の
取り扱いにようやく慣れ始めたところで,
リレイショナルデーターベイスなんかまでは
まだまだ手がまわっていない.
まあ,
ぼちぼちと進展させていくか.
- などと考えつつ,
フィルターをもう一段ついか.
これは
「E*cel によってデーターの並びがぐちゃぐちゃになりました」
という想定のもとで,
それを修復するためのものである.
- よーし,
95 年から 97 年まで全てのデーターが同じ流れの中で
処理できるようになった.
作図・計数は一瞬にして完了.
- 星崎さんに報告メイル送ると,
先方も夜更ししていて返信が戻って来る.
あーだこーだとやりとりが続く.
私のフィルタープログラム群で何箇所か
Unix 依存なところがあって
Window$ の Perl では動かない
……
ああ,
プラットホーム間の互換性とかあまり考えてなかった.
でもすぐには直せないんですよね.
文字コード処理とか日付計算のところとか.
- 寝るのは 0230 すぎになりそう.
- 今日の食卓
- 朝 (0920):
ナス・チンゲンサイ・エリンギ中華ふう.
はい,
先日の材料の残りです.
[食事風景]
材料はナス・チンゲンサイ・
エリンギ・味つけは「中華だ
し」の粉末 (いやはや)・胡
椒など.片栗粉でソースを
ペイスト化してる.
- 昼 (1300):
朝の残り.
- 晩 (1930):
朝昼の残り.