計算まち時間に Annika さんから古い測定機器から
回収したというよくわからぬ文字コードがたくさん混入した
ロガーファイル (いちおうテキストファイルらしきもの) が送られてきた.
ゑくせるで読めるように変換せよ,
とのこと.
よくわからないので,
アヤしげな文字コードはことごとく ,
に変換せよ,
という Perl スクリプトを書いてみる.
#!/usr/bin/perl -w
while (<>) {
chomp;
s/[^0-9A-Za-z:\.\-]/,/g;
print "$_\n";
}
ケガれ仕事にはケガれ言語を,
と変換ずみファイルを送りかえしたら,
他にもたくさんあるので「やりかた」を教えろ,
との御命令.
しょうがないので,
上と同じ内容を R でかいてみる.
file.input <- "AKJ20080625Bfinal2.dat"
file.output <- sub("\\.dat", "\\.csv", file.input)
cat("# converting", file.input, "->", file.output, "\n")
sink(file.output)
lines <- readLines(file.input)
for (line in lines) {
line <- gsub("[^0-9A-Za-z:\\.\\-]", ",", line)
cat(line, "\n", sep = "")
}
sink()
こんなところだろうか?