風邪はあいかわらず回復せず、今日一日じっとしていてだいぶよくなったので、晩飯準備の作業したら体温39度以上に急上昇…
— 久保拓弥 (@KuboBook) 2014, 2月 10
動物は残り寿命が短くなるとリスク選好的になるとゆー理論(別名:おハナシ)があるけれど、そのひそみにならって病床ぼうげんを少しばかり…
— 久保拓弥 (@KuboBook) 2014, 2月 10
TL上で都知事選挙の得票率と新都知事の得票率に負の相関うんぬんといったハナシが出てるけど、こういう割り算でーた解析やるひとたちは高熱でアタマをやられているのでは?横軸に投票数/有権者数、タテ軸に獲得票数/投票数とったら自己相関がでるに決まってるじゃん…つまり捏造された負の相関です
— 久保拓弥 (@KuboBook) 2014, 2月 10
もちろん横軸・タテ軸にそれぞれ有権者数の逆数と得票数がかけられてるから、それはノイズになりますよ…しかし、TL上の選挙あなりすとたちが意味ありげにギロンしてるのは、捏造相関。ゑくせる上で割り算値をこしらえて「相関を発見」するお作法でデータを殺めるのはこれっきりにしていただきたい…
— 久保拓弥 (@KuboBook) 2014, 2月 10
「これだともっと投票率があがれば・・」「はい、レッドカード」みたいな。
— baibai (@ibaibabaibai) 2014, 2月 10
もちろんTL上には有徳の賢者がおられて、たとえば私が私淑している @ibaibabaibai さんなどはRTしたよーに、ただちにカツをいれておられるけど、われわれ凡俗にはちと高邁なので、だそくな解題を追加してみました。
— 久保拓弥 (@KuboBook) 2014, 2月 10
おそらく、投票率に関する地区差と、ある候補の得票率の地区差の関係を調べるためには、階層ベイズモデルのあてはめが必要でしょう…
— 久保拓弥 (@KuboBook) 2014, 2月 10
@KuboBook 話が分かってないのですが、候補の人気が地域によらなければ「その地域での得票数~定数Xその地域の総投票数」だと思うんですが・・ 自明に負の相関が出る理由がわかりません。 引用文献にある場合はyが乱数ですがそれとは全然違うような。総投票数はスケールなので。
— baibai (@ibaibabaibai) 2014, 2月 10
@KuboBook 突然すいません。先生の本は拝見し、割り算データの害も私なりに理解したつもりではあるのですが、今回の場合には、仮に舛添さんが投票数のうち一定割合(r)を獲得するとすれば、縦軸は一定になりますよね?だから自己相関が出るとは限らないと思うのですが、どうなのでしょうか
— あっちゃん↑↑ (@atusify) 2014, 2月 10
RTにあるように、ご指摘いろいろいただきました…たしかに選挙区ごとの得票数が(投票数とは関係ない)乱数になっているときだけ負の相関になりますね。また、得票数はスケール変数とご指摘も。一候補だけ見るなら、カウントデータと見ていいかも…
— 久保拓弥 (@KuboBook) 2014, 2月 10
ということで、私のハナシとしては、A*X と B/X (A, B は定数もしくは乱数) の間で相関を調べたり、回帰をするのはアブないですよ…という一般論に後退しました。
— 久保拓弥 (@KuboBook) 2014, 2月 10
ちなみに私の「レッドカード」は「もっと投票率があがれば宇都宮や細川や・・が当選したかも」みたいなのはただちにはいえない、ということで。図を描かれた方たちはその点はよく理解されているようにみえましたが。@KuboBook
— baibai (@ibaibabaibai) 2014, 2月 10
割り算値の大好きなヒトたちのため書き直すと…ということで、私のハナシとしては、X/A と B/X (A, B は定数もしくは乱数) の間で相関を調べたり、回帰をするのはアブないですよ…という一般論に後退しました。
— 久保拓弥 (@KuboBook) 2014, 2月 10