Kameno external storage

由無し事をたまに綴るブログです。

1ビットサンプリングでも高精度の計測ができる理由

もうすぐ衆議院議員選挙の投票日ですね。有権者が投じる1票には1名の候補者(小選挙区)と1つの政党または候補者(比例代表)しか書けません。情報量としては小さいですが、多数の有効票の統計をとることで、得票率という有効桁数が数桁もある高精度な情報が得られます。小選挙区で当選するのは1名だけですが、得票率という統計量は有権者の意志を示す数値ですので、たとえ落選候補者に投じた一票であっても無意味ではありません。総選挙の票は世論調査とは比較にならないほどたくさんのサンプル数があるので、例えば原発にYes/Noという切り口, 増税or財政再建という切り口, TPP参加の是非など、争点になっている問題について因子分析することで、民意を具体的かつ説得力をもって示すことができます。

なお、せっかくの1票を棄権したり白票を投じたのでは、得票率に影響を与えません。仮にA, B, Cの3名の候補者がいてそれぞれ得票率が50%, 30%, 20%だったとすると、棄権票や白票はA候補に0.5票, B候補に0.3票, C候補に0.2票を投じたのと等価ですから、白票は「多数派を支持」したことに相当します。白票は政治への不満の意志表明にはなりません。

私が研究手法として使っている電波望遠鏡では、アンテナで受信した天体からの電波信号をサンプリングしてデジタル信号に変換してから解析します。アナログの電圧信号をデジタル化する際に、1ビット(2階調)とか2ビット(4階調)という、粗い量子化をしてしまいます。オーディオCDの量子化が16ビットあるのに比べて、何てひどい量子化でしょう。しかし、1秒間に数億点という高密度なサンプリングを行ない、莫大なサンプル数の統計をとることで、天体の電波強度という統計量は高い精度で計測できます。
簡単のため1ビット量子化でNサンプルの統計をとることを考えましょう。量子化した値は0または1の2階調です。1になる確率をp, 0になる確率を1-pとします。Nサンプルの統計で期待値はp, 分散は p(1-p)/N になります。標準偏差は分散の平方根で、sqrt( p(1-p)/N )になります。例えば1億点のサンプルの統計をとれば、0.01%程度の精度で電波強度が計測できるわけです。粗い量子化でも細かい階調の精度が出ることが感覚的に分からない、と質問されることが間々ありますが、選挙で得票率が細かい桁まで出ることを説明すると、納得してもらえます。

日曜日の総選挙では、たとえ支持する候補者・政党がなくても、支持する政策を得票率という民意で示すために少しでもマシな候補者・政党に投票しましょう。支持する政策と候補者・政党とのマッチングができるwebサービス(投票マッチング)
もあります。最高裁裁判官の国民審査も、無効票にならないよう×だけを書き入れるようご注意ください。