世論調査と選挙結果のズレはなぜ起こるのか？～アメリカ大統領選をうけて～

はじめに

2020年11月3日、今後4年間のアメリカの行く末を左右するアメリカ大統領選挙の日を迎えた。事前の予想ではバイデン氏が優勢と報じられていたが、このブログの執筆時点ではどちらに転ぶか分からない、まさに大接戦となっている。

さて、今回多くのメディアがバイデン氏の優勢を報道していたことから、「またマスコミは世論調査を外したのか」との感想を抱く人も少なくないだろう。実のところ、本当に世論調査が実際の結果から大きく外れているかどうかは、詳しく分析してみないと分からない。この記事では、そもそも世論調査と実際の結果にズレが生じるのはなぜかについて、なるべく分かりやすく説明する。

世論調査と実際の結果のズレの背景には、以下の5つの原因があると考えられる。

①調査対象者の選び方に問題がある

②統計的な誤差の問題

③調査対象者に選ばれてた人の中で、回答に協力してくれる人に偏りがある

④回答者が正直に回答してくれない

⑤直前まで投票先を決めない人の動きが読めない

順番に詳しく見ていこう。

①調査対象者の選び方に問題がある

これは専門的な言葉を使うと、標本抽出の方法に問題があるということだ。

世論調査をするといっても、有権者全員に調査するには時間も人手も足りない。（選挙のたびに何億人に調査することは不可能）
そこで、なるべく有権者全体の縮図となるように調査対象者を選ぶプロセスが必要である。

この場合、有権者全体のことを母集団、選ばれた調査対象者のことを標本と呼ぶ。
調査を正確なものにするためには、母集団（有権者全体）の縮図になるように標本（調査対象者）を抽出することが必要だ。調査対象者に偏りがあってはならない。
非常に重要なプロセスである。

マスコミの世論調査の主流は電話による調査である。この場合、電話番号を無作為に発生させることでランダムに調査対象者を選んでいる。
しばしば「携帯電話が含まれないから不正確」との主張を見かけるが、現在では多くの世論調査で携帯電話を含めた調査が行われている。*1
もちろん電話を保有していない人は調査対象から漏れる訳だが、そのことによる誤差は無視できる程度であろう。

②統計的な誤差の問題

いくら有権者全体の中からランダムに調査対象者を抽出しても、たまたま調査対象者がどちらかに偏ってしまうことはある。
くじ引きでたまたま当たりが連続して出るのと同じように。
その「偶然の偏り」がどの程度の確率で生じるのかを表すのが、誤差範囲である。

これは世論調査を行う以上、仕方のない問題である。
誤差を小さくするためには、回答者の数を増やすしかない。
しかし、回答者の数が一定数を超えれば、誤差範囲はそれほど変わらなくなる。
（日本であれば、だいたい1,000～2,000人が目安となる）

むやみに回答者数を増やすよりは、①で述べた調査対象者の選び方の方が重要である。
通常の世論調査では誤差範囲（95%信頼区間）は±2~4%程度であることが多いように思う。
誤差に対する理解を深めるためにも、マスコミは世論調査時に誤差範囲を同時に報道するような取り組みが必要かもしれない。

③調査対象者に選ばれてた人の中で、回答に協力してくれる人に偏りがある

ランダムに調査対象者を選んだとしても、その全員が回答に応じてくれるわけではない。
調査対象者のうち、どれだけの人が回答してくれたかという、回収率の問題である。

例えば電話調査の場合を考えてみよう。
　・たまたま家にいなかった
　・携帯電話に知らない番号から電話がきたら放置する
　・答えるのがめんどくさい
　・時間がない
理由は色々と考えられる。

問題なのは、回答してくれる人が何らかの属性に偏っている場合である。
よく指摘されるのが、高学歴な人ほど世論調査に回答しやすいとか、普段から政治に興味を持っている人ほど回答しやすいといったことである。
そうした場合、回答者が高学歴の人や政治に興味のある人に偏ってしまい、有権者全体の縮図とはならないのである。

そのような偏りを避けるためには、回答者の割合をあげることが大切であると考えられる。
電話調査であれば、繰り返し電話をしてみるのがよいかもしれない。
訪問での調査であれば、何らかのお礼を渡すといったことも考えられるかもしれない。

④回答者が正直に回答してくれない

ランダムに対象者を選んで、その対象者が調査に応じてくれたとしても、正直に回答してくれるかは別の問題だ。
では、正直に回答してくれないのは、どういう場合だろうか？

一つに、社会的望ましさのバイアスと呼ばれるものがある。
つまり、回答者は本心で支持している選択肢ではなくて、社会的に望ましいとされている選択肢を回答してしまう場合があるということだ。

有名な例に、1982年のサンフランシスコ州知事選におけるブラッドリー効果がある。
この選挙では、黒人のブラッドリー候補と白人候補が争い、事前の世論調査ではブラッドリー候補が優勢であった。しかし、実際の選挙結果は白人候補の勝利であった。その理由について、回答者が人種差別主義者だと思われるのを恐れ、本心とは異なる回答をしたのではないかという解釈がなされた。社会的望ましさのバイアスの典型的な例とされる。

では、社会的望ましさのバイアスを小さくする工夫はないだろうか。
例えば面接調査では、直接聞き取る方式と電子機器に入力してもらう方式では違いがあるかといった研究も行われている。*2
ちょっとした回答方法の工夫で小さくすることができるかもしれないので、考える価値がありそうだ。

⑤直前まで投票先を決めない人の動きが読めない

最後に、回答者の中には直前まで投票先を決めない人がいるという問題があげられる。
前回2016年の大統領選では、そのような有権者が多かったと指摘される。
一方、今回の大統領選では比較的多くの有権者が、早い段階で投票先を決めていたと指摘される。
直前まで投票先を決めない人が多いと、その人たちの動向で選挙結果が左右されることになり、世論調査と実際の結果の差が大きくなる可能性がある。

最後に

この記事では、世論調査と実際の結果ズレの一般的な要因を説明しただけで、今回の大統領選での世論調査について具体的な分析はしていない。
そもそも、今回の大統領選において世論調査がどの程度外れていたかも分析していない。
ここで説明した要因が今回の大統領選であてはまるかどうかについては、皆さんに考察して頂ければと思う。

*1:朝日新聞「『RDD』方式とは」

https://www.asahi.com/politics/yoron/rdd/

*2:西澤由隆・栗山浩一「面接調査におけるSocial Desirability Bias：その軽減へのfull-scale CASIの試み」『レヴァイアサン』 (46) 51 - 74，2010年