回答率という答えを堂々とスルーしてる奴 pic.twitter.com/UasPBZdFBB
— 限界サヨクのツイ栗鼠しらず (@desPAiR0906) April 16, 2018
この私のツイートに関して、今回は記事にします。
世論調査について、疑問を呈すという形で、ツイッターなどのインターネット上の調査が持ち出されることがよくあります。
しかし、これらの調査は基本的な部分で、まったく違う性質を持っています。
私のツイートで批判対象にしてるツイートで持ち出されている調査とはまた違うものになりますが、朝日新聞が自社が行っている世論調査について解説しているページがあります。
世論調査というのは、文字通り世論を調査するものです。
世論というものは、基本的には『有権者全体の意見の傾向』と読み替えて良いと思います。
つまり調査対象は『有権者全員』なのです。
基本的に、有権者全員に意見を聞くというのは不可能です。
あの一大イベントである国政選挙ですら、『投票率』という概念があるように、有権者全員の意見を聴取出来ているとは言い切れないものなのであることからもわかるように、毎度毎度、とても大規模な集団である日本の有権者全員に意見を聞くことはできません。
そんなことはできないから、間接民主制を採用しているわけです。
それを踏まえて、世論調査は、標本調査という方法を使います。
一部をサンプルとして抜き出して調査することで、全体の傾向を推測する、という方法です。
先程、解説記事を紹介した朝日新聞の場合、基本的には標本は特定の階層に偏らないように無作為抽出をしつつも、『回答者の構成比が総務省発表の実態構成比と同じになるように』などの調整を加えるなどし、なるべく有権者を代表する形になるようにしているようです。
NNN調査でも似たようなことがなされているのかもしれません。
このように、偏りがないように標本を抽出しているので、NNNのように回答数が800近くだったとしても、回答率はある程度の率になり、それなりの信頼性がある、と言えるようになります。
一方でインターネットによる調査の場合、回答者のサンプリングを行わず、回答するフォームがオープンであり、誰でも回答できるようになっている事が多いです。
つまり、調査対象が『インターネットを使ってる全員』となってしまいます。
この時点で調査対象が適切でないことが明白なのですが続きます。
ツイッターの場合、入力できる対象がツイッターアカウントを持ってる人なので、調査対象は『ツイッターアカウント全体』となるでしょう。
(日本語が読めなくても、制限はしていない以上、なんらかの手段でたどりつき、質問に答えてしまうことができてしまうことも見逃してはいけません。)
日本の有権者のみに絞れていない時点でツイッターアンケートはマスコミが行う世論調査とは調査対象が異なり、比較対象にはなりえません。
また、調査対象が膨大であるにもかかわらず、全くサンプリングをしない全数調査という形をとっているため、回答率は散々なことになります。
例えば、ツイートで例示されている34652という回答数。
一応、(実態は全く限定できていなかったというのは無視して)日本の有権者全体という調査範囲に絞ったとしても、有権者数は、(本来は調査時点の母数を利用すべきですが、わかりませんので、直近の数学を使いますが)2017年衆院選時点で【1億609万1229人】となっています。
その直近の有権者数を使って計算すると、回答率は約0.03%程度となります。
これでは明らかに回答数が足りていない調査不足状態であり、誤差の可能性だらけです。
また、そのように限定的な数の人しか回答していない一方で、回答者の属性傾向が一切示されていないため、回答者にどのように偏りがあったのかも評価不可能です。
それに比べれば、NNNの調査は(サンプリングに問題がなければ)信頼性について天と地の差があります。
そのような2つの調査が並べられてしまうような事が本来、あり得ないわけですが、マスコミを信じない方は、世論調査でわ行われるサンプリングを『操作』と受け取って批判するわけです。
しかし、『(サンプリングという)操作』すらしない調査は、とんでもないコストをかけて対象の大多数を調査しない限り、ほぼ何も表さないということをまずは前提にしないといけません。
そういうことを踏まえた上での世論調査批判は有益であると思いますが、そうでなければ、その批判は何も当たってないし、何も生まないとしか言いようがないのではないでしょうか。
コメント