鄭自隆/國立政治大學傳播學院兼任教授
日前網紅館長在直播節目,質疑《美麗島電子報》大選民調賴清德支持度39.4%,認為抽樣僅1000人,不可信,而且連帶掃到其他民調,認為坊間民調抽樣數有問題,怒轟「狗民調」、「自慰民調」,並在聊天室「自辦民調」,2.6萬人回應,結果顯示「92%不支持賴清德」,館長嗆,「隨便調查,超過90%的人賭X他(賴清德),哪來40%的人支持他?」
對民調,館長真的誤會了,他的第一個誤會是「樣本數要越多越好」。
民調樣本數是不是越多越好,舉個例子就會了解,當媽媽煮一鍋湯,要知道鹹淡是否合宜,是舀一瓢試吃,還是要喝一大碗,甚至要把整鍋湯喝完,才會知道是不是OK?當然再不擅廚藝的媽媽都知道只舀一瓢就可以;這就是抽樣,少數可以代表母體。
若媽媽真的把整鍋湯喝完來試鹹淡,這是「普查」census,普查當然是最好的,一網打進毫無漏網之魚,不過費時費力,而且有時後做不到,假設品管作業,要瞭解生產的這批燈泡可以點燃幾小時,使用普查就要把所有的燈泡一直燒到壞,才能取得數據,但會有老闆這麼笨嗎?
有了「抽樣」sampling,只要抽取一小部分的燈泡試點,其數據就可以推論到全體,「抽樣」是相對於「普查」的概念,其意義是 -
•節省經費:不用針對每一個體都進行測量;
•節省時間:測量數量減少,當然節省時間;
•不致完全毀損母體:如上述之生產線品管抽樣。
所以總統大選民調都必須透過抽樣的過程,普查費時費錢不可能做到,要執行抽樣必須遵循下列三原則 -
1、樣本必須從母體population產生;
2、隨機random,亦即母體中之每一個體有均等被抽中之機會,不可刻意挑選樣本,或避開那些樣本;
3、樣本數sample size必需具解釋力,這就是館長的第一個疑惑,別人家的民調才千餘人怎麼夠,要玩就玩大的,他來個2.6萬人,但樣本數是不是越多越好?
舉個例子就會瞭解,1936年美國總統大選競爭激烈,《文學文摘》the Literary Digest以家有裝置電話的家庭為母體,郵寄1000萬份問卷以預測總統選舉,回收200萬份!200萬份樣本夠嚇人吧。
不過結果卻槓龜,《文學文摘》調查結果是共和黨藍登Alf London支持度60%,贏了民主黨羅斯福40%,但選舉結果卻正好相反。問題出在那裡?
30年代家裡有電話的都是中上階層的家庭,而中上階層的人當時都傾向支持共和黨,所以會導致共和黨贏了民主黨的結論;因此儘管使用類似普查,樣本數驚人,但母體定義不精確,再多的樣本數也不管用!
所以調查樣本數不是越多越好,理論上1,067就可以了,樣本數1,067就可以有統計學所謂的「信心水準95%,抽樣誤差±3%」的解釋力,也就是針對同一母體,在同一時間,做100次相同的抽樣調查,其中會有95次調查的結果落在該次調查數據的±3%以內。
例如「總統候選人支持度」調查,該次調查結果A候選人支持度35%、B候選人支持度32%,由此可推論,若在同一時間、以同一母體抽樣,重複做100次的抽樣調查,其中會有95次調查的結果落在此次結果的±3%以內,亦即-
A候選人可能支持度為38~32%、B候選人可能支持度為35~28%。而且還有5次的調查結果會在「A候選人支持度38~32%」與「B候選人支持度35~28%」範圍之外。這也意謂候選人支持度必須贏對手6%以上,才有95%的勝算(不要忘了還是有5%的機率會「凸槌」),只贏1%或2%就宣稱民調領先並無意義。
館長第二個誤會是「沒有母體概念」。
抽樣調查要有意義,樣本必須從母體population產生,台灣總統大選民調的母體是1900萬左右的合格選民,樣本必須從這裡面抽出,所以現代很多民調用市話,或手機輔以市話,雖然不滿意,但在理論上可以接受。不過館長直播聊天室「自辦民調」,母體是他的粉,也就是網友批評的「同溫層」,而不是所有的選民,如此民調結果,就如同跑到眷村,或跑到長老教會,問人家說你會支持誰,然後做成針對所有選民的推論,一樣荒謬。
館長第三個誤會是「受訪者應勇於表態」。
民調受訪者必須被動產生,而不適合找主動表態者,主動表態涉入感高,在母體中是屬異類,就失掉代表性,館長直播聊天室都是高涉入的同溫層,和台灣普羅大眾結構不一樣, 因此調查結果一面倒呈現支持特定候選人,也就不奇怪了。
所以說,儘管現在民調數據不一,但其研究方法還是可以「推論到全體母體」,部分呈現目前的趨勢;但館長的聊天室民調,「僅代表填答者的共同意見」,唯一的結論是「館粉中的確有2.4萬人賭X賴清德」,此外沒有任何預測意義。