鄭自隆專欄／政治喊讓6%？科學說±3%？選贏才是真的

鄭自隆／政治大學傳播學院兼任教授

藍白合瀕臨藍白破，雙方爭執的是讓3%，還是應該讓6%？就回到學理來討論。

所有教科書都會這樣寫，當樣本數1,067方能達到統計學所謂的「信心水準95%，抽樣誤差±3%」；其意義是針對同一母體，在同一時間，做100次相同的抽樣調查，其中會有95次調查的結果落在該次調查數據的±3%以內。

例如藍白兩位候選人支持度調查，某次調查結果A候選人支持度32%、B候選人支持度30%，由此可推論，若在同一時間、以同一母體抽樣，重複做100次的抽樣調查，其中會有95次調查的結果落在此次結果的±3%以內，亦即－

A候選人可能支持度最低為29%，最高為35%。
B候選人可能支持度最低為27%，最高為33%。

換言之，當A在該次調查中只贏2%時，B可能以誤差範圍最高為33%贏過A目前的32%，所以依現在的遊戲規則，藍白都同意算B贏。

但另一種狀況，A候選人支持度33%、B候選人支持度30%，也就是－
A候選人可能支持度最低為30%，最高為36%。
B候選人可能支持度最低為27%，最高為33%。

也就是A在該次調查中贏3%時，B可能以誤差範圍最高為33%，和A的33%，依柯陣營詮釋的遊戲規則算打成平手。

但當A贏3.1%時，情況又不一樣了，A候選人支持度33.1%、B候選人支持度30%，詮釋結果就是－

A候選人可能支持度最低為30.1%，最高為36.1%。
B候選人可能支持度最低為27%，最高為33%。

從學理上來看就是，當A在該次調查中贏3.1%時，B在誤差範圍最高為33%，仍輸給A目前的33.1%，所以依柯營詮釋的遊戲規則，應該算A贏。不過也可以說，在95%的機率中，B候選人可能以最高支持度33%，贏過A的最低為支持度的30.1%，所以支持度必須贏對手6%以上，才有95%的勝算，只贏3%不算，要6%。

上述的說明是建立在以下幾個前提上：
   樣本必須從母體產生；
   樣本的取得必須隨機random；
   樣本數1,067。

真正的母體是明年1月13日具投票權的1900萬選民，但不可能直接以戶籍為基礎作為抽樣母體，這次藍白審視的民調，抽樣母體是市話和手機，市話的抽樣基礎是以「戶」為單位，而非「個人」，所以市話所構成的母體基礎和真正選民母體，當然會有偏差；手機雖然以「個人」為單位，但普及率也非百分百，因此和選民母體也有偏差。

至於±3%也不是固定的，其前提是樣本數是1067，但每次調查的樣本數不會是剛好1067，當樣本數為10,000時，抽樣誤差就縮小為±0.98%；樣本數為100時，抽樣誤差就擴大為±9.8%；如某天天公布的民調，其樣本數是400，因此抽樣誤差就是±4.9%。這次藍白比如果有採計此民調數據，依抽樣誤差的講法，則必須贏9.8%（4.9%×2）才算贏。

甚至依學理來解釋，贏9.8%也不是穩贏的，還有5%的機率會凸槌，投票結果會掉在抽樣誤差之外，難怪2000年大選後，連戰會怨嘆，明明民調都我們贏，為什麼會選輸？

民調之所以都被要求揭露這樣的統計學上的說明「信心水準95%，抽樣誤差±3%」，其學理精神就是詮釋空間的彈性，沒有一刀切的，數字是冷冰冰的，現實才是滾動的，何況有抽樣、母體的雙重偏差；學理上的彈性詮釋空間，在現實政治場域變成1%都不讓的僵局，讓3位仲裁的民調專家負明年大選藍白成敗的責任，恐怕太沉重了吧；固然政治上可以說要讓3%，還是讓6%？但科學上就是加減1.5或是加減3，這不一樣的。更要提醒的是，在明年1月13日的大選中，賴清德可是0.01%都不會讓的，藍白不應在3或6打轉，回到現實層面，找出贏的方程式。

鄭自隆專欄 ／政治喊讓6%？科學說±3%？選贏才是真的

鄭自隆專欄／政治喊讓6%？科學說±3%？選贏才是真的