鄭自隆專欄 /政治喊讓6%?科學說±3%?選贏才是真的

  • Line
國民黨總統參選人侯友宜(左)、民眾黨總統參選人柯文哲(右)。中央社

國民黨總統參選人侯友宜(左)、民眾黨總統參選人柯文哲(右)。中央社

A A A
2023-11-18 15:35

鄭自隆/政治大學傳播學院兼任教授

藍白合瀕臨藍白破,雙方爭執的是讓3%,還是應該讓6%?就回到學理來討論。

所有教科書都會這樣寫,當樣本數1,067方能達到統計學所謂的「信心水準95%,抽樣誤差±3%」;其意義是針對同一母體,在同一時間,做100次相同的抽樣調查,其中會有95次調查的結果落在該次調查數據的±3%以內。

例如藍白兩位候選人支持度調查,某次調查結果A候選人支持度32%、B候選人支持度30%,由此可推論,若在同一時間、以同一母體抽樣,重複做100次的抽樣調查,其中會有95次調查的結果落在此次結果的±3%以內,亦即-

A候選人可能支持度最低為29%,最高為35%。
B候選人可能支持度最低為27%,最高為33%。

換言之,當A在該次調查中只贏2%時,B可能以誤差範圍最高為33%贏過A目前的32%,所以依現在的遊戲規則,藍白都同意算B贏。

但另一種狀況,A候選人支持度33%、B候選人支持度30%,也就是-
A候選人可能支持度最低為30%,最高為36%。
B候選人可能支持度最低為27%,最高為33%。

也就是A在該次調查中贏3%時,B可能以誤差範圍最高為33%,和A的33%,依柯陣營詮釋的遊戲規則算打成平手。

但當A贏3.1%時,情況又不一樣了,A候選人支持度33.1%、B候選人支持度30%,詮釋結果就是-

A候選人可能支持度最低為30.1%,最高為36.1%。
B候選人可能支持度最低為27%,最高為33%。

從學理上來看就是,當A在該次調查中贏3.1%時,B在誤差範圍最高為33%,仍輸給A目前的33.1%,所以依柯營詮釋的遊戲規則,應該算A贏。不過也可以說,在95%的機率中,B候選人可能以最高支持度33%,贏過A的最低為支持度的30.1%,所以支持度必須贏對手6%以上,才有95%的勝算,只贏3%不算,要6%。

上述的說明是建立在以下幾個前提上:
    樣本必須從母體產生;
    樣本的取得必須隨機random;
    樣本數1,067。

真正的母體是明年1月13日具投票權的1900萬選民,但不可能直接以戶籍為基礎作為抽樣母體,這次藍白審視的民調,抽樣母體是市話和手機,市話的抽樣基礎是以「戶」為單位,而非「個人」,所以市話所構成的母體基礎和真正選民母體,當然會有偏差;手機雖然以「個人」為單位,但普及率也非百分百,因此和選民母體也有偏差。

至於±3%也不是固定的,其前提是樣本數是1067,但每次調查的樣本數不會是剛好1067,當樣本數為10,000時,抽樣誤差就縮小為±0.98%;樣本數為100時,抽樣誤差就擴大為±9.8%;如某天天公布的民調,其樣本數是400,因此抽樣誤差就是±4.9%。這次藍白比如果有採計此民調數據,依抽樣誤差的講法,則必須贏9.8%(4.9%×2)才算贏。

甚至依學理來解釋,贏9.8%也不是穩贏的,還有5%的機率會凸槌,投票結果會掉在抽樣誤差之外,難怪2000年大選後,連戰會怨嘆,明明民調都我們贏,為什麼會選輸?

民調之所以都被要求揭露這樣的統計學上的說明「信心水準95%,抽樣誤差±3%」,其學理精神就是詮釋空間的彈性,沒有一刀切的,數字是冷冰冰的,現實才是滾動的,何況有抽樣、母體的雙重偏差;學理上的彈性詮釋空間,在現實政治場域變成1%都不讓的僵局,讓3位仲裁的民調專家負明年大選藍白成敗的責任,恐怕太沉重了吧;固然政治上可以說要讓3%,還是讓6%?但科學上就是加減1.5或是加減3,這不一樣的。更要提醒的是,在明年1月13日的大選中,賴清德可是0.01%都不會讓的,藍白不應在3或6打轉,回到現實層面,找出贏的方程式。