看懂民調》樣本民調太少?學者:1068份可代表多數民意

《美麗島電子報》發布 8 月國政民調,賴清德持續以 42.5% 的支持度領先其他對手。不過這樣的結果,讓網紅館長不滿,除了認為結果不準確,更直呼《美麗島》是「假民調」,意外掀起民調抽樣的真實性攻防戰。

由《美麗島電子報》委託、戴立安設計問卷與分析、畢肯市場研究公司執行的「8 月國政民調」,聚焦民心動態、總統選舉、政黨聲望,與共產黨好感度四大面向,相關時事如郭台銘即將參選(編按:民調執行時,郭台銘尚未正式宣布參選)、選舉口號等新聞皆入題。

民調數字部分,蔡英文與陳建仁的施政滿意度突破四成,賴清德則以 42.5% 的支持度領先其他候選人,這與其他民調的結果並無二致。惟網紅「館長」陳之漢質疑民調樣本數過少,無法代表所有選民,與《美麗島電子報》董事長吳子嘉唇槍舌戰,成為選戰討論焦點。

▲ 柯文哲(左起)、賴清德、侯友宜與郭台銘。(圖/翻攝美麗島電子報)

▲ 柯文哲(左起)、賴清德、侯友宜與郭台銘。(圖/翻攝美麗島電子報)

【專家分析】

本次〈看懂民調〉專欄特以「民調識讀」為出發點,邀請中國文化大學新聞學系教授莊伯仲,以專文形式,詳細解釋「民調抽樣」的學理與內涵。

爭點一:民調抽樣 1068 份,為什麼能代表全體民意?

國內一般坊間都是採取抽樣(sampling)式的民調,以少數人作為樣本進行整體民意的推論。不過民調的抽樣並非隨便亂抽,而是採用「隨機抽樣」,也就是說,把受調查對象依據不同特徵分層,從不同的層之中,獨立隨機抽取樣本。

舉例來說,總統選舉的民調對象是全國民眾,就必須將民眾的居住/戶籍地做分層,並在各個縣市隨機抽出受訪對象。至於怎麼抽,會參考現實生活中的比例分配,例如新北市 2020 年的常住人口佔全國 18.31%,抽樣時就會盡量參照該比例,必要時加權,讓數字符合實際情況。

▲ 受訪樣本人數與其抽樣誤差的關聯。(圖/莊伯仲提供)

至於「1068」這個數字,則是跟誤差範圍有關。在分層抽樣的前提下,樣本越多,誤差範圍當然越小,但調查成本、時間也會增加。「1068 份」則是權衡成本、時間、誤差之下的數字,可謂「CP 值最高」的選項。

民調執行時還會受到許多因素干擾,例如訪員訓練、加權指數準不準、突發事件的影響,都會對準確度造成影響,這個地方可以做深度的探討。不過,以調查方式來說,這樣的民調是符合學理的。

(編按:《美麗島》的民調樣本最低設定在 1070 份,董事長吳子嘉曾在節目中表示「比所有的科學規定稍微高一點」。)

只抽樣少數人,何不直接普查?

如果可以直接普查全國 2,300 萬民眾,那當然是最準的,但實務上近乎不可能;即使廣發問卷,做出來的結果也不一定準確。

1936 年的美國總統選舉,就是很好的例子。當時,美國相當受歡迎的《文學文摘》(Literary Digest),在雜誌中夾帶問卷民調,讓讀者勾選支持的候選人——蘭登(Alf Landon)、或羅斯福(Franklin D. Roosevelt),請他們免費寄回公司,並在固定時間公布調查結果。

▲ 羅斯福、《文學文摘》與蘭登。(圖/翻攝維基百科,全民查假會社組圖)

《文學文摘》當時發了 1,000 萬張問卷出去,最後收回 230 萬張,都是相當驚人的樣本數。選前四天,《文學文摘》公布民調結果:蘭登會以 55% 勝過羅斯福的 41%,消息一出,瞬間登上了全美各大報的頭條。

不過,人多就代表準確嗎?令人跌破眼鏡的是,最後羅斯福以 61% 的得票率,大勝蘭登的 37%,跟先前做的民調結果天差地遠。

做了 230 萬份民調依舊失準,原因有二:當年《文學文摘》的閱讀群眾多為中上階層,幾乎沒調查到無產階級;另外,230 萬份民調必須主動寄回去,很難問到被動、不願表態的民眾。

同年在美國,另外一家民調公司成立,採用現今的抽樣分析模式,只用了 5 萬份樣本就預測出正確結果(羅斯福當選)。這家公司就是鼎鼎大名的「蓋洛普」(Gallup)。

網路投票、主動式填答民調,為什麼效力有限?

回到前一題的《讀者文摘》民調,因為必須主動寄回去,是屬於「自願參與」的性質,因為缺少了對政治較為被動的民眾,因此樣本不具代表性。

館長所做的聊天室民調「92% 不支持賴清德」也有異曲同工之妙,會收看館長直播的網友,大多與他目前的政治立場相同;也不是所有館粉都願意主動投票。在同溫層調查,又缺少嚴謹的抽樣,得到的結果,頂多只能代表「看館長直播、而且積極表態的網友,有 92% 不支持賴清德」而已。

2018 年台北市長選舉,民視政論節目《政經看民視》也曾利用 CALL-IN 民調,做出「92% 民眾支持姚文智」的反差數字,也是自願樣本缺乏抽樣與代表性的實例。

▲ 2018 年台北市長節目民調,在圖片最下排即有標註「非隨機抽樣民調」。(圖/翻攝《政經看民視》)

但這邊要強調的是,「網路投票、主動式填答」即便抽樣不具有代表性,民調結果的參考價值有限,也不能說是假民調。只要是符合學理做出來的民意調查,身為民調學者,我們都必須予以尊重。

不過,館長的部分質疑也不無道理。比如:這個年代打電話做民調,應該只有老人家會接答,根本問不到年輕人。如果改打手機,正常的年輕人看到「陌生來電」,多數又會掛掉拒接,那所謂的「民調」到底問到什麼人?確實值得我們深思。

【民調資訊】

  • 解讀日期:2023 年 9 月 4 日
  • 民調日期:2023 年 8 月 23 日至 24 日
  • 民調主題:2023 年 8 月國政民調
  • 報導機構:風傳媒、新頭殼、三立新聞、中時電子報等
  • 執行機構:美麗島電子報、戴立安、畢肯市場研究公司
  • 調查地區:全台各縣市
  • 樣本/誤差:成功完訪 1070 人,在信賴水準 95% 時抽樣誤差最大值為 ±3.0%。
  • 採用「比例估計法」(raking ratio estimation),母群體參數是依內政部公布 2023 年 7 月民眾性別、戶籍、年齡資料,與 2022 年 12 月的民眾教育程度等特徵,逐項重複進行連續性修正,以使樣本特徵與母群體結構達到一致(統計檢定顯著水準 p-value<0.05),此時整體樣本即具有代表性。

資料來源

美麗島民調:2023年8月國政民調 封面圖片來源:YouTube 頻道「館長惡名昭彰」、東森新聞《關鍵時刻》節目,全民查假會社組圖

熱門推薦