《ETtoday民調雲》於2022年9月23日至29日進行「2022台南市長選情調查」,以自建會員資料庫裡已貼標戶籍為台南市各行政區且年滿20歲以上民眾為抽樣範圍及對象,經電腦隨機抽取,再以「手機簡訊」方式通知,進行封閉性網路問卷調查。調查共發出60,000通簡訊通知,回收有效樣本數為1,070份。
學者指出,此「訪問」成功率約僅為一般市話調查的六分之一左右,再加上實務上手機使用明顯存在年齡層差異的情況,原始樣本結構可能偏向較為年輕的選民。
本次解讀民調報告如下:
解讀日期:2022年10月12日
民調日期:2022年9月23日至29日
民調主題:2022台南市長選情調查
報導機構:ETtoday民調雲、ETtoday新聞雲、中時新聞網、TVBS新聞網等
執行機構:ETtoday民調雲
調查地區:台南市各行政區
樣本/誤差:《ETtoday民調雲》自建會員資料庫內(會員資料皆有性別、年齡、戶籍縣市、鄉鎮市區、手機號碼等欄位),已貼標戶籍為台南市各行政區且年滿20歲以上民眾,回收有效樣本數為1,070份,抽樣誤差在95%信心水準下,為正負3%。
民調摘要:本次民調由《ETtoday民調雲》負責問卷設計、樣本抽樣、調查執行、資料處理、統計分析及報告撰寫。調查期間於2022年9月23日至29日進行,以《ETtoday民調雲》自建會員資料庫內(會員資料皆有性別、年齡、戶籍縣市、鄉鎮市區、手機號碼等欄位),已貼標戶籍為台南市各行政區且年滿20歲以上民眾為抽樣範圍及對象,樣本抽樣方法採「分層隨機抽樣」,依性別、年齡、行政區交叉分層,各層依人口比例配置樣本數後由電腦隨機抽取,再以「手機簡訊」方式通知,進行封閉性網路問卷調查(受訪者屬被動受訪,非公開問卷讓其主動表態);調查共發出60,000通簡訊通知,回收有效樣本數為1,070份,抽樣誤差在95%信心水準下,為正負3%。進行統計分析之前,原始資料先依台南市最新人口統計資料(111年8月底)進行性別、年齡、地區、教育程度樣本加權,以符合台南市20歲以上人口之母體結構,使本調查具有代表性。此民調詢問台南市長候選人支持度、候選人看好度、候選人喜好度、居住台南市幸福度、現任台南市長黃偉哲施政表現滿意度、最在意的市政發展項目。
爭點解讀:
一、此民調使用「簡訊通知」的調查方法讓會員填答網路問卷,並未獲得可觀的問卷回收量,這樣的調查方式是否存在問題?
二、民調詢問受訪者對候選人的喜好度,對選情預測有幫助嗎?
專家分析:
世新大學行政管理學系教授莊文忠解讀:
《ETtoday民調雲》於9月23日至29日,以自建的會員資料庫為抽樣底冊(sampling frame)進行「分層隨機抽樣」,針對20歲以上的台南市民進行「2022台南市長選情調查」,共發出60,000通簡訊通知,回收有效樣本數1,070份,問卷回收率為1.8%。該調查結果顯示,年底台南市長選舉由國民黨謝龍介、民進黨黃偉哲、無黨籍許忠信、無黨籍林義豐、無黨籍吳炳輝這五位競爭,黃偉哲支持度50.1%、謝龍介支持度29.3%、林義豐支持度3.3%、許忠信支持度1.2%、吳炳輝支持度0%,前兩名黃偉哲與謝龍介的支持度差距為20.8%,黃偉哲大幅領先。該調查報告亦強調,因距離選舉還有一段時間,後續變化仍有待觀察。
本項調查不僅提供調查方法的詳細說明,亦列出該題的提問內容和提供交叉分析結果,相較於坊間的調查,為值得肯定之處。進入資訊化社會後,不僅民意表達的形式和管道越來越多元,網路調查也越來越普遍,而利用網路樣本資料庫(internet panels)進行調查即是其中一例,本項調查即屬之。基本上,網路樣本資料庫的建立與維繫並不容易,調查機構必須事先透過其他調查計畫或樣本招募來蒐集和累積會員數,以提供其母體涵蓋率,並定期或不定期透過問卷調查和點數發放(或抽獎活動)來維持會員參與的活躍性。此種調查的優點是,調查機構可以事先掌握會員的個人基本資料(例如性別、年齡、戶籍縣市、鄉鎮市區、手機號碼等欄位),是以,在發送調查簡訊時即可以事先篩選合格的對象,減少不合格樣本的比例(例如選取戶籍設在台南市的會員),且可以針對問卷回收情形,替補訪問失敗的樣本,進一步達到配額控制的效果。但此一調查方式亦有其值得探討地方,以下就本項調查為例進行解析。
首先,調查機構以自建的會員資料庫為抽樣底冊,但調查報告中並非說明此一會員資料庫的建置方式,是隨機樣本或自願樣本?資料庫的會員結構與調查母體(如台南市選民人口)的一致性?會不會有性別、年齡或行政區等變數的偏差?與此相關的是,此一會員資料庫的規模有多大?其中設籍在台南市的會員人數又有多少?這都會影響到樣本的涵蓋率。
其次,即使此一資料庫的會員結構與調查母體接近,本項調查亦採取隨機抽樣方法抽取樣本,但採取發送手機簡訊方式通知中選會員參與調查,由會員自行決定是參與問卷填答,其回收樣本的性質較為接近自願樣本,再加上回收率僅有1.8%,樣本結構與母體結構之間可能存在明顯的偏差,以致於本項調查需要以事後加權方式進行調整,但本質上未處理的問題是,自願參與填答和自願放棄填答的會員在態度是否有明顯的差異,例如某一陣營的支持者積極參與或是某一陣營的支持者消極以對,果若如此,即使經過加權調整,此一調查仍有可能出現高估或低估特定候選人的支持度。
第三,本項調查以手機簡訊方式通知,且發出60,000通簡訊僅回收1,070份有效樣本,「訪問」成功率約僅為一般市話調查的六分之一左右,再加上實務上手機使用明顯存在年齡層差異的情況下,因此,此一原始樣本結構是否可能偏向較為年輕的選民?可惜本項調查並未進一步檢定或說明訪問成功與失敗樣本的人口結構是否有明顯差異。
第四,本項調查針對各個候選人的支持度與受訪者的基本人口變數進行交叉分析,但由交叉分析中各個選項的樣本數可知,各個選項的樣本數分布差異甚大,其抽樣誤差自然也是大小不一,尤其是在政黨傾向方面,選項已分別列出民進黨、國民黨、台灣民眾黨、時代力量及台灣基進黨等明確的政黨,又另設有「泛藍」和「泛綠」的選項,但在扣除前述幾個明確的政黨支持後,回答「泛藍」或「泛綠」這二個選項所指涉的對象為何並不清楚,且時代力量和台灣基進黨的樣本數各為5個和6個,其抽樣誤差已經大到不足以分析個別候選人的支持度差異;此外,議員選區中的第4選區,其樣本數僅有21個,除抽樣誤差也不小,可能也存在上述類似的問題外,也反映了其會員資料庫中此一地區的會員人數遠低於其他地區或拒絕參與調查的比例偏高甚多。
最後,在喜好度的分析方面,本項調查針對所有受訪者分析其對各個候選人的喜好度,意義似乎不大,甚至可能會進一步強化民調領先者的優勢印象,因為當受訪者已經表態支持特定的候選人後,表示此人即是其心目中最佳的人選,再問他(她)對各個候選人的喜好度,只是增加其他候選人的討厭比例,若是僅針對未表態支持特定候選人的受訪者,再詢問對各個候選人的喜好度,有助於研判或預測其可能的支持對象,參考價值應較高。