有些民調會詢問民眾對於政治人物的「感情溫度」,其為密西根大學在 1964 年推出的百分刻度形式的量表,利用分數形式表達對政治人物的主觀看法。「量表刻度」在民意調查上曾經歷哪些演變,又會面臨哪些挑戰?
【民調摘要】
台灣民意基金會長期製作「感情溫度計」(feeling thermometer)調查,詢問民眾對於政治人物、選舉候選人的感情,藉此測量政治人物受歡迎的程度。
究竟感情溫度計的學理及內涵為何?為什麼會使用百分制?又要如何解讀這些數字所代表的意義?本文作者、世新大學資訊管理系前主任吳統雄,曾在 1983 年共同推動臺灣第一次的選舉調查,有豐富之經驗與了解,本文謹邀請吳統雄前系主任進行詳細解析。
【專家分析】
態度測量最常用的量表即為總加量表,又可據其創設人 Likert 稱為李克量表。表中每一個問題項目都附著一個標尺,再依受訪者「贊成或反對」的程度,分成若干個「刻度」(Steps 或 Points),訪問後,每一個刻度都給予一個分數,以便後續分析。
Likert 最早於 1932 年創設總加量表時採用 5 個度數,日後發展由 3 刻度到 100 刻度的都有。
1964 年,密西根大學成立「美國國家選舉研究中心 The American National Election Studies, ANES) 」推出 100 刻度的型式,並命名為「感情溫度計 feeling thermometer」,就是 51 到 100 度表示「溫暖、贊成」, 0 到 49 度表示「寒冷、不贊成」,而 50 度表示無感。
▲ 情感溫度計之刻度量表。(圖/翻攝德州政治計劃;宋思彤中譯)
該中心的 4 位核心學者 Campbell,Converse,Miller,和 Stoke 使用這項工具,發展了直到現在仍為顯學的「政黨投票論」,也使得密西根大學成為調查研究的重鎮。不過,這是另一主題,容日後有機會再詳細討論。
在以往文獻中,討論刻度的「度數」方面,包括三個、且都偏向形式上的問題:
-
最適刻度的範圍大約是多少?
-
度數是奇數還是偶數好?
-
要不要有沒意見或是不知道的「中間分數」(middle point)?
本文作者在長期選舉研究中,發現了 2 個文化與方法論的問題:
-
刻度的「相對客觀性」與「文化適域性」為何?處理方法為何?
-
刻度反映的到底是「點」測量,還是「區間」測量?
1. 文化上的問題
根據國內研究經驗,本研究者建議以使用百分打分數法,其優點基於以下的觀察、分析與討論:
(1) 相對客觀性與文化適域性
Likert 測量的是一種「虛擬量」(當時的術語稱為模糊量 -vague quantifier),不具物理上的客觀性;但如果有高比例的人,認同其數字的高低與實質的高低,觀念上相當接近,就可視為具備某種程度的「相對客觀性」。而這種相對客觀性,可能並非是放諸四海而皆準的。
「文化適域性」係指一種觀念或技術——在此即蔚為測量工具——在某地區適用,但移往其他地區卻可能產生不同效果,所以必須根據每一個地區的特色作「適域性」調整。
Likert 最早使用 5 個度數,可能就是歐美採用 5 刻度作人類行為測量(尤其在學習成就評量上)早已有長遠的歷史與傳統,大家都很熟悉,自然而然(自然就是文化)的接受這種形式。
▲ 美國實施之 5 點制量表。(圖/翻攝 Question Pro;宋思彤中譯)
本研究者在 1983 年推動臺灣第一次的選舉調查,當時還是「威權時代」,對公共事務——尤其選舉作調查,還存在著心理上的禁忌,所以絕大多數的人民之前不曾接觸過調查,甚至不知道什麼是調查。
我們在作預訪籌備階段時發現,若採用美國常用的 5 點量表,受訪者很難回答,因為其在生活經驗中過去並沒有相關回答的經驗。即使回答了,我們分析其中的一致性也很低。
本文作者觀察到這個現象,認為不能硬生生移植這種量表,必須考慮尋求臺灣文化中具備相對客觀性的測量方法。
而我國從小學開始,就實施百分評鑑法,而不同於國外的 5 等評鑑法。因此國人對百分法的內涵意義均十分清楚而敏銳:60 就是及格(普通),80 就是很好(或很贊成)90 以上是非常好,100 更就是滿分;60 以下則是不及格(或不贊成),50 以上還有補考機會,以下便是死當,而 0 分就是繳白卷。
所以我們改用:「請你用學校打分數的方法,為某人打一個分數」。
▲ 以國內學生時期考試打分數的「百分評鑑法」,容易使受訪者理解。(圖/Getty Images;示意畫面)
在這種文化情境下,果然較容易使受訪者態度與評分刻度呈現自然、與相互呼應的結果。正式實施之後,甚至訪員不必完全說明,受訪者會自動回應:「60 就是及格,我知道!」
果然突破了受訪者不了解的障礙,順利的在臺灣開創了公共調查與選舉預測。
(2) 容易評分與回答
傳統的評分法,在設計格式時係以視覺為主,但在電話訪問中,如果反復詢問「您非常不贊成?很不贊成?不贊成 … …非常贊成?」,問不了三、四題,雙方頭都昏了。因此,宜改用適合聽覺的百分評分。
(3) 可以區分「沒意見」和「不知道」
如果研究者想觀察真正的「沒意見的中立態度」時,就是 60 至 69 分區間的受訪者。另外,也可在答案中增加「不知道」的選項,反映真正「不知道在問什麼」的受訪者。
在訪問過程中,形式上既然沒有中間分數,就不會發生以中間分數搪塞的系統性偏差,不致使「沒意見」和「不知道」混淆而造成統計困擾。
2. 新挑戰:「點」測量與「區間」測量
(1) 5 點制的盛行
在 1983 年的選舉調查之後,民意調查如雨後春筍般盛行。許多機構引入各式各樣的調查,但似乎多沒有注意到「相對客觀性」與「文化適域性」的問題,而直接採用了 5 點量表。數十年後,多數中年以下的人民,已對 5 點評分制應該已經不陌生,而 5 點制亦應具備了相當程度的相對客觀性。
(2) 「點」測量與「區間」測量
「虛擬量」的特性,就是測量值的差異不一定是真實差異。
百分制有一個優點,就是可以作「事後歸類」,把 80 至 100 視為一類、60 至 80 視為一類…等,不要再次在類別中分高下,避免假性差異。也就是對受訪者而言,是作「點測量」,而最後可得到「整體」的「區間測量」結果,可能較符合人類行為的特質。
而 5 點制在執行上,等於是讓受訪者在事前就作歸類了,其實有相當微妙的不同。
但臺灣目前是百分制和 5 點制並行,本文作者在臺、美教學期間,就發現兩地似乎對「5 點」代表的意義有所不同:(美國的 5 點,在許多地方化為「分」時,是 0 到 4 分,但為比較之方便,本文均依臺灣習慣,作為 1-5「分」來討論。)
-
5 點制有沒有滿分?5 點是「點測量」的 100 分?還是區間測量的 80 分?
-
5 點的「及格」是「4」?還是「3」?
-
5 點的「1」是「0 分」嗎?
-
美國人民在文化上,似乎不常打最低分,臺灣呢?
-
5 點制用「1-5」的形式,或用「-2,-1,0,1,2」的形式,在資料收集的結果會不會有所不同?
本文作者於 1999 年在臺大的教學網群上,開闢了「相對客觀性實驗」專題網站,追蹤受訪者對刻度的感受,至 2011 年作出累積報告,發現臺灣人民對 5 點制已經具備基礎「相對客觀性」,其「區間性」的客觀程度與百分制相當接近;但在重要切點:如及格點、優秀點上,仍不如以 60 為及格的百分打分數制明確。
核稿/責任編輯:宋思彤