【專訪】古倫維:五招識讀術 拆穿假影像、假訊息

文/蘇元和

近年來,深偽變造(Deepfake)、ChatGPT等AI生成技術日趨成熟,加以新型態網路社群平台管道多元化發展,無論是假文字、假資訊、假影像日益氾濫,因此,數位時代,民眾如何提升數位、AI識讀能力是當今重要的課題。

「假新聞的產生和偵測是一體兩面。」中研院資訊科學研究所研究員古倫維教授認為,但假新聞偵測已經不容易,後續因應之道則更加困難。而投入研究假新聞多年的她與實驗室團隊究竟如何靠著科技力,揪出假新聞,又如何從使用者、閱聽眾的角度,去降低假新聞對讀者的影響。以下是專訪古倫維教授的重點摘要內容。

《全民查假會社》問(以下簡稱問):人工智慧AI深度偽造技術發展,請問如何辨識假影片、假照片,有無關鍵的技巧與線索可協助辨識?

古倫維答(以下簡稱答):第一線索就是圖片裡的影像物件搭配比較奇怪,比如說前陣子有五角大廈被攻擊的照片,這個照片的旁邊就出現電線桿,熟悉相關研究的學者就認為,照片旁邊出現電線桿,搭配看起來很可疑是假的,所以這是一個判斷線索的重點,就是物件搭配不協調。

第二就是焦距的對焦點,比如說照片的焦距好像比較聚焦在電線桿,這就是一個可能是假照片的線索,因為在平常的真實照片中,通常是一個重大的物件或事件才是我們的焦點,這種前後景深,或焦距不符合常理的情形,也是另一個判斷的線索。

第三就是照片影像的細節陰影跟邊緣,例如生成的人臉嘴唇看起來很豐厚,這樣的豐唇是很漂亮的樣子,但其實一般真實照片的人物很少是這樣的,除非是模特兒的照片。

第四點就是有些研究指出,手指頭是很難生成的部分,那麼偽造的手指頭可能是不正常的長,或是比例不對,甚至是多出一根手指。但我認為,類似這樣的細節其實技術上很快就可能被克服,因為技術進步很快,如果只是記得這些關鍵的辨識技巧,也很有可能隨著時間改變,這些技巧無法永遠適用假影片的偵測。

另一方面,大家都會認知到,現在新聞或網路世界是有出現假新聞的,但對於假新聞的比例上來講,大家感受力卻是很低的,因為一般人的心態上可能是:「這個世界上有假新聞,可是我不會碰到。」我覺得這種心態也是使得假新聞或假訊息傳播層面影響變大與變廣的原因之一。

我們的研究曾經發現,針對某一事件,百分之九十的民眾都說了解,但在回答相關內容是假的還是真的時,還是有半數以上是答錯,也就是說,對多數閱聽眾來講,知道某件事情,不代表確定事件是真的還是假的。

因此,很多閱聽眾或民眾認為,自己理解的事件內容一定是真的,或是認為自己可以判斷真假,但實際上並非如此。

到目前為止,國際上透過教育機構或研究機構提出的教育方法,有一個面向是說,除了讓學生知道什麼是假的之外,還要讓他們有機會看到假的資訊或假影像,換句話說,我們要能夠辨別假的,我們必須要看過假的。所以,我們在教育現場有一些機會,或有一些課堂,或透過社會活動,多提供新的假的影片、假文字,然後告訴民眾它是假的。也就是說,提高閱聽眾對於假的資訊或影像的敏感度,是有助於降低假訊息或假影像的衝擊,這個在研究上是有證實的。

因此,第五點就是面對數位時代的世界,我們需要去教育或推廣社會大眾,保持懷疑的心態看待這個世界,這是必要的。「有時候在日常生活中,如果我們沒有被騙過,就很容易被騙。」

問:由AI偽造的假文章或訊息,或由ChatGPT生成的文字內容,請問有其辨識的關鍵技巧?

答:若是假文字或假新聞,第一個辨識的技巧就是在文字上可能欠缺時間跟來源的資訊,也就是假訊息的文字什麼時候發生?消息來源?這都是比較可能欠缺的資訊。

第二辨識的關鍵是跟時間軸有關的資訊,往往會是錯的,在假的資訊裡面,有可能時序性的事實它的順序有問題,比如說以前的市長是誰,然後現在的市長是另外一位,讀者在閱讀文章時候,如果敏感度低就容易放過、然後相信、再傳播出去。深度偽造的假文章的生成式模型有一個弱點就是對於時間性的資訊,處理得不是很好。

第三點就是人名的部分打錯,雖然大家對於網路文章的正確性很寬容,也就是打錯字沒關係,但如果是人名打錯的話,這個有可能是一個關鍵的線索,並指出可能是生成的錯誤訊息。

第四點就是文字生成的內容還沒有做到非常生活化,所以,我們有時候在閱讀一些自動產生的文章之後,會覺得它有一種說教的感覺,或者內容概念比較模糊,這個辨識的技巧就是觀察到內容可能有好多句話,但都沒有一個真正的事實。

這種情況就是說語言會隨著時間改變,比如說我們在生活中常常講的話都會隨著當下流行什麼而有所不同、或有不同慣用語,這些語言特性是會一直改變的,但是生成式模型沒有辦法一直不停重新訓練,所以語感會感覺使用比較舊一點的詞彙。

第五點就是如果它的標題非常聳動,這個我們就要懷疑,因為機器學習的模型在產生假新聞的時候,本身就有這種學習的機制,所以如果我們看到聳動標題,我們還是要有一個保持疑問的心態,也就是要先查證一下。

不管是假影像或假文字都有其辨識的線索與技巧,但事實上要去辨識出假的、或真的,不是那麼容易,除非偽造的品質本身就做得不是很好,一旦偽造的品質做得很好,真的不容易看出來是假的,面對任何可疑的訊息,主動去查證,這才是最重要的。

我仍要強調,因為技術進步很快,雖然有很多關鍵的小技巧可以去辨識假訊息或假影像,但開發AI生成技術的人也知道這些辨識的方法,所以他們也會很努力的去解決這些缺失。

延伸閱讀

更多古倫維教授研究頻道->Ku's Lab 古老師研究室 

熱門推薦