【專訪】李政德率團隊積極研發 靠AI揪出假訊息

文/蘇元和

根據瑞典哥德堡大學今年(2023)發布最新研究報告指出,台灣是全球受境外假訊息影響最嚴重的國家,且已蟬聯10年榜首。

AI人工智慧發展浪潮,深偽 (Deepfake) 技術日趨成熟,ChatGPT席捲全球,變造「不存在的訊息」更容易且快速,如今,生成式AI假訊息日漸氾濫,嚴重威脅社會安定、國家安全及民主政治,因此,提升公民識讀素養、培養獨立判斷的能力是重中之重。

成功大學資訊工程學系教授李政德率研究團隊利用機器學習與圖神經網路技術,開發一套能「揪出假訊息」的系統,減少社群媒體上假訊息帶來的誤導,獲得第九屆傑出人才基金會「年輕學者創新獎」,也被列為國科會(科技部)哥倫布計畫的成果。

以下是專訪李政德教授的摘要內容。

《全民查假會社》問(以下簡稱問):你與研究團隊利用機器學習與圖神經網路技術,開發一套減少使用者被假消息誤導的可能,請重點說明其成果如何協助降低假訊息的誤導?

李政德答(以下簡稱答):這套系統專為社群媒體上的假訊息偵測而設計。深入了解社群媒體,其核心賴以存在的是綿密的使用者社群網路。利用其豐富的社交功能,如短文發佈、分享、留言、回覆及點讚等,訊息能迅速廣播開去,特別是當來自粉絲頁時,其影響範疇更加廣泛。

我們系統重點關注在使用者發布或轉發的訊息形成的訊息傳播結構。我們不等訊息發布後的一、兩週再進行真偽偵測,因那時不實資訊早已擴散,很可能已誤導人們作出不當決策。我們的策略是,對訊息發布的初期,如前幾個小時內的訊息傳播、原始貼文的文字內容,以及使用者的回應,透過我們專門設計的圖神經網路技術與文字大數據分析,來評估該訊息的真實性。

當系統判斷某訊息為不實資訊時,我們的演算法可以明確指出令人懷疑的特定詞彙,並進一步追蹤可能的惡意傳播者。

問:假訊息(文字)往往不斷地一直被製造或者是更新,請問大數據Data來得及趕的上這一些生成假訊息的文字量嗎?

答:假訊息可大致分為兩類。首先,有的是既存的主題,如某些關於醫療或運動的不實消息。其次,是新近出現的議題,例如即將舉行的總統大選或新發生事件的相關假新聞。

我們所採納的策略能夠偵測已知及新的假訊息事件。對於新的假訊息事件,必須細心辨別其中是否含有特殊字詞或專有名詞。這些詞彙可能源自於惡意者,隱含著偽造或誤導的意圖,甚至針對某特定事件製造不實描述。

問:請進一步具體說明如何一個小時內,可降低假訊息誤導的方法嗎?

答:我們主要採用圖神經網路技術,將使用者間的訊息傳播結構視作圖網路(Graph)。在此網路中,我們利用節點分類(Node Classification)方法判斷:若該節點代表使用者,則判定該使用者是否轉發假訊息;若是文章,則評估該文章是否為假訊息。

問:請問判斷假訊息之後的下一步會怎麼做?

答:判斷真偽的標準取決於訊息的傳播結構,例如:檢視使用者在一週內的傳播訊息量、訊息的長度、及所含的關鍵字等。這些資訊可用於建構圖神經網路的特徵向量,除了基於傳播結構外,還考慮了文字與時間元素,例如:使用者的平均轉傳時間與頻率。這些特徵向量被輸入至圖神經網路中,輔助我們進行使用者與訊息的真假判定。

問:請問最後怎麼降低假訊息再擴散出去?

答:當社群媒體的使用者遇到某訊息時,系統會即時告知該訊息被認定為真或假的機率。如果機率高,使用者就會警覺這可能是假訊息,減少其傳播意願。反之,若風險較低,使用者可能繼續正常閱讀和分享。

問:請問這一套系統是指有一個平臺去協助標籤是真或假新聞的機率?

答:我們演算法是這麼做,至於平臺的部分,我們目前還在開發中。雖然我們正研發相應的演算法平臺,但當前該方法尚未在國內社群平臺上使用。然而,我們已在Twitter進行應用,因為其用戶經常公開分享訊息,與此相反,Facebook和LINE的使用者資料及訊息分享傳播資料之取得較為困難。

值得強調的是,「打假」組織的核心目的在於遏制假訊息的擴散。若能向使用者明確展示某一訊息的真偽機率,確實能大幅助於減少假消息的傳播。要注意,我們的系統目前只對文字訊息進行辨識,不涵蓋真假影音或影像。但對於社群媒體上的文字,如YouTube的標題或簡介,仍然進行分析。

問:你與團隊研究一套攻擊模型(Attack Model)可偵測假新聞;防禦模型(Defense Model)可保護社群使用者個資。請重點說明如何偵測假新聞?

答:攻擊模型和防禦模型是緊密相關的。在進行假訊息偵測時,往往未意識到有專業的惡意組織在背後製造不實資訊。攻擊模型即模擬這些專門生產假消息的組織,嘗試騙過我們的偵測機制。換句話說,它目的在攻擊我們的假訊息偵測系統,降低其準確度。為此,我們在偵測前會先模擬這些惡意攻擊,確保即使真的受到攻擊,偵測系統也能保持其原有的準確性。這實際上是一個「道高一尺、魔高一丈」的持續對抗。

問:請問偵測假訊息時發現了那些假訊息樣態?

答:這些假訊息製造者的手法多種多樣,且難以一一界定。實際上,這些惡意的第三方可能會巧妙地調整其文字用語。對此,我們的模型需要持續對新資料進行模型調整和優化,因為我們面對不只一種,而是多種的攻擊模型。每一模型都模擬了不同的假訊息生成策略,以騙過我們的偵測系統。

我們研究的終極目標是建立一個更完善的假訊息偵測平台,能夠抵擋多種形式的假訊息攻擊。因為不同的攻擊者會有不同的目的,他們針對同一訊息所造成的假文字可能形式迥異,因此很難有一定之規律樣態。

熱門推薦