文/林佳玟(台大新聞所)
在 AI 生成技術蓬勃發展的當下,假訊息的影響力、辨識難度正同步攀升。
大數據公司創辦人暨執行長、網路溫度計共同創辦人,以及巨網資訊總經理金志丞,本月應邀由《全民查假會社》舉辦的「假訊息,真 AI」論壇上進行專題演講,並以「AI 生成技術與假訊息的未來」為主題,帶來業界第一手的 AI 生成技術研究及觀察。期待透過分享與溝通,將「AI 趨勢變成常識」。
45 秒破解考題,AI 浪潮勢不可當
金志丞以台南一中的教師甄試考題為例,說明生成式 AI(Generative AI)突破性的進展,「一個需要邏輯推理的考題,ChatGPT 僅用 45 秒就能解決。」
去(2023)年,AI Impacts 也針對全球逾 3,000 名重要 AI 研究人員進行問卷調查,受訪者更認為,2030 年時,暢銷小說將有可能由 AI 創作完成。金志丞直言,在 AI 的浪潮之下,首當其衝的就是內容創作者,「未來,何為真?何為假?我們必須重新定義。」
▲ 金志丞引用報告指出,2030 年的暢銷書很有可能是 AI 所撰寫而成。
AI 生成技術的蓬勃發展,也帶來了假訊息的危機。金志丞提到,假訊息的社會成本相當巨大。根據 Gartner 的研究報告顯示,2028 年企業在判斷假訊息的支出,將會超過 5,000 億美元,超過資安和行銷預算的一半。
此外,他特別警告,台灣連續 11 年被評為「假訊息問題最嚴重的國家」,隨著 AI 生成內容的大規模爆發,假訊息的隱蔽性越來越高,「我們需要用 AI 來破解 AI,否則難以應對假訊息的蔓延。」
「困惑度」與「浮水印」,成 AI 生成內容破解秘辛
金志丞指出,AI 生成的文字內容辨識分成「黑盒」與「白盒」兩個層面,前者不需要大型語言模型(LLM)的運作,判別的方式依賴對於文法和句型;而後者則是在生成的過程中,加入類似「浮水印」的參數,以供判讀。
而 AI 研究公司 OpenAI,在今年八月宣布內部已研發出一套「可以檢測 AI 生成文章」的工具,且準確率高達 99%。這樣的技術就是依賴「白盒」辨識,不過目前尚未公開。
▲ 金志丞提到,AI 生成技術不斷進化,有時甚至真假難辨。
金志丞特別提及,由於 AI 生成的文句具有「用詞一致、文法工整、字句順暢」等特色,因此可以透過判斷文句的「困惑度」(perplexity)來辨識——即是指詞彙搭配的機率高低,若機率越高,代表使用頻率越高,而困惑度也就越低。
此技術是目前剖析 AI 生成內容的重要方法之一,可用來找出生成文章中的蛛絲馬跡。
除了文字內容,AI 生成影像的監管也成為重要課題。金志丞強調,未來的「浮水印技術」將是 AI 生成影像判讀的關鍵,中、美等國家也正在擬定相應的監管措施。
假帳號傾向自我群聚,傳播鏈走入死胡同
假訊息不僅是 AI 生成內容的挑戰,更涉及其如何快速傳播。
金志丞表示,假訊息的傳播路徑,通常依賴於社群網路中的假帳號操作。他以圖論(Graph Theory)為基礎,說明真帳號會與真帳號互動,而假帳號往往傾向「自我群聚」,進而「走入死胡同」。
▲ 金志丞與意藍科技創辦人楊立偉,共同主持演講場次後的觀眾問答。
他解釋,假帳號的傳播模式更類似「悄悄話」的形式,通常只存在於某些封閉的圈子中,試圖影響真帳號,而非大規模的公開傳播,與真帳號的路徑完全相同。因此,分析社群網路中帳號間的連結方式,對於揭開假訊息的傳播路徑至關重要。
AI技術對接資料庫與專家學者 雙重驗證建構資訊信任
最後,金志丞強調了「事實查核」的重要性。
▲ 金志丞引用《全民查假會社》查核報告,說明事實查核的重要性。
他認為,未來的事實查核工作將協同資料庫與 AI 作戰。通過建立龐大的資料庫,對接 AI 技術的自動化比對流程,並且在專業領域中,加入專家、學者等真人進行雙重驗證,即可以更有效地打擊假訊息,為資訊生態系統建構信任圈。
核稿/責任編輯:宋思彤