整合多元資料、打造「水庫最上游」!楊立偉:利用 AI 實現即時輿情分析

 

文/林佳玟(台大新聞所)

本(12)月 14 日,意藍科技創辦人、國立臺灣大學資訊管理學系、工商管理學系兼任助理教授楊立偉,出席《全民查假會社》舉辦的「假訊息・真 AI!」年度論壇。

▲ 楊立偉深入探討生成式 AI,在新聞傳播、輿情監測領域的革新和影響。

在專題演講中,他以「AI 輿情應變顧問即時輿情+GenAI」為題,深入探討生成式 AI 在新聞傳播及輿情監測領域的革新和影響,並詳細解說 AI 如何提供即時分析的操作策略,以及其內容揀選的邏輯。

生成式 AI 成為輿情應變、資訊查驗利器

楊立偉在演講中指出,生成式 AI 的技術,對輿情應變的實務運作,具有不可忽視的潛力,特別是在公關危機、假訊息處理及危急事件的反應。

他強調,意藍科技旗下的社群口碑資料庫 OpView 作為「水庫的最上游」,在適法性的狀況下,匯聚了來自 800 多家台灣媒體和全球外電的數據,必須迅速、準確地彙整來自媒體及社群網絡等大量數據,並在 15 分鐘內給予網路輿情分析,實現對各類事件的即時監測與回應,而這對於企業和政府機構,在面對突發事件時至關重要。

▲ 楊立偉指出,社群口碑資料庫可以快速提供輿情分析。

楊立偉以實機展示了資訊查驗的對話過程,包含:「請問韓國總統宣布戒嚴時,軍隊的坦克車是否有開進市區,請明確回答?」、「請問習近平是否會參加美國總統川普的就職典禮?」以及「請問中共是否已經封鎖了台灣海峽,不讓船隻通過,這是真的嗎?」

楊立偉強調,利用自然語言處理技術,其可以利用輕鬆的口語問答形式,來解決專業領域中的複雜問題。

整合多元資料,解決「幻覺」問題

楊立偉表示,為了全面加速資訊蒐集的廣度與深度,使得系統能夠從大量的資料中快速揀選出可靠的資訊,「AI 輿情應變顧問系統在資訊篩選上,基於從眾、從權威、從模式(pattern)三個核心原則。」

此外,即時反應系統需要整合多元資料,包含非結構資料的新聞報導,以及結構化數據庫資料,增加「可解釋性」和「可驗證性」,避免出現類似 ChatGPT 的「幻覺」問題,以提升 AI 輿情顧問系統的可靠性和實用性。

若以「消費者在討論電價上漲與冷氣使用時,最關注的是什麼?」這個提問為例,企業內部資料、外部公共數據的結合,有助於提供使用者精準且可驗證的答案,或是協助使用者做出應對策略。

▲ 楊立偉全面導入 GenAI,同時在系統面整合多元資料,提升可靠性與實用性。

知識代理人:優化資料庫 迎戰複合型任務

在演講的最後,楊立偉羅列了大語言模型的潛力與挑戰。他認為,隨著大型語言模型(LLM)技術的發展,智慧型代理(AI Agent)能夠拆解問題及需求,並動態調用多個資料源、API 和資料庫來提供即時資訊,完成複合型的知識任務。

然而,大語言模型也面臨著「不良資訊污染」的問題。過去傾向認為資料庫越龐大,模型越具有優勢,然而現在更重視「品質高、水準好」的內容。

楊立偉以醫藥衛生相關的資訊為例,說明在專業領域上,有賴於結合打詐、查假和求證的機制,建立完善的標準作業流程(SOP)以及對 AI 系統的持續監控與優化,更能夠確保資料庫的內容正確性。

▲ 金志丞與意藍科技創辦人楊立偉,共同主持演講場次後的觀眾問答。

他強調,未來 AI 不僅要在文本處理上做到「精準」,還需要在數據處理和外部工具的協同運作上,做到完美配合。因此,即便大型語言模型不擅長算數,但能夠呼叫外部的程式語言完成任務,就像是「雖然我跑不快,但我能夠設計出一個:讓我移動更快的交通工具」,這將是未來 AI 發展的重要方向。

熱門推薦