文/蘇元和
隨著假資訊、假影像、假照片的氾濫,歐盟、美國、加拿大、法國、日本、新加坡等政府紛紛因應而立法;台灣為遏止假新聞,從成立「假訊息防制中心」到升級成「資安工作站」;此外,國際上亦有科技業者谷哥、臉書Meta、微軟投入開發AI圖像辨識工具,對抗假影像、假資訊等作為。
AI人工智慧時代,國內投入研究對抗假影像、假照片、假訊息的動能如何?又有哪些突破?這些都將攸關台灣與公民的數位素養與識讀的實力。
以下是專訪專攻研究影像辨識技術、機器、深度學習的成大統計所助理教授許志仲的內容摘要。
《全民查假會社》問(以下簡稱問):全球關注AI深度偽造的假資訊等假影片,請問國內研究動能為何?突破是什麼?
許志仲答(以下簡稱答):其實臺灣AI的研究能量不算太差,蠻厲害的,但是我們在做Deepfake Detection上,尤其是深度偽造影像偵測上研究的團隊非常少,這使我蠻意外的。以影像領域來說,在臺灣,我們團隊做最久是沒錯的,但我想後面應該會開始有更多專家學者願意投入。然而,在我認識的專家學者當中,目前也僅了解到中研院的陳駿承教授、臺科大的花凱龍教授等團隊有較深入的投入。當然,在台灣尚有其他教授有研究,但可能都不是以深度偽造影視訊的偵測為主要研究議題。
問:臺灣有這個能力做此領域研究,但沒有投入太多與意願?
答:不算是真的沒有意願,個人看法是有一些原因存在的。比方說像是我們現在做一些Deepfake Detection的技術,不好做的原因是因為既有網路上的資料庫,學術研究都會拿一些資料庫來用,例如最知名的 FaceForensics++,但那些資料庫都太過理想化,也就是說它效能很容易都可以做到很好,所以現在要超越過去的方法,幅度都不高導致效能看起來沒有進步很多,不太容易有大突破。
第二點是真實狀況底下的Deepfake Detection很難解,也就是真實場域中深度偽造影視訊不會像既有的資料庫一般理想,都有許多假設好的情況。我舉個例來說,現在都已經快「以假亂真」了,線索都快看不出來,可是如果我再刻意增加一些攻擊,比方說增加模糊,或者讓偽造品質變差,變成有一塊一塊的,你更分不出真假了,結果是機器也分不出真假,因為偽造的線索也一併的被消滅掉了。所以真實的情況底下很難做到好,因此相對來說要快速發表學術論文相對不易。
像我們研究團隊已經研究快5年了,在這方面的領域的論文也才發表三篇,所以從學術界來講,其實很不及格的,因為我們希望一年起碼一篇,才可以對計畫有所交代。但換句話說,這也代表我們在學術研究上還有很多機會可以做更好。另外,圖像研究雖然好玩,但研究要去辨識真假就只能看數字,這些純數值的評估 (例如正確率) 其實有點無聊的,所以對學生的動力來講,也沒那麼高。綜上所述,深度偽造辨識研究就變成是一個比較少人投入的領域,大概是有這些來龍去脈的。
問:可以歸納兩個瓶頸,第一、資料庫的取得、或資料庫不豐富、或更新度沒那麼快,第二就是AI還是用數字去評估的、是無聊的,學生投入動力較低?
答:對、沒有錯。
問:在這個領域有產學合作的案例嗎?或是已有商業化的辨識產品?
答:其實是有,但是它通常是商業用途,我們目前比較常見的,然後又是免費的就是Deepware,但它效果就是不太好,而且也比較沒有對應新的深度偽造技術的偵測。
目前很多公司也有開發商業軟體,比較有名就是Reality Defense,但價格很貴,但需要安全的相關單位也會採購這樣的軟體,它每一年就要耗費數百萬的預算。這對學術界來講,較少也較不會去採購這樣昂貴軟體。
從國內產業來講,目前還沒有任何一家公司在深度偽造辨識領域上已有商業化知名的產品。反觀國際上谷哥、臉書Meta、微軟都已有開發自己的辨識技術。我想這與台灣產業結構側重硬體應該是有相關。
有一點爭議是,比方說我掃描你的Facebook上傳的照片,每一個是不是有Deepfake的影子,那代表你就知道我的照片裡面有什麼,這樣有沒有涉及侵犯隱私的疑慮。因此這些國際科技業者不大能公開自己研發的技術,主要是因為還有很多層面的問題,不是只有純技術的,還有法規的問題。
問:另一方面如果科技商公布AI辨識的技術到哪,就有如同你講過「道高一尺、魔高一丈」,讓「深度偽造」技術有機會超越?
答:沒有錯,一定會的。
問:國際上,還有其它研發動能嗎?
答:其實很多國家是有在發展,像我們研究這種多媒體的安全領域,一般會稱它數位鑑識(Digital Forensics),美國加州大學洛杉磯分校(UCLA)有一個知名的研究團隊,美國也有DARPA Media Forensics的大計畫,這就是一個國家去組織一個大的團隊,然後專門因應包括多媒體等不實訊息的流傳。臺灣也有類似這樣的一個大計畫 (訊息科技專案計畫),是國科會在執行,但研究團隊中較高的研究團隊比例是比較偏向自然語言處理(NLP)的機器學習技術。目前確實比較少針對Deepfake影像的辨識偵測投入研究。