用Deepfake輕鬆偽造屬於你的影片

Posted by
來源:washingtonexaminer

人工智能技術發展越趨成熟,越來越多開發團隊把這個技術應用至各個領域。現時已經開始有開發團隊利用人工智能技術研發AI詩人及AI作曲家,早前亦已把作品公諸於世,喜歡作品與否真是見仁見智。最近有一個主題獲得媒體廣泛報導,有市民在網上看到一段關於美國前總統奧巴馬演說之短片。一開始大眾都以為是真的,細心看了短片之備註後,才發現這內容是經人工智能改造的!在不討論演說內容之前提下,主角之面部表情跟真人的幾乎完全沒分別。

Deepfake技術於2017年已經出現,這名字是由一個Reddit社群的用家命名的。「Deepfake」一詞其實是由「Deep Learning深度學習」和「Fake偽造」合成而來的,意思就是利用深度學習去偽造一些作品,主要針對圖像或影片中把一個人的臉替換成另一個人的臉。早期沒有獲得廣泛報導的原因主要是技術門檻比較高,如果對人工智能算式及視頻剪接一竅不通,根本沒可能對Deepfake進行操作。隨著Deepfake在Github上變成開源(Open Source),技術門檻降低了不少,使用量迅速提昇。這項技術的確是這兩三年在人臉交換處理技術的一個大突破。

利用Deepfake進行具體操作大致分為三個步驟:

  1. 提取(Extraction)
    首要步驟是從影片中提取人臉。由於影片中的人臉會不斷移動,所以系統可以從中提取出數百甚至數千張高質素人臉圖像,利用Python操作Deepfake便可輕易完成。人工智能系統之表現,往往與所輸入之數據質素掛鉤。如果希望系統創造出來之結果質素較高,可以利用Deepfake功能去篩選成千上萬張圖像,確保它們都是高質素的。用家也可以進行後期手動檢查以保障數據質素。
  2. 模型訓練(Model Training)
    下一步是選擇要訓練之模型。Deepfake主要利用GAN(Generative Adversarial Network 生成式對抗網絡)進行操作。在GAN有兩個機器學習模型,分別為生成網路(Generator)和辨別網路(Discriminator)。生成網路扮演著「造假者」,在模型訓練後產生偽造影片;而辨別網路則扮演「檢測者」,不斷地檢視「假影片」,直至它再辨別不了結果是假的。數據越多,效果越理想,「假影片」越真實。
  3. 轉化(Conversion)
    將模型訓練好,便可以用來製作Deepfake影片。轉換過程會採用剛訓練好之模型,並使用它來生成多個圖像以覆蓋在目標影片之上。用家可以調整各種參數,例如更改影片大小、輸出之顏色或重新縮放覆蓋的圖像等。設置操作間單,很快便可完成。最後一步是把所有轉換後之片段合併至影片當中,這樣就大功告成了!

雖然Deepfake很強大,但是也有弱點的。例如有學者在探討用Deepfake製造出來的影片中,主角都不怎麼泛眼,又或是眼神一般都不自然等等。想一想Deepfake的做法,它是利用成千上萬張靜態圖片進行模式訓練,在影片中一般人很少會出現大量閉著眼睛的圖像。而眼神方面,由於是系統生成的,眼神連貫性有機會出現落差。

科技公司和學術機構開始推出Deepfake打假挑戰計畫,Facebook早前宣佈投入1000萬美元在這項計畫中,目標是阻止被視作是破壞網路資訊完整性的重大威脅。Facebook、微軟和全球AI產業聯盟人工智慧夥伴關係,結合麻省理工學院、康乃爾大學、牛津大學、加州大學柏克萊分校、馬里蘭大學和紐約州立大學阿爾巴尼分校等學術機構致力打假。 在資訊泛濫時代,越來越多文字、聲音、影像等資訊出現,網絡使用者需要具備分辨來源真偽之心態去辨別資料可信性。造假門檻越來越低,意味著假資訊甚至假新聞將會充斥於網絡上。先做好Fact Check驗證真偽才根據資訊採取行動,以保障自己及別人之安全及利益。

Facebook: https://www.facebook.com/drjackeiwong/
Instagram: https://www.instagram.com/drjackeiwong/
YouTube: https://www.youtube.com/drjackeiwong/