用Deepfake輕鬆偽造屬於你的影片 – Dr. Jackei 科技生活日誌

人工智能技術發展越趨成熟，越來越多開發團隊把這個技術應用至各個領域。現時已經開始有開發團隊利用人工智能技術研發AI詩人及AI作曲家，早前亦已把作品公諸於世，喜歡作品與否真是見仁見智。最近有一個主題獲得媒體廣泛報導，有市民在網上看到一段關於美國前總統奧巴馬演說之短片。一開始大眾都以為是真的，細心看了短片之備註後，才發現這內容是經人工智能改造的！在不討論演說內容之前提下，主角之面部表情跟真人的幾乎完全沒分別。

Deepfake技術於2017年已經出現，這名字是由一個Reddit社群的用家命名的。「Deepfake」一詞其實是由「Deep Learning深度學習」和「Fake偽造」合成而來的，意思就是利用深度學習去偽造一些作品，主要針對圖像或影片中把一個人的臉替換成另一個人的臉。早期沒有獲得廣泛報導的原因主要是技術門檻比較高，如果對人工智能算式及視頻剪接一竅不通，根本沒可能對Deepfake進行操作。隨著Deepfake在Github上變成開源（Open Source），技術門檻降低了不少，使用量迅速提昇。這項技術的確是這兩三年在人臉交換處理技術的一個大突破。

利用Deepfake進行具體操作大致分為三個步驟：

提取（Extraction）
首要步驟是從影片中提取人臉。由於影片中的人臉會不斷移動，所以系統可以從中提取出數百甚至數千張高質素人臉圖像，利用Python操作Deepfake便可輕易完成。人工智能系統之表現，往往與所輸入之數據質素掛鉤。如果希望系統創造出來之結果質素較高，可以利用Deepfake功能去篩選成千上萬張圖像，確保它們都是高質素的。用家也可以進行後期手動檢查以保障數據質素。
模型訓練（Model Training）
下一步是選擇要訓練之模型。Deepfake主要利用GAN（Generative Adversarial Network 生成式對抗網絡）進行操作。在GAN有兩個機器學習模型，分別為生成網路（Generator）和辨別網路（Discriminator）。生成網路扮演著「造假者」，在模型訓練後產生偽造影片；而辨別網路則扮演「檢測者」，不斷地檢視「假影片」，直至它再辨別不了結果是假的。數據越多，效果越理想，「假影片」越真實。
轉化（Conversion）
將模型訓練好，便可以用來製作Deepfake影片。轉換過程會採用剛訓練好之模型，並使用它來生成多個圖像以覆蓋在目標影片之上。用家可以調整各種參數，例如更改影片大小、輸出之顏色或重新縮放覆蓋的圖像等。設置操作間單，很快便可完成。最後一步是把所有轉換後之片段合併至影片當中，這樣就大功告成了！

雖然Deepfake很強大，但是也有弱點的。例如有學者在探討用Deepfake製造出來的影片中，主角都不怎麼泛眼，又或是眼神一般都不自然等等。想一想Deepfake的做法，它是利用成千上萬張靜態圖片進行模式訓練，在影片中一般人很少會出現大量閉著眼睛的圖像。而眼神方面，由於是系統生成的，眼神連貫性有機會出現落差。

科技公司和學術機構開始推出Deepfake打假挑戰計畫，Facebook早前宣佈投入1000萬美元在這項計畫中，目標是阻止被視作是破壞網路資訊完整性的重大威脅。Facebook、微軟和全球AI產業聯盟人工智慧夥伴關係，結合麻省理工學院、康乃爾大學、牛津大學、加州大學柏克萊分校、馬里蘭大學和紐約州立大學阿爾巴尼分校等學術機構致力打假。在資訊泛濫時代，越來越多文字、聲音、影像等資訊出現，網絡使用者需要具備分辨來源真偽之心態去辨別資料可信性。造假門檻越來越低，意味著假資訊甚至假新聞將會充斥於網絡上。先做好Fact Check驗證真偽才根據資訊採取行動，以保障自己及別人之安全及利益。

Facebook: https://www.facebook.com/drjackeiwong/
Instagram: https://www.instagram.com/drjackeiwong/
YouTube: https://www.youtube.com/drjackeiwong/