AI時代,真實已經是易碎品了

尋夢新聞LINE@每日推播熱門推薦文章,趣聞不漏接❤️

加入LINE好友

  這幾天,科技新聞的頭條大事是:Facebook發布了名為Libra的加密貨幣白皮書,這是一套基於加密貨幣理念設計的,且Facebook不能完全控制的數字貨幣。當然,它仍然是幾家巨頭控制的中心化較強的貨幣,而不是真正的去中心加密貨幣。這不是Facebook第一次嘗試這個方向,這一次它的準備比以往的方案完善很多。雖然和真正的「區塊鏈去中心貨幣」還有很多區別,但是好歹巨頭們總算沖進了這個市場。

AI時代,真實已經是易碎品了 科技 第1張

  所以,即使Facebook的目的達不到,對於整個行業仍然意義重大。不過我這篇文章並不是專門討論FB的加密貨幣,區塊鏈和加密貨幣這兩個東西緊密關聯,有的項目看重鏈多一些,有的看重幣多一些,Facebook的Libra是看重幣多一些,更著重強調它的支付功能,和更低成本的跨國支付結算。而非常巧合的是,同樣在這幾天,Stephen Wolfram也寫了一篇關於區塊鏈的文章,這篇文章講到了區塊鏈的一個重要應用,但是在FB發幣新聞的熱潮下,它獲得關注少了很多。但在我看來,這篇文章討論了的東西更值得思考。

  Stephen Wolfram知名度在中文世界似乎並沒有特別高,這和他的實際業界地位差距很大。如果讓我評價,他是整個行業內最天才的人之一。此人無論是科研還是商業,都有超乎尋常的成就。他15歲就開始發表物理學論文,一心想做物理學家,20歲在加州理工拿到了物理學博士學位之後,開始研究複雜性理論,之後為了他的研究需要,決定自己做一些工具,最終發明了Mathematica。Mathematica算的上是歷史上最重要的軟件之一。除了數學和物理研究,他也是最早研究人工智能的科學家之一。 為什麼他會寫這篇文章呢,要從基於深度學習的視頻換臉術DeepFake談起,如果你常看科技新聞,應該記得去年這時候熱門的換臉黑科技DeepFake。一年之後,基於它的各種奇怪應用層出不窮,起初人們也就是拿來換換明星的臉玩,但很快人們發現,這種技術如果用來做假新聞,就會造成極大破壞性和難以預料的後果。隨著2020美國大選越來越近,這種擔心也隨之增加。

  六月初,美國眾議院情報委員會召開了一個聽證會,希望了解DeepFake和AI相關的一些問題,Stephen Wolfram是被邀請參加聽證會的人之一。但是他沒空去,於是把想法寫成了這篇文章放在了自己Blog上。這對於我這樣的讀者倒是個好事,這可以讓他更從容的寫下他的想法,而不是被聽證會的節奏干擾。

  眾所周知,偽造照片是一個歷史悠久的技術,從有PhotoShop之前的年代使用傳統膠片人們就一直在做,Stephen Wolfram說照片偽造技術和照相技術歷史幾乎一樣長。而今天我們的問題是,當AI可以用來參與偽造照片的時候,我們有沒有簡單的辦法分辨出哪些照片是真的?畢竟之前大家說「無圖無真相」,現在是「有圖有視頻它也未必是真的」。

  要討論這個問題,我們先要隱藏技術細節來簡單介紹一下偽造照片和視頻使用的人工智能技術:GAN(生成對抗網路),用最容易理解的方式,可以看作兩個系統互相對抗,一個系統生成假數據集叫做生成器,另外一個系統叫做判別器,它用真實數據集來判別生成的假數據集的真偽。然後兩個系統互相對抗,最終目的就是讓判別器無法判斷真假,所以這類系統的目標就是生成機器無法判別真假的數據集。GAN網路當然不是萬能的,說它有智能也是一種美化的說法,它當然沒有真正的智能,也理解不了邏輯本身,但是用在偽造視頻和照片上,它目前的能力已經足夠給人類帶來麻煩了。因為如果生成器生成的內容足夠多,並且利用社交網路傳播和轉發,那麼要鑒別真假,就成了一個工作量巨大的事情。相信在這個時代,大部分人都對各種群里面千奇百怪的謠言有深刻體驗,那麼考慮一下,這些文字謠言都配上了很真實的照片和視頻的時候,要鑒別真假的勞力力會增加多少?

  已經無法阻止人們使用機器源源不斷產生假圖片和視頻了。對於某些關鍵性內容,人類應該還可以花費巨大的成本,由類似鑒證小組這樣的專家組織來判別真偽,但是對於日常生活中,尤其是社交網路流行的海量內容,限於效率和人力成本,可以說是無能為力的。假視頻生成的速度會遠遠大於鑒定的速度,即使能鑒定出來真偽也沒意義了。

  要高效率的鑒別真假,那就只能依靠機器,使用AI來鑒別假視頻的創業公司也出現了不少。但是如果思考這個問題:機器有沒有能力鑒別圖片和視頻是否是偽造的?很遺憾,答案應該是悲觀的。悲觀的原因在介紹GAN的原理時候已經包含了,既然生成器的目的就是挑戰判別器使之無法分辨,就意味著這樣的圖片和視頻,機器已經分辨不出了。雖然人類能找到一些圖片生成的不足,做出更好的判別器來,但這些不足一樣會被生成器補上。Stephen Wolfram的說法是「這是一場軍備競賽」,兩者博弈,最終結果只能是讓假數據達到更高的高度。所以想用機器來幫助區分真假的想法,可能會在短期內有效,但長期看來,這些掙扎都是無力的,最終一定是生成器強於判別器,即無法判斷的假圖片和假視頻會取勝。

  按照這個推論,我們今天定義「真實」的方式會發生徹底的變化。目前我們做為事件真實發生的證據都不再可信,比如說,現在你可以拿行車記錄儀的視頻證明自己在交通事故中是無責一方,但是未來,這種證據可能就無效了,因為誰也不知道視頻是不是被AI重新處理過的。甚至社會上流行的照片和視頻,假的會比真的還多,因為一個真正的視頻,經過AI處理可以變成不同的假視頻,用在不同場合。目前社會的很多錨點都會消失,而我們對此毫無辦法。

  所以,我們需要一套完全不同的思路來處理真實性問題,即:從目前的「默認照片和視頻真實,除非找到證據證偽「,轉變成「默認照片和視頻是不真實的,除非找到證據證真」。為了滿足這種需求,就需要一種系統,可以公正,中立的存放所有證據,並且讓機器容易讀取這種證據,給出「可證真概率很高」之類的結論。Stephen Wolfram認為,這種系統就是區塊鏈。區塊鏈的去中心,不可篡改,以及比較好的程序可讀寫特性,都完美符合以上需求。

  使用區塊鏈技術不能直接判斷真實,但是如果每一個視頻創建出來,每一個照片拍攝完成,就在區塊鏈上存證,將來就有可能讓機器利用這些證據來幫助人判斷真假。而且,今天我們還不能完全預知未來世界的變化,也不知道AI和偽造技術會發展到什麼程度。所以我們只能盡量保存更多的元數據。包括拍攝時候的場景數據,比如GPS信息,時間,溫度,天氣…各種相關和不相關的信息,都應該保存起來,越多的元數據,將來用來判斷真假的數據越充足。具體做法就是把所有這些元數據打包到媒體文件中,然後計算hash,把hash記錄到一個去中心的區塊鏈上。等到將來有一天,機器會有辦法讀取今天保存的信息,用來確定信息真實性。目前的「無圖沒真相」,就會變成「不在鏈上沒真相「。

  這里特別需要注意的是,要做到這個系統還有無數技術細節需要處理。比如並不是存放在鏈上的數據一定是真的。同樣可能出現第一個作者拍攝視頻之後先進行偽造,再簽名往區塊鏈上存放,這時候要判斷真偽就變得更加困難。所以最終判斷真偽的結果仍然只是一個概率,而不是放在鏈上100%就是真實的。但是公開存放了盡量多的元數據之後,人們可以利用這些元數據來進行更多的分析和交叉對比,進一步降低偽造的可能性。如前面這個例子,如果偽造的視頻中出現了的人,在相近的時間段內,在區塊鏈上找到了另外一個不同地理位置的視頻也包含了他形象,那麼就可以認為這兩個視頻中至少有一個是偽造的。並且,這種偽造的證據在鏈上無法被消除,最終會使得上傳者的可信度降低。總之,這樣的系統可以提供更多的正經,使用更自動化的手段解決問題,它仍然不是完美的解決方案,但是比沒有這個系統還是好很多。未來人們會越來越體驗到概率的無處不在,人們只能說「有很大概率是真的」,很難說「絕對是真的」。

  這個推論過程非常清晰簡單,而且也確實想不到其他解決方案了。實際上Stephen Wolfram一直是記錄全部個人數據的推崇者,他在長達二十多年的時間里,盡可能的記錄了自己周圍的一切數據,從工作時間到使用的文檔類型,郵件發送頻率,所有數據只要能記錄的都記錄,並且會寫程序分析這些數據。唯一的區別是,過去這些數據他自己存放,供自己使用,但在未來,做為信息創建者,一部分數據記錄應該被公開出來,供更多人使用,這是一個有意思的變化。

  讓我比較驚喜的時候,這和我們的思路是一致的。我之前曾經寫過我們做PRESSone的目標是幫助完成「確權」,而且我還經常試圖解釋「確權」不是「版權」,雖然確權之後下一步可以完成版權相關應用,但是這兩個概念是不一樣的。但是我一直沒找到特別好的例子來說明,為什麼不一樣,以及為什麼要使用區塊鏈這麼複雜的系統來完成確權,所以PRESSone總是被人們歸類為「內容版權「類應用,說它是內容版權當然也不是不可以,但確權才是更重要的基礎。區塊鏈相比中心數據庫是一種昂貴得多的存儲系統,既然使用了這種昂貴的方案,那麼就需要有昂貴的理由。人們最容易問的問題就是:「為什麼我需要使用它」。很有意思的是,隨著時間的推移,這種答案正在越來越多的冒出來,科技的發展使得人類在很多場景下不得不需要這樣的系統。而且科技的發展正在把越來越多的人卷入這個領域,過去只是科技行業從業者,現在創作者也不得不關心這個領域。誰也不想讓自己的作品將來變成創造用途不明的假視頻的素材,那麼現在需要做的就是,保留不可篡改的數據,然後等著未來到來。

>AI時代,真實已經是易碎品了

About 尋夢園
尋夢園是台灣最大的聊天室及交友社群網站。 致力於發展能夠讓會員們彼此互動、盡情分享自我的平台。 擁有數百間不同的聊天室 ,讓您隨時隨地都能找到志同道合的好友!