/ 最新消息

可怕！打過「馬賽克」的圖竟能以 AI 還原

2020.12.29|

作者雷鋒網 | 發布日期 2020 年 12 月 13 日 0:00

美國時間 12 月 10 日晚上，GitHub 某 AI 項目衝上熱門榜，截至目前獲得 8.4k 顆星。

此 AI 項目的主要功能就是：去除馬賽克，還原文字密碼。

AI 破解「密碼」

不少人都認為只要打了馬賽克，就不會洩露敏感資訊，因此在公開的社群平台，經常能看到打上馬賽克的結婚照、證書照、成績照等。但無論圖像、文字還是符號，AI 還原馬賽克已不是難事了。

最近名為 Sipke Mellema 的程式設計師便開發一款工具。他說，某些公司內部文件經常使用畫素化顯示密碼，但沒有工具可幫這類圖像恢復密碼，因此便自己寫了一個。

先來看效果圖：

第一行是畫素化後密碼，狠狠打上馬賽克，看不出原始痕跡。

第二行是經 AI 還原後的文字，可看到序列大致還原，且準確度很高，只要稍微推理就能得到第三行的原始密碼。

這「不可思議」的 AI 還原技術如何做到的？

馬賽克是圖像畫素化處理之一，透過將影像特定區域的色階細節劣化並打亂色塊，達到模糊圖像的效果。

畫素化在許多領域用於模糊圖像訊息，其中線性盒濾波器（Linear Box Filter）是較普遍的處理法。線性盒濾波器採用畫素框，用框中所有畫素的平均值覆蓋畫素。

像下圖分為四個色塊，每個色塊由色塊平均值覆蓋，最終形成畫素化表情，由於原始訊息缺失，因此不能直接反轉濾波器。

Mellema 正是利用線性盒濾波器，提出 AI 還原算法──Depix。

線性盒濾波器是種確定性算法，對相同的值執行畫素化通常會產生同樣的畫素塊（Block），那麼反之，使用相同位置的塊畫素化相同文本，是否也會得到同樣塊值？

Mellema 嘗試透過畫素化文本找出相符模式，結果發現確實如此。

具體來說，Mellema 把每塊或塊組合看作子問題。算法要求在相同背景，具備相同文本大小和顏色，因此他沒有選擇創建潛在符號的查找表，因為現代文本編輯器可添加色調、飽和度和亮度，也就是說有大量潛在符號。

處理符號方面，Mellema 使用待處理符號的德布魯因序列（De Bruijn sequence），貼到相同的編輯器，然後截圖。截圖可用作相似塊的查找圖像，例如：

因此這項 AI 技術不能用於身分辨識。例如監視器拍攝的失焦無法辨別照片，不能透過 PULSE 還原成原始圖片，不過在醫學、顯微鏡、天文學、衛星圖像等領域有廣泛應用。

技術方面，不同其他超解析度成像法，PULSE 不是遍歷 LR（Low Resolution）圖像來慢慢添加細節，而是發現與 HR 相對應的 LR，透過「縮減損失」（Downscale）得到 SR（Super Resolution）圖像。