/ 最新消息
最新消息

可怕!打過「馬賽克」的圖竟能以 AI 還原

2020.12.29|
AI

作者  | 發布日期 2020 年 12 月 13 日 0:00

美國時間 12 月 10 日晚上,GitHub 某 AI 項目衝上熱門榜,截至目前獲得 8.4k 顆星。

此 AI 項目的主要功能就是:去除馬賽克,還原文字密碼。

AI 破解「密碼」

不少人都認為只要打了馬賽克,就不會洩露敏感資訊,因此在公開的社群平台,經常能看到打上馬賽克的結婚照、證書照、成績照等。但無論圖像、文字還是符號,AI 還原馬賽克已不是難事了。

最近名為 Sipke Mellema 的程式設計師便開發一款工具。他說,某些公司內部文件經常使用畫素化顯示密碼,但沒有工具可幫這類圖像恢復密碼,因此便自己寫了一個。

先來看效果圖:

第一行是畫素化後密碼,狠狠打上馬賽克,看不出原始痕跡。

第二行是經 AI 還原後的文字,可看到序列大致還原,且準確度很高,只要稍微推理就能得到第三行的原始密碼。

這「不可思議」的 AI 還原技術如何做到的?

馬賽克是圖像畫素化處理之一,透過將影像特定區域的色階細節劣化並打亂色塊,達到模糊圖像的效果。

畫素化在許多領域用於模糊圖像訊息,其中線性盒濾波器(Linear Box Filter)是較普遍的處理法。線性盒濾波器採用畫素框,用框中所有畫素的平均值覆蓋畫素。

像下圖分為四個色塊,每個色塊由色塊平均值覆蓋,最終形成畫素化表情,由於原始訊息缺失,因此不能直接反轉濾波器。

Mellema 正是利用線性盒濾波器,提出 AI 還原算法──Depix。

線性盒濾波器是種確定性算法,對相同的值執行畫素化通常會產生同樣的畫素塊(Block),那麼反之,使用相同位置的塊畫素化相同文本,是否也會得到同樣塊值?

Mellema 嘗試透過畫素化文本找出相符模式,結果發現確實如此。

具體來說,Mellema 把每塊或塊組合看作子問題。算法要求在相同背景,具備相同文本大小和顏色,因此他沒有選擇創建潛在符號的查找表,因為現代文本編輯器可添加色調、飽和度和亮度,也就是說有大量潛在符號。

處理符號方面,Mellema 使用待處理符號的德布魯因序列(De Bruijn sequence),貼到相同的編輯器,然後截圖。截圖可用作相似塊的查找圖像,例如:

 

因此這項 AI 技術不能用於身分辨識。例如監視器拍攝的失焦無法辨別照片,不能透過 PULSE 還原成原始圖片,不過在醫學、顯微鏡、天文學、衛星圖像等領域有廣泛應用。

技​術方面,不同其他超解析度成像法,PULSE 不是遍歷 LR(Low Resolution)圖像來慢慢添加細節,而是發現與 HR 相對應的 LR,透過「縮減損失」(Downscale)得到 SR(Super Resolution)圖像。

原始文章: https://technews.tw/2020/12/13/the-mosaic-picture-is-restored-by-ai/