13 個字母價值 4 萬美元?21 歲大學生用 AI 破譯千年古卷!

整理 | 鄭麗媛

近來,一位 21 歲的電腦科學學生,因為一個歷史性成就獲得了 4 萬美元獎金。

提問:什麼歷史性成就?答:成功破譯了 2000 年前被掩埋、已碳化且無法打開的赫庫蘭尼姆古卷中的一個單詞。

提問:卷軸都沒打開,他是怎麼破譯的?答:利用 AI 技術。

這位獲獎者名為 Luke Farritor,而這個價值 4 萬美元的獎項是維蘇威火山挑戰賽的 First Letters Prize(首字母獎),其獲獎要求是參賽者在卷軸中 4 平方釐米的區域內找到至少 10 個字母。

利用高能 X 射線和 AI 技術,對古代卷軸進行成像

公元 79 年,維蘇威火山爆發,摧毀了龐貝城和赫庫蘭尼姆城,連帶著存於龐貝附近一座私人圖書館中的古代卷軸也被掩埋。近 2000 年來,這座唯一倖存的圖書館一直被埋在地下 20 米深的火山泥中,直到 1700 年代才被挖掘出來。可由於在火山灰和氣體的灼熱作用下,這些卷軸早已碳化、非常脆弱,稍微處理不當就會立即化為灰燼。

如何在不打開卷軸的前提下,閱讀其中的內容?數百年來,這個問題一直沒有答案。基於此,2023 年 3 月,維蘇威火山挑戰賽正式發起——而它的設立,最早源自於 2019 年肯塔基大學 EduceLab 的 Brent Seales 教授在粒子加速器中,成功對赫庫蘭尼姆古捲進行了成像。

多年來,專家們嘗試通過各種方法試圖展開古代卷軸,但有些在展開過程中就毀壞了,有些則是展開後文字暴露在空氣中會導致墨水褪色。Brent Seales 教授帶領的團隊曾通過高能 X 射線識別出了恩蓋迪(En-Gedi)卷軸中的文字。

但恩蓋迪卷軸的墨水是金屬基的,因此在 X 射線資料中會顯示出來,而赫庫蘭尼姆古捲上的墨水可能是碳基的,與紙張成分有重合,因此在 X 射線掃描中無法明顯成像。也就是 Brent Seales 所說的:用肉眼無法從略微不同的 X 射線技術捕捉到的掃描結果中,解讀出赫庫蘭尼姆古卷中的字母。

基於這個現狀,Brent Seales 研究小組提出了一種新方法:利用高能 X 射線和 AI 技術中的機器學習模型。具體來說,就是先掃描並拍攝帶有可見墨水的分離卷軸碎片照片,然後將這些照片餵給機器學習模型,使其找出並學習 X 射線掃描中墨水區域和空白區域之間的細微差別。一旦經過這樣的碎片化訓練,該模型就有望與完整卷軸的資料結合使用,從而識別其中的文字內容。

通過這種方法,2019 年 Brent Seales 團隊在粒子加速器中對赫庫蘭尼姆卷軸進行成像,成功生成了解析度高達 4 微米的 3D CT 掃描。

這一成功引起了科技企業家 Nat Friedman 和 Daniel Gross 的注意,併為了加快破譯古代卷軸,發起了維蘇威火山挑戰賽:總獎池高達 70 萬美元,還為開源工具和技術的開發頒發了幾個較小的獎項。

訓練 AI 模型識別「裂紋圖案」

訓練 AI 模型識別「裂紋圖案」

自今年 3 月維蘇威火山挑戰賽正式發起,吸引了諸多參賽者,其中 Casey Handmer 是前 JPL 公司的創始人,他在八月初寫了一篇博文,提到他發現了一種看起來像是墨水痕跡的 「裂紋圖案」。

(左圖:可見有裂紋的墨水紋理。右圖:顯示墨水位置的標註。它可能是「pi」,也可能是大寫「eta」的底部)

通過連續數小時盯著分段 CT 掃描圖像,Casey Handmer 發現了這一圖案——這絕對是一個重大而令人驚訝的發現,因為此前在卷軸中並沒有看到過這種圖案。

基於 Casey Handmer 的發現,不少參賽者也開始尋找裂紋圖案,此次獲得 4 萬美元獎金的 Luke Farritor 就是其中一員,他是一名在讀大學生,也曾是一名 SpaceX 暑期實習生。

Luke Farritor 在 Discord 上看到有人在討論這一話題,便開始利用晚上和深夜的時間對裂紋圖案進行機器學習模型訓練。他找到了幾十個墨跡筆畫和一些完整的字母,將其進行標記並用作訓練資料。每發現一個新的裂紋,模型就會得到改進,從而找出卷軸中更多的裂紋圖案——在這種循環中,模型不斷進化。

沒過多久,Luke Farritor 訓練下的 AI 模型就找到了他肉眼看不見的裂紋圖案,並開始形成了一些字母和實際單詞的蛛絲馬跡。於是 Luke Farritor 向維蘇威火山挑戰賽的 First Letters Prize(首字母獎)提交了第一份參賽作品(要求在 4 平方釐米的區域內找到至少 10 個字母):

發現 13 個字母,獲得 4 萬美元獎金

在這幅圖中,隱約可以看到 ΠΟΡΦΥΡΑϹ(porphyras)一詞的輪廓。Brent Seales 教授看到這張照片時也非常驚訝:儘管字母很模糊,但他們一眼就能讀出 “porphyras “這個單詞。

經過全面的技術審查後,挑戰賽官方將 Luke Farritor 提交照片的更新版本發給了專業技術小組,他們在其中標註了 13 個可見字母,儘管可信度各不相同(綠色:可信度超過 80%;黃色:可信度在 50-80%;紅色:可信度低於 50%):

其中,Porphyras 這個單詞雖然在古代文獻中比較罕見,但也經得起推敲,其意思就是「紫色的」(注:這種古文字中的字母與現代文字看起來有點不同,且該時期的文字不使用空格,因此很難確定單詞的邊界)。

對此,一位相關專家補充道:「πορφυ̣ρ̣ας̣,可能是 πορφύ̣ρ̣ας̣(名詞,紫色染料或紫色布)或 πορφυ̣ρ̣ᾶς̣(形容詞,紫色)。由於缺乏上下文,無法排除 πορφύ̣ρ̣α ς̣κ[ 或 πορφυ̣ρ̣ᾶ ς̣κ[ 的可能性。

最終,Luke Farritor 提交的這張照片得到維蘇威火山挑戰賽的官方認可,獲得了 4 萬美元的 First Letters Prize(首字母獎),而他本人在得知這個好訊息的第一時間也十分興奮:

此後不久,另一位參賽者 Youssef Nader 基於 Luke Farritor 的機器學習方法進行了改進——採用領域轉移技術,使這些模型適用於卷軸:在卷軸資料上進行無監督預訓練,然後在片段標籤上進行微調。通過這種方式,Youssef Nader 在同一區域發現了同樣的單詞,其結果更為清晰可見,從而贏得了該獎項的第二名,獲得了 1 萬美元的獎金。

值得一提的是,幾天前 Youssef Nader 的 AI 模型識別出了令人震驚的清晰度和大小的新圖像:雖然並非所有字母都清晰易讀,但可以看到有四列半的文字內容。

「我們的專家團隊正在努力進一步調查,很快會有這方面的更新。」對於這個發現,維蘇威火山挑戰賽官方的樂觀情緒空前高漲:這些進展表明,斬獲 70 萬美元的大獎「指日可待」!

參考連結:

https://scrollprize.org/firstletters

https://caseyhandmer.wordpress.com/2023/08/05/reading-ancient-scrolls/

https://www.theguardian.com/science/2019/oct/03/ancient-scrolls-charred-by-vesuvius-could-be-read-once-again

相關文章

Napster 成立 | 歷史上的今天

Napster 成立 | 歷史上的今天

整理 | 王啟隆 透過「歷史上的今天」,從過去看未來,從現在亦可以改變未來。 今天是 2023 年 6 月 1 日,在 1979 年的今天,...