研究者たちは最先端のAIモデルを用いて、79年のベスビオ山噴火で高温になった古代の巻物を「解読」しようとしている。噴火はナポリ湾の大部分を灰に覆い尽くし、今では有名なポンペイやヘルクラネウムといった町もその一部となった。巻物の解読作業は人工知能革命が起こる何世紀も前から始まっていたが、無数の新技術によって、その作業はかつてないほど容易かつ迅速になっている。
「AI」という言葉は、テクノロジーそのものと同じくらい扱いにくく、しばしば大雑把に使われます。何世紀にもわたって人類が解明できなかったものをAIが解読するとは、一体どういうことなのでしょうか?その答えを探るため、古典を解読し、分類するアルゴリズムやモデルの開発に携わる専門家たちに話を聞きました。
巻物の消失と再発見
約2000年前、ナポリ湾はヴェスヴィオ山の大噴火によって揺さぶられ、ポンペイとヘルクラネウムは灰に埋もれました。両都市は1500年以上もの間、地図から消え去りました。
時は流れ、1750年。井戸を掘っていた作業員が土の下から大理石の床を発見します。さらに発掘を進めると、炭化した巻物と焦げたパピルスの断片が約2,000点埋もれた別荘が見つかります。当初、巻物は漁網や焦げた丸太と間違えられ、多くは捨てられたり、たいまつとして燃やされたりしました。やがて、巻物の一つが落とされて割れ、黒焦げになった円筒の正体が明らかになります。ゲティ美術館によると、この別荘の巻物(現在はヴィラ・デイ・パピルスとして知られています)は、古典世界から現存する唯一の蔵書です。
ポンペイやヘルクラネウムのフレスコ画や人骨の型と同様に、これらの巻物は非常に脆く、事実上解読不可能なほどです。巻物を解こうとする度重なる苦心の試みにより、多くの巻物が断片化し、崩壊し、奇跡的にそこに封じ込められていた情報は時とともに失われてしまいました。
しかし、これまでに読まれた巻物の中にはギリシャの哲学者ガダラのフィロデモスの著作も含まれており、一部の研究者は、この別荘はフィロデモスのパトロンであり、ユリウス・カエサルの義父でもあるルキウス・カルプルニウス・ピソ・カエソニヌスのものだったと考えている。
現在、300 冊を超える未開封の巻物が残っており、ありがたいことに、その内容を明らかにしようとする初期の粗雑な試みを免れています。

ヴェスヴィオの挑戦:現代の技術により、パピルスを粉砕する必要はない
ベスビオ・チャレンジは2023年3月に開始されました。これは、AIを用いてヘルクラネウムの巻物に隠された文字、そして最終的には単語を特定することを一般の人々に競わせるプロジェクトです。未開封のパピルスの巻物の一つから発見され、翻訳された最初の単語(「紫」)は、2023年10月に発表されました。この単語の発見者は、昨年失われた図書館の調査に携わる人々に支払われた100万ドルの一部として、その功績に対して4万ドルを獲得しました。
機械学習とコンピュータービジョンは、このチャレンジのバーチャルアンラッピング手法で使用される2種類の人工知能です。機械学習は、データとアルゴリズムを用いてAIシステムが人間の学習を模倣することを可能にし、時間の経過とともに精度を向上させます。コンピュータービジョンはまさにその名の通り、コンピューターが物体や人物を識別し、最終的には機械が見たものを通して思考できるようにする研究分野です。

「未開封のヘルクラネウム・パピルスの仮想開封を目的とした新しいコンピュータービジョン技術は、ヘルクラネウムのパピルス学に新たな希望をもたらし、ベスビオ山の噴火前の約2000年前に最後に読まれた巻物の解読を可能にします」と、ナポリ・フェデリコ2世大学のパピルス学者で、ベスビオ・チャレンジのパピルス学チームのメンバーであるフェデリカ・ニコラルディ氏は、ギズモードへのメールで述べた。
ベスビオ・チャレンジのメンバーを含むチームは、2015年にエン・ゲディの巻物を用いてこの技術を試用しました。この作業では、巻物の3次元ボリュームスキャンを行い、その3D構造を明らかにしました。次に、コンピュータソフトウェアが巻物に巻き付けられた各層と、スキャン画像中の明るいピクセル(表面に残ったインクを表す)を解析しました。最終的に、巻物は仮想的に「解かれ」、文書のデジタル版が読みやすい形でレイアウトされました。
ベスビオ・チャレンジの2024年の目標は、チームがスキャンした巻物の90%を解読することです。特定の巻物の最初の文字を解読した人には賞金が贈られるほか、巻物のうち1つの自動分節化に成功した人にはさらに高額の賞金が贈られます。もし解読されれば、巻物が灰に埋もれて以来、初めて解読されることになります。
研究者はなぜ巻物を読むのに AI を必要とするのでしょうか?
「古文書を扱う上で大きな問題は、これらの文書の保存状態が断片的であることが多いことです」と、ノッティンガム大学の古典学者で、ベスビオ・チャレンジのメンバーではないテア・ソマーシールド氏は、ギズモードとの電話インタビューで述べた。「機械学習は、パターン、つまりテキストのパターンを識別し、それを利用して特定のタスクを実行するのに非常に優れています。」
古典文学において、AIはこれまで人間が苦労して行っていたプロセスを高速化し、スケールアップさせています。ヘルクラネウム・パピルスの場合、そうした作業にはいくつかの形態があります。
「参加者たちは、閉じた巻物の中でおそらくインクが塗られている部分を特定する方法を見つけ出し、畳み込みニューラルネットワーク、そして最終的にはトランスフォーマースタイルのネットワークを使ってインクを推測できるラベルセットを段階的に構築していきました」と、ケンタッキー大学のコンピューター科学者でEduce Labの主任研究員であるブレント・シールズ氏は、ギズモードとの電話インタビューで語った。
簡単に言えば、畳み込みニューラルネットワークとは、タスクにディープラーニングを活用する機械学習モデルの集合体です。畳み込みニューラルネットワークは、分類やコンピュータービジョンに基づくタスクに特に有用であり、炭化したパピルスに残るかすかなインクの痕跡を処理する際にも有用です。
「このアプローチは、点描画法のようなものだと考えることができます」とシールズ氏は述べた。「表面の非常に小さな部分に注目し、その小さな部分がインクであるかどうかを判断しているのです。」
Transformerは、モデルが膨大なテキスト文字列を処理し、複数のデータストリームをより適切に処理できるようにする新しいAI技術です。このような「マルチモーダル」AIシステムにより、AIはテキスト入力から画像を生成したり、コンピュータービジョンと自然言語処理を組み合わせて手書きの文字の画像を読み取ったりすることが可能になります。(ちなみに、「ChatGPT」の「T」はTransformerの略です。)
「トランスフォーマーは、比類のない文脈を捉える能力を持つため、現在コンピューターサイエンスの最先端技術です」とソマーシールド氏は述べ、その能力は「古代の断片的な文書を復元するのに役立つ」ほか、文書の年代を特定し、書かれた場所を予測するのにも役立つと語った。
古典作品で活躍するAI分野はコンピュータービジョンだけではない
ベスビオ チャレンジは、研究者が古代テキストの研究に AI を活用するために行っているアプローチの 1 つにすぎません。
2019年、ソマーシールド氏と、プロジェクト共同リーダーでGoogle DeepMindの研究科学者であるヤニス・アサエル氏は、古代ギリシャ語のテキストを復元するために設計された、当時最先端だったニューラルネットワーク「ピュティア」モデルを開発しました。ピュティアは、損傷したテキストから文字を復元することでテキストを復元しました。ピュティアの文字エラー率は30.1%で、人間の碑文学者のエラー率は57.3%でした。
その後、ソマーシールドとアサエルのチームは、ニューラルネットワークを用いて古代文書の復元と帰属特定を行う、より強力なトランスフォーマーベースのIthacaモデルを発表しました。研究チームが論文で述べているように、Ithacaは「歴史家のワークフローを支援し、拡張するように設計」されています。このモデル単体では、損傷した文書の復元精度が62%でしたが、歴史家が Ithacaを使用することで、その精度は25%から72%に飛躍的に向上しました。Ithacaや同様のモデルは、「人工知能と歴史家の間の協力の可能性を解き放つことができる」と研究チームは述べています。
2024年にComputational Linguistics誌に掲載された論文で、彼らのチームは機械学習を用いた古代文献研究の包括的な調査を発表しました。彼らは、デジタル化、修復、帰属作業から言語分析、文献批評、翻訳に至るまで、古代文献研究の勢いが高まっていることを発見しました。
しかし、研究者たちは克服すべきハードルも特定しました。彼らのデータは、機械学習を用いた古代文献の既存研究では、言語、歴史、地理が異なる割合で表現されていることを浮き彫りにしました。ご想像の通り、古代ギリシャ語とラテン語の文献は、楔形文字、古代朝鮮語、インダス文字などの他の文字よりもはるかに多く表現されていました。研究者が古代文献に機械学習を適用する際に、すべての文化が表現されるようにするのは、モデル自体ではなく、人間の研究者の仕事であることは明らかです。
人間をループ内に維持する
ベスビオ・チャレンジをめぐる騒ぎの中で、ある重要な事実が忘れられがちです。それは、AI自体が巻物を読み取っているわけではないということです。これはチームの研究成果を軽視するものではありません。むしろ、その成果を強調するものです。研究者たちは、AIに頼ることが無意味な場合や、AIを使うことで巻物の内容に関する結果が不正確になる可能性がある場合には、AIに頼っていません。
「AIフレームワークは文字の完全な形を判断するわけではありません」とシールズ氏は述べた。巻物の中でインクが認識された箇所をハイライト表示しているだけで、「幻覚の可能性を減らす」のだ。言い換えれば、チームのモデルがエータをシータと誤認し、パピルスに込められた意味を混乱させてしまうのを防ぐのだ。
「個々のインクの決定がどのように整列し、それが文章として意味を成すかどうかを判断するのは人間です」と彼は付け加えた。

「これらの技術を古代言語に適用し始めるとすぐに、その欠点と可能性を痛感するでしょう」とソマーシールド氏は述べた。「答えは、人間を常に関与させておく必要があるということです。」
まだやるべきことはたくさんある
今月初め、Sommerschield 氏と Assael 氏は、協力を促進し、この分野の研究の勢いをサポートするために、古代言語のための機械学習 (ML4AL) ワークショップを開催しました。
「専門家、学生、実務家、博物館関係者、あるいは一般の人々が関与し、恩恵を受け、それを利用し、問題を解決し、破壊し、本当に最大限に活用しようと努める必要があります」とソマーシールド氏は付け加えた。
ベスビオ・チャレンジの次のステップは、巻物を大規模に分割・スキャンし、効率的に解読するためのワークフローを構築することです。作業対象となる現存する巻物はおよそ300点あり、スキャンのためには(保存修復士をハンドラーとして)イギリスの粒子加速器まで輸送する必要があります。現在、すべての巻物をスキャンするには合計3,000万ドルの費用がかかります。
さて、皆さんの熱い疑問、つまりヴェスヴィオ山の麓で発見されたこれらの文書から一体何が学べるのでしょうか?ニコラルディ氏はギズモードに対し、「ギリシャ哲学に光を当てる哲学書、特にエピクロスとその弟子たちの著作がさらに発見されることを期待しています。これらの書物は、パピリ邸の図書館以外では完全に失われています」と語りました。
それだけではありません。ゲティ美術館によると、1752年と1754年にヴィラ・デイ・パピリから約1,100点の巻物が発見されました。しかし、ヴィラの敷地はまだ完全に発掘されておらず、プロジェクトのウェブサイトによると、さらに多くの巻物が埋まっていることは「ほぼ確実」とのことです。発掘には多額の費用がかかりますが、その瞬間が来るまでには、チームには精査すべき巻物が山ほどあります。
しかし、巻物はパズルのピースの一つに過ぎません。今、私たちが直面している課題は、AIを活用して古代世界をより深く理解することであり、それは私たちがよく知る文書を再検討することを意味します。2000年もの間読まれていなかったものを読むことを想像するのは刺激的ですが、AIは古典全体に影響を及ぼします。時には、何かを新たな視点で捉えることは、初めて見るのと同じくらい有益なのです。