古代くさび形文字の文書をAIで翻訳——5千年前の知識解明を加速
2023/07/30 06:30
イスラエルのテルアビブ大学でコンピューターサイエンスを研究するGai Gutherz氏と、アリエル大学の考古学者Shai Gordin氏が、古代アッカド語の「くさび形文字」をAIで解読した。この研究成果は、2023年5月2日付けの科学雑誌『PNAS Nexus』に掲載された。
紀元前3400年頃~紀元後75年頃のくさび形文字が刻まれた数十万枚の粘土板は、古代メソポタミアの政治、社会、経済、科学の歴史が記録されている。しかしそれらを解読できる専門家の数は限られ、粘土板に記録された知識の解明は進んでいない。
同研究では、アッカド語を英語へ機械翻訳するソースとして、文字コード規格のUnicodeに収録されたくさび形文字と、ラテン文字による音訳の2種類を用意して、自然言語処理で翻訳した。翻訳結果は、採点システム「Bilingual Evaluation Understudy 4(BLEU4)」が、0~100の数値で評価した。
評価の結果は、くさび形文字のUnicodeから英語への直接翻訳で36.52点、音訳を経て英訳する場合は37.47点を記録した。これは、初期段階のモデルの結果としては優秀とされ、くさび形文字から英語への直接翻訳で、より高品質の結果を得た。
また、比較的良い結果を得た翻訳対象の特徴は、短文と中長文で、特に専門的あるいは定型的な文型の文書だ。一方、ソースの文書が長く複雑になると、訳文の誤りや内容の欠落が増加することも判明した。
著者らは今回の研究の成果について論文のなかで、「古代メソポタミアの文化遺産の保存と普及に向けた、大きな一歩だ」と述べている。
(fabcross for エンジニアより転載)