ШІ Aeneas допомагає історикам розшифровувати римські написи


Команда Google DeepMind створила штучний інтелект, який допомагає дослідникам аналізувати давньоримські написи та знаходити зв'язки між фрагментами тексту.

Зображення ZME Science
Зображення ZME Science

Римляни створили надзвичайно організоване та добре структуроване суспільство. Важливою частиною цього була писемність — вони писали часто і детально. У них були записи про римських громадян, торговельні угоди, судові процеси, закони та багато інших речей. Ці тексти вирізьблювали на кам'яних стінах, бронзових табличках, урнах і навіть свинцевих табличках прокльонів. Такі написи є одними з найбагатших джерел інформації про деталі повсякденного життя в античності. Проте вони рідко збереглися в цілісному вигляді.

Для істориків складання цілісної картини є кропітким завданням. Їм доводиться шукати контекст у фрагментах, пов'язувати їх з іншими наявними записами та часто покладатися на енциклопедичні знання й трудомісткі ручні пошуки. Тепер новий інструмент штучного інтелекту допомагає повернути час назад.

Команда з Google DeepMind та кількох університетів представила Aeneas — генеративну та безкоштовну модель штучного інтелекту, розроблену для допомоги історикам у контекстуалізації давньолатинських написів. Основна функція штучного інтелекту полягає у визначенні паралелей — інших написів із схожим формулюванням, функцією або культурним контекстом.

Головна ідея Aeneas базується на процесі, який називається контекстуалізацією. Уявіть давній напис як одну частинку пазла. Маючи лише її, майже неможливо розгледіти загальну картину. Щоб справді зрозуміти її, потрібно знайти інші частинки, з якими вона пов'язана. Історики роблять це, шукаючи згадані вище паралелі.

Aeneas навчався на Латинському епіграфічному наборі даних, масивному корпусі з понад 176 тисяч написів, зібраних із трьох основних баз даних. Модель перетворює кожен напис у своєрідний цифровий відбиток, який фіксує не лише його текст, але й історичні та лінгвістичні закономірності. Порівнюючи ці відбитки, Aeneas може миттєво отримати ранжований список найбільш релевантних паралелей, щоб допомогти історику обґрунтувати своє дослідження.

Простіше кажучи, штучний інтелект приймає текст, а в деяких випадках і зображення, та створює список пов'язаних написів. Він не просто шукає схожі слова, а також ідентифікує та пов'язує написи через лінгвістичні подібності та інші зв'язки.

Щоб перевірити його реальну цінність, дослідники провели найбільше спільне дослідження між давніми історикам та штучним інтелектом на сьогодні, залучивши 23 експерти. Результати продемонстрували потужну синергію. Працюючи самостійно, історики досягали 39-відсоткової помилки символів при відновленні текстів. З прогнозами Aeneas цей показник помилок знизився до 21 відсотка, перевершивши модель, що працювала самостійно. Інструмент підвищив упевненість істориків на 44 відсотки і був визнаний корисною відправною точкою для досліджень у 90 відсотках випадків.

Наприклад, один неназваний експерт зазначив: «Паралелі, знайдені Aeneas, повністю змінили моє сприйняття оцінюваного напису. Я не помітив деталей, які зробили всю різницю як у відновленні, так і в хронологічній атрибуції тексту». Подібно до цього, інший повідомив: «Допомога паралельних написів чудово підходить для розуміння типу напису товаришів по зброї, які встановлюють написи, тоді як мій власний пошук став більш вузьким, зосереджуючись на наборі написів».

Штучний інтелект назвали на честь Енея, видатної постаті як римської, так і грецької mythології. Він був троянським героєм, який згодом став легендарним засновником Риму.

Aeneas базується на попередній грецькій моделі DeepMind під назвою Ithaca, яка зосереджувалася на грецьких рукописах. Його також можна адаптувати для інших давніх мов, таких як іврит, коптська, санскрит або вавилонська. Він міг би допомогти реконструювати втрачені історії, розглянути давні наукові припущення та пролити світло на маргіналізовані голоси, вирізьблені в камені, але майже стерті часом. Він також найбільш корисний для дослідників, які працюють в установах з недостатнім персоналом або не мають обширних знань про римські написи.

Розроблений DeepMind у партнерстві з істориками з Ноттінгемського, Оксфордського та Уорвікського університетів, Aeneas є мультимодальним, що означає, що він може аналізувати як текст, так і зображення написів для підвищення точності своїх прогнозів.

Дослідники також протестували його на Res Gestae Divi Augusti, автобіографічному некролозі імператора Августа, одному з найбільш гаряче обговорюваних римських написів. Протягом століть історики сперечалися про те, коли саме він був написаний. Без попередніх знань Aeneas проаналізував повний текст і запропонував розподіл можливих дат, який акуратно охопив обидві сторони дебатів.

Це демонструє як переваги, так і обмеження: він пропонує контекстуалізацію та корисну інформацію, але вам все ще потрібні експерти-люди, щоб зробити висновки.

Дослідники зробили модель, її код та набір даних відкритими та безкоштовно доступними онлайн, відкриваючи двері для нових відкриттів про римський світ і не тільки.

«Команда Aeneas продовжує співпрацювати з різноманітними експертами з предметних областей, використовуючи Aeneas, щоб допомогти пролити світло на наше давнє минуле — з більшим попереду», — пише команда DeepMind.

Дослідження було опубліковано в журналі Nature.

— За матеріалами ZME Science