
Команда Google DeepMind створила штучний інтелект, який допомагає дослідникам аналізувати давньоримські написи та знаходити зв'язки між фрагментами тексту.
Римляни створили вражаюче організоване та ретельно структуроване суспільство. Однією з ключових складових цього була писемність – вони активно і детально документували різні аспекти свого життя. У їхніх архівах зберігалися записи про римських громадян, комерційні угоди, судові процеси, закони та безліч інших важливих питань. Такі документи вигравіювали на кам'яних стінах, бронзових табличках, вазах і навіть свинцевих листах з прокльонами. Ці написи є одними з найцінніших джерел інформації про буденність людей у давніх часах. Проте, на жаль, вони рідко збереглися в повному обсязі.
Для істориків створення цілісного образу минулого є складним завданням. Вони змушені шукати контекст у розрізнених фрагментах, з'єднувати їх з іншими доступними матеріалами і часто покладатися на свої енциклопедичні знання та трудомісткі ручні дослідження. Проте тепер новітній інструмент штучного інтелекту відкриває можливість для нових відкриттів у вивченні минулого.
Команда Google DeepMind у співпраці з кількома університетами презентувала Aeneas — безкоштовну генеративну модель штучного інтелекту, створену для підтримки істориків у контекстуалізації давньолатинських текстів. Головна мета цього штучного інтелекту полягає у виявленні паралелей — інших написів, які мають подібну формулювання, функціональність або культурний контекст.
Головна ідея Aeneas базується на процесі, який називається контекстуалізацією. Уявіть давній напис як одну частинку пазла. Маючи лише її, майже неможливо розгледіти загальну картину. Щоб справді зрозуміти її, потрібно знайти інші частинки, з якими вона пов'язана. Історики роблять це, шукаючи згадані вище паралелі.
Aeneas навчався на основі Латинського епіграфічного набору даних, який складається з величезної колекції понад 176 тисяч написів, зібраних з трьох основних джерел. Ця модель перетворює кожен напис у своєрідний цифровий відбиток, що фіксує не лише текст, але й історичні та лінгвістичні аспекти. Порівнюючи ці відбитки, Aeneas здатен швидко сформувати ранжований список найбільш відповідних паралелей, що допомагає досліднику підкріпити свої висновки.
Простіше кажучи, штучний інтелект приймає текст, а в деяких випадках і зображення, та створює список пов'язаних написів. Він не просто шукає схожі слова, а також ідентифікує та пов'язує написи через лінгвістичні подібності та інші зв'язки.
Щоб перевірити його реальну цінність, дослідники провели найбільше спільне дослідження між давніми історикам та штучним інтелектом на сьогодні, залучивши 23 експерти. Результати продемонстрували потужну синергію. Працюючи самостійно, історики досягали 39-відсоткової помилки символів при відновленні текстів. З прогнозами Aeneas цей показник помилок знизився до 21 відсотка, перевершивши модель, що працювала самостійно. Інструмент підвищив упевненість істориків на 44 відсотки і був визнаний корисною відправною точкою для досліджень у 90 відсотках випадків.
Наприклад, один анонімний фахівець зауважив: "Паралелі, знайдені Aeneas, кардинально змінили моє уявлення про оцінюваний напис. Я не помітив тих нюансів, які мали вирішальне значення як для відновлення, так і для хронологічної атрибуції тексту". У схожому ключі інший експерт додав: "Допомога паралельних написів є відмінним інструментом для розуміння типів написів, які встановлюють товариші по зброї, тоді як мій власний підхід став більш спеціалізованим, зосереджуючись на обмеженому наборі написів".
Штучний інтелект назвали на честь Енея, видатної постаті як римської, так і грецької mythології. Він був троянським героєм, який згодом став легендарним засновником Риму.
Aeneas є розвитком попередньої грецької моделі DeepMind, відомої як Ithaca, яка спеціалізувалася на дослідженні грецьких рукописів. Цю систему можна також налаштувати для роботи з іншими давніми мовами, такими як іврит, коптська, санскрит або вавилонська. Вона має потенціал для відновлення втрачених оповідей, аналізу стародавніх наукових теорій та виявлення голосів, які залишилися на маргінесах історії, але були майже знищені часом. Цей інструмент особливо корисний для науковців, які працюють в умовах обмежених ресурсів або не мають глибоких знань про римські написи.
Розроблений DeepMind у партнерстві з істориками з Ноттінгемського, Оксфордського та Уорвікського університетів, Aeneas є мультимодальним, що означає, що він може аналізувати як текст, так і зображення написів для підвищення точності своїх прогнозів.
Вчені також провели тестування на Res Gestae Divi Augusti, автобіографічному некролозі імператора Августа, що є одним з найбільш обговорюваних римських написів. Протягом багатьох століть історики дискутували про точний час його створення. Не маючи попередніх знань, Aeneas здійснив детальний аналіз повного тексту та запропонував можливі варіанти датування, які вдало охопили всі аспекти суперечок.
Це ілюструє як сильні сторони, так і недоліки: він надає контекст та корисні відомості, проте для прийняття рішень все ще необхідні професіонали.
Науковці створили модель, а також опублікували її код та набір даних, які тепер доступні безкоштовно в Інтернеті, що відкриває можливості для нових досліджень римської епохи та інших тем.
"Команда Aeneas продовжує співпрацювати з різноманітними експертами з предметних областей, використовуючи Aeneas, щоб допомогти пролити світло на наше давнє минуле -- з більшим попереду", -- пише команда DeepMind.
Результати дослідження були надруковані в науковому журналі Nature.
#Університет #Суспільство #Модель #Історія #Знання #Штучний інтелект #Функція (математика) #Сприйняття #Рукопис #Оксфордський університет #Природа (газета) #База даних #Мова іврит #Стародавній Рим #Грецька мова #Вавилон #Лінгвістика #Августе. #Класична античність #DeepMind #Свинцевий. #Коптська мова #Санскрит #Автобіографія