Х иляди исторически документи, съхранявани с векове в библиотеки и архиви по целия свят в криптиран вид, стават достъпни за четене за първи път. Благодарение на технологиите с изкуствен интелект (ИИ), учените се научиха бързо да разбиват тайни кодове, които досега се смятаха за абсолютно безнадеждни.
Това се посочва в аналитична статия на научния журналист Сандрин Кьорстемилер за BBC.
Тайните рецепти на Ватикана: разшифроването на Борджийския шифър
Едно от ключовите постижения на машинното обучение е пълният анализ на Борджийския кодекс (Borg.lat.898) от Ватиканската библиотека.
Тази книга от 408 страници, написана преди около 400 години, се състои от 34 мистериозни символа, няколко латински букви и заглавна страница на арабски език. Надписът на корицата подсказвал, че тя съдържа лековити средства за човешкото тяло. По времето, когато е създаден ръкописът, медицинските практики често са били шифрирани, за да се избегнат обвинения в магьосничество.
След намесата на ИИ се оказало, че книгата съдържа хиляди странни рецепти: от съвети да се пие висококачествено червено вино до рецепта за ферментиране на индийско орехче в тесто за лечение на дизентерия.
Както отбелязва Беата Медеши, професор по компютърна лингвистика в Стокхолмския университет, дори с компютърни алгоритми търсенето на криптографския ключ е изисквало дълга и упорита работа, тъй като много страници са били сериозно повредени от времето.
Защо усилията на учените вече не са достатъчни?
Традиционното дешифриране на исторически текстове е изключително бавен процес. Основният проблем е, че преди да се използва какъвто и да е аналитичен софтуер, всяка буква и символ трябва първо ръчно да се прехвърлят от хартия в дигитален формат.
Поради лошия почерк на древните автори и избледнялото мастило, ръчната транскрипция на само две страници текст може да отнеме цял работен ден на съвременен експерт.
Освен това авторите в миналото са използвали различни трикове, за да защитят информацията:
- въвеждали са допълнителни „празни“ символи (заблуждаващи знаци), за да объркат изследователите;
- използвали са между 5 и 8 различни знака, за да кодират една-единствена обикновена буква;
- шифрирали са текстове на езици, които сами по себе си са мъртви или непознати.
Например на екип от френски криптографи са били нужни шест месеца, за да дешифрират писмо от три страници на император Карл V, написано с помощта на 120 тайни символа. Текстът разкрил неочакван исторически факт: един на най-могъщите владетели на своето време е бил обхванат от паника, страхувайки се от опит за убийство от страна на италиански наемник.
От разпознаване на букви до тайни любовни писма
Днес технологиите с ИИ се интегрират във всички етапи на изследванията. Професор Мишел Валдиспюл от Университета в Осло използва ИИ платформата Transkribus, за да дигитализира писмо, написано през 1637 г. от благородника Зигизмунд Хайснер фон Вандерслебен в разгара на Трийсетгодишната война.
Системата, обучена върху хиляди ръкописи от различни векове, успешно разпознала смесения текст, в който немският език се редувал с дигитални шифровани блокове. Това позволило да се прочете предупреждение, адресирано до шведския канцлер Аксел Оксенщиерна, за предателство и заговори сред протестантските съюзници, по-конкретно с участието на лорд Франц Хайнрих от Саксония, което принудило автора да предприеме стратегическо отстъпление.
В същото време учени от проекта Descrypt изграждат база данни с древни шифри, за да обучават ИИ. Сред находките са над 400 мистериозни шифрирани картички от края на XIX и началото на XX век. Първите декодирани фрагменти разкриват, че това са били тайни любовни писма, написани на немски език.
ИИ чатбот срещу „халюцинациите“
Следващата стъпка в технологичното развитие е създаването на специализиран чатбот. Този ИИ комбинира разпознаване на изображения, големи езикови модели (като ChatGPT) и дешифриране в един единствен процес. Потребителите просто качват снимка на страницата, за да получат декодирания текст.
Важна техническа подробност: ботът документира процеса на декодиране стъпка по стъпка и обяснява защо решението му е достоверно. Това е от критично значение за историците, тъй като доказва, че невронната мрежа не е „халюцинирала“ и не си е измислила превода сама. Освен това системата е способна да се самообучава, като автоматично взема предвид корекциите, направени от човешки експерти.
Очаква се в бъдеще мащабът и скоростта на ИИ да бъдат използвани за разрешаването на най-старите лингвистични мистерии на човечеството, които все още се съпротивляват на класическия анализ, включително 4000-годишния Фестки диск от Крит и древногръцката писменост Линеар А.