Расшифровка

Повторное открытие значения языка или письменности

В филологии дешифровка — это открытие значения символов, обнаруженных в вымерших языках и /или алфавитах . ^[1]

Дешифрование пересекается с другой технической областью, известной как криптоанализ , областью, которая направлена на расшифровку записей, используемых в секретной связи, известной как шифротекст . Известный случай этого был в криптоанализе Энигмы во время Второй мировой войны . Многие другие шифры прошлых войн были взломаны только недавно. ^[2] Однако, в отличие от расшифровки языка, субъекты, использующие шифротекст, намеренно создают препятствия, чтобы помешать посторонним раскрыть смысл системы связи. ^[3]

На сегодняшний день не менее дюжины языков остаются нерасшифрованными. ^[4] Знаменательной недавней расшифровкой стала расшифровка линейного эламского письма. ^[5]

Категории

По мнению Гельба и Уайтинга, подход к дешифрованию зависит от четырех категорий ситуаций в нерасшифрованном языке: ^[3]^[6]

Тип O: известная письменность и известный язык. Хотя расшифровка в этом случае тривиальна, полезную информацию можно почерпнуть, когда известный язык записан алфавитом, отличным от того, которым он обычно пишется. Изучение письменности финикийского или шумерского языков в греческом алфавите позволяет почерпнуть информацию о произношении и огласовке, которую невозможно получить при изучении выражения этих языков в их обычной письменности.
Тип I: неизвестная письменность и известный язык. Расшифрованные языки в этой категории включают финикийский , угаритский , кипрский и линейное письмо B. В этой ситуации алфавитные системы являются самыми простыми для расшифровки, за ними следуют слоговые языки, и, наконец, самыми сложными являются логосиллабические .
Тип II: известная письменность и неизвестный язык. Примером может служить линейное письмо А. Строго говоря, эта ситуация относится не к дешифровке, а к лингвистическому анализу. Дешифровка в этой категории считается крайне сложной для выполнения на основе только внутренней информации.
Тип III: неизвестное письмо и неизвестный язык. Примерами служат письмо Арханеса и формула Арханеса, Фестский диск , критские иероглифы и кипро-минойская слоговая азбука . Когда такая ситуация возникает в изолированной культуре и без доступа к внешней информации, дешифровка обычно считается невозможной.

Методы

Существует ряд методов, позволяющих расшифровать вымершую письменность или язык. Их можно разделить на подходы, использующие внешнюю или внутреннюю информацию. ^[3]

Внешняя информация

Многие успешные шифровки исходили из открытия внешней информации, распространенным примером является использование многоязычных надписей , таких как Розеттский камень (с одним и тем же текстом в трех письменностях: демотической , иероглифической и греческой ), что позволило расшифровать египетские иероглифы. В принципе, многоязычный текст может быть недостаточным для расшифровки, поскольку перевод не является линейным и обратимым процессом, а вместо этого представляет собой кодирование сообщения в другой символической системе. Перевод текста с одного языка на другой, а затем со второго языка обратно на первый редко воспроизводит в точности исходное письмо. Аналогичным образом, если только в многоязычном тексте не содержится значительного количества слов, из него можно почерпнуть ограниченную информацию. ^[3]

Внутренняя информация

Внутренние подходы многошаговые: сначала нужно убедиться, что рассматриваемое письмо представляет собой настоящее письмо, а не группу изобразительных изображений или современную подделку без дальнейшего смысла. Обычно к этому подходят с помощью методов из области грамматологии . Перед расшифровкой смысла можно определить количество отдельных графем (что, в свою очередь, позволяет определить, является ли система письма алфавитной, слоговой или логослоговой; это связано с тем, что такие системы письма обычно не пересекаются по количеству используемых графем ^[6] ), последовательность письма (будь то слева направо, справа налево, сверху вниз и т. д.) и определение того, правильно ли сегментированы отдельные слова при написании алфавита (например, с использованием пробела или другого специального знака) или нет. Если можно определить повторяющееся схематическое расположение, это может помочь в расшифровке. Например, если в последней строке текста есть небольшое число, можно обоснованно предположить, что оно относится к дате, где одно из слов означает «год», а иногда также появляется королевское имя. Другой случай — когда текст содержит много небольших чисел, за которыми следует слово, за которым следует большее число; здесь слово, вероятно, означает «итого» или «сумма». После того, как информация, которая может быть выведена из вероятного содержания, исчерпана, необходимо перейти к систематическому применению статистических инструментов. К ним относятся методы, касающиеся частоты появления каждого символа, порядка, в котором эти символы обычно появляются, появляются ли некоторые символы в начале или конце слов и т. д. Существуют ситуации, когда орфографические особенности языка затрудняют, если не делают невозможным, расшифровку определенных признаков (особенно без определенной внешней информации), например, когда алфавит не выражает двойные согласные. Существуют также дополнительные и более сложные методы. В конечном итоге применение таких статистических методов становится чрезвычайно трудоемким, и для их автоматического применения можно использовать компьютеры. ^[3]

Вычислительные подходы

Вычислительные подходы к расшифровке неизвестных языков начали появляться в конце 1990-х годов. ^[7] Обычно существует два типа вычислительных подходов, используемых при расшифровке языка: подходы, предназначенные для создания переводов на известных языках, и подходы, используемые для обнаружения новой информации, которая может позволить будущие усилия по переводу. Второй подход более распространен и включает такие вещи, как обнаружение родственных или связанных слов, обнаружение ближайшего известного языка, выравнивание слов и многое другое. ^[6]

Искусственный интеллект

В последние годы все больше внимания уделяется методам, использующим искусственный интеллект для расшифровки утраченных языков, особенно с помощью методов обработки естественного языка (NLP). Методы проверки концепции независимо друг от друга перерасшифровали угаритское и линейное письмо B , используя данные из похожих языков, в данном случае иврита и древнегреческого . ^[8]

Расшифровка произношения

Связанные с попытками расшифровать значение языков и алфавитов, включают попытки расшифровать, как произносились вымершие системы письма или более старые версии современных систем письма (например, английский в 1600-х годах). В этой связи было разработано несколько методов и критериев. Важные критерии включают (1) Рифмы и свидетельства поэзии (2) Доказательства из случайных написаний и орфографических ошибок (3) Интерпретации материала на одном языке авторами на иностранных языках (4) Информация, полученная из родственных языков (5) Грамматические изменения в написании с течением времени. ^[9]

Например, анализ поэзии фокусируется на использовании игры слов или литературных приемов между словами, имеющими похожее звучание. Пьеса Шекспира « Ромео и Джульетта» содержит игру слов, которая опирается на похожее звучание между словами «душа» и «подошвы», что позволяет с уверенностью утверждать, что похожее произношение между терминами сегодня также существовало во времена Шекспира. Другим распространенным источником информации о произношении является использование рифмы в более ранних текстах , например, когда последовательные строки в поэзии заканчиваются похожим или одинаковым звуком. Однако этот метод имеет некоторые ограничения, поскольку тексты могут использовать рифмы, которые опираются на визуальное сходство между словами (например, «любовь» и «удалить»), а не на слуховое сходство, и что рифмы могут быть несовершенными . Другой источник информации о произношении исходит из явного описания произношений из более ранних текстов, как в случае с Grammatica Anglicana , например, в следующем комментарии о букве <o>: «В долгое время она, естественно, звучит резко и высоко; как в chósen, hósen, hóly, fólly [...] В короткое время более ровно и похоже на u; как còsen, dòsen, mòther, bròther, lòve, pròve». ^[10] Другой пример исходит из подробных комментариев о произношении санскрита из сохранившихся трудов санскритских грамматистов. ^[9]

Вызовы

При расшифровке языков возникает множество проблем, в том числе: ^[4]^[6]

Когда неизвестно, какой язык к нему ближе всего.
Когда слова в письме не имеют четкого деления на сегменты, как в некоторых иберийских языках .
Когда система письма неизвестна. В частности, если мало уверенности относительно количества графем, которые существуют в определенной системе письма, то невозможно определить, является ли эта система алфавитом, слоговым письмом, логосиллабрией или чем-то еще.
Когда направление чтения неизвестно. Например, может быть неясно, предназначена ли система письма для чтения слева направо или справа налево.
Когда неизвестно, используются ли в сценарии знаки препинания или пробелы между словами.
Когда язык письменности, подлежащей расшифровке, неизвестен.
Когда имеется небольшой набор данных, доступный для изучения свойств сценария. Это может привести к таким проблемам, как неполный словарь, известный для сценария.
Когда типичный порядок между подлежащими, дополнениями и глаголами неизвестен.
Когда неизвестно, могут ли некоторые слова изменять свою форму и каким образом.
Когда неизвестно, используются ли несколько символов для представления одного и того же звука, слога, слова, понятия или идеи (аллографы).
Когда неясно, как почерк или стиль письма конкретного писца соотносятся со стилем письма другого писца, работающего над тем же текстом (те же буквы или слова могут быть написаны способом, который выглядит по-разному), в таком случае сложно сопоставить информацию из нескольких примеров использования системы письма.
Когда неизвестно, меняют ли некоторые слова свое значение в зависимости от контекста, в котором они появляются (омонимы).
Когда контекст открытия письменности неизвестен. Это происходит потому, что информация о месте, откуда произошла система письма, может предоставить ценную информацию о ее связи с известными языками.
Отсутствие адекватных цифровых наборов данных для документированных систем письма ограничивает возможности использования вычислительных методов для дешифровки.
Когда отсутствуют достаточные аппаратные ресурсы, такие как высокопроизводительные вычисления (что может быть необходимо для более ресурсоемких вычислительных методов).

Известные дешифровщики

Имя ученого	Скрипт расшифрован	Дата
Магнус Цельсий	Руны без ставов	1674
Йон Олафссон из Груннавика	Шифрованные руны	1740-е годы
Жан-Жак Бартелеми	Пальмирский алфавит	1754
Жан-Жак Бартелеми	финикийский алфавит	1758
Антуан-Исаак Сильвестр де Саси	пехлевийское письмо	1791
Жан-Франсуа Шампольон	Египетские иероглифы ( расшифровка )	1822
Георг Фридрих Гротефенд , Эжен Бюрнуф и Генри Роулинсон	Древнеперсидская клинопись ( расшифровка )	1823
Томас Янг	Демотическое письмо
Мануэль Гомес-Морено	Северо-восточное иберийское письмо
Джеймс Принсеп	Брахми , Кхароштхи
Эдвард Хинкс	Месопотамская клинопись
Бедржих Грозный	Хеттская клинопись
Вильгельм Томсен	Древнетюркский
Джордж Смит и Сэмюэль Бирч и др. ^[11]	Кипрская слоговая азбука
Ганс Бауэр и Эдуард Поль Дорм ^[12]	Угаритский алфавит
Ван Йырон , Лю Э , Сун Йиран и др.	Скрипт Oracle Bone
Алексей Иванович Иванов , Николай Александрович Невский и др.	Тангутское письмо
Майкл Вентрис , Джон Чедвик и Элис Кобер	Линейное письмо Б
Юрий Кнорозов и Татьяна Проскурякова и др.	Майя
Луи Фелисьен де Сольси	Ливийско-берберская письменность (почти полностью)
Ян-Улоф Тьедер	«Увеличенный начальный шрифт» Равенны (вариант латинского алфавита )
Заза Алексидзе	Кавказский албанский алфавит
Франсуа Дессе ^[5]	Линейный Эламит

Смотрите также

Расшифрованные письмена

Нерасшифрованные письмена

Нерасшифрованные тексты

Ссылки

^ Хотя письменность ливийско-берберская была почти полностью расшифрована, язык — нет.

^ Траск, Р. Л. (2000). Словарь исторической и сравнительной лингвистики . Издательство Фицроя Дирборна, стр. 82 («Процесс определения связи между исчезнувшей и неизвестной системой письма и языком, который она представляет. Строго говоря, дешифровка — это разъяснение письменности , то есть определение значений написанных символов»)
^ Бауэр, Крейг П. (2023-03-04). «Новый золотой век дешифровки». Cryptologia . 47 (2): 97–100. doi :10.1080/01611194.2023.2170158. ISSN 0161-1194.
^ abcde Gelb, IJ; Whiting, RM (1975). «Методы дешифровки». Журнал Королевского Азиатского Общества . 107 (2): 95–104. doi :10.1017/S0035869X00132769. ISSN 2051-2066.
^ ab Luo, Jiaming; Hartmann, Frederik; Santus, Enrico; Barzilay, Regina; Cao, Yuan (2021). «Расшифровка недостаточно сегментированных древних письменностей с использованием фонетического предшествующего». Труды Ассоциации компьютерной лингвистики . 9 : 69–81. arXiv : 2010.11054 . doi :10.1162/tacl_a_00354. ISSN 2307-387X.
^ аб Дессет, Франсуа; Табибзаде, Камбиз; Кервран, Матье; Баселло, Джан Пьетро; Маркези и Джанни (1 июля 2022 г.). «Расшифровка линейного эламского письма». Zeitschrift für Assyriologie und vorderasiatische Archäologie . 112 (1): 11–60. дои : 10.1515/za-2022-0003. ISSN 1613-1150.
^ abcd Браович, Майя; Крстинич, Дамир; Штула, Майя; Иванда, Антония (2024-06-01). «Систематический обзор вычислительных подходов к расшифровке эгейских и кипрских письменностей бронзового века». Компьютерная лингвистика . 50 (2): 725–779. doi : 10.1162/coli_a_00514 . ISSN 0891-2017.
^ Найт, Кевин; Ямада, Кэндзи (1999). "Вычислительный подход к расшифровке неизвестных текстов" (PDF) . Неконтролируемое обучение при обработке естественного языка .
^ Луо, Цзямин; Цао, Юань; Барзилай, Регина (2019). «Нейронное дешифрование с помощью потока с минимальной стоимостью: от угаритского к линейному B». arXiv . Ассоциация компьютерной лингвистики: 3146–3155. arXiv : 1906.06718 . doi :10.18653/v1/P19-1303.
^ ab Campbell, Lyle (2021). Историческая лингвистика: введение (4-е изд.). MIT Press. стр. 372–375. ISBN 978-0-262-53159-7.
^ Берридж, Кейт; Бергс, Александр (2017). Понимание языковых изменений . Серия «Понимание языка». Лондон, Нью-Йорк: Routledge, Taylor & Francis Group. С. 234–235. ISBN 978-0-415-71339-9.
^ «Кипро-Силлабический».
^ "Анатомия дешифровки", http://images.library.wisc.edu/WI/EFacs/transactions/WT1966/reference/wi.wt1966.adcorre.pdf"

Дальнейшее чтение

Дэниелс, Питер Т. (2020). «Расшифровка древних ближневосточных языков». В Hasselbach-Andee, Rebecca (ред.). A Companion to Ancient Near Eastern Languages . Wiley. стр. 1–25.
Феррера, Сильвия; Тамбурини, Фабио (2022). «Передовые методы дешифровки древних письменностей». Язык и лингваджио : 239–259.

[13] Хотя письменность ливийско-берберская была почти полностью расшифрована, язык — нет.

[1] Траск, Р. Л. (2000). Словарь исторической и сравнительной лингвистики . Издательство Фицроя Дирборна, стр. 82 («Процесс определения связи между исчезнувшей и неизвестной системой письма и языком, который она представляет. Строго говоря, дешифровка — это разъяснение письменности , то есть определение значений написанных символов»)

[2] Бауэр, Крейг П. (2023-03-04). «Новый золотой век дешифровки». Cryptologia . 47 (2): 97–100. doi :10.1080/01611194.2023.2170158. ISSN 0161-1194.

[:1-3] Gelb, IJ; Whiting, RM (1975). «Методы дешифровки». Журнал Королевского Азиатского Общества . 107 (2): 95–104. doi :10.1017/S0035869X00132769. ISSN 2051-2066.

[:0-4] Luo, Jiaming; Hartmann, Frederik; Santus, Enrico; Barzilay, Regina; Cao, Yuan (2021). «Расшифровка недостаточно сегментированных древних письменностей с использованием фонетического предшествующего». Труды Ассоциации компьютерной лингвистики . 9 : 69–81. arXiv : 2010.11054 . doi :10.1162/tacl_a_00354. ISSN 2307-387X.

[:4-5] аб Дессет, Франсуа; Табибзаде, Камбиз; Кервран, Матье; Баселло, Джан Пьетро; Маркези и Джанни (1 июля 2022 г.). «Расшифровка линейного эламского письма». Zeitschrift für Assyriologie und vorderasiatische Archäologie . 112 (1): 11–60. дои : 10.1515/za-2022-0003. ISSN 1613-1150.

[:2-6] Браович, Майя; Крстинич, Дамир; Штула, Майя; Иванда, Антония (2024-06-01). «Систематический обзор вычислительных подходов к расшифровке эгейских и кипрских письменностей бронзового века». Компьютерная лингвистика . 50 (2): 725–779. doi : 10.1162/coli_a_00514 . ISSN 0891-2017.

[7] Найт, Кевин; Ямада, Кэндзи (1999). "Вычислительный подход к расшифровке неизвестных текстов" (PDF) . Неконтролируемое обучение при обработке естественного языка .

[8] Луо, Цзямин; Цао, Юань; Барзилай, Регина (2019). «Нейронное дешифрование с помощью потока с минимальной стоимостью: от угаритского к линейному B». arXiv . Ассоциация компьютерной лингвистики: 3146–3155. arXiv : 1906.06718 . doi :10.18653/v1/P19-1303.

[:3-9] Campbell, Lyle (2021). Историческая лингвистика: введение (4-е изд.). MIT Press. стр. 372–375. ISBN 978-0-262-53159-7.

[10] Берридж, Кейт; Бергс, Александр (2017). Понимание языковых изменений . Серия «Понимание языка». Лондон, Нью-Йорк: Routledge, Taylor & Francis Group. С. 234–235. ISBN 978-0-415-71339-9.

[11] «Кипро-Силлабический».

[12] "Анатомия дешифровки", http://images.library.wisc.edu/WI/EFacs/transactions/WT1966/reference/wi.wt1966.adcorre.pdf"