ИСО 11940

Стандарт ISO для транслитерации тайских символов

ISO 11940 — стандарт ISO для транслитерации тайских символов , опубликованный в 1998 году, обновленный в сентябре 2003 года и подтвержденный в 2008 году. Расширение этого стандарта под названием ISO 11940-2 определяет упрощенную транскрипцию на его основе.

Согласные

тайскийббнетб
ИСОкк̄чḳ̄hкхк̛чкчнгсc̄hчсч̣
 
тайскийбкб 
ИСОдṭ̄hṯhт̛чгтт̄чйтхн
 
тайский 
ИСОбпp̄hфотфп̣чм
 
тайскийб
ИСОугвлłжṣ̄с̛̄с̄часхчас

Транслитерация чистых согласных происходит от их обычного произношения в качестве начального согласного. Неотмеченный h используется для образования диграфов, обозначающих придыхательные согласные . Высокие и низкие пары согласных систематически различаются путем применения макрона к согласному высокого класса. Дальнейшая дифференциация согласных с одинаковой фонетической функцией достигается путем оставления наиболее частых неотмеченными, обозначения второго по частоте встречаемости точкой снизу, обозначения третьего по частоте рогом и обозначения четвертого по частоте подчеркиванием. Использование точки снизу имеет аналогичный эффект с индологической практикой различения ретрофлексных согласных точкой снизу, но есть тонкие различия — это транслитерации ธtho thong и ศso sala , которые отмечены точкой снизу, а не транслитерации соответствующих ретрофлексных согласных . Транслитерации согласных следует вводить в следующем порядке: базовая буква, макрон, если есть, и затем точка снизу, рог или «макрон снизу». Только три согласных имеют рог в своей транслитерации, ฅkho khon , ฒtho phuthao и ษso ruesi , и только один согласный имеет подчеркивание, ฑtho nang montho .

Гласные

тайский–ั ำ–ิ–ี–ึ–ื–ุ–ูвฤๅбда
ИСОааåяяụ̄тыuеæояявłłɨужх

Буква å является единственным предварительным символом, указанным в результатах транслитерации.

Lakkhangyao (ๅ) показан только в сочетании с гласными буквами ฤ и ฦ. Стандарт просто перечисляет ฤ и ฦ с согласными и lakkhangyao с гласными. Изолированная lakkhangyao также транслитерируется маленькой буквой "i" со штрихом ( ɨ ), но это не должно встречаться в тайском, пали или санскрите.

Транслитерации วwo waen и อo ang включены сюда из-за их использования в качестве полноценных символов гласных, но их транслитерация не зависит от того, как они используются, и стандарт просто перечисляет их вместе с согласными.

Составные гласные символы транслитерируются в соответствии с их составляющими.

Другие объединяющие знаки

тайский–่–้–๊–๋–็–์–๎–ํ–ฺ
ИСО–̀–̂–́–̌–̆–̒~–̊–̥

Обратите внимание, что ямаккан (–๎) представлен пробелом-тильдой, а не надстрочной тильдой.

Знаки препинания и цифры

тайскийк
ИСО«ǂ§ǀǁ»0123456789

ISO 11940:1998 различает символ сокращения paiyannoi (ฯ) и терминатор предложения angkhandiao (ฯ), хотя ни национальный стандарт символов TIS 620-2533 , ни Unicode версии 5.0 не различают их. Paiyannoi транслитерируется как ǂ , а angkhandiao транслитерируется как ǀ . Обратите внимание, что paiyannoi , angkhandiao и angkhankhu (๚) транслитерируются буквами, используемыми для щелкающих согласных , а не двойными крестиками, вертикальными чертами или дандами .

Последовательность символов

В целом символы транслитерируются слева направо, а там, где символы имеют одинаковое горизонтальное положение, сверху вниз. Вертикальная последовательность на самом деле просто указывается как знаки тона и thanthakhat (–์), предшествующие любым другим знакам выше или ниже согласной. Стандарт отрицает в конце Раздела 4.2, что может встречаться сочетание sara u (◌ุ, ◌ู) и nikkhahit (◌ํ), а затем приводит пример этого при указании транслитерации nikkhahit , но не показывает транслитерацию сочетания. Эффект этих правил заключается в том, что, за исключением nikkhahit , все негласные знаки, прикрепленные к согласной в тайском языке, присоединяются к согласной в римской транслитерации.

Стандарт допускает, что попытка перестановки предварительных гласных и согласных может быть удобной для тех, кто привык к латинскому алфавиту , но рекомендует не переставлять предварительные гласные.

Например, ภาษาไทย ( RTGSPhasa Thai ) следует транслитерировать в p̣hās̛̄āịthy , а เชียงใหม่ ( RTGSChiang Mai ) – в echīyngıh̄m̀ .

Вариации

Причины

Стандарт определяет порядок, в котором должны быть напечатаны акценты, но не все системы ввода будут записывать акценты в порядке, в котором они напечатаны. Unicode определяет две нормализованные формы для букв с несколькими акцентами, и транслитерированный текст с большой вероятностью будет сохранен в одной из этих форм. Это усложняет автоматическую обратную транслитерацию. Поскольку процессы, совместимые с Unicode, должны правильно обрабатывать такие вариации, транслитерации на этой странице были выбраны для простоты отображения — современные системы рендеринга могут отображать эквивалентные формы по-разному.

Многие шрифты плохо отображают новые сочетания согласных и ударений. Например, Институт эстонского языка публикует в Интернете объяснение применения стандарта к тайскому языку , и за одним исключением это, похоже, соответствует стандарту. Исключением является то, что, за исключением макрона, ударения над согласными фактически смещены вправо, создавая впечатление, что они были введены как соответствующие некомбинируемые символы. Стандарт определяет транслитерации в кодовых точках, но кто-то, работающий с этим свободным объяснением, может легко сделать вывод, что следует использовать формы интервалов тоновых ударений.

ОИТ (CLDR 1.4.1)

Реализация ICU , записанная в версии 1.4.1 Common Locale Data Repository, спонсируемой Unicode , [1] использует штрих вместо рога в транслитерации согласных. Это влияет на транслитерацию ฅkho khon , ฒtho phuthao и ษso bo ruesi . ฏto patak также транслитерируется по -другому, как , а не .

Эта реализация транслитерирует ำ как  вместо å , чтобы избежать двусмысленности с гипотетической последовательностью тайского письма ะํ ( sara a , nikkhahit ). Реализация ICU транслитерирует ฺphinthu как ˌ вместо , чтобы избежать проблем с нормализацией Unicode . Это имеет побочный эффект улучшения разборчивости при применении к согласной с точкой.

Реализация ICU транслитерирует ฯpaiyannoi как (двойной кинжал), а angkhankhu как || (две вертикальные черты ASCII). Поскольку реализация ICU использует Unicode, она не может надежно отличить angkhandiao от paiyannoi без семантического анализа и не делает такой попытки.

Последовательность символов в реализации ICU отличается. Она транспонирует предварительные гласные со следующими согласными и обрабатывает знаки на согласных в том порядке, в котором они хранятся в памяти. (Большинство методов ввода на тайском языке гарантируют, что знаки хранятся в порядке снизу вверх.) Она не транспонирует предварительные гласные с полными согласными кластерами; согласные кластеры не могут быть идентифицированы с полной точностью, а транспонирование гласных с кластерами потребовало бы дополнительного символа для обеспечения надежного преобразования обратно в тайский алфавит.

Например, в этой реализации ภาษาไทย транслитерируется в p̣hās̄ʹāthịy , а เชียงใหม่ в cheīyngh̄ım̀ .

Наконец, эта реализация генерирует транслитерации в форме нормализации Unicode C (NFC).

Смотрите также

Ссылки

  1. ^ http://unicode.org/Public/cldr/1.4.1/core.zip файлы transforms/ThaiLogical-Latin.xml и transforms/Thai-ThaiLogical.xml (используются транслитераторами ICU "Thai-Latin" и "Latin-Thai")
  • Официальный сайт ИСО
  • Правила транслитерации на Unicode.org [ постоянная неработающая ссылка ]
  • Романизация тайских топонимов в базе данных KNAB Института эстонского языка
Взято с "https://en.wikipedia.org/w/index.php?title=ISO_11940&oldid=1237250562"