Две точки (диакритический знак)

Диакритический знак, состоящий из двух точек, расположенных над буквой.
◌̈ ◌̤
Две точки
  • U+0308 ◌̈ ОБЪЕДИНЕНИЕ ДИЭРЕЗЫ [a]
  • U+0324 ◌̤ ОБЪЕДИНЕНИЕ ДИЭРЕЗЫ НИЖЕ
  • U+07F3 ...

Диакритические знаки из двух точек ¨ , расположенных рядом над или под буквой, используются в нескольких языках для различных целей. Наиболее знакомыми для носителей английского языка являются диэрезис и умлаут , хотя есть и множество других. Например, в албанском языке ë представляет собой шва . Такие диакритические знаки также иногда используются по стилистическим причинам (как в фамилии Бронте или названии группы Mötley Crüe ).

В современных компьютерных системах, использующих Unicode , двухточечные диакритические знаки почти всегда кодируются одинаково, имея одинаковую кодовую точку . [1] Например, U+00F6 ö ЛАТИНСКАЯ СТРОЧНАЯ БУКВА O С ДИАЭРЕЗОЙ представляет как o-умляут, так и o-диарезис . Их внешний вид в печати или на экране может различаться в разных гарнитурах , но редко в пределах одной гарнитуры.

Слово «трема» ( фр . tréma ), используемое в лингвистике и классической науке , описывает форму как диакритического знака умлаута, так и диэрезиса, а не их функцию, и используется в этих контекстах для обозначения того и другого.

Использует

Диарезис

Как диакритический знак «диерезис», он используется для обозначения разделения двух отдельных гласных в соседних слогах, когда встречается диерезис (или хиатус) , чтобы отличить его от диграфа или дифтонга . Например, в устаревшем написании «coöperate» диерезис напоминал читателю, что слово имеет четыре слога co-op-er-ate , а не три. Он используется в нескольких языках Западной и Южной Европы, хотя сейчас редко в английском языке. [2] Одно из известных его применений — во французском языке — диерезис используется в слове naïve, которое в английском языке обычно пишется без диерезиса. Однако во французском языке обязательно указывать, что оно произносится как [na.iv], а не [nev].

Умляут

Как диакритический знак «умлаут», он обозначает звуковой сдвиг  — также известный как умлаут  — при котором гласный заднего ряда становится гласным переднего ряда . Это специфическая черта немецкого и других германских языков, влияющая на графемы ⟨a⟩ , ⟨o⟩ , ⟨u⟩ и ⟨au⟩ , которые модифицируются в ä , ö , ü и ⟨äu⟩ .

Он происходит от шрифта Зюттерлина , который ранее широко использовался в немецком рукописном письме, в котором буква e формируется в виде двух коротких параллельных вертикальных линий, расположенных очень близко друг к другу (см. в разделе Характеристики шрифта Зюттерлина ).

Стилистическое использование

Диакритический знак в виде двух точек иногда используется и по чисто стилистическим причинам. Например, семья Бронте , чья фамилия произошла от гэльского языка и была англизирована как «Пранти» или «Бранти»: В какой-то момент отец сестёр, Патрик Бронте (урождённый Бранти), решил использовать альтернативное написание с диакритическим знаком трема над конечной ⟨e⟩ , чтобы указать, что имя состоит из двух слогов.

Аналогично « металлический умлаут » — это диакритический знак, который иногда используется без причины или в декоративных целях над буквами в названиях хард-рок- или хэви-метал -групп, например, Motörhead и Mötley Crüe , а также пародийных групп, таких как Spın̈al Tap .

Другие варианты использования по языку

Двойная точка также используется как диакритический знак в случаях, когда она не выполняет функции ни диэрезиса, ни умлаута. В Международном фонетическом алфавите (МФА) двойная точка над буквой используется для обозначения централизованной гласной , что больше похоже на умлаут, чем на диэрезис. В других языках она используется для обозначения долготы гласной, назализирования, тона и различных других случаев, когда диэрезис или умлаут были доступны типографически. МФА использует двойную точку под буквой для обозначения придыхательного (бормотания) голоса . [3] [b]

Гласные

Согласные

Якальтекский ( язык майя ) и малагасийский — одни из немногих языков, в которых есть двойная точка над буквой «n»; в обоих языках — это велярный носовой звук [ŋ] .

В удмуртском языке двойная точка также используется с согласными буквами ӝ [dʒ] (от ж [ʒ] ), ӟ [dʑ] (от з [z] ~ [ʑ] ) и ӵ [tʃ] (от ч [tɕ] ).

Когда различие важно, и используются для представления [ħ] и [ɣ] в курдском алфавите курманджи (которые в противном случае представлены как "h" и "x"). Эти звуки заимствованы из арабского языка.

и ÿ : Ÿ — это, как правило, гласный звук, но в тлингитском языке он используется как (полугласный) согласный [ɰ] (a [w] без использования губ) . Этот звук также встречается в прибрежном цимшианском языке , где он пишется как ẅ .

В ряде языков Вануату используются двойные точки на согласных, чтобы представлять лингволабиальные (или «апиколабиальные») фонемы в их орфографии. Так, Араки противопоставляет билабиальный p [p] лингволабиальному [t̼] ; билабиальный m [m] лингволабиальному [n̼] ; и билабиальный v [β] лингволабиальному [ð̼] .

Сенека использует ⟨s̈⟩ вместо [ʃ] .

В арабском языке буква используется в транслитерации ISO 233 для tāʾ marbūṭah [ة], используемой для обозначения женского рода в существительных и прилагательных.

В сирийском языке используется две точки над буквой, называемые Siyame, чтобы указать, что слово следует понимать как множественное число. Например, ܒܝܬܐ ( bayta ) означает «дом», а ܒܝ̈ܬܐ ( bayte ) означает «дома». Этот знак используется, особенно когда отсутствуют гласные знаки, которые могли бы различать эти две формы. Хотя происхождение Siyame отличается от происхождения знака диэрезиса, в современных компьютерных системах оба представлены одним и тем же символом Unicode. Однако это часто приводит к неправильной передаче сирийского текста.

В письме н'ко , используемом для записи языков манде в Западной Африке, используется двухточечный диакритический знак (среди прочих) для представления неродных звуков. Точки немного больше тех, которые используются для диэрезиса или умлаута.

Диакритический знак внизу

В IPA указан «умлаут с нижним индексом», например, хинди [kʊm̤ar] «гончар»; [3] : 25  система латинизации ALA-LC предусматривает его использование и является одной из основных схем латинизации персидского языка (например, переводя ض как ⟨z̤⟩ ). Эта нотация использовалась для записи некоторых азиатских языков латинским шрифтом, например, Red Karen .

Двойная точка под гласной до сих пор используется в романизации восточноминьского языка в Фучжоу для обозначения измененного гласного звука; размещение диакритического знака-модификатора под гласной буквой упрощает его сочетание с тональными диакритическими знаками над буквой, как в слове Mìng-dĕ̤ng-ngṳ̄ («восточноминьский язык»).

Боковые точки

Диакритические знаки и  , известные как Bangjeom ( 방점; 傍點), использовались для обозначения тональных акцентов в хангыле для среднекорейского языка . Они писались слева от слога в вертикальном письме и над слогом в горизонтальном письме.

Компьютерные кодировки

В Юникоде

Кодировка символов обычно рассматривает умлаут и диарезис как один и тот же диакритический знак. Unicode называет их диарезисами, не делая никаких различий, хотя сам термин имеет более точное литературное значение. Например, U+00F6 ö ЛАТИНСКАЯ СТРОЧНАЯ БУКВА O С ДИЕРЕЗОЙ представляет как o-умлаут , так и o-диарезис , в то время как для представления всех таких случаев используются похожие коды.

Unicode кодирует ряд случаев «буквы с двумя диакритическими знаками» как предварительные символы , и они показаны ниже. (Unicode использует термин «Диаэрезис» для всех двухточечных диакритических знаков, независимо от фактического термина, используемого для рассматриваемого языка.) Кроме того, многие другие символы могут быть составлены с помощью возможности комбинирования символов , U+0308 ◌̈ ОБЪЕДИНЕНИЕ ДИАЭРЕЗЫ , которая может использоваться с любой буквой или другим диакритическим знаком для создания настраиваемого символа, но это не означает, что результат имеет какое-либо реальное применение, и не показан в таблице.

Как объединяющий символ U+0308 , так и предварительно составленные кодовые точки могут рассматриваться как умлаут или диэрезис в зависимости от контекста. Возможны составные диакритические знаки, например, U+01DA ǚ СТРОЧНАЯ ЛАТИНСКАЯ БУКВА U С ДИЭРЕЗОЙ И КАРОНОМ , используемые в качестве тональных знаков для Hanyu Pinyin , в котором используются как диакритический знак из двух точек, так и диакритический знак карона . И наоборот, когда буква, на которую нужно поставить ударение, — это ⟨i⟩ , диакритический знак заменяет букву , таким образом: ⟨ï⟩ .

Иногда необходимо различать знак умлаута и знак диэрезиса. Например, любой из них может встречаться в немецком имени . ISO/IEC JTC 1/SC 2/WG 2 рекомендует следующее для таких случаев: [6]

  • Для представления умлаута используйте соединительную диэрезису (U+0308)
  • Для представления диэрезиса используйте Соединитель графем (CGJ, U+034F) + Соединительный диэрезис (U+0308)

Тот же совет можно найти в официальном разделе часто задаваемых вопросов по Unicode. [7]

Начиная с версии 3.2.0, Unicode также предоставляет U+0364 ◌ͤ ОБЪЕДИНЕНИЕ СТРОЧНОЙ ЛАТИНСКОЙ БУКВЫ E, что позволяет создавать устаревшую типографику с умлаутом.

Unicode предоставляет объединяющую двойную точку ниже как U+0324 ◌̤ ОБЪЕДИНЯЮЩАЯ ДИАЭРЕЗА НИЖЕ .

Наконец, для использования со скриптом N'Ko есть U+07F3 ◌++ NKO ОБЪЕДИНЯЮЩАЯ ДВОЙНАЯ ТОЧКА НАД НИМИ .

До Unicode

ASCII , семибитный код с 95 «печатаемыми» символами, не предусматривает никаких диакритических знаков. Последующая стандартизация рассматривала ASCII как национальный вариант ISO/IEC 646 в США : французский, немецкий и другие национальные варианты переназначили несколько кодовых точек определенным гласным с диакритическими знаками в качестве предсоставных символов. Некоторые из этих вариантов также определяли последовательность e ,backspace, " как производящую ë , но немногие терминалы поддерживали это.

Последующая (восьмибитная) кодировка символов ISO 8859-1 включает буквы ä , ë , ï , ö , ü и их соответствующие заглавные формы, а также ÿ только в нижнем регистре , с добавлением Ÿ в пересмотренном издании ISO 8859-15 и Windows-1252 .

Использование компьютера

Буквы с умлаутом на немецкой компьютерной клавиатуре .

Кодировка символов обычно рассматривает умлаут и диарезис как один и тот же диакритический знак. Unicode называет их диарезисами, не делая никаких различий, хотя сам термин имеет более точное литературное значение. Например, U+00F6 ö ЛАТИНСКАЯ СТРОЧНАЯ БУКВА O С ДИЕРЕЗОЙ представляет как o-умлаут , так и o-диарезис , в то время как для представления всех таких случаев используются похожие коды.

В странах, где местные языки обычно включают буквы с диакритическими знаками, местные клавиатуры обычно гравируются с этими символами. Если на клавиатуре нет букв с двойными точками, существует ряд способов ввести их в компьютерную систему. (Подробности см. в местных источниках, документации по компьютерной системе и в статье Ввод Unicode .)

Смотрите также

Примечания

  1. ^ Диакритический знак в Unicode обозначается как диэрезис, без каких-либо различий, хотя этот термин имеет более точное литературное значение.
  2. ^ В Справочнике IPA этот знак называется «нижний индексный умлаут», в отличие от выбора Консорциума Unicode, который называет его «треаэрезисом снизу».

Ссылки

  1. The Unicode Standard v 5.0 . Сан-Франциско: Addison-Wesley. 2006. стр. 228. ISBN 0-321-48091-0.
  2. ^ Baum, Dan (16 декабря 2010 г.). «Странный знак The New Yorker — диэрезис». Dscriber . Торговые секреты. Архивировано из оригинала 16 декабря 2010 г. Среди многих загадок The New Yorker есть этот забавный маленький умлаут над словами вроде coöperate и reëlect. The New Yorker, кажется, единственное издание на планете, которое его использует, и я всегда находил его немного претенциозным, пока не провел небольшое исследование. Оказывается, это не умлаут. Это диэрезис.
  3. ^ ab Международная фонетическая ассоциация (2021). Справочник Международной фонетической ассоциации: руководство по использованию Международного фонетического алфавита . Кембридж: Издательство Кембриджского университета. ISBN 9780521652360..
  4. ^ "Māori Orthographic Conventions". Комиссия по языку маори. Архивировано из оригинала 2009-09-06 . Получено 11 июня 2010 .
  5. ^ «Язык маори в Интернете» . Те Ара: Энциклопедия Новой Зеландии .
  6. Каплан, Майкл С. (4 сентября 2006 г.). «У каждого персонажа есть история #24: U+0308 (ОБЪЕДИНЕНИЕ ДИЭРЕЗИСА)».
  7. ^ «Символы и знаки комбинирования | В: Unicode, похоже, не различает трему и умлаут, но мне нужно различать. Что мне делать?». Консорциум Unicode.
Взято с "https://en.wikipedia.org/w/index.php?title=Две_точки_(диакритический знак)&oldid=1266310902"