◌̈ ◌̤ | |
---|---|
Две точки | |
|
Диакритические знаки из двух точек ¨ , расположенных рядом над или под буквой, используются в нескольких языках для различных целей. Наиболее знакомыми для носителей английского языка являются диэрезис и умлаут , хотя есть и множество других. Например, в албанском языке ë представляет собой шва . Такие диакритические знаки также иногда используются по стилистическим причинам (как в фамилии Бронте или названии группы Mötley Crüe ).
В современных компьютерных системах, использующих Unicode , двухточечные диакритические знаки почти всегда кодируются одинаково, имея одинаковую кодовую точку . [1] Например, U+00F6 ö ЛАТИНСКАЯ СТРОЧНАЯ БУКВА O С ДИАЭРЕЗОЙ представляет как o-умляут, так и o-диарезис . Их внешний вид в печати или на экране может различаться в разных гарнитурах , но редко в пределах одной гарнитуры.
Слово «трема» ( фр . tréma ), используемое в лингвистике и классической науке , описывает форму как диакритического знака умлаута, так и диэрезиса, а не их функцию, и используется в этих контекстах для обозначения того и другого.
Как диакритический знак «диерезис», он используется для обозначения разделения двух отдельных гласных в соседних слогах, когда встречается диерезис (или хиатус) , чтобы отличить его от диграфа или дифтонга . Например, в устаревшем написании «coöperate» диерезис напоминал читателю, что слово имеет четыре слога co-op-er-ate , а не три. Он используется в нескольких языках Западной и Южной Европы, хотя сейчас редко в английском языке. [2] Одно из известных его применений — во французском языке — диерезис используется в слове naïve, которое в английском языке обычно пишется без диерезиса. Однако во французском языке обязательно указывать, что оно произносится как [na.iv], а не [nev].
Как диакритический знак «умлаут», он обозначает звуковой сдвиг — также известный как умлаут — при котором гласный заднего ряда становится гласным переднего ряда . Это специфическая черта немецкого и других германских языков, влияющая на графемы ⟨a⟩ , ⟨o⟩ , ⟨u⟩ и ⟨au⟩ , которые модифицируются в ⟨ ä ⟩ , ⟨ ö ⟩ , ⟨ ü ⟩ и ⟨äu⟩ .
Он происходит от шрифта Зюттерлина , который ранее широко использовался в немецком рукописном письме, в котором буква e формируется в виде двух коротких параллельных вертикальных линий, расположенных очень близко друг к другу (см. в разделе Характеристики шрифта Зюттерлина ).
Диакритический знак в виде двух точек иногда используется и по чисто стилистическим причинам. Например, семья Бронте , чья фамилия произошла от гэльского языка и была англизирована как «Пранти» или «Бранти»: В какой-то момент отец сестёр, Патрик Бронте (урождённый Бранти), решил использовать альтернативное написание с диакритическим знаком трема над конечной ⟨e⟩ , чтобы указать, что имя состоит из двух слогов.
Аналогично « металлический умлаут » — это диакритический знак, который иногда используется без причины или в декоративных целях над буквами в названиях хард-рок- или хэви-метал -групп, например, Motörhead и Mötley Crüe , а также пародийных групп, таких как Spın̈al Tap .
Двойная точка также используется как диакритический знак в случаях, когда она не выполняет функции ни диэрезиса, ни умлаута. В Международном фонетическом алфавите (МФА) двойная точка над буквой используется для обозначения централизованной гласной , что больше похоже на умлаут, чем на диэрезис. В других языках она используется для обозначения долготы гласной, назализирования, тона и различных других случаев, когда диэрезис или умлаут были доступны типографически. МФА использует двойную точку под буквой для обозначения придыхательного (бормотания) голоса . [3] [b]
Якальтекский ( язык майя ) и малагасийский — одни из немногих языков, в которых есть двойная точка над буквой «n»; в обоих языках n̈ — это велярный носовой звук [ŋ] .
В удмуртском языке двойная точка также используется с согласными буквами ӝ [dʒ] (от ж [ʒ] ), ӟ [dʑ] (от з [z] ~ [ʑ] ) и ӵ [tʃ] (от ч [tɕ] ).
Когда различие важно, Ḧ и ẍ используются для представления [ħ] и [ɣ] в курдском алфавите курманджи (которые в противном случае представлены как "h" и "x"). Эти звуки заимствованы из арабского языка.
Ẅ и ÿ : Ÿ — это, как правило, гласный звук, но в тлингитском языке он используется как (полугласный) согласный [ɰ] (a [w] без использования губ) . Этот звук также встречается в прибрежном цимшианском языке , где он пишется как ẅ .
В ряде языков Вануату используются двойные точки на согласных, чтобы представлять лингволабиальные (или «апиколабиальные») фонемы в их орфографии. Так, Араки противопоставляет билабиальный p [p] лингволабиальному p̈ [t̼] ; билабиальный m [m] лингволабиальному m̈ [n̼] ; и билабиальный v [β] лингволабиальному v̈ [ð̼] .
Сенека использует ⟨s̈⟩ вместо [ʃ] .
В арабском языке буква ẗ используется в транслитерации ISO 233 для tāʾ marbūṭah [ة], используемой для обозначения женского рода в существительных и прилагательных.
В сирийском языке используется две точки над буквой, называемые Siyame, чтобы указать, что слово следует понимать как множественное число. Например, ܒܝܬܐ ( bayta ) означает «дом», а ܒܝ̈ܬܐ ( bayte ) означает «дома». Этот знак используется, особенно когда отсутствуют гласные знаки, которые могли бы различать эти две формы. Хотя происхождение Siyame отличается от происхождения знака диэрезиса, в современных компьютерных системах оба представлены одним и тем же символом Unicode. Однако это часто приводит к неправильной передаче сирийского текста.
В письме н'ко , используемом для записи языков манде в Западной Африке, используется двухточечный диакритический знак (среди прочих) для представления неродных звуков. Точки немного больше тех, которые используются для диэрезиса или умлаута.
В IPA указан «умлаут с нижним индексом», например, хинди [kʊm̤ar] «гончар»; [3] : 25 система латинизации ALA-LC предусматривает его использование и является одной из основных схем латинизации персидского языка (например, переводя ⟨ ض ⟩ как ⟨z̤⟩ ). Эта нотация использовалась для записи некоторых азиатских языков латинским шрифтом, например, Red Karen .
Двойная точка под гласной до сих пор используется в романизации восточноминьского языка в Фучжоу для обозначения измененного гласного звука; размещение диакритического знака-модификатора под гласной буквой упрощает его сочетание с тональными диакритическими знаками над буквой, как в слове Mìng-dĕ̤ng-ngṳ̄ («восточноминьский язык»).
Диакритические знаки 〮 и 〯 , известные как Bangjeom ( 방점; 傍點), использовались для обозначения тональных акцентов в хангыле для среднекорейского языка . Они писались слева от слога в вертикальном письме и над слогом в горизонтальном письме.
Кодировка символов обычно рассматривает умлаут и диарезис как один и тот же диакритический знак. Unicode называет их диарезисами, не делая никаких различий, хотя сам термин имеет более точное литературное значение. Например, U+00F6 ö ЛАТИНСКАЯ СТРОЧНАЯ БУКВА O С ДИЕРЕЗОЙ представляет как o-умлаут , так и o-диарезис , в то время как для представления всех таких случаев используются похожие коды.
Unicode кодирует ряд случаев «буквы с двумя диакритическими знаками» как предварительные символы , и они показаны ниже. (Unicode использует термин «Диаэрезис» для всех двухточечных диакритических знаков, независимо от фактического термина, используемого для рассматриваемого языка.) Кроме того, многие другие символы могут быть составлены с помощью возможности комбинирования символов , U+0308 ◌̈ ОБЪЕДИНЕНИЕ ДИАЭРЕЗЫ , которая может использоваться с любой буквой или другим диакритическим знаком для создания настраиваемого символа, но это не означает, что результат имеет какое-либо реальное применение, и не показан в таблице.
Как объединяющий символ U+0308 , так и предварительно составленные кодовые точки могут рассматриваться как умлаут или диэрезис в зависимости от контекста. Возможны составные диакритические знаки, например, U+01DA ǚ СТРОЧНАЯ ЛАТИНСКАЯ БУКВА U С ДИЭРЕЗОЙ И КАРОНОМ , используемые в качестве тональных знаков для Hanyu Pinyin , в котором используются как диакритический знак из двух точек, так и диакритический знак карона . И наоборот, когда буква, на которую нужно поставить ударение, — это ⟨i⟩ , диакритический знак заменяет букву , таким образом: ⟨ï⟩ .
Иногда необходимо различать знак умлаута и знак диэрезиса. Например, любой из них может встречаться в немецком имени . ISO/IEC JTC 1/SC 2/WG 2 рекомендует следующее для таких случаев: [6]
Тот же совет можно найти в официальном разделе часто задаваемых вопросов по Unicode. [7]
Начиная с версии 3.2.0, Unicode также предоставляет U+0364 ◌ͤ ОБЪЕДИНЕНИЕ СТРОЧНОЙ ЛАТИНСКОЙ БУКВЫ E, что позволяет создавать устаревшую типографику с умлаутом.
Unicode предоставляет объединяющую двойную точку ниже как U+0324 ◌̤ ОБЪЕДИНЯЮЩАЯ ДИАЭРЕЗА НИЖЕ .
Наконец, для использования со скриптом N'Ko есть U+07F3 ◌++ NKO ОБЪЕДИНЯЮЩАЯ ДВОЙНАЯ ТОЧКА НАД НИМИ .
ASCII , семибитный код с 95 «печатаемыми» символами, не предусматривает никаких диакритических знаков. Последующая стандартизация рассматривала ASCII как национальный вариант ISO/IEC 646 в США : французский, немецкий и другие национальные варианты переназначили несколько кодовых точек определенным гласным с диакритическими знаками в качестве предсоставных символов. Некоторые из этих вариантов также определяли последовательность e ,backspace, " как производящую ë , но немногие терминалы поддерживали это.
Последующая (восьмибитная) кодировка символов ISO 8859-1 включает буквы ä , ë , ï , ö , ü и их соответствующие заглавные формы, а также ÿ только в нижнем регистре , с добавлением Ÿ в пересмотренном издании ISO 8859-15 и Windows-1252 .
Кодировка символов обычно рассматривает умлаут и диарезис как один и тот же диакритический знак. Unicode называет их диарезисами, не делая никаких различий, хотя сам термин имеет более точное литературное значение. Например, U+00F6 ö ЛАТИНСКАЯ СТРОЧНАЯ БУКВА O С ДИЕРЕЗОЙ представляет как o-умлаут , так и o-диарезис , в то время как для представления всех таких случаев используются похожие коды.
В странах, где местные языки обычно включают буквы с диакритическими знаками, местные клавиатуры обычно гравируются с этими символами. Если на клавиатуре нет букв с двойными точками, существует ряд способов ввести их в компьютерную систему. (Подробности см. в местных источниках, документации по компьютерной системе и в статье Ввод Unicode .)
Среди многих загадок The New Yorker есть этот забавный маленький умлаут над словами вроде coöperate и reëlect. The New Yorker, кажется, единственное издание на планете, которое его использует, и я всегда находил его немного претенциозным, пока не провел небольшое исследование. Оказывается, это не умлаут. Это диэрезис.