Подстрочные и надстрочные индексы Unicode

Глифы знаменателя и числителя Unicode

Разница между надстрочными/подстрочными глифами и глифами числителя/знаменателя. Во многих популярных компьютерных шрифтах символы «надстрочного» и «подстрочного» индекса Unicode на самом деле являются глифами числителя и знаменателя.

В Unicode имеются подстрочные и надстрочные версии ряда символов, включая полный набор арабских цифр . [1] Эти символы позволяют представлять любые полиномиальные , химические и некоторые другие уравнения в виде обычного текста без использования какой-либо формы разметки, такой как HTML или TeX .

Консорциум Всемирной паутины и Консорциум Unicode дали рекомендации по выбору между использованием разметки и использованием надстрочных и подстрочных символов:

При использовании в математическом контексте ( MathML ) рекомендуется последовательно использовать стилистическую разметку для надстрочных и подстрочных индексов […] Однако, когда надстрочные и подстрочные индексы должны отражать семантические различия, проще работать с этими значениями, закодированными в тексте, а не с разметкой, например, в фонетической или фонематической транскрипции . [2]

Использует

Предполагаемое использование [2] при добавлении этих символов в Unicode состояло в создании настоящих верхних и нижних индексов, чтобы химические и алгебраические формулы могли быть записаны без разметки. Таким образом, "H₂O" (используя символ нижнего индекса 2) должен быть идентичен "H 2 O" (с разметкой нижнего индекса).

В действительности, многие шрифты, включающие эти символы, игнорируют определение Unicode и вместо этого разрабатывают цифры для математических глифов числителя и знаменателя , [3] [4], которые выровнены с линией заглавной буквы и базовой линией соответственно. При использовании с солидусом эти глифы являются обычной заменой диагональных дробей, таких как ³/₄ для глифа ¾. Это изменение было сделано, поскольку использование разметки не дает хорошего графического приближения дробей (сравните разметку 3 / 4 с предварительно составленным ¾). Изменение также делает надстрочные буквы полезными для порядковых указателей , более точно соответствуя символам ª и º. Однако это делает их некорректными для обычных надстрочных и подстрочных индексов, и поэтому химические и алгебраические формулы лучше отображаются с использованием разметки.

Сравнение отображения надстрочных и подстрочных знаков в различных шрифтах в Unicode и HTML [5]
ШрифтЮникодHTML
Шрифт браузера по умолчаниюх², х₂х 2 , х 2
Андиках², х₂х 2 , х 2
Арно Прох², х₂х 2 , х 2
Бриллх², х₂х 2 , х 2
Бриозо Прох², х₂х 2 , х 2
Калибрих², х₂х 2 , х 2
Чандарах², х₂х 2 , х 2
Карлитох², х₂х 2 , х 2
Кантареллх², х₂х 2 , х 2
ФираГОх², х₂х 2 , х 2
ЭБ Гарамондх², х₂х 2 , х 2
Книга Гентиумх², х₂х 2 , х 2
Латох², х₂х 2 , х 2
Linux Libertineх², х₂х 2 , х 2
Ното Сансх², х₂х 2 , х 2
Noto Serifх², х₂х 2 , х 2
Открытый Сансх², х₂х 2 , х 2
Убунтух², х₂х 2 , х 2
Ирсах², х₂х 2 , х 2

Unicode подразумевает, что диагональные дроби будут отображаться с помощью другого механизма: дробная косая черта U+2044 визуально похожа на косую черту, но при использовании с обычными цифрами (не надстрочными и подстрочными индексами) она указывает системе макета, что дробь, например ¾, должна отображаться с использованием автоматической подстановки глифов. [6] [a] Поддержка на стороне пользователя была довольно плохой в течение ряда лет, но шрифты, браузеры, [b] текстовые процессоры, [c] программное обеспечение для настольных издательских систем [d] и другие все больше поддерживают предполагаемое поведение Unicode. Этот браузер и ваш шрифт по умолчанию отображают его как 3⁄4. (См. Slash (пунктуация)#Fractions для отображения в различных других шрифтах.)

Блок надстрочных и подстрочных индексов

Наиболее распространенные надстрочные цифры (1, 2 и 3) были включены в ISO-8859-1 и, следовательно, были перенесены в эти кодовые точки в диапазоне Latin-1 Unicode. Остальные были помещены вместе с основными арифметическими символами, а позже и некоторыми латинскими подстрочными индексами, в выделенный блок с U+ 2070 по U+209F. В таблице ниже эти символы показаны вместе. Каждому надстрочному или подстрочному символу предшествует базовая линия x, показывающая высоту подстрочного/надстрочного индекса.

символы Юникода
0123456789АБСДЭФ
У+00Бxх²х³х¹
У+207xх⁰хⁱх⁴х⁵х⁶х⁷х⁸х⁹х⁺х⁻х⁼х⁽х⁾хⁿ
У+208xх₀х₁х₂х₃х₄х₅х₆х₇х₈х₉х₊х₋х₌х₍х₎
У+209xхₐхₑхₒхₓхₔхₕхₖхₗхₘхₙхₚхₛхₜх₝х₞х₟
  Зарезервировано для будущего использования.
  Другие символы Latin-1, не относящиеся к надстрочным или подстрочным индексам.

Другие надстрочные и подстрочные символы

Unicode также включает кодовые точки для надстрочных и подстрочных символов, предназначенных для семантического использования, в следующих блоках: [1] [7]

Надстрочный индекс
Объединение надстрочных знаков
  • Блок Combining Diacritical Marks содержит средневековые надстрочные диакритические знаки. Эти буквы пишутся непосредственно над другими буквами, встречающимися в средневековых германских рукописях, поэтому эти глифы не включают пробел, например uͤ. Здесь они показаны над точечным кругом- заполнителем ◌: ◌ͣ ◌ͤ ◌ͥ ◌ͦ ◌ͧ ◌ͨ ◌ͩ ◌ͪ ◌ͫ ◌ͬ ◌ͭ ◌ͮ ◌ͯ.
  • Расширенный блок «Комбинированные диакритические знаки» содержит три комбинируемые островные буквы для среднеанглийского ормулума , ◌ᫌ ◌ᫍ ◌ᫎ. [8]
  • Блок «Комбинированные диакритические знаки» содержит дополнительные средневековые надстрочные диакритические знаки, достаточные для завершения основного строчного латинского алфавита, за исключением j, q и y, нескольких маленьких заглавных букв и лигатур (ae, ao, av) и дополнительных букв: ◌᷒ ◌ᷓ ◌ᷔ ◌ᷕ ◌ᷖ ◌ᷗ ◌ᷘ ◌ᷙ ◌ᷚ ◌ᷛ ◌ᷜ ◌ᷝ ◌ᷞ ◌ᷟ ◌ᷠ ◌ᷡ ◌ᷢ ◌ᷣ ◌ᷤ ◌ᷥ ◌ᷦ ◌ᷧ ◌ᷨ ◌ᷪ ◌ᷫ ◌ᷬ ◌ᷭ ◌ᷮ ◌ᷯ ◌ᷰ ◌ᷱ ◌ᷲ ◌ᷳ ◌ᷴ, греческий ◌ᷩ.
  • Блоки Cyrillic Extended-A и -B содержат несколько средневековых надстрочных буквенных диакритических знаков, достаточных для завершения основного строчного кириллического алфавита, используемого в церковнославянских текстах, а также включают дополнительную лигатуру (ст): ◌ⷠ ◌ⷡ ◌ⷢ ◌ⷣ ◌ⷤ ◌ⷥ ◌ⷦ ◌ⷧ ◌ⷨ ◌ⷩ ◌ⷪ ◌ⷫ ◌ⷬ ◌ⷭ ◌ⷮ ◌ⷯ ◌ⷰ ◌ⷱ ◌ⷲ ◌ⷳ ◌ⷴ ◌ⷵ ◌ⷶ ◌ⷷ ◌ⷸ ◌ⷹ ◌ⷺ ◌ⷻ ◌ⷼ ◌ⷽ ◌ⷾ ◌ⷿ ◌ꙴ ◌ꙵ ◌ꙶ ◌ꙷ ◌ꙸ ◌ꙹ ◌ꙺ ◌ꙻ ◌ꚞ ◌ꚟ.
  • Блок кириллицы Extended-D имеет один дополнительный объединяющий символ — і: ◌𞂏.
Подстрочный индекс
  • Блок расширенной латиницы-C содержит один нижний индекс ⱼ.
  • Блок фонетических расширений содержит несколько подстрочных букв и символов: латинские/IPA ᵢ ᵣ ᵤ ᵥ и греческие ᵦ ᵧ ᵨ ᵩ ᵪ.
  • Блок Cyrillic Extended-D также содержит множество кириллических индексов: 𞁑 𞁒 𞁓 𞁔 𞁕 𞁖 𞁗 𞁘 𞁙 𞁚 𞁛 𞁜 𞁝 𞁞 𞁟 𞁠 𞁡 𞁢 𞁣 𞁤 𞁥 𞁦 𞁧 𞁨 𞁩 𞁪.
Объединение нижнего индекса

Таблицы латиницы, греческого, кириллицы и МФА

В консолидированном виде стандарт Unicode содержит надстрочные и подстрочные версии подмножества латинских, греческих и кириллических букв. Здесь они расположены в алфавитном порядке для сравнения (или для удобства копирования и вставки). Поскольку эти символы появляются в разных диапазонах Unicode, они могут не иметь одинакового размера или положения из-за подстановки шрифтов браузером. Затененные ячейки обозначают маленькие заглавные буквы, которые не очень отличаются от минускулов, и греческие буквы, которые неотличимы от латинских, и поэтому не должны поддерживаться Unicode.

Мало знаков препинания кодируется. Скобки показаны выше в базовом блоке выше, а восклицательный знак ⟨ ⟩ показан в таблице IPA ниже. Вопросительный знак может быть создан с помощью надстрочного гелевого вопросительного знака и объединяющей точки: ⟨ ˀ̣ ⟩, хотя некоторые шрифты не отображают его правильно.

Латинские надстрочные и подстрочные буквы
АБСДЭФГЧАСяДж.КЛМНОПВРСТУВВтХИЗ
Верхний индекс заглавныйᴿ*
Верхний индекс, малая прописная буква*𐞄**𐞒𐞖*𐞪𐞲
Надстрочный минускулʰʲˡ𐞥ʳˢʷˣʸ
Надпись малая прописная◌ᷛ◌ᷞ◌ᷟ◌ᷡ◌ᷢ
Надстрочный минускул◌ͣ◌ᷨ◌ͨ◌ͩ◌ͤ◌ᷫ◌ᷚ◌ͪ◌ͥ◌ᷜ◌ᷝ◌ͫ◌ᷠ◌ͦ◌ᷮ◌ͬ◌ᷤ◌ͭ◌ͧ◌ͮ◌ᷱ◌ͯ◌ᷦ
Нижний индекс минускул***
Подстрочный минускул◌᷊◌ᪿ

Дополнительные заглавные буквы верхнего индекса — ᴭ ᴯ ᴲ ᴻ. Некоторые из них являются малыми заглавными буквами в исходных документах предложений Unicode.
Заглавная буква верхнего индекса S была предложена для будущей версии стандарта Unicode . [9] [10]
*Версии верхнего индекса S, малых заглавных A, D, E и P, а также версии нижнего индекса w, y и z были предложены для будущей версии стандарта Unicode. [11] [12] [10]

Греческие надстрочные и подстрочные буквы
АБГΔЭΖΗΘІКΛМΝΞΟППΣТΥФΧΨΩ
Надстрочный минускул[А]ᶿ[А]
Надстрочный минускул[А]◌ᷩ
Нижний индекс минускулͺ [13]
Подстрочный минускул◌ͅ◌̫ [14]
  1. ^ abc В некоторых шрифтах латинская альфа ᵅ и ипсилон ᶹ могут использоваться в качестве надстрочных греческих букв альфа и ипсилон. ᵋ и ᶥ также официально являются латинскими буквами, но отображаются так же, как греческие.

Для будущей версии стандарта Unicode были предложены надстрочные версии греческих букв psi и omega. [11] [10]

Кириллические надстрочные и подстрочные буквы
АӘБВГҐДЕЄЖЗЅИІЇЈКЛМНОӨПРСҪ
Надстрочный индекс🀰🞁🀱🀲🀳𞀴🀵🀶𞀷🞁🀸🞁𞁌̈🞁𞀹🞀�🞀�𞀼🞁�😉😉𞀿🞁
Надпись◌ⷶ◌ⷠ◌ⷡ◌ⷢ◌ⷣ◌ⷷ◌ꙴ◌ⷤ◌ⷥ◌ꙵ◌🞂�◌ꙶ◌ⷦ◌ⷧ◌ⷨ◌ⷩ◌ⷪ◌ⷫ◌ⷬ◌ⷭ
Подстрочный индекс🞁🞁🞁🞁💥🞁🞁🞁🞁�🞁🞁🞁𞁨̈🞁🞁🞁🞁🞁
ТУҮҰФХѠЦЧЏШЩЪЫЬѢЭЮѤѦяяѲӀ
Надстрочный индекс🞁💜🞁🞁🞁🞁💜🞁🞁🞁🞁💜🞁🞁
Надпись◌ⷮ◌ꙷ◌ⷹ◌ꚞ◌ⷯ◌ꙻ◌ⷰ◌ⷱ◌ⷲ◌ⷳ◌ꙸ◌ꙹ◌ꙺ◌ⷺ◌ⷻ◌ⷼ◌ꚟ◌ⷽ◌ⷾ◌ⷿ◌ⷴ
Подстрочный индекс🞁😉🞁🞁😉💪😉🞁🞁

Многие символы кириллицы были добавлены в блок Cyrillic Extended-D , который был добавлен в бесплатные шрифты Gentium Plus и Andika с версией 6.2 в феврале 2023 года.

См. также малые заглавные буквы в Unicode .

Надстрочный индекс IPA

Блок Latin Extended-F был создан для оставшихся надстрочных букв IPA . Они поддерживаются бесплатными шрифтами Gentium Plus и Andika . Дополнительные надстрочные символы для исторических и пара-IPA букв были предложены для будущих версий стандарта Unicode. [12] [10]

Согласные буквы

Символы Unicode для надстрочных (модификаторных) согласных букв IPA и extIPA следующие. Весь блок Latin Extended-F посвящен надстрочным буквам IPA. Символы для звуков со вторичной артикуляцией заключены в скобки и размещены под базовыми буквами.

Согласные IPA и extIPA, а также надстрочные варианты и их коды Unicode
БилабиальныйЛабиодентальныйСтоматологическийАльвеолярныйПостальвеолярныйРетрофлексПалатальныйВелярныйязычковыйГлоточныйГортанная щель
носовойм ᵐ
1D50
ɱ ᶬ
1DAC
н ⁿ
207F
( )
 
 
( ȵ )
ɳ ᶯ
1DAF
ɲ ᶮ
1DAE
ŋ ᵑ
1D51
ɴ ᶰ
1DB0
Взрывнойп ᵖ
1D56
б ᵇ
1D47
т ᵗ
1D57
( ƫ ᶵ )
1DB5
д ᵈ
1D48
( )
 
 
( ȶ )
 
 
( ȡ )
ʈ 𐞯
107AF
ɖ 𐞋
1078B
с ᶜ
1D9C
ɟ ᶡ
1DA1
к ᵏ
1D4F
ɡ ᶢ / г ᵍ
1DA2/1D4D
д 𐞥
107A5
ɢ 𐞒
10792
ʡ 𐞳
107B3
ʔ ˀ
02C0
Аффрикатаʦ 𐞬
107AC
ʣ 𐞇
10787
ʧ 𐞮
107AE
( ʨ 𐞫 )
107AB
ʤ 𐞊
1078A
( ʥ 𐞉 )
10789
ꭧ 𐞭
107 г. н.э.
( 𝼜 )
ꭦ 𐞈
10788
( 𝼙 )
Фрикативныйɸ ᶲ
1DB2
β ᵝ
1D5D
ф ᶠ
1DA0
v ᵛ
1D5B
θ ᶿ
1DBF
ð ᶞ
1D9E
с ˢ
02E2
( )
z ᶻ
1DBB
( )
ʃ ᶴ
1DB4
( ɕ ᶝ )
1D9D
ʒ ᶾ
1DBE
( ʑ ᶽ )
1DBD
ʂ ᶳ
1DB3
( )
ʐ ᶼ
1DBC
( )
ç ᶜ̧
1D9C + 0327 [e]
ʝ ᶨ
1DA8
x ˣ
02E3
( ɧ 𐞗 )
10797
ɣ ˠ
02E0
χ ᵡ
1D61
ʁ ʶ
02B6
ħ 𐞕
10795
( ʩ 𐞐 )
10790
ʕ ˤ
02E4 [ж]
h ʰ
02B0
( )
ɦ ʱ
02B1
Аппроксимантʋ ᶹ
1DB9
ɹ ʴ
02B4
ɻ ʵ
02B5
j ʲ
02B2
( ɥ ᶣ )
1DA3
 
 
( ʍ ꭩ )
AB69
ɰ ᶭ
1DAD
( w ʷ )
02B7
Кран/заслонкаⱱ 𐞰
107B0
ɾ 𐞩
107A9
ɽ 𐞨
107A8
Трельб 𐞄
10784
г ʳ
02B3
ʀ 𐞪
107AA
ʜ 𐞖
10796
ʢ 𐞴
107B4
Боковой фрикативныйɬ 𐞛
1079B
( ʪ 𐞙 )
10799
ɮ 𐞞
1079E
( ʫ 𐞚 )
1079A
ꞎ 𐞝
1079D
𝼅 𐞟
1079F
𝼆 𐞡
107A1
𝼄 𐞜
1079C
Боковая аппроксимациял ˡ
02E1
( ᶅ ᶪ )
1DAA
 
 
( ȴ )
ɭ ᶩ
1DA9
ʎ 𐞠
107A0
ʟ ᶫ
1DAB
( ɫ ꭞ ) [г]
AB5E
Боковой кран/заслонкаɺ 𐞦
107A6
𝼈 𐞧
107A7
Имплозивныйƥɓ 𐞅
10785
ƭɗ 𐞌
1078C
𝼉ᶑ 𐞍
1078D
ƈʄ 𐞘
10798
ƙɠ 𐞓
10793
ʠʛ 𐞔
10794
Нажмите кнопку «Отпустить»ʘ 𐞵
107B5
ǀ 𐞶
107B6
ʇǃ ꜝ
A71D
ʗ𝼊 𐞹
107B9
ψǂ 𐞸
107B8
𝼋( ʞ )
Боковой щелчок
для освобождения
ǁ 𐞷
107B7
ʖ
Ударный¡ ꜞ
A71E [ч]

Диакритический знак для отрезающих согласных U+2BC работает с надстрочными буквами, хотя сам по себе не является надстрочным: ⟨ ᵖʼ ᵗʼ ᶜʼ ᵏˣʼ ⟩. Если необходимо провести различие, можно использовать объединяющий апостроф U+315: ⟨ ᵖ̕ ᵗ̕ ᶜ̕ ᵏˣ̕ ⟩. Промежуточный диакритический знак следует использовать для базовой буквы с надстрочным освобождением, например, [tˢʼ] или [kˣʼ] , где область действия апострофа включает ненадстрочную букву, но объединяющий апостроф U+315 может использоваться для обозначения слабо артикулированного абруптивного согласного, например, [ᵗ̕] или [ᵏ̕] , где весь согласный пишется как надстрочный, или вместе с U+2BC, когда отдельные апострофы имеют область действия над базовой и модифицирующей буквами, как в ⟨ pʼᵏˣ̕ ⟩. [15]

Пробелы в виде диакритических знаков, как в ⟨ ⟩, не могут быть вторично надстрочными в обычном тексте: ⟨ ᵗʲ ⟩. (В этом случае старая буква МФА для [tʲ] , ⟨ ƫ ⟩, имеет надстрочный вариант в Unicode, U+1DB5 ⟨ ⟩, но это не всегда так.)

Среди старых букв, ⟨ ⟩ (U+A727) была графическим вариантом ⟨ ɮ ⟩. Ее надстрочный индекс поддерживается в ⟨ ⟩ (U+AB5C). Наиболее распространенные буквы с небным крючком также поддерживаются; они отображены в таблице выше. В МФА когда-то был своеобразный завиток на некоторых палатализованных буквах: это фрикативные буквы ⟨ ʆ ʓ ⟩. Их надстрочные формы были предложены для будущей версии стандарта Unicode. [12] [10] Устаревшие буквы ⟨ ƞ ⟩ и ⟨ ɼ ⟩ также были предложены для будущей версии стандарта Unicode. [12] [10]

Среди букв пара-IPA, надстрочные синологические ⟨ ȡ ȴ ȵ ȶ ⟩ были предложены для будущей версии стандарта Unicode. [11] [10] Надстрочные губно-зубные взрывные бантуистские ⟨ ȹ ⟩ и ⟨ ȸ ⟩ были предложены для будущей версии стандарта Unicode. [11] [10] Центральные полугласные ⟨ ɉ ⟩, ɥ̶ и также были предложены для будущей версии стандарта Unicode. [11] [10] [16]

Для будущей версии стандарта Unicode были предложены старые щелкающие буквы. [17] [10]

Гласные буквы

Символы Unicode для надстрочных (модификаторных) гласных букв IPA, а также пара расширенных букв ⟨ ᵿ ⟩, которые можно найти в английских словарях, приведены ниже. Недавно выведенные из употребления альтернативные буквы, такие как ⟨ ɩ ɷ ⟩, также поддерживаются; они заключены в скобки и размещены под стандартными буквами IPA:

Гласные IPA и варианты надстрочных знаков
ПереднийЦентральныйНазад
Закрыватья ⁱ
2071
у ʸ
02B8
ɨ ᶤ
1DA4
ʉ ᶶ
1DB6
ɯ ᵚ
1D5A
у ᵘ
1D58
Почти-близкоɪ ᶦ
1DA6
( ɩ ᶥ )
1DA5
ʏ 𐞲
107B2




( ᵻ ᶧ )
1DA7


( ᵿ )



( ω )

ʊ ᶷ
1DB7
( ɷ 𐞤 )
107A4
Близко-серединае ᵉ
1D49
ø 𐞢
107A2
ɘ 𐞎
1078E
ɵ ᶱ
1DB1
ɤ 𐞑
10791
о ᵒ
1D52
Серединаə ᵊ
1D4A
Открытый-среднийɛ ᵋ
1D4B
œ ꟹ
A7F9
ɜ ᶟ
1D9F
( ᴈ ᵌ )
1D4C
ɞ 𐞏
1078F
ʌ ᶺ
1DBA
ɔ ᵓ
1D53
Почти открытоæ 𐞃
10783
ɶ 𐞣
107A3
ɐ ᵄ
1D44
ɑ ᵅ
1D45
ɒ ᶛ
1D9B
Открытьа ᵃ
1D43

Составные ротические гласные буквы Unicode ⟨ ɚ ɝ ⟩ напрямую не поддерживаются. Вместо них следует использовать ротический диакритический знак U+02DE ◌˞ : ⟨ ᵊ˞ ᶟ˞ ⟩. [18]

ɜ ⟩ и ⟨ перевернуты ɛ . Более старая IPA, перевернутая ɛ , ⟨ ⟩, также поддерживается, на U+1D4C ⟨ ⟩. Однако, ненадолго воскрешенная гласная буква ⟨ ʚ ⟩ (U+029A) не поддерживается, поддерживается только ее перевернутая замена ⟨ ɞ ⟩.

Среди старых букв ⟨ ⟩ (U+1D1C), графический вариант ⟨ ʊ ⟩, поддерживается в ⟨ ⟩ (U+1DB8) [19] .

Среди букв пара-IPA для будущей версии стандарта Unicode были предложены синологические надстрочные символы ⟨ ɿ ʅ ʮ ʯ  ⟩. [11] [10] [16]

Длина отметок

Также поддерживаются две метки длины:

Длина отметок
ДлинныйПолудлинный
ː 𐞁
10781
ˑ 𐞂
10782

Они используются для добавления длины другому надстрочному индексу, например, ⟨ Cʰ𐞁 ⟩ или ⟨ Cʰ𐞂 ⟩ для долгого придыхания.

Универсальные символы

Поддерживаются в основном символы подстановки надстрочного индекса (полные заглавные буквы): например, ᴺC (преназализованный согласный), ꟲN (престопный носовой), Pꟳ (фрикативное освобождение), NᴾF (вставной взрывной), CVNᵀ (тононосный слог), Cᴸ (плавное или боковое освобождение), Cᴿ (ротическое или резонансное освобождение), Vᴳ (нескользящее/дифтонг), Cⱽ (мимолетная гласная). Символ подстановки надстрочного индекса S для свистящего освобождения был предложен для будущей версии стандарта Unicode; [16] [10] символ подстановки надстрочного индекса для мимолетного/вставного щелчка не был предложен. В основном поддерживаются другие основные латинские символы подстановки надстрочного индекса для тона и слабых неопределенных звуков, описанные в статье о Международном фонетическом алфавите . (См. таблицу в предыдущем разделе.)

Объединение знаков и индексов

Кроме того, очень немногие буквы МФА, выходящие за рамки основного латинского алфавита, имеют комбинационные формы или поддерживаются в качестве нижних индексов:

Дополнительные символы МФА
дɑæβçðəʃʍχʔʼ
Надпись◌ᷲ◌ᷧ◌ᷔ◌ᷩ◌ᷗ◌ᷙ◌ᷪ◌ᷯ◌̉ [я]◌̓
Подстрочный индекс
Подстрочный◌ᫀ◌̦

Составные персонажи

В первую очередь для совместимости с более ранними наборами символов Unicode содержит ряд символов, которые образуют надстрочные и подстрочные индексы с другими символами. [1] В большинстве шрифтов они отображаются гораздо лучше, чем попытки построить эти символы из вышеуказанных символов или с помощью разметки.

Примечания

  1. ^ Общий обзор и техническую информацию о замене глифов (но не конкретно для дробей) см. в GSUB — Таблица замены глифов в спецификации OpenType на сайте Microsoft Typography.
  2. ^ Такие как Chrome , Firefox и Falkon
  3. ^ Например, LibreOffice Writer
  4. ^ Такие как Adobe InDesign и Scribus
  5. ^ Надстрочный индекс ⟨ ç ⟩ состоит из надстрочного индекса c и комбинирующего седиля , который должен правильно отображаться в хорошем шрифте. Надстрочный индекс c был специально запрошен для этой цели в предложении Unicode L2/03-180.
  6. ^ U+02E4 ˤ БУКВА-МОДИФИКАТОР МАЛЕНЬКАЯ ПЕРЕВЕРНУТАЯ ГЛОТТАЛЬНАЯ СТОПКА — это надстрочный вариант U+0295 ʕ ЛАТИНСКАЯ БУКВА ГЛОТКОВАЯ ЗВОНОЧНАЯ ФРИКАТИВНАЯ и определена для использования в МФА. Похожий символ U+02C1 ˁ БУКВА-МОДИФИКАТОР ПЕРЕВЕРНУТАЯ ГЛОТТАЛЬНАЯ СТОПКА — это перевернутая U+02C0 ˀ БУКВА-МОДИФИКАТОР ГЛОТТАЛЬНАЯ СТОПКА , возможно, кастрированный перевернутый вопросительный знак. Шрифты непоследовательны в том, выглядят ли они по-разному и в чем разница.
  7. ^ В шрифтах Microsoft надстрочный индекс ⟨ ɫ ⟩ был ошибочно задуман как надстрочный индекс ⟨ ⟩.
  8. ^ U+A71D ⟨ ⟩ и A71E ⟨ ⟩ были приняты в качестве африканских эквивалентов символов IPA ⟨ downstep и ⟨ upstep . Соответствие U+A71D ⟨ ⟩ с клик-буквой IPA ⟨ ǃ ⟩ является, таким образом, случайным. По совпадению, U+A71E ⟨ ꜞ ⟩ служит в качестве надстрочного варианта ударного согласного extIPA ⟨ ¡ ⟩; другие ударные буквы, ⟨ ʬ ⟩ и ⟨ ʭ ⟩, не поддерживают надстрочный формат в Unicode.
  9. ^ На самом деле это вьетнамский диакритический знак dấu hỏi , а не конкретно IPA, но графически оба являются кастрированными вопросительными знаками.

Ссылки

  1. ^ abc "UCD: UnicodeData.txt". Стандарт Unicode . Получено 14 мая 2016 г.
  2. ^ ab Martin Dürst, Asmus Freytag (16 мая 2007 г.). "Unicode в XML и других языках разметки". W3C . Получено 13 сентября 2010 г. .
  3. ^ "fraction | Dart Package". Dart packages . 27 декабря 2021 г. Получено 21 сентября 2022 г.
  4. ^ "MathML | Общие элементы макета | Дроби". data2type GmbH (на немецком языке). 30 марта 2021 г. Получено 13 января 2022 г.[ мертвая ссылка ‍ ]
  5. ^ Все эти шрифты правильно поддерживают дробную косую черту U+2044.
  6. ^ Мартин Дюрст, Асмус Фрейтаг (16 мая 2007 г.). «Фракционный слэш». W3C . Проверено 13 сентября 2010 г.
  7. ^ "UCD: Scripts.txt". Стандарт Unicode . Получено 21 сентября 2022 г.
  8. ^ Эверсон, Майкл; Уэст, Эндрю (5 октября 2020 г.). «L2/20-268: Пересмотренное предложение о добавлении десяти символов для среднеанглийского языка в UCS» (PDF) .
  9. ^ Кирк Миллер (30 января 2024 г.). «L2/24-081: запрос Unicode для модификатора заглавной буквы S» (PDF) .
  10. ^ abcdefghijkl "Предлагаемые новые символы: таблица конвейеров". Unicode Consortium . 10 сентября 2024 г. Получено 21 сентября 2024 г.
  11. ^ abcdef Кирк Миллер (14 июня 2024 г.). "L2/24-147: Модификатор синологических расширений к МФА" (PDF) .
  12. ^ abcd Кирк Миллер (6 июня 2024 г.). "L2/24-171: Различные исторические и пара-IPA модификаторы букв" (PDF) .
  13. ^ ͺ ⟩ устанавливается ниже обычного нижнего индекса. Он эквивалентен нижнему индексу ⟨ ◌ͅ ⟩ на пробеле.
  14. ^ ◌̫ ⟩ традиционно набирается как омега.
  15. ^ Кирк Миллер и Майкл Эшби, L2/20-253R Запрос Unicode для букв-модификаторов МФА (b), нелегочных.
  16. ^ abc Кирк Миллер (30 января 2024 г.). "L2/24-081: Латинская фонетическая трель и строчные заглавные буквы" (PDF) .
  17. ^ Кирк Миллер (26 апреля 2024 г.). «L2/24-052R: запрос Unicode для модификатора pre-Kiel click letters» (PDF) .
  18. ^ Кирк Миллер и Майкл Эшби, L2/20-252R Запрос Unicode для букв-модификаторов МФА (a), легочный
  19. ^ Кирк Миллер (30 января 2024 г.). «L2/24-081: латинская фонетическая The для средней тильды» (PDF) .
  20. ^ Сильва, Эдуардо Марин (1 марта 2017 г.). «L2/17-066R: Предложение по кодированию знака Marca Registrada» (PDF) .
Взято с "https://en.wikipedia.org/w/index.php?title=Unicode_subscripts_and_superscripts&oldid=1272277944"