Стандарт Unicode присваивает различные свойства каждому символу и кодовой точке Unicode . [1] [2]
Свойства могут использоваться для обработки символов (кодовых точек) в процессах, таких как разрыв строки, направление письма справа налево или применение элементов управления. Некоторые «свойства символов» также определены для кодовых точек, которым не назначен символ, и кодовых точек, помеченных как «<не символ>». Свойства символов описаны в Стандартном приложении № 44. [2]
Свойства имеют уровни силы: нормативный, информативный, вспомогательный или предварительный. Для простоты спецификации свойство символа может быть назначено путем указания непрерывного диапазона кодовых точек, которые имеют то же свойство. [3]
Свойства отображаются в следующем порядке: [4]
[код];[имя];[gc];[cc];[bc];[разложение];[nv-dec];[nv-dig];[nv-num];[bm];[псевдоним];;[верхний регистр];[нижний регистр];[заглавный регистр]
Свойство между «псевдонимом» и «верхним регистром» устарело и теперь равно нулю для всех символов Unicode.
Первое свойство — это шестнадцатеричный код .
Символу Unicode присваивается уникальное Имя (na). [1] Имя состоит из заглавных букв A–Z, цифр 0–9, дефиса-минуса и пробела . Некоторые последовательности исключаются: имена, начинающиеся с пробела или дефиса, имена, заканчивающиеся пробелом или дефисом, повторяющиеся пробелы или дефисы, а также пробел после дефиса не допускаются. Имя гарантированно уникально в Unicode и может использоваться для идентификации кодовой точки и ее символа. Идеографические символы, которых десятки тысяч, именуются по шаблону " cjk unified ideograph - hhhh ". Например, U+4E00 一 CJK UNIFIED IDEOGRAPH-4E00 . Символы форматирования также именуются: U+00A0 NO-BREAK SPACE .
Следующие классы кодовых точек не имеют имени (na=""): элементы управления (общая категория: Cc), частное использование (Co), суррогат (Cs), несимволы (Cn) и зарезервированные (Cn). На них можно ссылаться неформально с помощью общего или специального мета-имени, называемого "метками кодовых точек": <control>, <control-0088>, <reserved>, <noncharacter- hhhh >, <private-use- hhhh > или <surrogate>. Поскольку эти метки содержат скобки <>, они никогда не могут отображаться как имя, что предотвращает путаницу.
В версии 2.0 Unicode многие имена были изменены. С этого момента вступило в силу правило «имя никогда не изменится», включая строгое (нормативное) использование псевдонимов. Неиспользуемые имена версии 1.0 были перемещены в свойство Alias, чтобы обеспечить некоторую обратную совместимость.
Начиная с версии Unicode 2.0, опубликованное имя для кодовой точки никогда не изменится. Поэтому в случае неправильного написания имени символа или если имя символа полностью неверно или серьезно вводит в заблуждение, символу может быть назначен формальный псевдоним имени символа , и этот псевдоним может использоваться приложениями вместо фактического дефектного имени символа. [1] Например, U+FE18 ︘ ФОРМА ПРЕДСТАВЛЕНИЯ ДЛЯ ВЕРТИКАЛЬНОЙ ПРАВОЙ БЕЛОЙ ДВУХСТОРОННЕЙ СКОБКИ имеет псевдоним имени символа " ФОРМА ПРЕДСТАВЛЕНИЯ ДЛЯ ВЕРТИКАЛЬНОЙ ПРАВОЙ БЕЛОЙ ДВУХСТОРОННЕЙ СКОБКИ " для того, чтобы смягчить неправильное написание "bracket" как "brakcet" [ sic ] в фактическом имени символа; U+A015 ꀕ СЛОГОВЫЙ И И У имеет псевдоним имени персонажа «ЗНАК ПОВТОРЕНИЯ СЛОГА И И», поскольку, в отличие от имени персонажа, он не имеет фиксированного слогового значения.
В дополнение к псевдонимам имен символов, которые являются исправлениями для некорректных имен символов, некоторым символам назначаются псевдонимы, которые являются альтернативными именами или сокращениями. В стандарте Unicode определены пять типов псевдонимов имен символов:
Все формальные псевдонимы имен персонажей следуют правилам для допустимых имен персонажей и гарантированно являются уникальными как в пределах псевдонима имени персонажа, так и в пределах пространств имен имен персонажей (по этой причине имя ISO 6429 "BELL" не определено как псевдоним для U+0007 <control-0007> ). потому что U+1F514 называется "BELL"). [1]
Начиная с версии Unicode 16.0, тридцать пять формальных псевдонимов имен символов определены как исправления для дефектных имен символов. [5]
Помимо этих нормативных имен, в таблицах кодов Unicode могут быть показаны неформальные имена . Это другие общеупотребительные имена для символа, и они не имеют тех же ограничений на символы. Эти неформальные имена не гарантируют уникальность и могут быть изменены или удалены в более поздних версиях стандарта.
Каждой кодовой точке назначается значение для категории General. Это одно из свойств символа, которое также определяется для неназначенных кодовых точек и кодовых точек, которые определены как "не символ".
Общая категория (свойство символа Unicode) [a] | |||||
---|---|---|---|---|---|
Ценить | Категория Major, minor | Базовый тип [б] | Назначен символ [b] | Количество [c] (на 16.0) | Замечания |
L , буква; LC , регистровая буква (только Lu, Ll и Lt) [d] | |||||
Лу | Буква, заглавная | Графический | Характер | 1,858 | |
Лл | Буква, строчная | Графический | Характер | 2,258 | |
лейтенант | Буква, заглавная | Графический | Характер | 31 | Лигатуры или диграфы, содержащие заглавную букву, за которой следует строчная часть (например, Dž , Lj , Nj и Dz ) |
Лм | Буква, модификатор | Графический | Характер | 404 | Буква -модификатор |
Ло | Письмо, другое | Графический | Характер | 136,477 | Идеограмма или буква в однобуквенном алфавите |
М , Марк | |||||
Мн | Марк, без пробелов | Графический | Характер | 2,020 | |
Мак | Марк, интервал, объединение | Графический | Характер | 468 | |
Мне | Марк, прилагаю | Графический | Характер | 13 | |
Н , Число | |||||
нд | Число, десятичная цифра | Графический | Характер | 760 | Все они, и только они, имеют числовой тип = De [e] |
Нл | Число, буква | Графический | Характер | 236 | Цифры, состоящие из букв или буквоподобных символов (например, римские цифры ) |
Нет | Номер, другой | Графический | Характер | 915 | Например, обыкновенные дроби , надстрочные и подстрочные цифры, двадцатеричные цифры |
П , Пунктуация | |||||
ПК | Пунктуация, соединитель | Графический | Характер | 10 | Включает пробельные символы подчеркивания , такие как "_", и другие пробельные символы связи . В отличие от других знаков пунктуации, они могут быть классифицированы как символы "слова" библиотеками регулярных выражений . [f] |
Пд | Знаки препинания, тире | Графический | Характер | 27 | Включает несколько символов дефиса |
Пс | Пунктуация открытая | Графический | Характер | 79 | Символы открывающих скобок |
Пе | Пунктуация, закрыть | Графический | Характер | 77 | Символы закрывающих скобок |
Пи | Пунктуация, начальная цитата | Графический | Характер | 12 | Открывающая кавычка . Не включает в себя "нейтральную" кавычку ASCII. Может вести себя как Ps или Pe в зависимости от использования |
Пф | Пунктуация, заключительная цитата | Графический | Характер | 10 | Закрывающая кавычка. Может вести себя как Ps или Pe в зависимости от использования |
По | Пунктуация, прочее | Графический | Характер | 640 | |
S , Символ | |||||
См | Символ, математика | Графический | Характер | 950 | Математические символы (например, + , − , = , × , ÷ , √ , ∊ , ≠ ). Не включает круглые и квадратные скобки, которые находятся в категориях Ps и Pe. Также не включает ! , * , - или / , которые, несмотря на частое использование в качестве математических операторов, в первую очередь считаются «знаками препинания». |
Сц | Символ, валюта | Графический | Характер | 63 | Символы валют |
Ск | Символ, модификатор | Графический | Характер | 125 | |
Так | Символ, другой | Графический | Характер | 7,376 | |
Z , Разделитель | |||||
Зс | Разделитель, пространство | Графический | Характер | 17 | Включает пробел, но не TAB , CR или LF , которые являются Cc |
Зл | Разделитель, линия | Формат | Характер | 1 | Только U+2028 РАЗДЕЛИТЕЛЬ СТРОК (LSEP) |
Зп | Разделитель, абзац | Формат | Характер | 1 | Только U+2029 РАЗДЕЛИТЕЛЬ АБЗАЦЕВ (PSEP) |
С , Другое | |||||
Копия | Другое, контроль | Контроль | Характер | 65 (никогда не изменится) [э] | Без имени, [g] <control> |
Ср. | Другой, формат | Формат | Характер | 170 | Включает в себя мягкий дефис , соединительные управляющие символы ( ZWNJ и ZWJ ), управляющие символы для поддержки двунаправленного текста и символы языковых тегов. |
Cs | Другое, суррогатное | Суррогатная мать | Нет (используется только в UTF-16 ) | 2,048 (никогда не изменится) [e] | Без имени, [г] <суррогат > |
Ко | Другое, частное использование | Частное использование | Характер (но интерпретация не указана) | 137 468 всего (никогда не изменится) [e] ( 6 400 в БМП , 131 068 в самолетах 15–16 ) | Без имени, [г] <частное использование> |
Cn | Другое, не назначено | Нехарактерный | Нет | 66 (не изменится, если диапазон кодовых точек Unicode не будет расширен) [e] | Без имени, [г] <не персонаж> |
Сдержанный | Нет | 819,467 | Без имени, [г] <зарезервировано> | ||
|
Символы имеют отдельные свойства, указывающие на то, что они являются символами пунктуации . Все свойства имеют значения Да/Нет : Dash , Quotation_Mark , Sentence_Terminal , Terminal_Punctuation . Свойство Punctuation относится к символам, которые используются для разделения или структурирования текста, и они классифицируются по разным типам в зависимости от их ролей. Unicode назначает этим символам пунктуации определенные категории.
Пробел — это широко используемая концепция для типографского эффекта. В основном она охватывает невидимые символы, которые имеют эффект пробела в отображаемом тексте. Она включает пробелы , табуляции и элементы управления форматированием новой строки. В Unicode такой символ имеет свойство "WSpace=yes". В версии 16.0 существует 25 пробельных символов.
Имя | Кодовая точка | Ширина коробки | Может сломаться ? | В IDN ? | Сценарий | Блокировать | Общая категория | Примечания | |
---|---|---|---|---|---|---|---|---|---|
табуляция символов | U+0009 | 9 | Да | Нет | Общий | Базовая латынь | Другое, контроль | HT, Горизонтальная табуляция . Именованная сущность HTML/XML : 	 , LaTeX : \tab , C escape:\t | |
подача строки | У+000А | 10 | Является ли переносом строки | Общий | Базовая латынь | Другое, контроль | LF, Перевод строки . Именованная сущность HTML/XML: 
 , C escape:\n | ||
строка табуляции | У+000Б | 11 | Является ли переносом строки | Общий | Базовая латынь | Другое, контроль | VT, вертикальная табуляция . C escape:\v | ||
подача формы | У+000С | 12 | Является ли переносом строки | Общий | Базовая латынь | Другое, контроль | FF, подача страницы . C escape:\f | ||
возврат каретки | У+000Д | 13 | Является ли переносом строки | Общий | Базовая латынь | Другое, контроль | CR, Возврат каретки . C escape:\r | ||
космос | U+0020 | 32 | Да | Нет | Общий | Базовая латынь | Разделитель, пространство | Наиболее распространенный (обычный пробел ASCII). LaTeX:\ | |
следующая строка | U+0085 | 133 | Является ли переносом строки | Общий | Дополнение Latin-1 | Другое, контроль | NEL, Следующая строка . LaTeX:\\ | ||
пространство без перерыва | У+00А0 | 160 | Нет | Нет | Общий | Дополнение Latin-1 | Разделитель, пространство | Неразрывный пробел : идентичен U+0020, но не является точкой, в которой строка может быть разорвана. HTML/XML именованная сущность: ,   , LaTeX:~ | |
огамический знак пространства | У+1680 | 5760 | Да | Нет | Огам | Огам | Разделитель, пространство | Используется для разделения слов в тексте огамом . Обычно вертикальная линия в вертикальном тексте или горизонтальная линия в горизонтальном тексте, но может также быть пустым пространством в шрифтах «без основы». Требуется шрифт огамом. | |
вчетвером | У+2000 | 8192 | Да | Нет | Общий | Общая пунктуация | Разделитель, пространство | Ширина одного en . U+2002 канонически эквивалентен этому символу; U+2002 предпочтительнее. | |
эм квадро | У+2001 | 8193 | Да | Нет | Общий | Общая пунктуация | Разделитель, пространство | Также известен как «баранина квадратная». Ширина в один em . U+2003 канонически эквивалентен этому символу; U+2003 предпочтительнее. | |
в пространстве | У+2002 | 8194 | Да | Нет | Общий | Общая пунктуация | Разделитель, пространство | Также известен как «орех». Ширина одного en . U+2000 En Quad канонически эквивалентен этому символу; предпочтительнее U+2002. HTML/XML именованная сущность:   , LaTeX: \enspace (пробел en LaTeX является неразрывным) | |
эм пространство | У+2003 | 8195 | Да | Нет | Общий | Общая пунктуация | Разделитель, пространство | Также известен как «баран». Ширина одного em . U+2001 Em Quad канонически эквивалентен этому символу; U+2003 предпочтительнее. HTML/XML именованная сущность:   , LaTeX:\quad | |
пространство из трех штук | У+2004 | 8196 | Да | Нет | Общий | Общая пунктуация | Разделитель, пространство | Также известен как «толстый пробел». Ширина — одна треть em. HTML/XML-именованная сущность:   , LaTeX: \; (толстый пробел LaTeX — это неразрывный пробел) | |
пространство из четырех клеток | У+2005 | 8197 | Да | Нет | Общий | Общая пунктуация | Разделитель, пространство | Также известно как «промежуток между строками». Ширина — одна четвертая часть em. HTML/XML-именованная сущность:   | |
пространство из шести клеток | У+2006 | 8198 | Да | Нет | Общий | Общая пунктуация | Разделитель, пространство | Одна шестая часть em в ширину. В компьютерной типографике иногда приравнивается к U+2009. | |
пространство для фигур | У+2007 | 8199 | Нет | Нет | Общий | Общая пунктуация | Разделитель, пространство | Интервал между цифрами . В шрифтах с моноширинными цифрами, равный ширине одной цифры. HTML/XML именованная сущность:   | |
пробел пунктуации | У+2008 | 8200 | Да | Нет | Общий | Общая пунктуация | Разделитель, пространство | Ширина узкой пунктуации в шрифте, т.е. ширина точки или запятой. [6] Именованная сущность HTML/XML:   | |
тонкое пространство | У+2009 | 8201 | Да | Нет | Общий | Общая пунктуация | Разделитель, пространство | Тонкий пробел ; одна пятая (иногда одна шестая) ширины em. Рекомендуется использовать в качестве разделителя тысяч для измерений, выполненных в единицах СИ . В отличие от U+2002 до U+2008, его ширина может быть скорректирована при наборе. [7] Именованный объект HTML/XML:   ,   , LaTeX: \, (тонкий пробел LaTeX является неразрывным пробелом) | |
пространство для волос | У+200А | 8202 | Да | Нет | Общий | Общая пунктуация | Разделитель, пространство | Тоньше тонкого пробела. HTML/XML именованная сущность:   ,  | |
разделитель строк | У+2028 | 8232 | Является ли переносом строки | Общий | Общая пунктуация | Разделитель, линия | |||
разделитель абзацев | У+2029 | 8233 | Является ли переносом строки | Общий | Общая пунктуация | Разделитель, абзац | |||
узкое пространство без перерывов | У+202Ф | 8239 | Нет | Нет | Общий | Общая пунктуация | Разделитель, пространство | Узкий неразрывный пробел . По функциям схож с U+00A0 Неразрывный пробел. При использовании с монгольским его ширина обычно составляет одну треть обычного пробела; в другом контексте его ширина иногда напоминает ширину тонкого пробела (U+2009). LaTeX:\, | |
среднее математическое пространство | У+205Ф | 8287 | Да | Нет | Общий | Общая пунктуация | Разделитель, пространство | MMSP. Используется в математических формулах. Четыре восемнадцатых em. [8] В математической типографике ширина пробелов обычно указывается в целых кратных восемнадцатой em, и 4/18 em может использоваться в нескольких ситуациях, например, между a и + и между + и b в выражении a + b . [9] HTML/XML именованная сущность:   , LaTeX: \: (средний пробел LaTeX является неразрывным пробелом) | |
идеографическое пространство | У+3000 | 12288 | Да | Нет | Общий | Символы и пунктуация CJK | Разделитель, пространство | Ширина ячейки символа CJK ( полная ширина ). Используется, например, в тай тоу . |
Имя | Кодовая точка | Ширина коробки | Может сломаться ? | В IDN ? | Сценарий | Блокировать | Общая категория | Примечания | |
---|---|---|---|---|---|---|---|---|---|
монгольский разделитель гласных | У+180Е | 6158 | | Да | Нет | монгольский | монгольский | Другое, Формат | MVS. Узкий пробельный символ, используемый в монгольском языке для придания двум последним символам слова разных форм. [10] Он больше не классифицируется как пробельный символ (т. е. в категории Zs) в Unicode 6.3.0, хотя и классифицировался в предыдущих версиях стандарта. |
пространство нулевой ширины | У+200Б | 8203 | | Да | Нет | ? | Общая пунктуация | Другое, Формат | ZWSP, пробел нулевой ширины . Используется для обозначения границ слов в системах обработки текста при использовании скриптов, не использующих явные интервалы. Он похож на мягкий дефис , с той разницей, что последний используется для обозначения границ слогов и должен отображать видимый дефис, когда строка прерывается на нем. Именованный объект HTML/XML : [11] [c] ​ |
нулевая ширина несоединительный элемент | У+200С | 8204 | | Да | Контекстно-зависимый [16] | ? | Общая пунктуация | Другое, Формат | ZWNJ, несоединитель нулевой ширины . При размещении между двумя символами, которые в противном случае были бы соединены, ZWNJ заставляет их печататься в их конечной и начальной формах соответственно. Именованная сущность HTML/XML: ‌ |
соединитель нулевой ширины | У+200Д | 8205 | | Да | Контекстно-зависимый [17] | ? | Общая пунктуация | Другое, Формат | ZWJ, соединитель нулевой ширины . При размещении между двумя символами, которые в противном случае не были бы соединены, ZWJ заставляет их печататься в их соединенных формах. Может также использоваться для отображения соединяющихся форм изолированно. В зависимости от того, ожидается ли лигатура или конъюнкт по умолчанию, может либо вызывать (как в эмодзи и в сингальском языке ), либо подавлять (как в деванагари ) замену одним глифом, при этом все еще разрешая использование отдельных соединяющихся форм (в отличие от ZWNJ). Именованная сущность HTML/XML: ‍ |
соединитель слов | У+2060 | 8288 | | Нет | Нет | ? | Общая пунктуация | Другое, Формат | WJ, соединитель слов . Аналогично U+200B, но не является точкой, в которой может быть разорвана строка. Именованная сущность HTML/XML: ⁠ |
неразрывный пробел нулевой ширины | У+FEFF | 65279 | | Нет | Нет | ? | Арабские формы представления -B | Другое, Формат | Неразрывный пробел нулевой ширины . Используется в основном как знак порядка байтов . Использование в качестве указания на неразрывность устарело, начиная с Unicode 3.2; вместо этого см. U+2060. |
|
Значение регистра в Unicode — Normataive. Оно относится к тем письменностям, в которых есть заглавные (т. е. заглавные, маюскульные) и строчные (т. е. малые, минускульные) буквы. Разница в регистре встречается в адламском, армянском, чероки, коптском, кириллическом, дезеретском, гарайском, глаголическом, греческом, грузинском, хуцури и мхедрули, латинском, медефаидринском, древневенгерском, осейджском, виткуки и варанг-сити.
(верхний, нижний, титульный, складной — как простой, так и полный)
Этот раздел нуждается в расширении . Вы можете помочь, дополнив его. ( Март 2022 ) |
Идеографический, алфавитный, несимвольный.
Этот раздел нуждается в расширении . Вы можете помочь, дополнив его. ( Март 2022 ) |
Некоторые распространённые коды:
10–199 = различные классы с фиксированной позицией
Знаки, прикрепляемые к базовой букве:
Знаки, не прикрепленные к базовой букве:
Шесть свойств символов относятся к двунаправленному письму: Bidi_Class , Bidi_Control , Bidi_Mirrored , Bidi_Mirroring_Glyph , Bidi_Paired_Bracket и Bidi_Paired_Bracket_Type .
Одной из основных особенностей Unicode является поддержка двунаправленного ( Bidi ) отображения текста справа налево (R-to-L) и слева направо (L-to-R). Двунаправленный алгоритм Unicode UAX9 [19] описывает процесс представления текста с изменяющимися направлениями письма. Например, он позволяет использовать цитату на иврите в английском тексте. Bidi_Character_Type отмечает поведение символа при направленном письме. Для переопределения направления Unicode определил специальные символы управления форматированием ( Bidi-Control s). Эти символы могут задавать направление и по определению влияют только на двунаправленное письмо.
Каждая кодовая точка имеет свойство Bidi_Class . Оно определяет ее поведение в двунаправленном тексте, интерпретируемом алгоритмом:
Тип [2] | Описание | Сила | Направленность | Общая область применения | Символ Bidi_Control [3] |
---|---|---|---|---|---|
Л | Слева направо | Сильный | Слева направо | Большинство алфавитных и слоговых символов, китайские иероглифы, неевропейские или неарабские цифры, символы LRM, ... | U+200E МЕТКА СЛЕВА НАПРАВО (LRM) |
Р | Справа налево | Сильный | П-в-Л | Адлам, Гарай, иврит, мандейский язык, Менде Кикакуи, Н'Ко, самаритянин, древние письменности, такие как Харошти и Набатейский, символы RLM, ... | U+200F МАРКИРОВКА СПРАВА НАЛЕВО (RLM) |
АЛ | Арабская буква | Сильный | П-в-Л | Арабский, ханифи-рохинджа, согдийский, сирийский и тханский алфавиты, а также большинство знаков препинания, характерных для этих алфавитов, символ ALM, ... | U+061C АРАБСКИЙ БУКВЕННЫЙ ЗНАК (ALM) |
RU | Европейский номер | Слабый | Европейские цифры, восточные арабо-индийские цифры, коптские цифры-эпакты, ... | ||
ЭС | Европейский Сепаратор | Слабый | знак плюс , знак минус , ... | ||
ET | Европейский номерной терминатор | Слабый | знак градуса , символы валют, ... | ||
АН | Арабские цифры | Слабый | Арабско-индийские цифры, арабские десятичные разделители и разделители тысяч, цифры Руми, цифры Ханифи рохинджа, ... | ||
КС | Общий разделитель чисел | Слабый | двоеточие , запятая , точка , неразрывный пробел , ... | ||
НСМ | Непробеловая отметка | Слабый | Символы в общих категориях Знак, не содержащий пробелов, и Знак, заключающий в себе (Mn, Me) | ||
БН | Нейтральный на границе | Слабый | Игнорируемые по умолчанию, несимволы, управляющие символы, отличные от явно заданных других типов | ||
Б | Разделитель абзацев | Нейтральный | Разделитель абзацев , соответствующие функции новой строки, определение абзаца протокола более высокого уровня | ||
С | Разделитель сегментов | Нейтральный | Вкладки | ||
WS | Пробелы | Нейтральный | пробел , пробел между цифрами , разделитель строк , перевод страницы , общие пробелы в блоках пунктуации (набор меньше, чем список пробелов Unicode) | ||
НА | Другие нейтральные | Нейтральный | Все остальные символы, включая символы замены объектов | ||
ЖРД | Встраивание слева направо | Явный | Слева направо | Только символ LRE | U+202A ВНЕДРЕНИЕ СЛЕВА НАПРАВО (LRE) |
МРО | Переопределение слева направо | Явный | Слева направо | Только персонаж LRO | U+202D ПЕРЕОПРЕДЕЛЕНИЕ СЛЕВА НАПРАВО (LRO) |
РЛЭ | Встраивание справа налево | Явный | П-в-Л | только символ RLE | U+202B ВНЕДРЕНИЕ СПРАВА НАЛЕВО (RLE) |
РЛО | Переопределение справа налево | Явный | П-в-Л | Только символ RLO | U+202E ПЕРЕОПРЕДЕЛЕНИЕ СПРАВА НАЛЕВО (RLO) |
Формат поп-направления | Явный | только символ PDF | U+202C POP НАПРАВЛЕННОЕ ФОРМАТИРОВАНИЕ (PDF) | ||
ЛРИ | Изолировать слева направо | Явный | Слева направо | Только символ LRI | U+2066 ИЗОЛЯЦИЯ СЛЕВА НАПРАВО (LRI) |
РЛИ | Изолировать справа налево | Явный | П-в-Л | Только символ RLI | U+2067 ИЗОЛЯЦИЯ СПРАВА НАЛЕВО (RLI) |
ФСИ | Первый сильный изолят | Явный | Только символ FSI | U+2068 ПЕРВЫЙ СИЛЬНЫЙ ИЗОЛЯТ (FSI) | |
ПДИ | Поп-направленный изолят | Явный | только символ PDI | U+2069 ПОП НАПРАВЛЕННЫЙ ИЗОЛЯТ (PDI) | |
Примечания
|
В обычных ситуациях алгоритм может определить направление текста по этому свойству символа. Для управления более сложными ситуациями Bidi, например, когда английский текст имеет кавычки на иврите, в Unicode добавляются дополнительные параметры. Двенадцать символов имеют свойство Bidi_Control=Yes
: ALM, FSI, LRE, LRI, LRM, LRO, PDF, PDI, RLE, RLI, RLM и RLO, как указано в таблице. Это невидимые символы управления форматированием, используемые только алгоритмом и не имеющие эффекта за пределами двунаправленного форматирования. [19] Несмотря на название, они являются символами форматирования, а не управляющими символами, и имеют общую категорию Другие, формат (Cf) в определении Unicode.
По сути, алгоритм определяет последовательность символов с тем же сильным типом направления (R-to-L или L-to-R), принимая во внимание переопределение специальными элементами управления Bidi. Числовые строки (слабые типы) назначаются направлению в соответствии с их сильным окружением, как и нейтральные символы. Наконец, символы отображаются в соответствии с направлением строки.
Два свойства символа имеют значение для определения зеркального отображения глифа в двунаправленном тексте: Bidi_Mirrored=Yes
указывает, что глиф должен быть зеркальным при написании от R к L. Bidi_Mirroring_Glyph=U+hhhh
Затем свойство может указывать на зеркальный символ. Например, скобки ( , ) зеркально отображаются таким образом. Формирование курсивных шрифтов, таких как арабский, и зеркальное отображение глифов, имеющих направление, не является частью алгоритма.
Символы классифицируются с типом Numeric . [1] Такие символы, как дроби, подстрочные и надстрочные индексы, римские цифры, числители валют, обведенные числа и цифры, специфичные для письменности, имеют тип Numeric. Они имеют числовое значение , которое может быть десятичным, включая ноль и отрицательные числа, или вульгарной дробью. Если такого значения нет, как у большинства символов, то числовой тип — «None».
Символы, имеющие числовое значение, делятся на три группы: десятичные (De), цифровые (Di) и числовые (Nu, т. е. все остальные). «Десятичный» означает, что символ является прямой десятичной цифрой. Только символы, являющиеся частью непрерывного закодированного диапазона 0..9, имеют числовой тип Decimal. Другие цифры, такие как надстрочные индексы, имеют числовой тип Digit. Все числовые символы, такие как дроби и римские цифры, в конечном итоге имеют тип «Numeric». Предполагаемый эффект заключается в том, что простой синтаксический анализатор может использовать эти десятичные числовые значения, не отвлекаясь, скажем, на числовой надстрочный индекс или дробь. Восемьдесят три идеограммы CJK, представляющие число, включая те, которые используются для бухгалтерского учета, имеют тип Numeric.
С другой стороны, символы, которые могут иметь числовое значение в качестве второго значения, по-прежнему помечены как Numeric type None и не имеют числового значения. Например, латинские буквы могут использоваться в нумерации абзацев, как "II.A.1.b", но буквы "I", "A" и "b" не являются числовыми (тип None ) и не имеют числового значения.
свойство символа Unicode ) | Числовой тип [a] [b] (||||
---|---|---|---|---|
Числовой тип | Код | Имеет числовое значение | Пример | Замечания |
Не числовое | <none> | Нет |
| Числовое значение="NaN" |
Десятичная дробь | De | Да |
| Прямая цифра (десятичное основание ). Соответствует в обоих случаях общей категории=Nd [a] |
Цифра | Di | Да |
| Десятичная дробь, но в типографском контексте |
Числовой | Nu | Да |
| Числовое значение, но не десятичное |
а. ^ "Раздел 4.6: Числовое значение". Стандарт Unicode . Консорциум Unicode. Сентябрь 2024 г. | ||||
б. ^ "Производные числовые типы Unicode 16.0". База данных символов Unicode . Консорциум Unicode. 2024-04-30. |
Шестнадцатеричные символы — это символы в серии с шестнадцатеричными значениями 0...9ABCDEF (шестнадцать символов, десятичное значение 0–15). Свойство символа Hex_Digit устанавливается в значение Yes, когда символ находится в такой серии:
Символы в Unicode, обозначенные [a]Hex_Digit=Yes | |||
---|---|---|---|
0123456789ABCDEF | Базовая латынь, заглавные буквы | ТакжеASCII_Hex_Digit=Yes | |
0123456789abcdef | Базовая латиница, строчные буквы | ТакжеASCII_Hex_Digit=Yes | |
0123456789ABCDEF | Полноширинные формы , заглавные буквы | ||
0123456789abcdef | Полноширинные формы, строчные буквы | ||
а. ^ "Unicode 16.0 UCD: PropList.txt". 2024-05-31 . Получено 2024-09-13 . |
Сорок четыре символа обозначены как Hex_Digit . Символы в блоке Basic Latin также обозначены как ASCII_Hex_Digit .
В Unicode нет отдельных символов для шестнадцатеричных значений. Следствием этого является то, что при использовании обычных символов невозможно определить, подразумевается ли шестнадцатеричное значение или подразумевается ли значение вообще. Это должно определяться на более высоком уровне, например, путем добавления 0x к шестнадцатеричному числу или по контексту. Единственная особенность заключается в том, что Unicode может отмечать, может ли последовательность быть или не быть шестнадцатеричным значением.
Блок — это уникальный поименованный, непрерывный диапазон кодовых точек. Он идентифицируется первой и последней кодовой точкой. Блоки не перекрываются . Блок может содержать зарезервированные, не назначенные и т. д. кодовые точки. Каждый назначенный символ имеет одно значение «имя блока» из 338 имен, назначенных в версии Unicode 16.0. Неназначенные кодовые точки за пределами существующего блока имеют значение по умолчанию «No_block».
Самолет | Диапазон блока | Имя блока | Кодовые точки [a] | Назначенные символы | Сценарии [б] [в] [г] [д] [е] |
---|---|---|---|---|---|
0 БМП | U+0000..U+007F | Базовая латынь [г] | 128 | 128 | Латинский (52 символа), Общий (76 символов) |
0 БМП | U+0080..U+00FF | Latin-1 Дополнение [h] | 128 | 128 | Латинский (64 символа), Общий (64 символа) |
0 БМП | U+0100..U+017F | Расширенная латиница-А | 128 | 128 | латинский |
0 БМП | U+0180..U+024F | Расширенная латиница-B | 208 | 208 | латинский |
0 БМП | U+0250..U+02AF | Расширения IPA | 96 | 96 | латинский |
0 БМП | U+02B0..U+02FF | Буквы-модификаторы интервала | 80 | 80 | Бопомофо (2 символа), Латинский (14 символов), Общий (64 символа) |
0 БМП | U+0300..U+036F | Объединение диакритических знаков | 112 | 112 | Унаследованный |
0 БМП | U+0370..U+03FF | Греческий и коптский | 144 | 135 | Коптский (14 символов), греческий (117 символов), общий (4 символа) |
0 БМП | U+0400..U+04FF | кириллица | 256 | 256 | Кириллица (254 символа), Наследуемый (2 символа) |
0 БМП | U+0500..U+052F | Кириллическое дополнение | 48 | 48 | кириллица |
0 БМП | U+0530..U+058F | армянский | 96 | 91 | армянский |
0 БМП | U+0590..U+05FF | иврит | 112 | 88 | иврит |
0 БМП | U+0600..U+06FF | арабский | 256 | 256 | Арабский (238 символов), Общий (6 символов), Унаследованный (12 символов) |
0 БМП | U+0700..U+074F | сирийский | 80 | 77 | сирийский |
0 БМП | U+0750..U+077F | Арабское приложение | 48 | 48 | арабский |
0 БМП | U+0780..U+07BF | Тана | 64 | 50 | Тана |
0 БМП | U+07C0..U+07FF | НКо | 64 | 62 | Н'Ко |
0 БМП | U+0800..U+083F | самаритянин | 64 | 61 | самаритянин |
0 БМП | U+0840..U+085F | мандейский | 32 | 29 | мандейский |
0 БМП | U+0860..U+086F | Сирийское дополнение | 16 | 11 | сирийский |
0 БМП | U+0870..U+089F | Арабский расширенный-B | 48 | 42 | арабский |
0 БМП | U+08A0..U+08FF | Арабский расширенный-А | 96 | 96 | Арабский (95 символов), Общий (1 символ) |
0 БМП | U+0900..U+097F | Деванагари | 128 | 128 | Деванагари (122 символа), Общий (2 символа), Унаследованный (4 символа) |
0 БМП | U+0980..U+09FF | бенгальский | 128 | 96 | бенгальский |
0 БМП | У+0А00..У+0А7Ф | Гурмукхи | 128 | 80 | Гурмукхи |
0 БМП | У+0А80..У+0АФФ | гуджарати | 128 | 91 | гуджарати |
0 БМП | U+0B00..U+0B7F | Ория | 128 | 91 | Ория |
0 БМП | U+0B80..U+0BFF | тамильский | 128 | 72 | тамильский |
0 БМП | U+0C00..U+0C7F | телугу | 128 | 100 | телугу |
0 БМП | U+0C80..U+0CFF | каннада | 128 | 91 | каннада |
0 БМП | U+0D00..U+0D7F | малаялам | 128 | 118 | малаялам |
0 БМП | U+0D80..U+0DFF | сингальский | 128 | 91 | сингальский |
0 БМП | U+0E00..U+0E7F | тайский | 128 | 87 | Тайский (86 символов), Общий (1 символ) |
0 БМП | U+0E80..U+0EFF | Лаосский | 128 | 83 | Лаосский |
0 БМП | U+0F00..U+0FFF | тибетский | 256 | 211 | Тибетский (207 символов), Общий (4 символа) |
0 БМП | У+1000..У+109Ф | Мьянма | 160 | 160 | Мьянма |
0 БМП | У+10А0..У+10ФФ | грузинский | 96 | 88 | Грузинский (87 символов), Общий (1 символ) |
0 БМП | U+1100..U+11FF | Хангыль Джамо | 256 | 256 | Хангыль |
0 БМП | У+1200..У+137Ф | Эфиопский | 384 | 358 | Эфиопский |
0 БМП | У+1380..У+139Ф | Эфиопская добавка | 32 | 26 | Эфиопский |
0 БМП | У+13А0..У+13ФФ | чероки | 96 | 92 | чероки |
0 БМП | У+1400..У+167Ф | Единая канадская аборигенная слоговая система | 640 | 640 | Канадские аборигены |
0 БМП | У+1680..У+169Ф | Огам | 32 | 29 | Огам |
0 БМП | У+16А0..У+16ФФ | Рунический | 96 | 89 | Рунический (86 символов), Общий (3 символа) |
0 БМП | У+1700..У+171Ф | тагальский | 32 | 23 | тагальский |
0 БМП | У+1720..У+173Ф | Хануноо | 32 | 23 | Хануноо (21 символ), Обычный (2 символа) |
0 БМП | У+1740..У+175Ф | Бухид | 32 | 20 | Бухид |
0 БМП | У+1760..У+177Ф | Тагбанва | 32 | 18 | Тагбанва |
0 БМП | U+1780..U+17FF | кхмерский | 128 | 114 | кхмерский |
0 БМП | У+1800..У+18АФ | монгольский | 176 | 158 | Монгольский (155 символов), Общий (3 символа) |
0 БМП | U+18B0..U+18FF | Расширенная унифицированная канадская аборигенная слоговая система | 80 | 70 | Канадские аборигены |
0 БМП | У+1900..У+194Ф | Лимбу | 80 | 68 | Лимбу |
0 БМП | У+1950..У+197Ф | Тай Ле | 48 | 35 | Тай Ле |
0 БМП | У+1980..У+19ДФ | Новый Тай Лю | 96 | 83 | Новый Тай Лю |
0 БМП | U+19E0..U+19FF | Кхмерские символы | 32 | 32 | кхмерский |
0 БМП | У+1А00..У+1А1Ф | бугийский | 32 | 30 | бугийский |
0 БМП | У+1А20..У+1ААФ | Тай Тхам | 144 | 127 | Тай Тхам |
0 БМП | U+1AB0..U+1AFF | Расширенное объединение диакритических знаков | 80 | 31 | Унаследованный |
0 БМП | U+1B00..U+1B7F | балийский | 128 | 127 | балийский |
0 БМП | U+1B80..U+1BBF | Суданский | 64 | 64 | Суданский |
0 БМП | U+1BC0..U+1BFF | Батак | 64 | 56 | Батак |
0 БМП | U+1C00..U+1C4F | Лепча | 80 | 74 | Лепча |
0 БМП | У+1С50..У+1С7Ф | Ол Чики | 48 | 48 | Ол Чики |
0 БМП | U+1C80..U+1C8F | Кириллица расширенная-С | 16 | 11 | кириллица |
0 БМП | U+1C90..U+1CBF | Грузинский расширенный | 48 | 46 | грузинский |
0 БМП | U+1CC0..U+1CCF | Суданская добавка | 16 | 8 | Суданский |
0 БМП | U+1CD0..U+1CFF | Ведические расширения | 48 | 43 | Обычный (16 символов), Наследуемый (27 символов) |
0 БМП | U+1D00..U+1D7F | Фонетические расширения | 128 | 128 | Кириллица (2 символа), греческий (15 символов), латиница (111 символов) |
0 БМП | U+1D80..U+1DBF | Дополнение к фонетическим расширениям | 64 | 64 | Греческий (1 символ), латинский (63 символа) |
0 БМП | U+1DC0..U+1DFF | Дополнение к комбинированным диакритическим знакам | 64 | 64 | Унаследованный |
0 БМП | U+1E00..U+1EFF | Расширенная латиница Дополнительный | 256 | 256 | латинский |
0 БМП | U+1F00..U+1FFF | Греческий расширенный | 256 | 233 | греческий |
0 БМП | У+2000..У+206Ф | Общая пунктуация | 112 | 111 | Обычный (109 символов), Унаследованный (2 символа) |
0 БМП | У+2070..У+209Ф | Надстрочные и подстрочные индексы | 48 | 42 | Латинский (15 символов), Общий (27 символов) |
0 БМП | У+20А0..У+20CF | Символы валют | 48 | 33 | Общий |
0 БМП | U+20D0..U+20FF | Объединение диакритических знаков для символов | 48 | 33 | Унаследованный |
0 БМП | У+2100..У+214Ф | Буквоподобные символы | 80 | 80 | Греческий (1 символ), Латинский (4 символа), Общий (75 символов) |
0 БМП | У+2150..У+218Ф | Числовые формы | 64 | 60 | Латинский (41 символ), Общий (19 символов) |
0 БМП | U+2190..U+21FF | Стрелки | 112 | 112 | Общий |
0 БМП | U+2200..U+22FF | Математические операторы | 256 | 256 | Общий |
0 БМП | U+2300..U+23FF | Разное техническое | 256 | 256 | Общий |
0 БМП | У+2400..У+243Ф | Контрольные картинки | 64 | 42 | Общий |
0 БМП | У+2440..У+245Ф | Оптическое распознавание символов | 32 | 11 | Общий |
0 БМП | U+2460..U+24FF | Вложенные буквенно-цифровые символы | 160 | 160 | Общий |
0 БМП | У+2500..У+257Ф | Рисунок коробки | 128 | 128 | Общий |
0 БМП | У+2580..У+259Ф | Блочные элементы | 32 | 32 | Общий |
0 БМП | У+25А0..У+25ФФ | Геометрические фигуры | 96 | 96 | Общий |
0 БМП | U+2600..U+26FF | Разные символы | 256 | 256 | Общий |
0 БМП | У+2700..У+27БФ | Дингбаты | 192 | 192 | Общий |
0 БМП | U+27C0..U+27EF | Различные математические символы-А | 48 | 48 | Общий |
0 БМП | U+27F0..U+27FF | Дополнительные стрелки-A | 16 | 16 | Общий |
0 БМП | U+2800..U+28FF | Шаблоны Брайля | 256 | 256 | шрифт Брайля |
0 БМП | У+2900..У+297Ф | Дополнительные стрелки-B | 128 | 128 | Общий |
0 БМП | U+2980..U+29FF | Различные математические символы-B | 128 | 128 | Общий |
0 БМП | U+2A00..U+2AFF | Дополнительные математические операторы | 256 | 256 | Общий |
0 БМП | U+2B00..U+2BFF | Различные символы и стрелки | 256 | 253 | Общий |
0 БМП | U+2C00..U+2C5F | Глаголица | 96 | 96 | Глаголица |
0 БМП | У+2С60..У+2С7Ф | Расширенная латиница-C | 32 | 32 | латинский |
0 БМП | U+2C80..U+2CFF | коптский | 128 | 123 | коптский |
0 БМП | U+2D00..U+2D2F | Грузинское дополнение | 48 | 40 | грузинский |
0 БМП | У+2Д30..У+2Д7Ф | Тифинаг | 80 | 59 | Тифинаг |
0 БМП | У+2Д80..У+2ДДФ | Эфиопский расширенный | 96 | 79 | Эфиопский |
0 БМП | U+2DE0..U+2DFF | Кириллица расширенная-А | 32 | 32 | кириллица |
0 БМП | У+2Е00..У+2Е7Ф | Дополнительная пунктуация | 128 | 94 | Общий |
0 БМП | U+2E80..U+2EFF | Дополнение CJK Radicals | 128 | 115 | Хан |
0 БМП | У+2Ф00..У+2ФДФ | Радикалы Канси | 224 | 214 | Хан |
0 БМП | У+2ФФ0..У+2ФФФ | Идеографическое описание символов | 16 | 16 | Общий |
0 БМП | У+3000..У+303Ф | Символы и пунктуация CJK | 64 | 64 | Хан (15 символов), Хангыль (2 символа), Общий (43 символа), Унаследованный (4 символа) |
0 БМП | У+3040..У+309Ф | Хирагана | 96 | 93 | Хирагана (89 символов), Общая (2 символа), Унаследованная (2 символа) |
0 БМП | У+30А0..У+30ФФ | Катакана | 96 | 96 | Катакана (93 символа), Общий (3 символа) |
0 БМП | У+3100..У+312Ф | Бопомофо | 48 | 43 | Бопомофо |
0 БМП | У+3130..У+318Ф | Совместимость с Хангылем Jamo | 96 | 94 | Хангыль |
0 БМП | У+3190..У+319Ф | Канбун | 16 | 16 | Общий |
0 БМП | У+31А0..У+31БФ | Бопомофо расширенный | 32 | 32 | Бопомофо |
0 БМП | U+31C0..U+31EF | CJK-штрихи | 48 | 39 | Общий |
0 БМП | U+31F0..U+31FF | Фонетические расширения катаканы | 16 | 16 | Катакана |
0 БМП | U+3200..U+32FF | Прилагаемые письма CJK и месяцы | 256 | 255 | Хангыль (62 символа), Катакана (47 символов), Общий (146 символов) |
0 БМП | U+3300..U+33FF | Совместимость с CJK | 256 | 256 | Катакана (88 символов), Общий (168 символов) |
0 БМП | U+3400..U+4DBF | Расширение A унифицированных идеограмм CJK | 6,592 | 6,592 | Хан |
0 БМП | U+4DC0..U+4DFF | Символы гексаграммы Ицзин | 64 | 64 | Общий |
0 БМП | U+4E00..U+9FFF | Унифицированные идеограммы CJK | 20,992 | 20,992 | Хан |
0 БМП | У+А000..У+А48Ф | Слоги И | 1,168 | 1,165 | Йи |
0 БМП | U+A490..U+A4CF | Радикалы Йи | 64 | 55 | Йи |
0 БМП | U+A4D0..U+A4FF | Лису | 48 | 48 | Лису |
0 БМП | У+А500..У+А63Ф | Вай | 320 | 300 | Вай |
0 БМП | У+А640..У+А69Ф | Кириллица расширенная-Б | 96 | 96 | кириллица |
0 БМП | У+А6А0..У+А6ФФ | Бамум | 96 | 88 | Бамум |
0 БМП | У+А700..У+А71Ф | Буквы модификатора тона | 32 | 32 | Общий |
0 БМП | U+A720..U+A7FF | Расширенная латиница-D | 224 | 199 | Латинский (194 символа), Общий (5 символов) |
0 БМП | У+А800..У+А82Ф | Силоти Нагри | 48 | 45 | Силоти Нагри |
0 БМП | У+А830..У+А83Ф | Формы общих индийских чисел | 16 | 10 | Общий |
0 БМП | У+А840..У+А87Ф | Пхагс-па | 64 | 56 | Фагс Па |
0 БМП | У+А880..У+А8ДФ | Саураштра | 96 | 82 | Саураштра |
0 БМП | U+A8E0..U+A8FF | Расширенный деванагари | 32 | 32 | Деванагари |
0 БМП | У+А900..У+А92Ф | Кая Ли | 48 | 48 | Кая Ли (47 символов), Обычный (1 символ) |
0 БМП | У+А930..У+А95Ф | Реджанг | 48 | 37 | Реджанг |
0 БМП | У+А960..У+А97Ф | Хангыль Джамо Расширенный-А | 32 | 29 | Хангыль |
0 БМП | У+А980..У+А9ДФ | яванский | 96 | 91 | Яванский (90 символов), Общий (1 символ) |
0 БМП | U+A9E0..U+A9FF | Мьянма Расширенный-B | 32 | 31 | Мьянма |
0 БМП | У+АА00..У+АА5Ф | Чам | 96 | 83 | Чам |
0 БМП | У+АА60..У+АА7Ф | Мьянма Расширенный-A | 32 | 32 | Мьянма |
0 БМП | У+АА80..У+ААДФ | Тай Вьет | 96 | 72 | Тай Вьет |
0 БМП | У+ААЕ0..У+ААФФ | Расширения Meetei Mayek | 32 | 23 | Митэй Майек |
0 БМП | U+AB00..U+AB2F | Эфиопский расширенный-А | 48 | 32 | Эфиопский |
0 БМП | У+АВ30..У+АВ6Ф | Расширенная латиница-E | 64 | 60 | Латинский (56 символов), греческий (1 символ), общий (3 символа) |
0 БМП | У+АБ70..У+АББФ | Дополнение Чероки | 80 | 80 | Чероки |
0 БМП | U+ABC0..U+ABFF | Митэй Майек | 64 | 56 | Митэй Майек |
0 БМП | U+AC00..U+D7AF | Слоги хангыля | 11,184 | 11,172 | Хангыль |
0 БМП | U+D7B0..U+D7FF | Хангыль Джамо Расширенный-B | 80 | 72 | Хангыль |
0 БМП | U+D800..U+DB7F | Высокие суррогаты | 896 | 0 | Неизвестный |
0 БМП | U+DB80..U+DBFF | Высокое частное использование суррогатов | 128 | 0 | Неизвестный |
0 БМП | U+DC00..U+DFFF | Низкие суррогаты | 1,024 | 0 | Неизвестный |
0 БМП | U+E000..U+F8FF | Зона частного пользования | 6,400 | 6,400 | Неизвестный |
0 БМП | U+F900..U+FAFF | Совместимость идеограмм CJK | 512 | 472 | Хан |
0 БМП | U+FB00..U+FB4F | Алфавитные формы представления | 80 | 58 | Армянский (5 символов), Иврит (46 символов), Латынь (7 символов) |
0 БМП | У+ФБ50..У+ФДФФ | Арабские формы представления-A | 688 | 631 | Арабский (629 символов), Общий (2 символа) |
0 БМП | U+FE00..U+FE0F | Селекторы вариаций | 16 | 16 | Унаследованный |
0 БМП | У+ФЕ10..У+ФЕ1Ф | Вертикальные формы | 16 | 10 | Общий |
0 БМП | У+ФЕ20..У+ФЕ2Ф | Объединение половинных отметок | 16 | 16 | Кириллица (2 символа), Наследуемый (14 символов) |
0 БМП | У+ФЕ30..У+ФЕ4Ф | Формы совместимости CJK | 32 | 32 | Общий |
0 БМП | У+ФЕ50..У+ФЕ6Ф | Малые варианты формы | 32 | 26 | Общий |
0 БМП | U+FE70..U+FEFF | Арабские формы представления-B | 144 | 141 | Арабский (140 символов), Общий (1 символ) |
0 БМП | U+FF00..U+FFEF | Формы половинной и полной ширины | 240 | 225 | Хангыль (52 символа), Катакана (55 символов), Латиница (52 символа), Общий (66 символов) |
0 БМП | У+ФФФ0..У+ФФФФ | Специальные предложения | 16 | 5 | Общий |
1 СМП | U+10000..U+1007F | Линейное слоговое письмо Б | 128 | 88 | Линейное письмо Б |
1 СМП | U+10080..U+100FF | Идеограммы линейного письма Б | 128 | 123 | Линейное письмо Б |
1 СМП | U+10100..U+1013F | Эгейские числа | 64 | 57 | Общий |
1 СМП | U+10140..U+1018F | Древнегреческие числа | 80 | 79 | греческий |
1 СМП | U+10190..U+101CF | Древние Символы | 64 | 14 | Греческий (1 символ), Общий (13 символов) |
1 СМП | U+101D0..U+101FF | Фестский диск | 48 | 46 | Обычный (45 символов), Унаследованный (1 символ) |
1 СМП | U+10280..U+1029F | Ликийский | 32 | 29 | Ликийский |
1 СМП | У+102А0..У+102ДФ | Карианский | 64 | 49 | Карианский |
1 СМП | U+102E0..U+102FF | Коптские числа Эпакта | 32 | 28 | Обычный (27 символов), Унаследованный (1 символ) |
1 СМП | U+10300..U+1032F | Старый курсив | 48 | 39 | Старый курсив |
1 СМП | U+10330..U+1034F | готика | 32 | 27 | готика |
1 СМП | U+10350..U+1037F | Старый Пермский | 48 | 43 | Старый Пермский |
1 СМП | U+10380..U+1039F | Угаритский | 32 | 31 | Угаритский |
1 СМП | U+103A0..U+103DF | Древнеперсидский | 64 | 50 | Древнеперсидский |
1 СМП | U+10400..U+1044F | Дезерет | 80 | 80 | Дезерет |
1 СМП | U+10450..U+1047F | Шэвиан | 48 | 48 | Шэвиан |
1 СМП | U+10480..U+104AF | Османия | 48 | 40 | Османия |
1 СМП | U+104B0..U+104FF | Осейдж | 80 | 72 | Осейдж |
1 СМП | U+10500..U+1052F | Эльбасан | 48 | 40 | Эльбасан |
1 СМП | U+10530..U+1056F | Кавказский албанец | 64 | 53 | Кавказский албанец |
1 СМП | U+10570..U+105BF | Виткуки | 80 | 70 | Виткуки |
1 СМП | U+105C0..U+105FF | Тодри | 64 | 52 | Тодри |
1 СМП | U+10600..U+1077F | Линейное письмо А | 384 | 341 | Линейное письмо А |
1 СМП | U+10780..U+107BF | Расширенная латиница-F | 64 | 57 | латинский |
1 СМП | U+10800..U+1083F | Кипрская слоговая азбука | 64 | 55 | кипрский |
1 СМП | U+10840..U+1085F | Имперский арамейский | 32 | 31 | Имперский арамейский |
1 СМП | U+10860..U+1087F | Пальмирена | 32 | 32 | Пальмирена |
1 СМП | U+10880..U+108AF | набатейский | 48 | 40 | набатейский |
1 СМП | U+108E0..U+108FF | Хатран | 32 | 26 | Хатран |
1 СМП | U+10900..U+1091F | финикийский | 32 | 29 | финикийский |
1 СМП | U+10920..U+1093F | Лидийский | 32 | 27 | Лидийский |
1 СМП | U+10980..U+1099F | Мероитские иероглифы | 32 | 32 | Мероитские иероглифы |
1 СМП | U+109A0..U+109FF | Мероитский курсив | 96 | 90 | Мероитский курсив |
1 СМП | У+10А00..У+10А5Ф | Кхароштхи | 96 | 68 | Кхароштхи |
1 СМП | У+10А60..У+10А7Ф | Древний южноаравийский | 32 | 32 | Древний южноаравийский |
1 СМП | У+10А80..У+10А9Ф | Древний североаравийский | 32 | 32 | Древний североаравийский |
1 СМП | U+10AC0..U+10AFF | Манихейский | 64 | 51 | Манихейский |
1 СМП | U+10B00..U+10B3F | авестийский | 64 | 61 | авестийский |
1 СМП | U+10B40..U+10B5F | Парфянские надписи | 32 | 30 | Парфянские надписи |
1 СМП | U+10B60..U+10B7F | Надписи на пехлеви | 32 | 27 | Надписи на пехлеви |
1 СМП | U+10B80..U+10BAF | Псалтырь пехлевийский | 48 | 29 | Псалтырь пехлевийский |
1 СМП | U+10C00..U+10C4F | Древнетюркский | 80 | 73 | Древнетюркский |
1 СМП | U+10C80..U+10CFF | старовенгерский | 128 | 108 | старовенгерский |
1 СМП | U+10D00..U+10D3F | Ханифи Рохинджа | 64 | 50 | Ханифи Рохинджа |
1 СМП | У+10Д40..У+10Д8Ф | Гарай | 80 | 69 | Гарай |
1 СМП | U+10E60..U+10E7F | Числовые символы Руми | 32 | 31 | арабский |
1 СМП | U+10E80..U+10EBF | езидский | 64 | 47 | езидский |
1 СМП | U+10EC0..U+10EFF | Арабский расширенный-C | 64 | 7 | арабский |
1 СМП | U+10F00..U+10F2F | Древний согдийский | 48 | 40 | Древний согдийский |
1 СМП | U+10F30..U+10F6F | согдийский | 64 | 42 | согдийский |
1 СМП | U+10F70..U+10FAF | Старый уйгурский | 64 | 26 | Старый уйгурский |
1 СМП | U+10FB0..U+10FDF | Хорезмский | 48 | 28 | Хорезмский |
1 СМП | U+10FE0..U+10FFF | Елимейский | 32 | 23 | Елимейский |
1 СМП | U+11000..U+1107F | Брахми | 128 | 115 | Брахми |
1 СМП | U+11080..U+110CF | Кайти | 80 | 68 | Кайти |
1 СМП | U+110D0..U+110FF | Сора Сомпенг | 48 | 35 | Сора Сомпенг |
1 СМП | U+11100..U+1114F | Чакма | 80 | 71 | Чакма |
1 СМП | U+11150..U+1117F | Махаджани | 48 | 39 | Махаджани |
1 СМП | U+11180..U+111DF | Шарада | 96 | 96 | Шарада |
1 СМП | U+111E0..U+111FF | Сингальские архаичные числа | 32 | 20 | сингальский |
1 СМП | U+11200..U+1124F | Ходжки | 80 | 65 | Ходжки |
1 СМП | U+11280..U+112AF | Мултани | 48 | 38 | Мултани |
1 СМП | U+112B0..U+112FF | Худавади | 80 | 69 | Худавади |
1 СМП | U+11300..U+1137F | Грантха | 128 | 86 | Grantha (85 символов), Унаследованный (1 символ) |
1 СМП | U+11380..U+113FF | Тулу-Тигалари | 128 | 80 | Тулу Тигалари |
1 СМП | U+11400..U+1147F | Ньюа | 128 | 97 | Ньюа |
1 СМП | U+11480..U+114DF | Тирута | 96 | 82 | Тирута |
1 СМП | U+11580..U+115FF | Сиддхам | 128 | 92 | Сиддхам |
1 СМП | U+11600..U+1165F | Моди | 96 | 79 | Моди |
1 СМП | U+11660..U+1167F | Монгольское дополнение | 32 | 13 | монгольский |
1 СМП | U+11680..U+116CF | Такри | 80 | 68 | Такри |
1 СМП | U+116D0..U+116FF | Мьянма Расширенный-C | 48 | 20 | Мьянма |
1 СМП | U+11700..U+1174F | Ахом | 80 | 65 | Ахом |
1 СМП | U+11800..U+1184F | Догра | 80 | 60 | Догра |
1 СМП | U+118A0..U+118FF | Варанг Сити | 96 | 84 | Варанг Сити |
1 СМП | U+11900..U+1195F | Ныряет Акуру | 96 | 72 | Ныряет Акуру |
1 СМП | U+119A0..U+119FF | Нандинагари | 96 | 65 | Нандинагари |
1 СМП | U+11A00..U+11A4F | Площадь Занабазара | 80 | 72 | Площадь Занабазара |
1 СМП | U+11A50..U+11AAF | Соёмбо | 96 | 83 | Соёмбо |
1 СМП | U+11AB0..U+11ABF | Расширенная версия канадской аборигенной слоговой письменности (А) | 16 | 16 | Канадские аборигены |
1 СМП | U+11AC0..U+11AFF | Пау Син Хау | 64 | 57 | Пау Син Хау |
1 СМП | U+11B00..U+11B5F | Расширенный Деванагари-А | 96 | 10 | Деванагари |
1 СМП | U+11BC0..U+11BFF | Сунувар | 64 | 44 | Сунувар |
1 СМП | U+11C00..U+11C6F | Бхайксуки | 112 | 97 | Бхайксуки |
1 СМП | U+11C70..U+11CBF | Мархен | 80 | 68 | Мархен |
1 СМП | U+11D00..U+11D5F | Масарам Гонди | 96 | 75 | Масарам Гонди |
1 СМП | U+11D60..U+11DAF | Гунджала Гонди | 80 | 63 | Гунджала Гонди |
1 СМП | U+11EE0..U+11EFF | Макасар | 32 | 25 | Макасар |
1 СМП | U+11F00..U+11F5F | Кави | 96 | 87 | Кави |
1 СМП | U+11FB0..U+11FBF | Добавка Лису | 16 | 1 | Лису |
1 СМП | U+11FC0..U+11FFF | Дополнение на тамильском языке | 64 | 51 | тамильский |
1 СМП | U+12000..U+123FF | Клинопись | 1,024 | 922 | Клинопись |
1 СМП | U+12400..U+1247F | Клинописные цифры и знаки препинания | 128 | 116 | Клинопись |
1 СМП | U+12480..U+1254F | Ранняя династическая клинопись | 208 | 196 | Клинопись |
1 СМП | U+12F90..U+12FFF | Кипро-минойский | 112 | 99 | кипро-минойский |
1 СМП | U+13000..U+1342F | Египетские иероглифы | 1,072 | 1,072 | Египетские иероглифы |
1 СМП | U+13430..U+1345F | Элементы управления форматом египетских иероглифов | 48 | 38 | Египетские иероглифы |
1 СМП | U+13460..U+143FF | Египетские иероглифы расширенные-A | 4000 | 3,995 | Египетские иероглифы |
1 СМП | U+14400..U+1467F | Анатолийские иероглифы | 640 | 583 | Анатолийские иероглифы |
1 СМП | U+16100..U+1613F | Гурунг Кхема | 64 | 58 | Гурунг Кхема |
1 СМП | U+16800..U+16A3F | Дополнение Бамум | 576 | 569 | Бамум |
1 СМП | У+16А40..У+16А6Ф | Мро | 48 | 43 | Мро |
1 СМП | U+16A70..U+16ACF | Тангса | 96 | 89 | Тангса |
1 СМП | U+16AD0..U+16AFF | Басса Вах | 48 | 36 | Басса Вах |
1 СМП | U+16B00..U+16B8F | Пахау Хмонг | 144 | 127 | Пахау Хмонг |
1 СМП | У+16Д40..У+16Д7Ф | Кират Рай | 64 | 58 | Кират Рай |
1 СМП | U+16E40..U+16E9F | Медефаидрин | 96 | 91 | Медефаидрин |
1 СМП | U+16F00..U+16F9F | Мяо | 160 | 149 | Мяо |
1 СМП | U+16FE0..U+16FFF | Идеографические символы и знаки препинания | 32 | 7 | Хань (4 символа), киданьское мелкое письмо (1 символ), нушу (1 символ), тангутское письмо (1 символ) |
1 СМП | U+17000..U+187FF | тангутский | 6,144 | 6,136 | тангутский |
1 СМП | U+18800..U+18AFF | Тангутские компоненты | 768 | 768 | тангутский |
1 СМП | U+18B00..U+18CFF | Киданьское мелкое письмо | 512 | 471 | Киданьское мелкое письмо |
1 СМП | U+18D00..U+18D7F | Тангутская добавка | 128 | 9 | тангутский |
1 СМП | U+1AFF0..U+1AFFF | Кана расширенная-B | 16 | 13 | Катакана |
1 СМП | U+1B000..U+1B0FF | Дополнение к Кана | 256 | 256 | Хирагана (255 символов), катакана (1 символ) |
1 СМП | U+1B100..U+1B12F | Кана расширенная-А | 48 | 35 | Хирагана (32 символа), катакана (3 символа) |
1 СМП | U+1B130..U+1B16F | Малое расширение Кана | 64 | 9 | Хирагана (4 символа), катакана (5 символов) |
1 СМП | U+1B170..U+1B2FF | Нушу | 400 | 396 | Нюшу |
1 СМП | U+1BC00..U+1BC9F | Дуплоян | 160 | 143 | Дуплоян |
1 СМП | U+1BCA0..U+1BCAF | Элементы управления сокращенным форматом | 16 | 4 | Общий |
1 СМП | U+1CC00..U+1CEBF | Символы для дополнения Legacy Computing | 704 | 686 | Общий |
1 СМП | U+1CF00..U+1CFCF | Знаменная музыкальная нотация | 208 | 185 | Обычный (116 символов), Унаследованный (69 символов) |
1 СМП | U+1D000..U+1D0FF | Византийские музыкальные символы | 256 | 246 | Общий |
1 СМП | U+1D100..U+1D1FF | Музыкальные символы | 256 | 233 | Обычный (211 символов), Унаследованный (22 символа) |
1 СМП | U+1D200..U+1D24F | Древнегреческая музыкальная нотация | 80 | 70 | греческий |
1 СМП | U+1D2C0..U+1D2DF | Кактовик Цифры | 32 | 20 | Общий |
1 СМП | U+1D2E0..U+1D2FF | Цифры майя | 32 | 20 | Общий |
1 СМП | У+1Д300..У+1Д35Ф | Символы Тай Сюань Цзин | 96 | 87 | Общий |
1 СМП | U+1D360..U+1D37F | Счетные стержни с цифрами | 32 | 25 | Общий |
1 СМП | U+1D400..U+1D7FF | Математические буквенно-цифровые символы | 1,024 | 996 | Общий |
1 СМП | U+1D800..U+1DAAF | Sutton SignWriting | 688 | 672 | Написание жестов |
1 СМП | U+1DF00..U+1DFFF | Расширенная латиница-G | 256 | 37 | латинский |
1 СМП | U+1E000..U+1E02F | Глаголическое дополнение | 48 | 38 | Глаголица |
1 СМП | U+1E030..U+1E08F | Кириллица расширенная-D | 96 | 63 | кириллица |
1 СМП | У+1Е100..У+1Е14Ф | Ньякенг Пуачуэ Хмонг | 80 | 71 | Ньякенг Пуачуэ Хмонг |
1 СМП | U+1E290..U+1E2BF | Тото | 48 | 31 | Тото |
1 СМП | U+1E2C0..U+1E2FF | Ванчо | 64 | 59 | Ванчо |
1 СМП | U+1E4D0..U+1E4FF | Наг Мундари | 48 | 42 | Мундари |
1 СМП | U+1E5D0..U+1E5FF | Ол Онал | 48 | 44 | Ол Онал |
1 СМП | U+1E7E0..U+1E7FF | Эфиопский расширенный-B | 32 | 28 | Эфиопский |
1 СМП | U+1E800..U+1E8DF | Менде Кикакуи | 224 | 213 | Менде Кикакуи |
1 СМП | U+1E900..U+1E95F | Адлам | 96 | 88 | Адлам |
1 СМП | U+1EC70..U+1ECBF | Индийские числа Siyaq | 80 | 68 | Общий |
1 СМП | U+1ED00..U+1ED4F | Османские числа Сияка | 80 | 61 | Общий |
1 СМП | U+1EE00..U+1EEFF | Арабские математические алфавитные символы | 256 | 143 | арабский |
1 СМП | U+1F000..U+1F02F | Плитки Маджонга | 48 | 44 | Общий |
1 СМП | U+1F030..U+1F09F | Плитки домино | 112 | 100 | Общий |
1 СМП | U+1F0A0..U+1F0FF | Игральные карты | 96 | 82 | Общий |
1 СМП | U+1F100..U+1F1FF | Прилагаемое буквенно-цифровое дополнение | 256 | 200 | Общий |
1 СМП | U+1F200..U+1F2FF | Прилагаемое идеографическое приложение | 256 | 64 | Хирагана (1 символ), Общая (63 символа) |
1 СМП | U+1F300..U+1F5FF | Различные символы и пиктограммы | 768 | 768 | Общий |
1 СМП | U+1F600..U+1F64F | Смайлики | 80 | 80 | Общий |
1 СМП | U+1F650..U+1F67F | Орнаментальные дингбаты | 48 | 48 | Общий |
1 СМП | U+1F680..U+1F6FF | Транспортные и картографические символы | 128 | 118 | Общий |
1 СМП | U+1F700..U+1F77F | Алхимические символы | 128 | 124 | Общий |
1 СМП | U+1F780..U+1F7FF | Геометрические фигуры расширены | 128 | 103 | Общий |
1 СМП | U+1F800..U+1F8FF | Дополнительные стрелки-C | 256 | 162 | Общий |
1 СМП | U+1F900..U+1F9FF | Дополнительные символы и пиктограммы | 256 | 256 | Общий |
1 СМП | U+1FA00..U+1FA6F | Шахматные символы | 112 | 98 | Общий |
1 СМП | U+1FA70..U+1FAFF | Символы и пиктограммы расширенные-A | 144 | 114 | Общий |
1 СМП | U+1FB00..U+1FBFF | Символы для устаревших вычислений | 256 | 249 | Общий |
2 СИП | U+20000..U+2A6DF | Расширение B унифицированных идеограмм CJK | 42,720 | 42,720 | Хан |
2 СИП | U+2A700..U+2B73F | Расширение C унифицированных идеограмм CJK | 4,160 | 4,154 | Хан |
2 СИП | U+2B740..U+2B81F | Расширение D унифицированных идеограмм CJK | 224 | 222 | Хан |
2 СИП | U+2B820..U+2CEAF | Расширение унифицированных идеограмм CJK E | 5,776 | 5,762 | Хан |
2 СИП | U+2CEB0..U+2EBEF | Расширение унифицированных идеограмм CJK F | 7,488 | 7,473 | Хан |
2 СИП | U+2EBF0..U+2EE5F | Расширение унифицированных идеограмм CJK I | 624 | 622 | Хан |
2 СИП | U+2F800..U+2FA1F | Дополнение к идеограммам совместимости CJK | 544 | 542 | Хан |
3 СОВЕТ | U+30000..U+3134F | Расширение унифицированных идеограмм CJK G | 4,944 | 4,939 | Хан |
3 СОВЕТ | U+31350..U+323AF | Расширение унифицированных идеограмм CJK H | 4,192 | 4,192 | Хан |
14 ССП | U+E0000..U+E007F | Теги | 128 | 97 | Общий |
14 ССП | U+E0100..U+E01EF | Дополнение к селекторам вариаций | 240 | 240 | Унаследованный |
15 ПУА-А | U+F0000..U+FFFFF | Дополнительная зона частного пользования-A | 65,536 | 65,534 | Неизвестный |
16 ПУА-Б | U+100000..U+10FFFF | Дополнительная зона частного пользования-B | 65,536 | 65,534 | Неизвестный |
|
Каждый назначенный символ может иметь одно значение для своего свойства «Script», обозначающее, к какому скрипту он принадлежит. [20] Значение представляет собой четырехбуквенный код в диапазоне Aaaa-Zzzz, как указано в ISO 15924, который сопоставлен с системой письма . За исключением случаев описания предыстории и использования скрипта, Unicode не использует связь между скриптом и языками , которые его используют. Таким образом, «иврит» относится к еврейскому скрипту, а не к еврейскому языку.
Специальный код Zyyy для "Common" допускает одно значение для символа, который используется в нескольких скриптах. Код Zinh "Inherited script", используемый для объединения символов и некоторых других специальных кодовых точек, указывает, что символ "наследует" свою идентичность скрипта от символа, с которым он объединен. (Ранее Unicode использовал для этой цели частный код Qaai.) Код Zzzz "Unknown" используется для всех символов, которые не принадлежат скрипту (т. е. значение по умолчанию), таких как символы и символы форматирования. В целом, символы одного скрипта могут быть разбросаны по нескольким блокам, как латинские символы . И наоборот: несколько скриптов могут присутствовать в одном блоке, например, блок Letterlike Symbols содержит символы из латинского, греческого и общего скриптов.
Если Script равен "" (пустой), то согласно Unicode символ не принадлежит к скрипту. Это относится к символам, поскольку существующие коды скрипта ISO "Zmth" (математическая нотация), "Zsym" (символ) и "Zsye" (символ, вариант эмодзи) не используются в Unicode. Свойство "Script" также пусто для кодовых точек, которые не являются типографскими символами, такими как элементы управления, заменители и кодовые точки частного использования.
Если в ISO 15924 есть определенное имя псевдонима письма, оно используется в имени символа: U+0041 A ЛАТИНСКАЯ ЗАГЛАВНАЯ БУКВА A и U+05D0 א ЕВРЕЙСКАЯ БУКВА ALEF .
ИСО 15924 | Скрипт в Unicode [e] | |||||||
---|---|---|---|---|---|---|---|---|
Код | Номер ISO | Официальное название ISO | Направленность | Псевдоним Unicode [f] | Версия | Персонажи | Примечания | Описание |
Адлм | 166 | Адлам | письмо справа налево | Адлам | 9.0 | 88 | Гл 19.9 | |
Афак | 439 | Афака | варьируется | ZZ — Не в Unicode, предложение изучается [i] | ||||
Агхб | 239 | Кавказский албанец | слева направо | Кавказский албанец | 7.0 | 53 | Древний/исторический | Гл 8.11 |
Ахом | 338 | Ахом, Тай Ахом | слева направо | Ахом | 8.0 | 65 | Древний/исторический | Гл 15.16 |
арабский | 160 | арабский | письмо справа налево | арабский | 1.0 | 1,373 | Гл. 9.2 | |
Аран | 161 | Арабский (вариант насталик) | смешанный | ZZ — Типографский вариант арабского языка (см. § Арабский) | ||||
Арми | 124 | Имперский арамейский | письмо справа налево | Имперский арамейский | 5.2 | 31 | Древний/исторический | Гл. 10.4 |
Армн | 230 | армянский | слева направо | армянский | 1.0 | 96 | Гл 7.6 | |
Авст | 134 | авестийский | письмо справа налево | авестийский | 5.2 | 61 | Древний/исторический | Гл 10.7 |
Бали | 360 | балийский | слева направо | балийский | 5.0 | 127 | Гл 17.3 | |
Баму | 435 | Бамум | слева направо | Бамум | 5.2 | 657 | Гл 19.6 | |
Бас | 259 | Басса Вах | слева направо | Басса Вах | 7.0 | 36 | Древний/исторический | Гл 19.7 |
Батк | 365 | Батак | слева направо | Батак | 6.0 | 56 | Гл 17.6 | |
Бенг | 325 | Бенгальский (Бенгальский) | слева направо | бенгальский | 1.0 | 96 | Гл 12.2 | |
Бхкс | 334 | Бхайксуки | слева направо | Бхайксуки | 9.0 | 97 | Древний/исторический | Гл 14.3 |
Блис | 550 | Blissymbols | варьируется | ZZ — Не в Unicode, предложение изучается [i] | ||||
Бопо | 285 | Бопомофо | письмо слева направо, справа налево | Бопомофо | 1.0 | 77 | Гл 18.3 | |
Братан | 300 | Брахми | слева направо | Брахми | 6.0 | 115 | Древний/исторический | Гл 14.1 |
Брай | 570 | шрифт Брайля | слева направо | шрифт Брайля | 3.0 | 256 | Гл 21.1 | |
Буги | 367 | бугийский | слева направо | бугийский | 4.1 | 30 | Гл 17.2 | |
Бухд | 372 | Бухид | слева направо | Бухид | 3.2 | 20 | Гл 17.1 | |
Какм | 349 | Чакма | слева направо | Чакма | 6.1 | 71 | Гл 13.11 | |
Банки | 440 | Единая канадская аборигенная слоговая система | слева направо | Канадские аборигены | 3.0 | 726 | Гл 20.2 | |
Кари | 201 | Карианский | письмо слева направо, справа налево | Карианский | 5.1 | 49 | Древний/исторический | Гл 8.5 |
Чам | 358 | Чам | слева направо | Чам | 5.1 | 83 | Гл 16.10 | |
Шер | 445 | чероки | слева направо | Чероки | 3.0 | 172 | Гл 20.1 | |
Чис | 298 | Чисои | слева направо | ZZ — Не в Unicode, предложение зрелое [ii] | ||||
Хрс | 109 | Хорезмский | письмо справа налево , сверху вниз | Хорезмский | 13.0 | 28 | Древний/исторический | Гл 10.8 |
Цирт | 291 | Кирт | варьируется | ZZ — Не в Unicode | ||||
Коптский | 204 | коптский | слева направо | коптский | 1.0 | 137 | Древний/исторический, отделившийся от греческого в 4.1 | Гл 7.3 |
Cpmn | 402 | Кипро-минойский | слева направо | кипро-минойский | 14.0 | 99 | Древний/исторический | Гл 8.4 |
Cprt | 403 | Кипрская слоговая азбука | письмо справа налево | кипрский | 4.0 | 55 | Древний/исторический | Гл 8.3 |
Сирл | 220 | кириллица | слева направо | кириллица | 1.0 | 508 | Включает типографский вариант старославянского языка (см. § Cyrs) | Гл 7.4 |
Cyrs | 221 | Кириллица (старославянский вариант) | варьируется | ZZ — Типографский вариант кириллицы (см. § Cyrl); Древний/исторический | ||||
Дэва | 315 | Деванагари (Нагари) | слева направо | Деванагари | 1.0 | 164 | Гл 12.1 | |
Диак | 342 | Ныряет Акуру | слева направо | Ныряет Акуру | 13.0 | 72 | Древний/исторический | Гл 15.15 |
Догр | 328 | Догра | слева направо | Догра | 11.0 | 60 | Древний/исторический | Гл 15.18 |
Dsrt | 250 | Дезерет (мормоны) | слева направо | Дезерет | 3.1 | 80 | Гл 20.4 | |
Дупл | 755 | Дюплоянская стенография, Дюплоянская стенография | слева направо | Дуплоян | 7.0 | 143 | Гл 21.6 | |
Египтянин | 070 | египетское демотическое письмо | смешанный | ZZ — Не в Unicode | ||||
Егых | 060 | египетский иератический | смешанный | ZZ — Не в Unicode | ||||
Египет | 050 | Египетские иероглифы | письмо справа налево , письмо слева направо | Египетские иероглифы | 5.2 | 5,105 | Древний/исторический | Гл 11.4 |
Эльба | 226 | Эльбасан | слева направо | Эльбасан | 7.0 | 40 | Древний/исторический | Гл 8.10 |
Элим | 128 | Елимейский | письмо справа налево | Елимейский | 12.0 | 23 | Древний/исторический | Гл 10.9 |
Эти | 430 | Эфиопский (геэз) | слева направо | Эфиопский | 3.0 | 523 | Гл 19.1 | |
Гара | 164 | Гарай | справа налево | Гарай | 16.0 | 69 | ||
Геок | 241 | Хуцури (Асомтаврули и Нусхури) | слева направо | грузинский | Юникод группирует Хуцори, Асомтаврули и Нусхури в «грузинский язык» (см. § Геок). Точно так же Мхедрули и Мтаврули являются «грузинскими» (см. § Георг). | Гл 7.7 | ||
Джордж | 240 | Грузинский (мхедрули и мтаврули) | слева направо | грузинский | 1.0 | 173 | В Unicode сюда также входит нусхури ( геок ). | Гл 7.7 |
Глаг | 225 | Глаголица | слева направо | Глаголица | 4.1 | 134 | Древний/исторический | Гл 7.5 |
Гонг | 312 | Гунджала Гонди | слева направо | Гунджала Гонди | 11.0 | 63 | Гл 13.15 | |
Гонм | 313 | Масарам Гонди | слева направо | Масарам Гонди | 10.0 | 75 | Гл 13.14 | |
Гот | 206 | готика | слева направо | готика | 3.1 | 27 | Древний/исторический | Гл 8.9 |
Гран | 343 | Грантха | слева направо | Грантха | 7.0 | 85 | Древний/исторический | Гл 15.14 |
Греческий | 200 | греческий | слева направо | греческий | 1.0 | 518 | Направленность иногда как бустрофедон | Гл 7.2 |
Гуджр | 320 | гуджарати | слева направо | гуджарати | 1.0 | 91 | Гл 12.4 | |
Гукх | 397 | Гурунг Кхема | слева направо | Гурунг Кхема | 16.0 | 58 | ||
Гуру | 310 | Гурмукхи | слева направо | Гурмукхи | 1.0 | 80 | Гл 12.3 | |
Ханб | 503 | Хан с Бопомофо (псевдоним Хан + Бопомофо) | смешанный | ZZ — См. § Хани, § Бопо | ||||
Вешать | 286 | Хангыль (Hangŭl, Хангыль) | слева направо, вертикально справа налево | Хангыль | 1.0 | 11,739 | Слоги хангыля перемещены в версии 2.0 | Гл 18.6 |
Хани | 500 | Хан (ханзи, кандзи, ханджа) | сверху вниз, столбцы справа налево (исторически) | Хан | 1.0 | 99,030 | Гл 18.1 | |
Хано | 371 | Хануноо (Hanunóo) | слева направо, снизу вверх | Хануноо | 3.2 | 21 | Гл 17.1 | |
Ганс | 501 | Хан (упрощенный вариант) | варьируется | ZZ — подмножество Хана (Ханзи, Кандзи, Ханджа) (см. § Хани) | ||||
Хант | 502 | Хан (традиционный вариант) | варьируется | ZZ — Подмножество § Хани | ||||
Хатр | 127 | Хатран | письмо справа налево | Хатран | 8.0 | 26 | Древний/исторический | Гл 10.12 |
иврит | 125 | иврит | письмо справа налево | иврит | 1.0 | 134 | Гл. 9.1 | |
Хира | 410 | Хирагана | вертикально справа налево, слева направо | Хирагана | 1.0 | 381 | Гл 18.4 | |
Хлув | 080 | Анатолийские иероглифы (лувийские иероглифы, хеттские иероглифы) | слева направо | Анатолийские иероглифы | 8.0 | 583 | Древний/исторический | Гл 11.6 |
Хмнг | 450 | Пахау Хмонг | слева направо | Пахау Хмонг | 7.0 | 127 | Гл 16.11 | |
Хмнп | 451 | Ньякенг Пуачуэ Хмонг | слева направо | Ньякенг Пуачуэ Хмонг | 12.0 | 71 | Гл 16.12 | |
Хркт | 412 | Японская слоговая азбука (альтернатива хирагане + катакане) | вертикально справа налево, слева направо | Катакана или Хирагана | См. § Хира, § Кана | Гл 18.4 | ||
Повешенный | 176 | Древневенгерский (венгерский рунический) | письмо справа налево | старовенгерский | 8.0 | 108 | Древний/исторический | Гл 8.8 |
Инды | 610 | Инд (Хараппский) | смешанный | ZZ — Не в Unicode, предложение изучается [i] | ||||
Итальянский | 210 | Древнеиталийские (этрусские, оскские и т. д.) | письмо справа налево , письмо слева направо | Старый курсив | 3.1 | 39 | Древний/исторический | Гл 8.6 |
Джамо | 284 | Джамо (псевдоним подмножества Джамо хангыля) | варьируется | ZZ — Подмножество § Hang | ||||
Ява | 361 | яванский | слева направо | яванский | 5.2 | 90 | Гл 17.4 | |
Япония | 413 | Японский (псевдоним Хан + Хирагана + Катакана) | варьируется | ZZ — См. § Хани, § Хира и § Кана | ||||
Юрц | 510 | чжурчжэнь | слева направо | ZZ — Не в Unicode | ||||
Кали | 357 | Кая Ли | слева направо | Кая Ли | 5.1 | 47 | Гл 16.9 | |
кана | 411 | Катакана | вертикально справа налево, слева направо | Катакана | 1.0 | 321 | Гл 18.4 | |
Кави | 368 | Кави | слева направо | Кави | 15.0 | 87 | Древний/исторический | Гл 17.9 |
Хар | 305 | Кхароштхи | письмо справа налево | Кхароштхи | 4.1 | 68 | Древний/исторический | Гл 14.2 |
Кхмр | 355 | кхмерский | слева направо | кхмерский | 3.0 | 146 | Гл 16.4 | |
Ходж | 322 | Ходжки | слева направо | Ходжки | 7.0 | 65 | Древний/исторический | Гл 15.7 |
Китл | 505 | Крупное киданьское письмо | слева направо | ZZ — Не в Unicode | ||||
Комплекты | 288 | Киданьская мелкая письменность | вертикально справа налево | Киданьское мелкое письмо | 13.0 | 472 | Древний/исторический | Гл 18.12 |
Кнда | 345 | каннада | слева направо | каннада | 1.0 | 91 | Гл 12.8 | |
Коре | 287 | Корейский (псевдоним хангыль + хань) | слева направо | ZZ — см. § Хани, § Ханг | ||||
Кпель | 436 | Кпелле | слева направо | ZZ — Не в Unicode, предложение изучается [i] | ||||
Край | 396 | Кират Рай | слева направо | Кират Рай | 16.0 | 58 | ||
Кти | 317 | Кайти | слева направо | Кайти | 5.2 | 68 | Древний/исторический | Гл 15.2 |
Лана | 351 | Тай Тхам (Ланна) | слева направо | Тай Тхам | 5.2 | 127 | Гл 16.7 | |
Лаоо | 356 | Лаосский | слева направо | Лаосский | 1.0 | 83 | Гл 16.2 | |
Латф | 217 | Латынь (вариант Fraktur) | варьируется | ZZ — Типографский вариант латиницы (см. § Latn) | ||||
Латг. | 216 | Латынь (гаэльский вариант) | слева направо | ZZ — Типографский вариант латиницы (см. § Latn) | ||||
лат. | 215 | латинский | слева направо | латинский | 1.0 | 1,487 | См. также: Латинский алфавит в Unicode | Гл 7.1 |
Леке | 364 | Леке | слева направо | ZZ — Не в Unicode | ||||
Лепц | 335 | Лепча (Ронг) | слева направо | Лепча | 5.1 | 74 | Гл 13.12 | |
Конечность | 336 | Лимбу | слева направо | Лимбу | 4.0 | 68 | Гл 13.6 | |
Лина | 400 | Линейное письмо А | слева направо | Линейное письмо А | 7.0 | 341 | Древний/исторический | Гл. 8.1 |
Линб | 401 | Линейное письмо Б | слева направо | Линейное письмо Б | 4.0 | 211 | Древний/исторический | Гл 8.2 |
Лису | 399 | Лису (Фрейзер) | слева направо | Лису | 5.2 | 49 | Гл 18.9 | |
Лома | 437 | Лома | слева направо | ZZ — Не в Unicode, предложение изучается [i] | ||||
Лики | 202 | Ликийский | слева направо | Ликийский | 5.1 | 29 | Древний/исторический | Гл 8.5 |
Лиди | 116 | Лидийский | письмо справа налево | Лидийский | 5.1 | 27 | Древний/исторический | Гл 8.5 |
Мадж | 314 | Махаджани | слева направо | Махаджани | 7.0 | 39 | Древний/исторический | Гл 15.6 |
Мака | 366 | Макасар | слева направо | Макасар | 11.0 | 25 | Древний/исторический | Гл 17.8 |
Манд | 140 | Мандейский, мандейский | письмо справа налево | мандейский | 6.0 | 29 | Гл 9.5 | |
Мани | 139 | Манихейский | письмо справа налево | Манихейский | 7.0 | 51 | Древний/исторический | Гл 10.5 |
Марк | 332 | Мархен | слева направо | Мархен | 9.0 | 68 | Древний/исторический | Гл 14.5 |
Майя | 090 | Иероглифы майя | смешанный | ZZ — Не в Unicode | ||||
Медф | 265 | Медефаидрин (Обери Окайме, Обери Ɔkaimɛ) | слева направо | Медефаидрин | 11.0 | 91 | Гл 19.10 | |
Починить | 438 | Менде Кикакуи | письмо справа налево | Менде Кикакуи | 7.0 | 213 | Гл 19.8 | |
Мерк | 101 | Мероитский курсив | письмо справа налево | Мероитский курсив | 6.1 | 90 | Древний/исторический | Гл 11.5 |
Меро | 100 | Мероитские иероглифы | письмо справа налево | Мероитские иероглифы | 6.1 | 32 | Древний/исторический | Гл 11.5 |
Млим | 347 | малаялам | слева направо | малаялам | 1.0 | 118 | Гл 12.9 | |
Моди | 324 | Моди, Моди | слева направо | Моди | 7.0 | 79 | Древний/исторический | Гл 15.12 |
Монг | 145 | монгольский | вертикально слева направо, слева направо | монгольский | 3.0 | 168 | Монг включает в себя клир и маньчжурскую письменность | Гл 13.5 |
Луна | 218 | Луна (код Луны, сценарий Луны, тип Луны) | смешанный | ZZ — Не в Unicode, предложение изучается [i] | ||||
Мру | 264 | Мро, Мру | слева направо | Мро | 7.0 | 43 | Гл 13.8 | |
Мтей | 337 | Мейтей Мейек (Мейтей, Мейтей) | слева направо | Митэй Майек | 5.2 | 79 | Гл 13.7 | |
Мульт | 323 | Мултани | слева направо | Мултани | 8.0 | 38 | Древний/исторический | Гл 15.10 |
Мымр | 350 | Мьянма (бирманский) | слева направо | Мьянма | 3.0 | 243 | Гл 16.3 | |
Нагм | 295 | Наг Мундари | слева направо | Наг Мундари | 15.0 | 42 | ||
Нанд | 311 | Нандинагари | слева направо | Нандинагари | 12.0 | 65 | Древний/исторический | Гл 15.13 |
Нарб | 106 | Древний североаравийский (Древний североаравийский) | письмо справа налево | Древний североаравийский | 7.0 | 32 | Древний/исторический | Гл 10.1 |
Нбат | 159 | набатейский | письмо справа налево | набатейский | 7.0 | 40 | Древний/исторический | Гл 10.10 |
Ньюа | 333 | Ньюа, Невар, Невари, Непальские липи | слева направо | Ньюа | 9.0 | 97 | Гл 13.3 | |
Нкдб | 085 | Наси Донгба (na²¹ɕi³³ to³³ba²¹, Нахи Томба) | слева направо | ZZ — Не в Unicode | ||||
Нкгб | 420 | Наси Геба (na²¹ɕi³³ gʌ²¹ba²¹, 'На-'Хи ²Ggŏ-¹baw, Нахи Геба) | слева направо | ZZ — Не в Unicode, предложение изучается [i] | ||||
Нкоо | 165 | Н'Ко | письмо справа налево | НКо | 5.0 | 62 | Гл 19.4 | |
Ншу | 499 | Нюшу | вертикально справа налево | Нушу | 10.0 | 397 | Гл 18.8 | |
Огам | 212 | Огам | снизу вверх, слева направо | Огам | 3.0 | 29 | Древний/исторический | Гл 8.14 |
Ольк | 261 | Ол Чики (Ол Цеметь, Ол, Сантали) | слева направо | Ол Чики | 5.1 | 48 | Гл 13.10 | |
Онао | 296 | Ол Онал | слева направо | Ол Онал | 16.0 | 44 | ||
Оркх | 175 | Древнетюркский, орхонский рунический | письмо справа налево | Древнетюркский | 5.2 | 73 | Древний/исторический | Гл 14.8 |
Орья | 327 | Ория (Одиа) | слева направо | Ория | 1.0 | 91 | Гл 12.5 | |
Осге | 219 | Осейдж | слева направо | Осейдж | 9.0 | 72 | Гл 20.3 | |
Осма | 260 | Османия | слева направо | Османия | 4.0 | 40 | Гл 19.2 | |
Оугр | 143 | Старый уйгурский | смешанный | Старый уйгурский | 14.0 | 26 | Древний/исторический | Гл 14.11 |
Ладонь | 126 | Пальмирена | письмо справа налево | Пальмирена | 7.0 | 32 | Древний/исторический | Гл 10.11 |
Паук | 263 | Пау Син Хау | слева направо | Пау Син Хау | 7.0 | 57 | Гл 16.13 | |
Пцун | 015 | Протоклинография | слева направо | ZZ — Не в Unicode | ||||
Пелм | 016 | Протоэламитский | слева направо | ZZ — Не в Unicode | ||||
Пермь | 227 | Старый Пермский | слева направо | Старый Пермский | 7.0 | 43 | Древний/исторический | Гл 8.13 |
Фаг | 331 | Пхагс-па | вертикально слева направо | Пхагс-па | 5.0 | 56 | Древний/исторический | Гл 14.4 |
Фли | 131 | Надписи на пехлеви | письмо справа налево | Надписи на пехлеви | 5.2 | 27 | Древний/исторический | Гл 10.6 |
ФЛП | 132 | Псалтырь пехлевийский | письмо справа налево | Псалтырь пехлевийский | 7.0 | 29 | Древний/исторический | Гл 10.6 |
Флв | 133 | Книга Пехлеви | смешанный | ZZ — Не в Unicode | ||||
Фнкс | 115 | финикийский | письмо справа налево | финикийский | 5.0 | 29 | Древний/исторический [г] | Гл 10.3 |
Пикд | 293 | Клингонский (KLI pIqaD) | слева направо | ZZ — Отклонено для включения в Unicode [iii] [iv] | ||||
Плрд | 282 | Мяо (Поллард) | слева направо | Мяо | 6.1 | 149 | Гл 18.10 | |
Прти | 130 | Парфянские надписи | письмо справа налево | Парфянские надписи | 5.2 | 30 | Древний/исторический | Гл 10.6 |
Псин | 103 | Протосинайский | смешанный | ZZ — Не в Unicode | ||||
Qaaa-Qabx | 900-949 | Зарезервировано для личного пользования (диапазон) | ZZ — Не в Unicode | |||||
Рандж | 303 | Ранджана | слева направо | ZZ — Не в Unicode | ||||
Ржнг | 363 | Реджанг (Реджанг, Каганга) | слева направо | Реджанг | 5.1 | 37 | Гл 17.5 | |
Рохг | 167 | Ханифи Рохинджа | письмо справа налево | Ханифи Рохинджа | 11.0 | 50 | Гл 16.14 | |
Роро | 620 | Ронгоронго | смешанный | ZZ — Не в Unicode, предложение изучается [i] | ||||
Бегун | 211 | Рунический | слева направо, бустрофедон | Рунический | 3.0 | 86 | Древний/исторический | Гл 8.7 |
Самр | 123 | самаритянин | письмо справа налево , сверху вниз | самаритянин | 5.2 | 61 | Гл. 9.4 | |
Сара | 292 | Сарати | смешанный | ZZ — Не в Unicode | ||||
Сарб | 105 | Древний южноаравийский | письмо справа налево | Древний южноаравийский | 5.2 | 32 | Древний/исторический | Гл 10.2 |
Саур | 344 | Саураштра | слева направо | Саураштра | 5.1 | 82 | Гл 13.13 | |
Sgnw | 095 | Написание жестов | вертикально слева направо | Написание жестов | 8.0 | 672 | Гл 21.7 | |
Шоу | 281 | Шэвиан (Шоу) | слева направо | Шэвиан | 4.0 | 48 | Гл 8.15 | |
Клочок | 319 | Шарада, Шарада | слева направо | Шарада | 6.1 | 96 | Гл 15.3 | |
Шуй | 530 | Шуйшу | слева направо | ZZ — Не в Unicode | ||||
Сидд | 302 | Сиддхам, Сиддхам, Сиддхаматрика | слева направо | Сиддхам | 7.0 | 92 | Древний/исторический | Гл 15.5 |
Сидт | 180 | Сидетик | справа налево | ZZ — Не в Unicode, предложение зрелое [ii] | ||||
Синд | 318 | Худавади, Синдхи | слева направо | Худавади | 7.0 | 69 | Гл 15.9 | |
Синх | 348 | сингальский | слева направо | сингальский | 3.0 | 111 | Гл 13.2 | |
Согд | 141 | согдийский | горизонтальное и вертикальное письмо в восточноазиатских письменностях , сверху вниз | согдийский | 11.0 | 42 | Древний/исторический | Гл 14.10 |
Сого | 142 | Древний согдийский | письмо справа налево | Древний согдийский | 11.0 | 40 | Древний/исторический | Гл 14.9 |
Сора | 398 | Сора Сомпенг | слева направо | Сора Сомпенг | 6.1 | 35 | Гл 15.17 | |
Сойо | 329 | Соёмбо | слева направо | Соёмбо | 10.0 | 83 | Древний/исторический | Гл 14.7 |
Сунд | 362 | Суданский | слева направо | Суданский | 5.1 | 72 | Гл 17.7 | |
Суну | 274 | Сунувар | слева направо | Сунувар | 16.0 | 44 | ||
Силос | 316 | Силоти Нагри | слева направо | Силоти Нагри | 4.1 | 45 | Древний/исторический | Гл 15.1 |
Syrc | 135 | сирийский | письмо справа налево | сирийский | 3.0 | 88 | Включает типографские варианты Estrangelo (см. § Syre), Western (§ Syrj) и Eastern (§ Syrn) | Гл. 9.3 |
Сире | 138 | Сирийский (вариант Эстранджело) | смешанный | ZZ — Типографский вариант сирийского языка (см. § Syrc) | ||||
Сырдж | 137 | Сирийский (западный вариант) | смешанный | ZZ — Типографский вариант сирийского языка (см. § Syrc) | ||||
Сирн | 136 | Сирийский (восточный вариант) | смешанный | ZZ — Типографский вариант сирийского языка (см. § Syrc) | ||||
Тегб | 373 | Тагбанва | слева направо | Тагбанва | 3.2 | 18 | Гл 17.1 | |
Такр | 321 | Такри, Такри, Танкри | слева направо | Такри | 6.1 | 68 | Гл 15.4 | |
Сказка | 353 | Тай Ле | слева направо | Тай Ле | 4.0 | 35 | Гл 16.5 | |
Талу | 354 | Новый Тай Лю | слева направо | Новый Тай Лю | 4.1 | 83 | Гл 16.6 | |
Тамл | 346 | тамильский | слева направо | тамильский | 1.0 | 123 | Гл 12.6 | |
Тан | 520 | тангутский | вертикально справа налево, слева направо | тангутский | 9.0 | 6,914 | Древний/исторический | Гл 18.11 |
Тавт | 359 | Тай Вьет | слева направо | Тай Вьет | 5.2 | 72 | Гл 16.8 | |
Тайо | 380 | Тай Йо | сверху вниз, столбцы справа налево | ZZ — Не в Unicode, предложение зрелое [ii] | ||||
Телу | 340 | телугу | слева направо | телугу | 1.0 | 100 | Гл 12.7 | |
Тэн | 290 | Тенгвар | слева направо | ZZ — Не в Unicode | ||||
Тфнг | 120 | Тифинаг (берберский) | письмо слева направо, справа налево , сверху вниз, снизу вверх | Тифинаг | 4.1 | 59 | Гл 19.3 | |
Тглг | 370 | Тагальский (Байбаин, Алибата) | слева направо | тагальский | 3.2 | 23 | Гл 17.1 | |
Таа | 170 | Тана | письмо справа налево | Тана | 3.0 | 50 | Гл 13.1 | |
тайский | 352 | тайский | слева направо | тайский | 1.0 | 86 | Гл 16.1 | |
Тибт | 330 | тибетский | слева направо | тибетский | 2.0 | 207 | Добавлено в версии 1.0, удалено в версии 1.1 и вновь введено в версии 2.0 | Гл 13.4 |
Тирх | 326 | Тирута | слева направо | Тирута | 7.0 | 82 | Гл 15.11 | |
Тнса | 275 | Тангса | слева направо | Тангса | 14.0 | 89 | Гл 13.18 | |
Тодр | 229 | Тодри | справа налево | Тодри | 16.0 | 52 | Древний/исторический | |
Толс | 299 | Толонг Сики | слева направо | ZZ — Не в Unicode, предложение зрелое [ii] | ||||
Тото | 294 | Тото | слева направо | Тото | 14.0 | 31 | Гл 13.17 | |
Тутг | 341 | Тулу-Тигалари | слева направо | Тулу Тигалари | 16.0 | 80 | ||
Угар | 040 | Угаритский | слева направо | Угаритский | 4.0 | 31 | Древний/исторический | Гл 11.2 |
Вайи | 470 | Вай | слева направо | Вай | 5.1 | 300 | Гл 19.5 | |
Висп | 280 | Видимая речь | слева направо | ZZ — Не в Unicode | ||||
Вит | 228 | Виткуки | слева направо | Виткуки | 14.0 | 70 | Древний/исторический | Гл 8.12 |
Вара | 262 | Варанг Сити (Варанг Кшити) | слева направо | Варанг Сити | 7.0 | 84 | Гл 13.9 | |
Чтчо | 283 | Ванчо | слева направо | Ванчо | 12.0 | 59 | Гл 13.16 | |
Воле | 480 | Волеаи | смешанный | ZZ — Не в Unicode, предложение изучается [i] | ||||
Xpeo | 030 | Древнеперсидский | слева направо | Древнеперсидский | 4.1 | 50 | Древний/исторический | Гл 11.3 |
Xsux | 020 | Клинопись, шумеро-аккадская | слева направо | Клинопись | 5.0 | 1,234 | Древний/исторический | Гл 11.1 |
Йези | 192 | езидский | письмо справа налево | езидский | 13.0 | 47 | Древний/исторический | Гл 9.6 |
Ииии | 460 | Йи | слева направо | Йи | 3.0 | 1,220 | Гл 18.7 | |
Занб | 339 | Площадь Занабазар (Zanabazarin Dörböljin Useg, Xewtee Dörböljin Bicig, шрифт Horizontal Square) | слева направо | Площадь Занабазара | 10.0 | 72 | Древний/исторический | Гл 14.6 |
Зинь | 994 | Код для унаследованного скрипта | Унаследованный | 657 | ||||
Змтх | 995 | Математическая нотация | ZZ — Не является «скриптом» в Unicode | |||||
Зсим | 996 | Символы | ZZ — Не является «скриптом» в Unicode | |||||
Зсье | 993 | Символы (вариант эмодзи) | ZZ — Не является «скриптом» в Unicode | |||||
Zxxx | 997 | Код для неписаных документов | ZZ — Не является «скриптом» в Unicode | |||||
Зыыы | 998 | Код для неопределенного скрипта | Общий | 9,053 | ||||
Зззз | 999 | Код для незакодированного скрипта | Неизвестный | 959,049 | В Unicode: все остальные кодовые точки | |||
Примечания
| ||||||||
Ссылки
|
Разложения, тип разложения, канонический объединяющий класс, исключения композиции и многое другое.
Этот раздел нуждается в расширении . Вы можете помочь, дополнив его. ( Март 2022 ) |
Age — это версия Стандарта, в которой впервые была обозначена кодовая точка. Номер версии сокращается до нумерации major.minor, хотя используются более подробные номера версий: версии 4.0.0 и 4.0.1 обе называются 4.0 как Age. Учитывая выпуски, Age может быть из диапазона: 1.1, 2.0, 2.1, 3.0, 3.1, 3.2, 4.0, 4.1, 5.0, 5.1, 5.2, 6.0, 6.1, 6.2, 6.3, 7.0, 8.0, 9.0, 10.0, 11.0, 12.0, 12.1, 13.0, 14.0, 15.0, 15.1 и 16.0. [21] Длинные значения для Age начинаются с буквы V и используют подчеркивание вместо точки: например, V1_1. [2] Кодовые точки без специально назначенного значения возраста имеют значение «NA» с длинной формой «Unassigned».
После определения символа он не будет удален или переназначен. [22] Однако символ может быть объявлен устаревшим , что означает, что его «использование настоятельно не рекомендуется». [23] Начиная с версии Unicode 15.1, следующие пятнадцать символов являются устаревшими: [24]
Устаревшие символы в Unicode | ||||
---|---|---|---|---|
Кодовая точка | Имя персонажа | Рекомендуемая альтернатива | Замечания | |
U+0149 | ЛАТИНСКАЯ СТРОЧНАЯ БУКВА N С ПРЕДШЕСТВУЮЩИМ АПОСТРОФОМ | U+02BC U+006E | ʼн | |
U+0673 | АРАБСКАЯ БУКВА АЛЕФ С ВОЛНИСТОЙ ХАМЗОЙ НИЖЕ | У+0627 У+065Ф | да | |
У+0Ф77 | ТИБЕТСКИЙ ЗНАК ГЛАСНОГО ВОКАЛЬНЫЙ RR | U+0FB2 U+0F81 [а] | ྲཱྀ | |
У+0Ф79 | ТИБЕТСКИЙ ЗНАК ГЛАСНОГО ВОКАЛЬНЫЙ LL | U+0FB3 U+0F81 [а] | ླཱྀ | |
У+17А3 | КХМЕРСКИЙ НЕЗАВИСИМЫЙ ГЛАСНОЙ QAQ | У+17А2 | អ | |
У+17А4 | КХМЕРСКИЙ НЕЗАВИСИМЫЙ ГЛАСНОЙ QAA | У+17А2 У+17Б6 | អា | |
У+206А | ЗАПРЕТИТЬ СИММЕТРИЧНУЮ ОБМЕНКУ | Нет [б] | ||
У+206Б | АКТИВИРОВАТЬ СИММЕТРИЧНЫЙ ОБМЕН | Нет [б] | ||
У+206С | ПРЕПЯТСТВУЕТ ФОРМИРОВАНИЮ АРАБСКИХ ФОРМ | Нет [б] | ||
У+206Д | АКТИВИРУЙТЕ ФОРМИРОВАНИЕ АРАБСКОЙ ФОРМЫ | Нет [б] | ||
У+206Е | НАЦИОНАЛЬНЫЕ ЦИФРОВЫЕ ФОРМЫ | Нет [б] | ||
У+206Ф | НОМИНАЛЬНЫЕ ФОРМЫ ЦИФР | Нет [б] | ||
U+2329 | УГЛОВАЯ СКОБКА, НАПРАВЛЕННАЯ ВЛЕВО | U+3008 [с] | 〈 | U+27E8 ⟨ МАТЕМАТИЧЕСКАЯ ЛЕВАЯ УГЛОВАЯ СКОБКА рекомендуется для математических и других технических целей. |
У+232А | ПРАВОУГОЛЬНАЯ СКОБКА | U+3009 [с] | 〉 | U+27E9 ⟩ МАТЕМАТИЧЕСКАЯ ПРЯМАЯ УГЛОВАЯ СКОБКА рекомендуется для математических и других технических целей. |
У+Е0001 | ЯЗЫКОВОЙ ТЕГ | Нет [д] | ||
|
Стандарт Unicode определяет следующие свойства, связанные с границами:
Unicode может назначать псевдонимы кодовым точкам. Эти имена уникальны среди всех имен (включая обычные), поэтому их можно использовать в качестве идентификатора. Существует пять возможных причин для добавления псевдонима:
После кодирования символа он не будет перемещен или удален.