Блок Unicode — это один из нескольких смежных диапазонов числовых кодов символов ( кодовых точек ) набора символов Unicode , которые определены Консорциумом Unicode для административных и документационных целей. Обычно предложения, такие как добавление новых глифов, обсуждаются и оцениваются путем рассмотрения соответствующего блока или блоков в целом.
Каждый блок, как правило, но не всегда, предназначен для предоставления глифов, используемых в одном или нескольких конкретных языках или в какой-либо общей прикладной области, такой как математика , геодезия , декоративный набор , социальные форумы и т. д.
Блоки Unicode идентифицируются уникальными именами, которые используют только символы ASCII и обычно описывают природу символов на английском языке ; например, «Tibetan» или «Supplemental Arrows-A». (При сравнении имен блоков предполагается, что заглавные буквы следует приравнивать к строчным, а пробелы, дефисы и подчеркивания игнорировать; поэтому последнее имя эквивалентно «supplemental_arrows__a» и «SUPPLEMENTALARROWSA». [1]
Блоки попарно не пересекаются ; то есть они не перекрываются. Начальная кодовая точка и размер (количество кодовых точек) каждого блока всегда кратны 16; поэтому в шестнадцатеричной нотации начальная (наименьшая) точка — U+ xxx 0, а конечная (наибольшая) точка — U+ yyy F, где xxx и yyy — три или более шестнадцатеричных цифры. (Эти ограничения предназначены для упрощения отображения глифов в документах Консорциума Unicode в виде таблиц с 16 строками, помеченными последней шестнадцатеричной цифрой кодовой точки. [1] ) Размер блока может варьироваться от минимум 16 до максимум 65 536 кодовых точек.
Каждая назначенная кодовая точка имеет свойство глифа, называемое «Блок», значением которого является строка символов, именующая уникальный блок, которому принадлежит эта точка. [2] Однако блок может также содержать неназначенные кодовые точки, обычно зарезервированные для будущих добавлений символов, которые «логически» должны принадлежать этому блоку. Кодовые точки, не принадлежащие ни одному из названных блоков, например, в неназначенных плоскостях 4–13, имеют значение block="No_Block". [1]
Просто принадлежность к определенному блоку Unicode не гарантирует определенных конкретных свойств символов, которые он должен или будет содержать. Идентичность любого символа определяется его свойствами, указанными в базе данных символов Unicode. Например, непрерывный диапазон из 32 несимвольных кодовых точек U+FDD0..U+FDEF не разделяет ни одно из свойств, общих с другими символами в блоке Arabic Presentation Forms-A , то есть они определенно не являются символами арабского письма или «несимволами с письмом справа налево», и назначаются там в качестве заполнителя для этого блока, учитывая, что было согласовано, что никакие другие совместимые с арабским символы не будут кодироваться. [3]
Каждая точка Unicode также имеет свойство, называемое « Общая категория », которое пытается описать роль соответствующего символа в языках или приложениях, ради которых он был включен в систему. Примерами Общих категорий являются «Lu» (что означает заглавную букву), «Nd» (десятичная цифра), «Pi» (открытая кавычка) и «Mn» (непробеловый знак, т. е. диакритический знак для предшествующего глифа). Это разделение полностью независимо от кодовых блоков: кодовые точки с заданной Общей категорией обычно охватывают много блоков и не обязательно должны быть последовательными, даже внутри каждого блока. [4]
Каждая кодовая точка также имеет свойство script , указывающее, для какой системы письма она предназначена, или предназначена ли она для нескольких систем письма. Это также не зависит от блока.
В описаниях системы Unicode блок может быть подразделен на более конкретные подгруппы, такие как « Шахматные символы » в блоке «Разные символы» (не путать с отдельным блоком «Шахматные символы »). Эти подгруппы не являются «блоками» в техническом смысле, используемом консорциумом Unicode, и названы только для удобства пользователей.
Unicode 16.0 определяет 338 блоков: [1]
Самолет | Диапазон блока | Имя блока | Кодовые точки [a] | Назначенные символы | Сценарии [б] [в] [г] [д] [е] |
---|---|---|---|---|---|
0 БМП | U+0000..U+007F | Базовая латынь [г] | 128 | 128 | Латинский (52 символа), Общий (76 символов) |
0 БМП | U+0080..U+00FF | Latin-1 Дополнение [h] | 128 | 128 | Латинский (64 символа), Общий (64 символа) |
0 БМП | U+0100..U+017F | Расширенная латиница-А | 128 | 128 | латинский |
0 БМП | U+0180..U+024F | Расширенная латиница-B | 208 | 208 | латинский |
0 БМП | U+0250..U+02AF | Расширения IPA | 96 | 96 | латинский |
0 БМП | U+02B0..U+02FF | Буквы-модификаторы интервала | 80 | 80 | Бопомофо (2 символа), Латинский (14 символов), Общий (64 символа) |
0 БМП | U+0300..U+036F | Объединение диакритических знаков | 112 | 112 | Унаследованный |
0 БМП | U+0370..U+03FF | Греческий и коптский | 144 | 135 | Коптский (14 символов), греческий (117 символов), общий (4 символа) |
0 БМП | U+0400..U+04FF | кириллица | 256 | 256 | Кириллица (254 символа), Наследуемый (2 символа) |
0 БМП | U+0500..U+052F | Кириллическое дополнение | 48 | 48 | кириллица |
0 БМП | U+0530..U+058F | армянский | 96 | 91 | армянский |
0 БМП | U+0590..U+05FF | иврит | 112 | 88 | иврит |
0 БМП | U+0600..U+06FF | арабский | 256 | 256 | Арабский (238 символов), Общий (6 символов), Унаследованный (12 символов) |
0 БМП | U+0700..U+074F | сирийский | 80 | 77 | сирийский |
0 БМП | U+0750..U+077F | Арабское приложение | 48 | 48 | арабский |
0 БМП | U+0780..U+07BF | Тана | 64 | 50 | Тана |
0 БМП | U+07C0..U+07FF | НКо | 64 | 62 | Н'Ко |
0 БМП | U+0800..U+083F | самаритянин | 64 | 61 | самаритянин |
0 БМП | U+0840..U+085F | мандейский | 32 | 29 | мандейский |
0 БМП | U+0860..U+086F | Сирийское дополнение | 16 | 11 | сирийский |
0 БМП | U+0870..U+089F | Арабский расширенный-B | 48 | 42 | арабский |
0 БМП | U+08A0..U+08FF | Арабский расширенный-А | 96 | 96 | Арабский (95 символов), Общий (1 символ) |
0 БМП | U+0900..U+097F | Деванагари | 128 | 128 | Деванагари (122 символа), Общий (2 символа), Унаследованный (4 символа) |
0 БМП | U+0980..U+09FF | бенгальский | 128 | 96 | бенгальский |
0 БМП | У+0А00..У+0А7Ф | Гурмукхи | 128 | 80 | Гурмукхи |
0 БМП | У+0А80..У+0АФФ | гуджарати | 128 | 91 | гуджарати |
0 БМП | U+0B00..U+0B7F | Ория | 128 | 91 | Ория |
0 БМП | U+0B80..U+0BFF | тамильский | 128 | 72 | тамильский |
0 БМП | U+0C00..U+0C7F | телугу | 128 | 100 | телугу |
0 БМП | U+0C80..U+0CFF | каннада | 128 | 91 | каннада |
0 БМП | U+0D00..U+0D7F | малаялам | 128 | 118 | малаялам |
0 БМП | U+0D80..U+0DFF | сингальский | 128 | 91 | сингальский |
0 БМП | U+0E00..U+0E7F | тайский | 128 | 87 | Тайский (86 символов), Общий (1 символ) |
0 БМП | U+0E80..U+0EFF | Лаосский | 128 | 83 | Лаосский |
0 БМП | U+0F00..U+0FFF | тибетский | 256 | 211 | Тибетский (207 символов), Общий (4 символа) |
0 БМП | У+1000..У+109Ф | Мьянма | 160 | 160 | Мьянма |
0 БМП | У+10А0..У+10ФФ | грузинский | 96 | 88 | Грузинский (87 символов), Общий (1 символ) |
0 БМП | U+1100..U+11FF | Хангыль Джамо | 256 | 256 | Хангыль |
0 БМП | У+1200..У+137Ф | Эфиопский | 384 | 358 | Эфиопский |
0 БМП | У+1380..У+139Ф | Эфиопская добавка | 32 | 26 | Эфиопский |
0 БМП | У+13А0..У+13ФФ | Чероки | 96 | 92 | Чероки |
0 БМП | У+1400..У+167Ф | Единая канадская аборигенная слоговая система | 640 | 640 | Канадские аборигены |
0 БМП | У+1680..У+169Ф | Огам | 32 | 29 | Огам |
0 БМП | У+16А0..У+16ФФ | Рунический | 96 | 89 | Рунический (86 символов), Общий (3 символа) |
0 БМП | У+1700..У+171Ф | тагальский | 32 | 23 | тагальский |
0 БМП | У+1720..У+173Ф | Хануноо | 32 | 23 | Хануноо (21 символ), Обычный (2 символа) |
0 БМП | У+1740..У+175Ф | Бухид | 32 | 20 | Бухид |
0 БМП | У+1760..У+177Ф | Тагбанва | 32 | 18 | Тагбанва |
0 БМП | U+1780..U+17FF | кхмерский | 128 | 114 | кхмерский |
0 БМП | У+1800..У+18АФ | монгольский | 176 | 158 | Монгольский (155 символов), Общий (3 символа) |
0 БМП | U+18B0..U+18FF | Расширенная унифицированная канадская аборигенная слоговая система | 80 | 70 | Канадские аборигены |
0 БМП | У+1900..У+194Ф | Лимбу | 80 | 68 | Лимбу |
0 БМП | У+1950..У+197Ф | Тай Ле | 48 | 35 | Тай Ле |
0 БМП | У+1980..У+19ДФ | Новый Тай Лю | 96 | 83 | Новый Тай Лю |
0 БМП | U+19E0..U+19FF | Кхмерские символы | 32 | 32 | кхмерский |
0 БМП | У+1А00..У+1А1Ф | бугийский | 32 | 30 | бугийский |
0 БМП | У+1А20..У+1ААФ | Тай Тхам | 144 | 127 | Тай Тхам |
0 БМП | U+1AB0..U+1AFF | Расширенное объединение диакритических знаков | 80 | 31 | Унаследованный |
0 БМП | U+1B00..U+1B7F | балийский | 128 | 127 | балийский |
0 БМП | U+1B80..U+1BBF | Суданский | 64 | 64 | Суданский |
0 БМП | U+1BC0..U+1BFF | Батак | 64 | 56 | Батак |
0 БМП | U+1C00..U+1C4F | Лепча | 80 | 74 | Лепча |
0 БМП | У+1С50..У+1С7Ф | Ол Чики | 48 | 48 | Ол Чики |
0 БМП | U+1C80..U+1C8F | Кириллица расширенная-С | 16 | 11 | кириллица |
0 БМП | U+1C90..U+1CBF | Грузинский расширенный | 48 | 46 | грузинский |
0 БМП | U+1CC0..U+1CCF | Суданская добавка | 16 | 8 | Суданский |
0 БМП | U+1CD0..U+1CFF | Ведические расширения | 48 | 43 | Обычный (16 символов), Наследуемый (27 символов) |
0 БМП | U+1D00..U+1D7F | Фонетические расширения | 128 | 128 | Кириллица (2 символа), греческий (15 символов), латиница (111 символов) |
0 БМП | U+1D80..U+1DBF | Дополнение к фонетическим расширениям | 64 | 64 | Греческий (1 символ), латинский (63 символа) |
0 БМП | U+1DC0..U+1DFF | Дополнение к комбинированным диакритическим знакам | 64 | 64 | Унаследованный |
0 БМП | U+1E00..U+1EFF | Расширенная латиница Дополнительный | 256 | 256 | латинский |
0 БМП | U+1F00..U+1FFF | Греческий расширенный | 256 | 233 | греческий |
0 БМП | У+2000..У+206Ф | Общая пунктуация | 112 | 111 | Обычный (109 символов), Унаследованный (2 символа) |
0 БМП | У+2070..У+209Ф | Надстрочные и подстрочные индексы | 48 | 42 | Латинский (15 символов), Общий (27 символов) |
0 БМП | У+20А0..У+20CF | Символы валют | 48 | 33 | Общий |
0 БМП | U+20D0..U+20FF | Объединение диакритических знаков для символов | 48 | 33 | Унаследованный |
0 БМП | У+2100..У+214Ф | Буквоподобные символы | 80 | 80 | Греческий (1 символ), Латинский (4 символа), Общий (75 символов) |
0 БМП | У+2150..У+218Ф | Числовые формы | 64 | 60 | Латинский (41 символ), Общий (19 символов) |
0 БМП | U+2190..U+21FF | Стрелки | 112 | 112 | Общий |
0 БМП | U+2200..U+22FF | Математические операторы | 256 | 256 | Общий |
0 БМП | U+2300..U+23FF | Разное техническое | 256 | 256 | Общий |
0 БМП | У+2400..У+243Ф | Контрольные картинки | 64 | 42 | Общий |
0 БМП | У+2440..У+245Ф | Оптическое распознавание символов | 32 | 11 | Общий |
0 БМП | U+2460..U+24FF | Вложенные буквенно-цифровые символы | 160 | 160 | Общий |
0 БМП | У+2500..У+257Ф | Рисунок коробки | 128 | 128 | Общий |
0 БМП | У+2580..У+259Ф | Блочные элементы | 32 | 32 | Общий |
0 БМП | У+25А0..У+25ФФ | Геометрические фигуры | 96 | 96 | Общий |
0 БМП | U+2600..U+26FF | Разные символы | 256 | 256 | Общий |
0 БМП | У+2700..У+27БФ | Дингбаты | 192 | 192 | Общий |
0 БМП | U+27C0..U+27EF | Различные математические символы-А | 48 | 48 | Общий |
0 БМП | U+27F0..U+27FF | Дополнительные стрелки-A | 16 | 16 | Общий |
0 БМП | U+2800..U+28FF | Шаблоны Брайля | 256 | 256 | шрифт Брайля |
0 БМП | У+2900..У+297Ф | Дополнительные стрелки-B | 128 | 128 | Общий |
0 БМП | U+2980..U+29FF | Различные математические символы-B | 128 | 128 | Общий |
0 БМП | U+2A00..U+2AFF | Дополнительные математические операторы | 256 | 256 | Общий |
0 БМП | U+2B00..U+2BFF | Различные символы и стрелки | 256 | 253 | Общий |
0 БМП | U+2C00..U+2C5F | Глаголица | 96 | 96 | Глаголица |
0 БМП | У+2С60..У+2С7Ф | Расширенная латиница-C | 32 | 32 | латинский |
0 БМП | U+2C80..U+2CFF | коптский | 128 | 123 | коптский |
0 БМП | U+2D00..U+2D2F | Грузинское дополнение | 48 | 40 | грузинский |
0 БМП | У+2Д30..У+2Д7Ф | Тифинаг | 80 | 59 | Тифинаг |
0 БМП | У+2Д80..У+2ДДФ | Эфиопский расширенный | 96 | 79 | Эфиопский |
0 БМП | U+2DE0..U+2DFF | Кириллица расширенная-А | 32 | 32 | кириллица |
0 БМП | У+2Е00..У+2Е7Ф | Дополнительная пунктуация | 128 | 94 | Общий |
0 БМП | U+2E80..U+2EFF | Дополнение CJK Radicals | 128 | 115 | Хан |
0 БМП | У+2Ф00..У+2ФДФ | Радикалы Канси | 224 | 214 | Хан |
0 БМП | У+2ФФ0..У+2ФФФ | Идеографическое описание символов | 16 | 16 | Общий |
0 БМП | У+3000..У+303Ф | Символы и пунктуация CJK | 64 | 64 | Хан (15 символов), Хангыль (2 символа), Общий (43 символа), Унаследованный (4 символа) |
0 БМП | У+3040..У+309Ф | Хирагана | 96 | 93 | Хирагана (89 символов), Общая (2 символа), Унаследованная (2 символа) |
0 БМП | У+30А0..У+30ФФ | Катакана | 96 | 96 | Катакана (93 символа), Общий (3 символа) |
0 БМП | У+3100..У+312Ф | Бопомофо | 48 | 43 | Бопомофо |
0 БМП | У+3130..У+318Ф | Совместимость с Хангылем Jamo | 96 | 94 | Хангыль |
0 БМП | У+3190..У+319Ф | Канбун | 16 | 16 | Общий |
0 БМП | У+31А0..У+31БФ | Бопомофо расширенный | 32 | 32 | Бопомофо |
0 БМП | U+31C0..U+31EF | CJK-штрихи | 48 | 39 | Общий |
0 БМП | U+31F0..U+31FF | Фонетические расширения катаканы | 16 | 16 | Катакана |
0 БМП | U+3200..U+32FF | Прилагаемые письма CJK и месяцы | 256 | 255 | Хангыль (62 символа), Катакана (47 символов), Общий (146 символов) |
0 БМП | U+3300..U+33FF | Совместимость с CJK | 256 | 256 | Катакана (88 символов), Общий (168 символов) |
0 БМП | U+3400..U+4DBF | Расширение A унифицированных идеограмм CJK | 6,592 | 6,592 | Хан |
0 БМП | U+4DC0..U+4DFF | Символы гексаграммы Ицзин | 64 | 64 | Общий |
0 БМП | U+4E00..U+9FFF | Унифицированные идеограммы CJK | 20,992 | 20,992 | Хан |
0 БМП | У+А000..У+А48Ф | Слоги И | 1,168 | 1,165 | Йи |
0 БМП | U+A490..U+A4CF | Радикалы Йи | 64 | 55 | Йи |
0 БМП | U+A4D0..U+A4FF | Лису | 48 | 48 | Лису |
0 БМП | У+А500..У+А63Ф | Вай | 320 | 300 | Вай |
0 БМП | У+А640..У+А69Ф | Кириллица расширенная-Б | 96 | 96 | кириллица |
0 БМП | У+А6А0..У+А6ФФ | Бамум | 96 | 88 | Бамум |
0 БМП | У+А700..У+А71Ф | Буквы модификатора тона | 32 | 32 | Общий |
0 БМП | U+A720..U+A7FF | Расширенная латиница-D | 224 | 199 | Латинский (194 символа), Общий (5 символов) |
0 БМП | У+А800..У+А82Ф | Силоти Нагри | 48 | 45 | Силоти Нагри |
0 БМП | У+А830..У+А83Ф | Формы общих индийских чисел | 16 | 10 | Общий |
0 БМП | У+А840..У+А87Ф | Пхагс-па | 64 | 56 | Фагс Па |
0 БМП | У+А880..У+А8ДФ | Саураштра | 96 | 82 | Саураштра |
0 БМП | U+A8E0..U+A8FF | Расширенный деванагари | 32 | 32 | Деванагари |
0 БМП | У+А900..У+А92Ф | Кая Ли | 48 | 48 | Кая Ли (47 символов), Обычный (1 символ) |
0 БМП | У+А930..У+А95Ф | Реджанг | 48 | 37 | Реджанг |
0 БМП | У+А960..У+А97Ф | Хангыль Джамо Расширенный-А | 32 | 29 | Хангыль |
0 БМП | У+А980..У+А9ДФ | яванский | 96 | 91 | Яванский (90 символов), Общий (1 символ) |
0 БМП | U+A9E0..U+A9FF | Мьянма Расширенный-B | 32 | 31 | Мьянма |
0 БМП | У+АА00..У+АА5Ф | Чам | 96 | 83 | Чам |
0 БМП | У+АА60..У+АА7Ф | Мьянма Расширенный-A | 32 | 32 | Мьянма |
0 БМП | У+АА80..У+ААДФ | Тай Вьет | 96 | 72 | Тай Вьет |
0 БМП | У+ААЕ0..У+ААФФ | Расширения Meetei Mayek | 32 | 23 | Митэй Майек |
0 БМП | U+AB00..U+AB2F | Эфиопский расширенный-А | 48 | 32 | Эфиопский |
0 БМП | У+АБ30..У+АБ6Ф | Расширенная латиница-E | 64 | 60 | Латинский (56 символов), греческий (1 символ), общий (3 символа) |
0 БМП | У+АБ70..У+АББФ | Дополнение Чероки | 80 | 80 | Чероки |
0 БМП | U+ABC0..U+ABFF | Митэй Майек | 64 | 56 | Митэй Майек |
0 БМП | U+AC00..U+D7AF | Слоги хангыля | 11,184 | 11,172 | Хангыль |
0 БМП | U+D7B0..U+D7FF | Хангыль Джамо Расширенный-B | 80 | 72 | Хангыль |
0 БМП | U+D800..U+DB7F | Высокие суррогаты | 896 | 0 | Неизвестный |
0 БМП | U+DB80..U+DBFF | Высокое частное использование суррогатов | 128 | 0 | Неизвестный |
0 БМП | U+DC00..U+DFFF | Низкие суррогаты | 1,024 | 0 | Неизвестный |
0 БМП | U+E000..U+F8FF | Зона частного пользования | 6,400 | 6,400 | Неизвестный |
0 БМП | U+F900..U+FAFF | Совместимость идеограмм CJK | 512 | 472 | Хан |
0 БМП | U+FB00..U+FB4F | Алфавитные формы представления | 80 | 58 | Армянский (5 символов), Иврит (46 символов), Латынь (7 символов) |
0 БМП | У+ФБ50..У+ФДФФ | Арабские формы представления-A | 688 | 631 | Арабский (629 символов), Общий (2 символа) |
0 БМП | U+FE00..U+FE0F | Селекторы вариаций | 16 | 16 | Унаследованный |
0 БМП | У+ФЕ10..У+ФЕ1Ф | Вертикальные формы | 16 | 10 | Общий |
0 БМП | У+ФЕ20..У+ФЕ2Ф | Объединение половинных отметок | 16 | 16 | Кириллица (2 символа), Наследуемый (14 символов) |
0 БМП | У+ФЕ30..У+ФЕ4Ф | Формы совместимости CJK | 32 | 32 | Общий |
0 БМП | У+ФЕ50..У+ФЕ6Ф | Малые варианты формы | 32 | 26 | Общий |
0 БМП | U+FE70..U+FEFF | Арабские формы представления-B | 144 | 141 | Арабский (140 символов), Общий (1 символ) |
0 БМП | U+FF00..U+FFEF | Формы половинной и полной ширины | 240 | 225 | Хангыль (52 символа), Катакана (55 символов), Латиница (52 символа), Общий (66 символов) |
0 БМП | У+ФФФ0..У+ФФФФ | Специальные предложения | 16 | 5 | Общий |
1 СМП | U+10000..U+1007F | Линейное слоговое письмо Б | 128 | 88 | Линейное письмо Б |
1 СМП | U+10080..U+100FF | Идеограммы линейного письма Б | 128 | 123 | Линейное письмо Б |
1 СМП | U+10100..U+1013F | Эгейские числа | 64 | 57 | Общий |
1 СМП | U+10140..U+1018F | Древнегреческие числа | 80 | 79 | греческий |
1 СМП | U+10190..U+101CF | Древние Символы | 64 | 14 | Греческий (1 символ), Общий (13 символов) |
1 СМП | U+101D0..U+101FF | Фестский диск | 48 | 46 | Обычный (45 символов), Унаследованный (1 символ) |
1 СМП | U+10280..U+1029F | Ликийский | 32 | 29 | Ликийский |
1 СМП | У+102А0..У+102ДФ | Карианский | 64 | 49 | Карианский |
1 СМП | U+102E0..U+102FF | Коптские числа Эпакта | 32 | 28 | Обычный (27 символов), Унаследованный (1 символ) |
1 СМП | U+10300..U+1032F | Старый курсив | 48 | 39 | Старый курсив |
1 СМП | U+10330..U+1034F | готика | 32 | 27 | готика |
1 СМП | U+10350..U+1037F | Старый Пермский | 48 | 43 | Старый Пермский |
1 СМП | U+10380..U+1039F | Угаритский | 32 | 31 | Угаритский |
1 СМП | U+103A0..U+103DF | Древнеперсидский | 64 | 50 | Древнеперсидский |
1 СМП | U+10400..U+1044F | Дезерет | 80 | 80 | Дезерет |
1 СМП | U+10450..U+1047F | Шэвиан | 48 | 48 | Шэвиан |
1 СМП | U+10480..U+104AF | Османия | 48 | 40 | Османия |
1 СМП | U+104B0..U+104FF | Осейдж | 80 | 72 | Осейдж |
1 СМП | U+10500..U+1052F | Эльбасан | 48 | 40 | Эльбасан |
1 СМП | U+10530..U+1056F | Кавказский албанец | 64 | 53 | Кавказский албанец |
1 СМП | U+10570..U+105BF | Виткуки | 80 | 70 | Виткуки |
1 СМП | U+105C0..U+105FF | Тодри | 64 | 52 | Тодри |
1 СМП | U+10600..U+1077F | Линейное письмо А | 384 | 341 | Линейное письмо А |
1 СМП | U+10780..U+107BF | Расширенная латиница-F | 64 | 57 | латинский |
1 СМП | U+10800..U+1083F | Кипрская слоговая азбука | 64 | 55 | кипрский |
1 СМП | U+10840..U+1085F | Имперский арамейский | 32 | 31 | Имперский арамейский |
1 СМП | U+10860..U+1087F | Пальмирена | 32 | 32 | Пальмирена |
1 СМП | U+10880..U+108AF | набатейский | 48 | 40 | набатейский |
1 СМП | U+108E0..U+108FF | Хатран | 32 | 26 | Хатран |
1 СМП | U+10900..U+1091F | финикийский | 32 | 29 | финикийский |
1 СМП | U+10920..U+1093F | Лидийский | 32 | 27 | Лидийский |
1 СМП | U+10980..U+1099F | Мероитские иероглифы | 32 | 32 | Мероитские иероглифы |
1 СМП | U+109A0..U+109FF | Мероитский курсив | 96 | 90 | Мероитский курсив |
1 СМП | У+10А00..У+10А5Ф | Кхароштхи | 96 | 68 | Кхароштхи |
1 СМП | У+10А60..У+10А7Ф | Древний южноаравийский | 32 | 32 | Древний южноаравийский |
1 СМП | У+10А80..У+10А9Ф | Древний североаравийский | 32 | 32 | Древний североаравийский |
1 СМП | U+10AC0..U+10AFF | Манихейский | 64 | 51 | Манихейский |
1 СМП | U+10B00..U+10B3F | авестийский | 64 | 61 | авестийский |
1 СМП | U+10B40..U+10B5F | Парфянские надписи | 32 | 30 | Парфянские надписи |
1 СМП | U+10B60..U+10B7F | Надписи на пехлеви | 32 | 27 | Надписи на пехлеви |
1 СМП | U+10B80..U+10BAF | Псалтырь пехлевийский | 48 | 29 | Псалтырь пехлевийский |
1 СМП | U+10C00..U+10C4F | Древнетюркский | 80 | 73 | Древнетюркский |
1 СМП | U+10C80..U+10CFF | старовенгерский | 128 | 108 | старовенгерский |
1 СМП | U+10D00..U+10D3F | Ханифи Рохинджа | 64 | 50 | Ханифи Рохинджа |
1 СМП | У+10Д40..У+10Д8Ф | Гарай | 80 | 69 | Гарай |
1 СМП | U+10E60..U+10E7F | Числовые символы Руми | 32 | 31 | арабский |
1 СМП | U+10E80..U+10EBF | езидский | 64 | 47 | езидский |
1 СМП | U+10EC0..U+10EFF | Арабский расширенный-C | 64 | 7 | арабский |
1 СМП | U+10F00..U+10F2F | Древний согдийский | 48 | 40 | Древний согдийский |
1 СМП | U+10F30..U+10F6F | согдийский | 64 | 42 | согдийский |
1 СМП | U+10F70..U+10FAF | Старый уйгурский | 64 | 26 | Старый уйгурский |
1 СМП | U+10FB0..U+10FDF | Хорезмский | 48 | 28 | Хорезмский |
1 СМП | U+10FE0..U+10FFF | Елимейский | 32 | 23 | Елимейский |
1 СМП | U+11000..U+1107F | Брахми | 128 | 115 | Брахми |
1 СМП | U+11080..U+110CF | Кайти | 80 | 68 | Кайти |
1 СМП | U+110D0..U+110FF | Сора Сомпенг | 48 | 35 | Сора Сомпенг |
1 СМП | U+11100..U+1114F | Чакма | 80 | 71 | Чакма |
1 СМП | U+11150..U+1117F | Махаджани | 48 | 39 | Махаджани |
1 СМП | U+11180..U+111DF | Шарада | 96 | 96 | Шарада |
1 СМП | U+111E0..U+111FF | Сингальские архаичные числа | 32 | 20 | сингальский |
1 СМП | U+11200..U+1124F | Ходжки | 80 | 65 | Ходжки |
1 СМП | U+11280..U+112AF | Мултани | 48 | 38 | Мултани |
1 СМП | U+112B0..U+112FF | Худавади | 80 | 69 | Худавади |
1 СМП | U+11300..U+1137F | Грантха | 128 | 86 | Grantha (85 символов), Унаследованный (1 символ) |
1 СМП | U+11380..U+113FF | Тулу-Тигалари | 128 | 80 | Тулу Тигалари |
1 СМП | U+11400..U+1147F | Ньюа | 128 | 97 | Ньюа |
1 СМП | U+11480..U+114DF | Тирута | 96 | 82 | Тирута |
1 СМП | U+11580..U+115FF | Сиддхам | 128 | 92 | Сиддхам |
1 СМП | U+11600..U+1165F | Моди | 96 | 79 | Моди |
1 СМП | U+11660..U+1167F | Монгольское дополнение | 32 | 13 | монгольский |
1 СМП | U+11680..U+116CF | Такри | 80 | 68 | Такри |
1 СМП | U+116D0..U+116FF | Мьянма Расширенный-C | 48 | 20 | Мьянма |
1 СМП | U+11700..U+1174F | Ахом | 80 | 65 | Ахом |
1 СМП | U+11800..U+1184F | Догра | 80 | 60 | Догра |
1 СМП | U+118A0..U+118FF | Варанг Сити | 96 | 84 | Варанг Сити |
1 СМП | U+11900..U+1195F | Ныряет Акуру | 96 | 72 | Ныряет Акуру |
1 СМП | U+119A0..U+119FF | Нандинагари | 96 | 65 | Нандинагари |
1 СМП | U+11A00..U+11A4F | Площадь Занабазара | 80 | 72 | Площадь Занабазара |
1 СМП | U+11A50..U+11AAF | Соёмбо | 96 | 83 | Соёмбо |
1 СМП | U+11AB0..U+11ABF | Расширенная версия канадской аборигенной слоговой письменности (A) | 16 | 16 | Канадские аборигены |
1 СМП | U+11AC0..U+11AFF | Пау Син Хау | 64 | 57 | Пау Син Хау |
1 СМП | U+11B00..U+11B5F | Расширенный Деванагари-А | 96 | 10 | Деванагари |
1 СМП | U+11BC0..U+11BFF | Сунувар | 64 | 44 | Сунувар |
1 СМП | U+11C00..U+11C6F | Бхайксуки | 112 | 97 | Бхайксуки |
1 СМП | U+11C70..U+11CBF | Мархен | 80 | 68 | Мархен |
1 СМП | U+11D00..U+11D5F | Масарам Гонди | 96 | 75 | Масарам Гонди |
1 СМП | U+11D60..U+11DAF | Гунджала Гонди | 80 | 63 | Гунджала Гонди |
1 СМП | U+11EE0..U+11EFF | Макасар | 32 | 25 | Макасар |
1 СМП | U+11F00..U+11F5F | Кави | 96 | 87 | Кави |
1 СМП | U+11FB0..U+11FBF | Добавка Лису | 16 | 1 | Лису |
1 СМП | U+11FC0..U+11FFF | Дополнение на тамильском языке | 64 | 51 | тамильский |
1 СМП | U+12000..U+123FF | Клинопись | 1,024 | 922 | Клинопись |
1 СМП | U+12400..U+1247F | Клинописные цифры и знаки препинания | 128 | 116 | Клинопись |
1 СМП | U+12480..U+1254F | Ранняя династическая клинопись | 208 | 196 | Клинопись |
1 СМП | U+12F90..U+12FFF | Кипро-минойский | 112 | 99 | кипро-минойский |
1 СМП | U+13000..U+1342F | Египетские иероглифы | 1,072 | 1,072 | Египетские иероглифы |
1 СМП | U+13430..U+1345F | Элементы управления форматом египетских иероглифов | 48 | 38 | Египетские иероглифы |
1 СМП | U+13460..U+143FF | Египетские иероглифы расширенные-A | 4000 | 3,995 | Египетские иероглифы |
1 СМП | U+14400..U+1467F | Анатолийские иероглифы | 640 | 583 | Анатолийские иероглифы |
1 СМП | U+16100..U+1613F | Гурунг Кхема | 64 | 58 | Гурунг Кхема |
1 СМП | U+16800..U+16A3F | Дополнение Бамум | 576 | 569 | Бамум |
1 СМП | У+16А40..У+16А6Ф | Мро | 48 | 43 | Мро |
1 СМП | U+16A70..U+16ACF | Тангса | 96 | 89 | Тангса |
1 СМП | U+16AD0..U+16AFF | Басса Вах | 48 | 36 | Басса Вах |
1 СМП | U+16B00..U+16B8F | Пахау Хмонг | 144 | 127 | Пахау Хмонг |
1 СМП | У+16Д40..У+16Д7Ф | Кират Рай | 64 | 58 | Кират Рай |
1 СМП | U+16E40..U+16E9F | Медефаидрин | 96 | 91 | Медефаидрин |
1 СМП | U+16F00..U+16F9F | Мяо | 160 | 149 | Мяо |
1 СМП | U+16FE0..U+16FFF | Идеографические символы и знаки препинания | 32 | 7 | Хань (4 символа), киданьское мелкое письмо (1 символ), нушу (1 символ), тангутское письмо (1 символ) |
1 СМП | U+17000..U+187FF | тангутский | 6,144 | 6,136 | тангутский |
1 СМП | U+18800..U+18AFF | Тангутские компоненты | 768 | 768 | тангутский |
1 СМП | U+18B00..U+18CFF | Киданьское мелкое письмо | 512 | 471 | Киданьское мелкое письмо |
1 СМП | U+18D00..U+18D7F | Тангутская добавка | 128 | 9 | тангутский |
1 СМП | U+1AFF0..U+1AFFF | Кана расширенная-B | 16 | 13 | Катакана |
1 СМП | U+1B000..U+1B0FF | Дополнение к Кана | 256 | 256 | Хирагана (255 символов), катакана (1 символ) |
1 СМП | U+1B100..U+1B12F | Кана расширенная-А | 48 | 35 | Хирагана (32 символа), катакана (3 символа) |
1 СМП | U+1B130..U+1B16F | Малое расширение Кана | 64 | 9 | Хирагана (4 символа), катакана (5 символов) |
1 СМП | U+1B170..U+1B2FF | Нушу | 400 | 396 | Нюшу |
1 СМП | U+1BC00..U+1BC9F | Дуплоян | 160 | 143 | Дуплоян |
1 СМП | U+1BCA0..U+1BCAF | Элементы управления сокращенным форматом | 16 | 4 | Общий |
1 СМП | U+1CC00..U+1CEBF | Символы для дополнения Legacy Computing | 704 | 686 | Общий |
1 СМП | U+1CF00..U+1CFCF | Знаменная музыкальная нотация | 208 | 185 | Обычный (116 символов), Унаследованный (69 символов) |
1 СМП | U+1D000..U+1D0FF | Византийские музыкальные символы | 256 | 246 | Общий |
1 СМП | U+1D100..U+1D1FF | Музыкальные символы | 256 | 233 | Обычный (211 символов), Наследуемый (22 символа) |
1 СМП | U+1D200..U+1D24F | Древнегреческая музыкальная нотация | 80 | 70 | греческий |
1 СМП | U+1D2C0..U+1D2DF | Кактовик Цифры | 32 | 20 | Общий |
1 СМП | U+1D2E0..U+1D2FF | Цифры майя | 32 | 20 | Общий |
1 СМП | У+1Д300..У+1Д35Ф | Символы Тай Сюань Цзин | 96 | 87 | Общий |
1 СМП | U+1D360..U+1D37F | Счетные стержни с цифрами | 32 | 25 | Общий |
1 СМП | U+1D400..U+1D7FF | Математические буквенно-цифровые символы | 1,024 | 996 | Общий |
1 СМП | U+1D800..U+1DAAF | Sutton SignWriting | 688 | 672 | Написание жестов |
1 СМП | U+1DF00..U+1DFFF | Расширенная латиница-G | 256 | 37 | латинский |
1 СМП | U+1E000..U+1E02F | Глаголическое дополнение | 48 | 38 | Глаголица |
1 СМП | U+1E030..U+1E08F | Кириллица расширенная-D | 96 | 63 | кириллица |
1 СМП | У+1Е100..У+1Е14Ф | Ньякенг Пуачуэ Хмонг | 80 | 71 | Ньякенг Пуачуэ Хмонг |
1 СМП | U+1E290..U+1E2BF | Тото | 48 | 31 | Тото |
1 СМП | U+1E2C0..U+1E2FF | Ванчо | 64 | 59 | Ванчо |
1 СМП | U+1E4D0..U+1E4FF | Наг Мундари | 48 | 42 | Мундари |
1 СМП | U+1E5D0..U+1E5FF | Ол Онал | 48 | 44 | Ол Онал |
1 СМП | U+1E7E0..U+1E7FF | Эфиопский расширенный-B | 32 | 28 | Эфиопский |
1 СМП | U+1E800..U+1E8DF | Менде Кикакуи | 224 | 213 | Менде Кикакуи |
1 СМП | U+1E900..U+1E95F | Адлам | 96 | 88 | Адлам |
1 СМП | U+1EC70..U+1ECBF | Индийские числа Siyaq | 80 | 68 | Общий |
1 СМП | U+1ED00..U+1ED4F | Османские числа Сияка | 80 | 61 | Общий |
1 СМП | U+1EE00..U+1EEFF | Арабские математические алфавитные символы | 256 | 143 | арабский |
1 СМП | U+1F000..U+1F02F | Плитки Маджонга | 48 | 44 | Общий |
1 СМП | U+1F030..U+1F09F | Плитки домино | 112 | 100 | Общий |
1 СМП | U+1F0A0..U+1F0FF | Игральные карты | 96 | 82 | Общий |
1 СМП | U+1F100..U+1F1FF | Прилагаемое буквенно-цифровое дополнение | 256 | 200 | Общий |
1 СМП | U+1F200..U+1F2FF | Прилагаемое идеографическое приложение | 256 | 64 | Хирагана (1 символ), Общая (63 символа) |
1 СМП | U+1F300..U+1F5FF | Различные символы и пиктограммы | 768 | 768 | Общий |
1 СМП | U+1F600..U+1F64F | Смайлики | 80 | 80 | Общий |
1 СМП | U+1F650..U+1F67F | Орнаментальные дингбаты | 48 | 48 | Общий |
1 СМП | U+1F680..U+1F6FF | Транспортные и картографические символы | 128 | 118 | Общий |
1 СМП | U+1F700..U+1F77F | Алхимические символы | 128 | 124 | Общий |
1 СМП | U+1F780..U+1F7FF | Геометрические фигуры расширены | 128 | 103 | Общий |
1 СМП | U+1F800..U+1F8FF | Дополнительные стрелки-C | 256 | 162 | Общий |
1 СМП | U+1F900..U+1F9FF | Дополнительные символы и пиктограммы | 256 | 256 | Общий |
1 СМП | U+1FA00..U+1FA6F | Шахматные символы | 112 | 98 | Общий |
1 СМП | U+1FA70..U+1FAFF | Символы и пиктограммы расширенные-A | 144 | 114 | Общий |
1 СМП | U+1FB00..U+1FBFF | Символы для устаревших вычислений | 256 | 249 | Общий |
2 СИП | U+20000..U+2A6DF | Расширение B унифицированных идеограмм CJK | 42,720 | 42,720 | Хан |
2 СИП | U+2A700..U+2B73F | Расширение C унифицированных идеограмм CJK | 4,160 | 4,154 | Хан |
2 СИП | U+2B740..U+2B81F | Расширение D унифицированных идеограмм CJK | 224 | 222 | Хан |
2 СИП | U+2B820..U+2CEAF | Расширение унифицированных идеограмм CJK E | 5,776 | 5,762 | Хан |
2 СИП | U+2CEB0..U+2EBEF | Расширение унифицированных идеограмм CJK F | 7,488 | 7,473 | Хан |
2 СИП | U+2EBF0..U+2EE5F | Расширение унифицированных идеограмм CJK I | 624 | 622 | Хан |
2 СИП | U+2F800..U+2FA1F | Дополнение к идеограммам совместимости CJK | 544 | 542 | Хан |
3 СОВЕТ | U+30000..U+3134F | Расширение унифицированных идеограмм CJK G | 4,944 | 4,939 | Хан |
3 СОВЕТ | U+31350..U+323AF | Расширение унифицированных идеограмм CJK H | 4,192 | 4,192 | Хан |
14 ССП | U+E0000..U+E007F | Теги | 128 | 97 | Общий |
14 ССП | U+E0100..U+E01EF | Дополнение к селекторам вариаций | 240 | 240 | Унаследованный |
15 ПУА-А | U+F0000..U+FFFFF | Дополнительная зона частного пользования-A | 65,536 | 65,534 | Неизвестный |
16 ПУА-Б | U+100000..U+10FFFF | Дополнительная зона частного пользования-B | 65,536 | 65,534 | Неизвестный |
|
Политика стабильности Unicode требует, чтобы символ, однажды назначенный, не мог быть перемещен или удален, хотя он может быть объявлен устаревшим. Это относится к Unicode 2.0 и всем последующим версиям.
До этого были перемещены следующие бывшие блоки:
Диапазон блока | Историческое название блока | Версия на момент добавления | Версия на момент удаления | Диапазон в настоящее время занят | Заменено блоком | Кодовые точки | Назначенные символы | Скрипты |
---|---|---|---|---|---|---|---|---|
У+1000..У+105Ф | Тибетский [5] | 1.0.0 | 1.0.1 | Мьянма | тибетский | 96 | 71 | тибетский |
U+3400..U+3D2D | Хангыль [6] | 1.0.0 | 2.0 | Расширение A унифицированных идеограмм CJK | Слоги хангыля | 2350 | 2350 | Хангыль |
U+3D2E..U+44B7 | Дополнительный Хангыль-А [6] | 1.1 | 2.0 | 1930 | 1930 | |||
U+44B8..U+4DFF | Хангыль Дополнительный-B [6] | Расширение A унифицированных идеограмм CJK и символы гексаграммы Ицзин | 2376 | 2376 |