Латинский алфавит в Unicode

Символы латинского алфавита, закодированные в стандарте Unicode

Более тысячи символов латинского алфавита закодированы в стандарте Unicode , сгруппированном в несколько базовых и расширенных латинских блоков . Расширенные диапазоны содержат в основном предварительно составленные буквы и диакритические знаки, которые эквивалентно кодируются с помощью комбинированных диакритических знаков , а также некоторые лигатуры и отдельные буквы, используемые, например, в орфографиях различных африканских языков (включая символы щелчка в расширенной латинице-B) и вьетнамском алфавите (расширенная латиница-дополнительная). Расширенная латиница-C содержит дополнения для уйгурских и клавдиевых букв . Расширенная латиница-D содержит символы, которые в основном представляют интерес для медиевистов. Расширенная латиница-E в основном содержит символы, используемые в немецкой диалектологии ( Teuthonista ). [1] Расширенная латиница-F и -G содержит символы для фонетической транскрипции .

Блоки

Начиная с версии 16.0 стандарта Unicode, 1487 символов в следующих 19 блоках классифицируются как принадлежащие к латинскому алфавиту. [2]

Кроме того, ряд латиноподобных символов закодирован в блоках Currency Symbols , Control Pictures , CJK Compatibility , Enclosed Alphanumerics , Enclosed CJK Letters and Months , Mathematical Alphanumeric Symbols и Enclosed Alphanumeric Supplement , но, хотя они графически являются латинскими буквами, они имеют свойство script common и, таким образом, не принадлежат к латинскому алфавиту в терминах Unicode. Lisu также состоит почти полностью из латинских форм, но использует свое собственное свойство script.

Таблица символов

В этой таблице символы с латинским алфавитом выделены цветом, что указывает на версию Unicode, в которой они были введены. Зарезервированные кодовые точки (которые могут быть назначены как символы в будущем) имеют серый фон. Все символы, не принадлежащие латинскому алфавиту, имеют белый фон (и поэтому версия Unicode, в которой они были введены, не указана).

Условные обозначения: версия Unicode
Юникод 1.0Юникод 6.1
Юникод 1.1Юникод 7.0
Юникод 2.0Юникод 8.0
Юникод 3.0Юникод 9.0
Юникод 3.2Юникод 11.0
Юникод 4.0Юникод 12.0
Юникод 4.1Юникод 13.0
Юникод 5.0Юникод 14.0
Юникод 5.1Юникод 15.0
Юникод 5.2Юникод 16.0
Юникод 6.0
СдержанныйНе латиница
У+0123456789АБСДЭФБлокировать#
0040@АБСДЭФГЧАСяДж.КЛМНОЭлементы управления C0 и базовая латиница
0000–007F
(идентичны ASCII )
52
0050ПВРСТУВВтХИЗ[\]^_
0060`абсгефгчасяджклмно
0070пдгсттывжхуз{|}~ДЕЛ
00А0 ¡¢£¤¥¦§¨©ª«¬®¯Элементы управления C1 и дополнение Latin-1
0080–00FF
(идентично ISO/IEC 8859-1 )
64
00B0°±²³´µ·¸¹º»¼½¾¿
00С0ААÂÃÄÅÆÇЭЭКËЯЯЯЯ
00D0ÐСТОÔХÖ×ØÙÚÛÜÝÞSS
00E0аавгдåæçèéêëяяяя
00F0ðсòóохö÷øùúûüýþÿ
0100АаĂаАąЧчЧЧĊчЧчДдРасширенная латиница-A
0100–017F
128
0110ÐдЭеЭĕЭеКęМеĜг«ğ
0120ГгГгЧАСчасЧАСчасЯяЯяЯяЯя
0130ЯяIJяĴяКккЁĺЯьЛľĿ
0140ŀЛłСнСņŇнʼnŊŋОōŎŏ
0150ŐоŒœŔŕŖŗØřŚśŜŝŞş
0160ШšТţŤť«»ŨũŪuŬŭŮ...
0170ŰűŲųŴŵŶŷŸŹźŻżŽžſ
0180ƀƁƂƃƄƅƆƇƈƉƊƋƌƍƎƏРасширенная латиница-B
0180–024F
208
0190ƐƑƒƓƔƕƖƗƘƙƚƛƜƝƞƟ
01А0ƠơƢƣƤƥƦƧƨƩƪƫƬƭƮƯ
01B0ưƱƲƳƴƵƶƷƸƹƺƻƼƽƾƿ
01С0ǀǁǂǃDŽDždžLJLjljNJNjnjǍǎǏ
01D0ǐǑǒǓǔǕǖǗǘǙǚǛǜǝǞǟ
01E0ǠǡǢǣǤǥǦǧǨǩǪǫǬǭǮǯ
01F0ǰDZDzdzǴǵǶǷǸǹǺǻǼǽǾǿ
0200ȀȁȂȃȄȅȆȇȈȉȊȋȌȍȎȏ
0210ȐȑȒȓȔȕȖȗȘșȚțȜȝȞȟ
0220ȠȡȢȣȤȥȦȧȨȩУȫȬȭȮȯ
0230ȰȱȲȳȴȵȶȷȸȹȺȻȼȽȾȿ
0240ɀɁɂɃɄɅɆɇɈɉɊɋɌɍɎɏ
0250ɐɑɒɓɔɕɖɗɘəɚɛɜɝɞɟРасширения IPA
0250–02AF
96
0260ɠɡɢɣɤɥɦɧɨɩɪɫɬɭɮɯ
0270ɰɱɲɳɴɵɶɷɸɹɺɻɼɽɾɿ
0280ʀʁʂʃʄʅʆʇʈʉʊʋʌʍʎʏ
0290ʐʑʒʓʔʕʖʗЬбʚʛʜʝʞʟ
02А0ʠʡʢʣʤʥʦʧʨʩʪʫʬʭʮʯ
02B0ʰʱʲʳʴʵʶʷʸʹʺ`ʼʽʾʿБуквы-модификаторы интервала
02B0–02FF
14
02E0ˠˡˢˣˤ˥˦˧˨˩˪˫ˬ˭ˮ˯
1D00Фонетические расширения
1D00–1D7F
111
1Д10
1Д20
1Д30ᴿ
1Д40
1Д50
1Д60
1Д70ᵿ
1Д80Фонетические расширения, дополнение
1D80–1DBF
63
1Д90
1DA0
1DB0ᶿ
1E00ххДдdРасширенная латиница, дополнительная
1E00–1EFF
256
1E10Хх
1E20хЧАСчасЧАСчасЧАСчасЧАСчасЧАСчасЯяЯя
1E30Ккххḿ
1E40
1E50
1E60
1E70ṿ
1E80
1E90часSS
1EA0
1EB0ế
1EC0ЯяЯя
1ED0
1EE0
1EF0ỿ
2070  Надстрочные и подстрочные индексы
2070–209F
15
2090  
2120ΩКÅБуквенные символы
2100–214F
4
2130
2140
2160Числовые формы
2150–218F
41
2170
2180    
2С60Расширенная латиница-C
2C60–2C7F
32
2С70Ɀ
А720Расширенная латиница-D
A720–A7FF
194
А730
А740
А750
А760
А770
А780
А790
А7А0
А7Б0
А7С0  
А7Д0     
А7Е0                
А7Ф0  
АВ30ꬿРасширенная латиница-E
AB30–AB6F
56
АВ40
АВ50
АВ60    
ФБ00fi         Алфавитные формы представления7
ФФ20Формы полуширины и полноширины
(полноширинные латинские буквы)
FF00–FFEF
52
ФФ30_
ФФ40
ФФ50
10780𐞀𐞁𐞂𐞃𐞄𐞅 𐞇𐞈𐞉𐞊𐞋𐞌𐞍𐞎𐞏Расширенная латиница-F
10780–107BF
57
10790𐞐𐞑𐞒𐞓𐞔𐞕𐞖𐞗𐞘𐞙𐞚𐞛𐞜𐞝𐞞𐞟
107А0𐞠𐞡𐞢𐞣𐞤𐞥𐞦𐞧𐞨𐞩𐞪𐞫𐞬𐞭𐞮𐞯
107B0𐞰 𐞲𐞳𐞴𐞵𐞶𐞷𐞸𐞹𐞺     
1DF00𝼀𝼁𝼂𝼃𝼄𝼅𝼆𝼇𝼈𝼉𝼊𝼋𝼌𝼍𝼎𝼏Расширенная латиница-G
1DF00–1DFFF
37
1DF10𝼐𝼑𝼒𝼓𝼔𝼕𝼖𝼗𝼘𝼙𝼚𝼛𝼜𝼝𝼞 
1DF20     𝼥𝼦𝼧𝼨𝼩𝼪     
Всего символов1,487

Смотрите также

Ссылки

  1. ^ Эверсон, Майкл ; Дикльбергер, Алоис; Пентцлин, Карл; Вандль-Фогт, Эвелин (2011-06-02). «Пересмотренное предложение по кодированию фонетических символов «Teuthonista» в UCS» (PDF) .
  2. ^ "Scripts-16.0.0.txt". Консорциум Unicode . 2024-04-30 . Получено 2024-09-12 .
Послушайте эту статью ( 4 минуты )
Разговорный значок Википедии
Этот аудиофайл был создан на основе редакции этой статьи от 9 ноября 2023 года и не отражает последующие правки. ( 2023-11-09 )
Взято с "https://en.wikipedia.org/w/index.php?title=Латинский_скрипт_в_Юникоде&oldid=1267541353"