MIME/IANA | окна-1253 |
---|---|
Псевдоним(ы) | cp1253 ( кодовая страница 1253) |
Язык(и) | Греческий , английский , математическое использование . |
Создано | Майкрософт |
Стандарт | Стандарт кодирования WHATWG |
Классификация | расширенный ASCII , Windows-125x |
На основе | ISO/IEC 8859-7 , Windows-1252 |
Кодовая страница Windows 1253 («Греческий - ANSI») [1], широко известная под зарегистрированным в IANA названием Windows-1253 [2] или сокращенно cp1253 [3] [ 4] — это кодовая страница Microsoft Windows , используемая для записи современного греческого языка . Она не поддерживает старый политонический греческий язык .
Он не полностью совместим с ISO 8859-7 , поскольку несколько символов, включая букву Ά , расположены в разных значениях байта:
µ
[a] и ¶
добавляются в их местоположения из Windows-1252 и ISO 8859-1 ( 0x B5 и 0xB6). Это конфликтует с местоположениями ΅
и Ά
, соответственно, в ISO 8859-7.‘
и ’
перемещаются из своих местоположений ISO 8859-7 (0xA1 и 0xA2) в свои местоположения Windows-1252 (0x91 и 0x92). Смещенные ΅
и Ά
перемещаются в освободившееся пространство в 0xA1 и 0xA2 соответственно.¤
и ¥
добавляются в свои местоположения из Windows-1252 и ISO 8859-1 (0xA4 и 0xA5). Это конфликтует с дополнениями, внесенными в ISO 8859-7 в 2003 году, когда €
и ₯
соответственно были добавлены в те же местоположения. €
был добавлен в Windows-1253 в 0x80, то же самое местоположение, в которое он был добавлен в Windows-1252. Нижний индекс йоты (ͺ) также был добавлен в ISO 8859-7 в 0xAA; он остается нераспределенным в Windows-1253.IBM использует кодовую страницу 1253 ( CCSID 1253 и расширенный CCSID знака евро 5349) для Windows-1253. [5] [6] [7]
Unicode предпочтительнее для греческого языка в современных приложениях, особенно в качестве кодировки UTF-8 в Интернете. Unicode предоставляет гораздо больше глифов для полного покрытия, см. таблицы в Греческий алфавит в Unicode и Древнегреческая музыкальная нотация .
В следующей таблице показан Windows-1253. Каждый символ показан с его эквивалентом в Unicode .
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | А | Б | С | Д | Э | Ф | |
0x | НУЛЕВОЙ | САХ | СТХ | ЭТХ | ЭОТ | ENQ | АСК | БЕЛ | БС | ХТ | ЛФ | ВТ | ФФ | CR | ТАК | СИ |
1x | ДЛЕ | ДК1 | ДК2 | ДК3 | ДК4 | НАК | СИН | ЭТБ | МОЖЕТ | ЭМ | СУБ | ЕСК | ФС | ГС | РС | НАС |
2x | СП | ! | " | # | $ | % | & | ' | ( | ) | * | + | , | - | . | / |
3x | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | : | ; | < | = | > | ? |
4x | @ | А | Б | С | Д | Э | Ф | Г | ЧАС | я | Дж. | К | Л | М | Н | О |
5x | П | В | Р | С | Т | У | В | Вт | Х | И | З | [ | \ | ] | ^ | _ |
6x | ` | а | б | с | г | е | ф | г | час | я | дж | к | л | м | н | о |
7x | п | д | г | с | т | ты | в | ж | х | у | з | { | | | } | ~ | ДЕЛ |
8x | € | ‚ | ƒ | „ | … | † | ‡ | ‰ | ‹ | |||||||
9x | ' | ' | « | ” | • | – | — | ™ | › | |||||||
Топор | НБСП | ΅ | Ά | £ | ¤ | ¥ | ¦ | § | ¨ | © | « | ¬ | ЗАСТЕНЧИВЫЙ | ® | ― | |
Вх | ° | ± | ² | ³ | ΄ | µ | ¶ | · | Έ | Ή | Ί | » | Ό | ½ | Ύ | Ώ |
Сх | ΐ | А | Б | Г | Δ | Э | Ζ | Η | Θ | І | К | Λ | М | Ν | Ξ | Ο |
Дкс | П | П | Σ | Т | Υ | Ф | Χ | Ψ | Ω | Ϊ | Ϋ | ά | έ | ή | ί | |
Бывший | ΰ | α | β | γ | δ | ε | ζ | η | θ | й | к | λ | μ | ν | ξ | о |
Фх | π | ρ | ς | σ | τ | υ | φ | χ | ψ | ω | ϊ | ϋ | ό | ύ | ώ |
μ
в 0xEC, который остается на месте. Unicode называет тот, что в 0xB5, " микро-знаком " (U+00B5), а тот, что в 0xEC, "греческой строчной буквой Mu" (U+03BC), хотя первый отображается на последний с помощью нормализации Unicode NFKC (хотя и не NFC) . См. также Дублирующиеся символы в Unicode § Дублирующийся против производного символа .