MIME/IANA | окна-1255 |
---|---|
Псевдоним(ы) | cp1255 ( кодовая страница 1255) |
Язык(и) | Иврит , английский |
Создано | Майкрософт |
Стандарт | Стандарт кодирования WHATWG |
Классификация | расширенный ASCII , Windows-125x |
Другие связанные кодировки | ИСО-8859-8 |
Windows-1255 (особенно часто называемая «ANSI») — кодовая страница , используемая в Microsoft Windows для записи иврита . Это почти совместимое надмножество ISO-8859-8 — большинство символов находятся в тех же позициях (за исключением A4, который является «знаком шекеля» в Windows-1255, но «общим знаком валюты» в ISO 8859-8, и за исключением DF, который не определен в Windows-1255, но «двойной нижней чертой» в ISO 8859-8), но Windows-1255 добавляет гласные и другие знаки в более низких позициях.
IBM использует кодовую страницу 1255 ( CCSID 1255, расширенный CCSID знака евро 5351 и еще более расширенный CCSID 9447) для Windows-1255. [1] [2] [3] [4]
Современные приложения предпочитают Unicode вместо Windows-1255, особенно в Интернете; [5] имея в виду UTF-8 , доминирующую кодировку для веб-страниц (или UTF-16, хотя и не в Интернете по соображениям безопасности). Windows-1255 используется менее чем 0,1% веб-сайтов. [6]
В следующей таблице показан Windows-1255. Каждый символ показан с его эквивалентом в Unicode .
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | А | Б | С | Д | Э | Ф | |
0x | НУЛЕВОЙ | САХ | СТХ | ЭТХ | ЭОТ | ENQ | АСК | БЕЛ | БС | ХТ | ЛФ | ВТ | ФФ | CR | ТАК | СИ |
1x | ДЛЕ | ДК1 | ДК2 | DC3 | ДК4 | НАК | СИН | ЭТБ | МОЖЕТ | ЭМ | СУБ | ЕСК | ФС | ГС | РС | НАС |
2x | СП | ! | " | # | $ | % | & | ' | ( | ) | * | + | , | - | . | / |
3x | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | : | ; | < | = | > | ? |
4x | @ | А | Б | С | Д | Э | Ф | Г | ЧАС | я | Дж. | К | Л | М | Н | О |
5x | П | В | Р | С | Т | У | В | Вт | Х | И | З | [ | \ | ] | ^ | _ |
6x | ` | а | б | с | г | е | ф | г | час | я | дж | к | л | м | н | о |
7x | п | д | г | с | т | ты | в | ж | х | у | з | { | | | } | ~ | ДЕЛ |
8x | € | ‚ | ƒ | „ | … | † | ‡ | ˆ | ‰ | ‹ | ||||||
9x | ' | ' | « | ” | • | – | — | ˜ | ™ | › | ||||||
Топор | НБСП | ¡ | ¢ | £ | ₪ | ¥ | ¦ | § | ¨ | © | × | « | ¬ | ЗАСТЕНЧИВЫЙ | ® | ¯ |
Вх | ° | ± | ² | ³ | ´ | µ | ¶ | · | ¸ | ¹ | ÷ | » | ¼ | ½ | ¾ | ¿ |
Сх | ְ | ֱ | ֲ | ֳ | ִ | ֵ | ֶ | ַ | ָ | ֹ | ֺ | ֻ | ּ | ֽ | ־ | ֿ |
Дкс | ׀ | ׁ | ׂ | ׃ | װ | ױ | ײ | ׳ | ״ | |||||||
Бывший | א | ב | ג | ד | ה | ו | ז | ח | ט | Й | ך | כ | ל | ם | מ | ן |
Фх | נ | ס | ע | ף | פ | й | צ | ק | ר | ש | ת | ЛРМ | РЛМ |
Windows-1255 иврит всегда имеет логический порядок (в отличие от визуального). Продукты Microsoft Hebrew (Windows, Office и Internet Explorer) сделали логически упорядоченный иврит общепринятым, в результате чего Windows-1255 является наиболее часто встречающейся в Интернете кодировкой иврита, вытеснив визуально упорядоченный ISO-8859-8 и предпочтя его логически упорядоченному ISO-8859-8-I , поскольку он предусматривает гласные.
Блок Unicode Hebrew (U+0590–U+05FF) следует Windows-1255, кодируя как буквы, так и гласные в тех же относительных позициях, что и Windows-1255. Unicode идет дальше в кодировании знаков кантилляции в нижних позициях. Unicode Hebrew всегда находится в логическом порядке.
Для современных приложений предпочтительной является кодировка UTF-8 или UTF-16 .
Предыстория: проблема иврита и Интернета