Windows-1255

Набор символов Windows для иврита
Windows-1255
MIME/IANAокна-1255
Псевдоним(ы)cp1255 ( кодовая страница 1255)
Язык(и)Иврит , английский
СозданоМайкрософт
СтандартСтандарт кодирования WHATWG
Классификациярасширенный ASCII , Windows-125x
Другие связанные кодировкиИСО-8859-8

Windows-1255 (особенно часто называемая «ANSI») — кодовая страница , используемая в Microsoft Windows для записи иврита . Это почти совместимое надмножество ISO-8859-8  — большинство символов находятся в тех же позициях (за исключением A4, который является «знаком шекеля» в Windows-1255, но «общим знаком валюты» в ISO 8859-8, и за исключением DF, который не определен в Windows-1255, но «двойной нижней чертой» в ISO 8859-8), но Windows-1255 добавляет гласные и другие знаки в более низких позициях.

IBM использует кодовую страницу 1255 ( CCSID 1255, расширенный CCSID знака евро 5351 и еще более расширенный CCSID 9447) для Windows-1255. [1] [2] [3] [4]

Современные приложения предпочитают Unicode вместо Windows-1255, особенно в Интернете; [5] имея в виду UTF-8 , доминирующую кодировку для веб-страниц (или UTF-16, хотя и не в Интернете по соображениям безопасности). Windows-1255 используется менее чем 0,1% веб-сайтов. [6]

Набор символов

В следующей таблице показан Windows-1255. Каждый символ показан с его эквивалентом в Unicode .

Windows-1255 [7] [8] [9] [10] [11] [12] [13]
0123456789АБСДЭФ
0xНУЛЕВОЙСАХСТХЭТХЭОТENQАСКБЕЛБСХТЛФВТФФCRТАКСИ
1xДЛЕДК1ДК2DC3ДК4НАКСИНЭТБМОЖЕТЭМСУБЕСКФСГСРСНАС
2x СП !"#$%&'()*+,-./
3x0123456789:;<=>?
4x@АБСДЭФГЧАСяДж.КЛМНО
5xПВРСТУВВтХИЗ[\]^_
6x`абсгефгчасяджклмно
7xпдгсттывжхуз{|}~ДЕЛ
8xƒˆ
9x''«˜
ТопорНБСП¡¢£¥¦§¨©×«¬ЗАСТЕНЧИВЫЙ®¯
Вх°±²³´µ·¸¹÷»¼½¾¿
Схְֱֲֳִֵֶַָ ֹ ֺֻּֽ־ֿ
Дкс׀ׁׂ׃װױײ׳״
БывшийאבגדהוזחטЙךכלםמן
ФхנסעףפйצקרשתЛРМРЛМ
  Отличия от ISO 8859-8

Использование

Windows-1255 иврит всегда имеет логический порядок (в отличие от визуального). Продукты Microsoft Hebrew (Windows, Office и Internet Explorer) сделали логически упорядоченный иврит общепринятым, в результате чего Windows-1255 является наиболее часто встречающейся в Интернете кодировкой иврита, вытеснив визуально упорядоченный ISO-8859-8 и предпочтя его логически упорядоченному ISO-8859-8-I , поскольку он предусматривает гласные.

Связь с Unicode

Блок Unicode Hebrew (U+0590–U+05FF) следует Windows-1255, кодируя как буквы, так и гласные в тех же относительных позициях, что и Windows-1255. Unicode идет дальше в кодировании знаков кантилляции в нижних позициях. Unicode Hebrew всегда находится в логическом порядке.

Для современных приложений предпочтительной является кодировка UTF-8 или UTF-16 .

Смотрите также

Ссылки

  1. ^ "Информационный документ о кодовой странице 1255". Архивировано из оригинала 2016-03-04.
  2. ^ "Информационный документ CCSID 1255". Архивировано из оригинала 27.03.2016.
  3. ^ "Информационный документ CCSID 5351". Архивировано из оригинала 29.11.2014.
  4. ^ "Информационный документ CCSID 9447". Архивировано из оригинала 2016-03-26.
  5. ^ Джон, Николас А. (2013). «Строительство многоязычного Интернета: Unicode, иврит и глобализация». Журнал компьютерно-опосредованной коммуникации . 18 (3): 321–338. doi : 10.1111/jcc4.12015 . ISSN  1083-6101. Предыстория: проблема иврита и Интернета
  6. ^ "Статистика использования Windows-1255 для веб-сайтов, январь 2019 г.". w3techs.com . Получено 17.01.2019 .
  7. ^ Таблица соответствия Unicode для Windows 1255
  8. ^ Сопоставления Unicode для Windows 1255 с «наилучшим соответствием»
  9. ^ Кодовая страница CPGID 01255 (pdf) (PDF) , IBM
  10. ^ Кодовая страница CPGID 01255 (txt), IBM
  11. ^ Международные компоненты для Unicode (ICU), ibm-1255_P100-1995.ucm, 2002-12-03
  12. ^ Международные компоненты для Unicode (ICU), ibm-1251_P100-1995.ucm, 2002-12-03
  13. ^ Международные компоненты для Unicode (ICU), ibm-5351_P100-1998.ucm, 2002-12-03
  • Регистрация имени набора символов IANA для Windows-1255
Взято с "https://en.wikipedia.org/w/index.php?title=Windows-1255&oldid=1246443308"