ИСО/МЭК 8859-11

Кодировка тайских символов, основанная на ASCII

ISO/IEC 8859-11:2001 , Информационные технологии — 8-битные однобайтовые кодированные графические наборы символов — Часть 11: Латинский/тайский алфавит , является частью серии ISO/IEC 8859 стандартных кодировок символов на основе ASCII , первое издание опубликовано в 2001 году. Его неофициально называют Латинский/тайский . Он почти идентичен национальному тайскому стандарту TIS-620 (1990). Единственное отличие состоит в том, что ISO/IEC 8859-11 выделяет неразрывный пробел для кода 0xA0, тогда как TIS-620 оставляет его неопределенным. (На практике это небольшое различие обычно игнорируется.)

ISO-8859-11 не является основным зарегистрированным именем набора символов IANA, несмотря на то, что соответствует обычному шаблону для наборов символов IANA на основе серии ISO 8859. Однако он определен как псевдоним [1] близкого эквивалента TIS-620 (в котором отсутствует неразрывный пробел), и который без проблем может использоваться для ISO/IEC 8859-11, поскольку неразрывный пробел имеет код, который не был выделен в TIS-620. Microsoft назначила кодовую страницу 28601, также известную как Windows-28601, для ISO-8859-11 в Windows. [2] В черновике тайские буквы были в разных местах. [3]

Как и во всех разновидностях ISO/IEC 8859, нижние 128 кодов эквивалентны ASCII . Дополнительные символы, за исключением неразрывного пробела, находятся в Unicode в том же порядке, только смещены с 0xA1 на U+0E01 и т. д.

Кодовая страница Microsoft Windows 874, а также кодовая страница, используемая в тайской версии Apple Macintosh , MacThai , являются вариантами TIS-620, однако несовместимыми друг с другом.

Набор символов

ИСО/МЭК 8859-11 [4]
0123456789АБСДЭФ
0x
1x
2x СП !"#$%&'()*+,-./
3x0123456789:;<=>?
4x@АБСДЭФГЧАСяДж.КЛМНО
5xПВРСТУВВтХИЗ[\]^_
6x`абсгефгчасяджклмно
7xпдгсттывжхуз{|}~
8x
9x
ТопорНБСПббнетб
Вхбкб
Схб
Дксัำิีึืฺุู฿
Бывшийв็่้๊๋์ํ๎
Фхк

Значения кодов D1, D4-DA, E7-EE являются объединяющими символами .

Расширения поставщика

Кодовая страница 874 (IBM) / 9066

Кодовая страница IBM 874 ( CP874 , IBM-874 , x-IBM874 ), также известная как кодовая страница 9066 ( IBM-9066 ), [5] отличается от ISO/IEC 8859-11 только девятью символами, показанными в рамке в следующей таблице: [6] [7] [8]

Кодовая страница IBM 874/9066 (отличия от ISO-8859-11) [9] [10] [11]
0123456789АБСДЭФ
Топор่ббнетб
Вхбкб
Схб
Дксัำิีึืฺุู้๊๋์฿
Бывшийв็่้๊๋์ํ๎
Фхк¢¬¦НБСП
  Отличия от ISO 8859-11

Код страницы 1161

Кодовая страница 1161 ( CP1161 , IBM-1161 ) — это вариант кодовой страницы IBM 874. Единственное отличие — знак евро (€) в позиции DE hex (222). [12] [13]

Кодовая страница 874 (Microsoft) / 1162

Кодовая страница Windows 874 ( windows-874 , MS874 , x-windows-874 ), известная как кодовая страница 1162 ( CP1162 , IBM-1162 ) от IBM, [14] [15] используется Microsoft Windows. Она отличается от ISO/IEC 8859-11 только добавлением девяти символов, показанных в следующей таблице:

Кодовая страница 1162 (IBM) / 874 (Microsoft): отличие от ISO-8859-11 [16] [17] [18] [19]
0123456789АБСДЭФ
8x
9x''«
  Отличия от ISO 8859-11

Mac OS тайский

Этот вариант используется в классической Mac OS .

Mac OS Тайский [20]
0123456789АБСДЭФ
8x«»่้๊๋์่้๊๋์«ํ
9xั็ิีึื่้๊๋์''
ТопорНБСПббнетб
Вхбкб
Схб
Дксัำิีึืฺุู ВЖ ЗВСП฿
Бывшийв็่้๊๋์ํ
Фхк®©
  Отличия от ISO 8859-11

Смотрите также

Сноски

Ссылки

  1. ^ «Наборы символов IANA».
  2. ^ "js-codepage, Получение кодовых страниц". GitHub . 12 октября 2021 г.
  3. ^ Эверсон, Майкл. «Предложенный ISO 8859-11».
  4. ^ Уистлер, Кен (2002-10-07), ISO/IEC 8859-11:2001 для Unicode, Консорциум Unicode
  5. ^ IBM ; Unicode Consortium . "convrtrs.txt". Международные компоненты для Unicode . v. 59180.0.1. Да ibm-874 == ibm-9066. ibm-1161 имеет обновление для евро.
  6. ^ "Информационный документ о кодовой странице 874". Архивировано из оригинала 2017-01-16.
  7. ^ "Информационный документ CCSID 874". Архивировано из оригинала 2016-03-27.
  8. ^ "Информационный документ CCSID 9066". Архивировано из оригинала 27.03.2016.
  9. ^ IBM . "Кодовая страница CPGID 00874" (PDF) . РЕЕСТР: Наборы графических символов и кодовые страницы .
  10. ^ Кодовая страница CPGID 00874 (txt), IBM
  11. ^ "Converter Explorer: ibm-874_P100-1995". Международные компоненты для Unicode . Консорциум Unicode .
  12. ^ "Кодовая страница 01161" (PDF) .
  13. ^ "Информационный документ CCSID 1161". Архивировано из оригинала 27.03.2016.
  14. ^ "Информационный документ о кодовой странице 1162". Архивировано из оригинала 2016-03-17.
  15. ^ "Информационный документ CCSID 1162". Архивировано из оригинала 27.03.2016.
  16. ^ "Кодовая страница 01162" (PDF) .
  17. ^ Стил, Шон (1998-02-28). "cp874 в таблицу Unicode". Консорциум Unicode , Microsoft .
  18. ^ Кодовая страница CPGID 01162 (txt), IBM
  19. ^ Международные компоненты для Unicode (ICU), ibm-1162_P100-1999.ucm, 2002-12-03
  20. ^ Apple (2005-04-05). «Преобразование (внешняя версия) набора символов тайского языка Mac OS в Unicode 3.2 и более поздние версии». Консорциум Unicode .
  • ИСО/МЭК 8859-11:2001
  • ISO/IEC 8859-11:1999 — 8-битные однобайтовые кодированные графические наборы символов, Часть 11: Набор латинских/тайских символов (проект от 22 июня 1999 г.; заменен ISO/IEC 8859-11:2001, опубликованным 15 декабря 2001 г.)
  • Кодовая страница Windows 874
  • Набор символов тайского языка ISO-IR 166 (13 июля 1992 г., из тайского стандарта TIS 620-2533 (1990))
  • Стандартизация и реализация тайского языка PDF 175k
Взято с "https://en.wikipedia.org/w/index.php?title=ISO/IEC_8859-11&oldid=1242296749"