Windows-1258

Набор символов Windows для вьетнамского языка
Windows-1258
MIME/IANAокна-1258
Псевдоним(ы)cp1258 ( кодовая страница 1258)
Язык(и)Вьетнамский , английский , французский , немецкий , испанский , датский , норвежский , шведский , финский , ирландский , албанский , люксембургский , голландский .
С комбинированными диакритическими знаками:
эстонский , итальянский , португальский , йоруба , гуарани , игбо , науру , транслитерация деванагари .
СозданоМайкрософт
СтандартСтандарт кодирования WHATWG
Классификациярасширенный ASCII , Windows-125x
На основеWindows-1252

Windows-1258кодовая страница , используемая в Microsoft Windows для представления вьетнамских текстов. Она использует комбинирование диакритических знаков .

Windows-1258 не совместим ни с вьетнамским стандартом ( TCVN 5712 / VSCII), ни с различными другими кодировками, используемыми на практике ( VISCII , VNI , VPS ). Скорее, он очень похож на Windows-1252 , с тем отличием, что s-caron и z-caron (которые были добавлены в Windows-1252 позже) отсутствуют, пять букв с диакритическими знаками были заменены комбинированными диакритическими знаками для вьетнамских тоновых знаков , одна была заменена знаком đông , а восемь других (по четыре на случай) были изменены на четыре вьетнамские буквы, которые иначе не поддерживались .

Использование комбинированных диакритических знаков означает, что Windows-1258 может охватывать большое количество комбинаций букв и тоновых знаков во вьетнамском языке, не ставя под угрозу покрытие управляющих кодов или символов. Однако это также означает, что программное обеспечение должно быть осторожным, чтобы обрабатывать преобразования между предварительно составленными символами и правильно комбинировать последовательности при преобразовании в/из других кодировок, и затрудняет определение видимой пользователем длины строки.

IBM использует кодовую страницу 1258 ( CCSID 1258 и расширенный CCSID знака евро 5354) для Windows-1258. [1] [2] [3]

UTF-8 является предпочтительной кодировкой для вьетнамского языка в современных приложениях. Windows-1258 не всегда может выполнять обратную передачу вьетнамского языка в кодировке Unicode из-за изменений, вызванных нормализацией Unicode . [4] Комбинированные диакритические знаки кодируются после буквы как в Windows-1258, так и в Unicode [4] (как VNI , в отличие от ANSEL ).

Набор символов

В следующей таблице показан Windows-1258. Каждый символ показан с его эквивалентом в Unicode .

Windows-1258 [5] [6] [7] [8] [9] [10]
0123456789АБСДЭФ
0xНУЛЕВОЙСАХСТХЭТХЭОТENQАСКБЕЛБСХТЛФВТФФCRТАКСИ
1xДЛЕДК1ДК2ДК3DC4НАКСИНЭТБМОЖЕТЭМСУБЕСКФСГСРСНАС
2x СП !"#$%&'()*+,-./
3x0123456789:;<=>?
4x@АБСДЭФГЧАСяДж.КЛМНО
5xПВРСТУВВтХИЗ[\]^_
6x`абсгефгчасяджклмно
7xпдгсттывжхуз{|}~ДЕЛ
8xƒˆŒ
9x''«»˜œŸ
ТопорНБСП¡¢£¤¥¦§¨©ª«¬ЗАСТЕНЧИВЫЙ®¯
Вх°±²³´µ·¸¹º»¼½¾¿
СхААÂĂÄÅÆÇЭЭКË◌̀ЯЯЯ
ДксÐС◌̉ОÔƠÖ×ØÙÚÛÜƯ◌̃SS
Бывшийаавадåæçèéêë◌́яяя
Фхдс◌̣óоơö÷øùúûüưÿ
  Отличия от Windows-1252

Код страницы 1129

Кодовая страница IBM 1129 ( CCSID 1129 и расширенный CCSID знака евро 1163) [11] [12] [13] похожа на кодовую страницу 1258, но имеет следующие отличия:

Кодовая страница 1129 (отличия от кодовой страницы 1258) [14] [15] [16] [17] [18] [19]
0123456789АБСДЭФ
8x
9x
ТопорНБСП¡¢£¤¥¦§œ©ª«¬ЗАСТЕНЧИВЫЙ®¯
Вх°±²³Ÿµ·Œ¹º»¼½¾¿
  Отличия от Windows-1258

Смотрите также

Ссылки

  1. ^ "Информационный документ о кодовой странице 1258". Архивировано из оригинала 2016-03-03.
  2. ^ "Информационный документ CCSID 1258". Архивировано из оригинала 29.11.2014.
  3. ^ "Информационный документ CCSID 5354". Архивировано из оригинала 29.11.2014.
  4. ^ ab Каплан, Майкл С. (2005-04-19). "Несколько подводных камней MultiByteToWideChar". Разбираемся во всем этом .
  5. ^ Стил, Шон (1998-04-15). "cp1258 в таблицу Unicode". Microsoft .
  6. ^ Сопоставления Unicode для Windows 1258 с «наилучшим соответствием»
  7. ^ Кодовая страница CPGID 01258 (pdf) (PDF) , IBM
  8. ^ Кодовая страница CPGID 01258 (txt), IBM
  9. ^ Международные компоненты для Unicode (ICU), ibm-1258_P100-1997.ucm, 2002-12-03
  10. ^ Международные компоненты для Unicode (ICU), ibm-5354_P100-1998.ucm, 2002-12-03
  11. ^ "Информационный документ о кодовой странице 1129". Архивировано из оригинала 21.09.2010.
  12. ^ "Информационный документ CCSID 1129". Архивировано из оригинала 2016-03-27.
  13. ^ "Информационный документ CCSID 1163". Архивировано из оригинала 29.11.2014.
  14. ^ Лунде, Кен (13 января 2009 г.). "Приложение L: Вьетнамские наборы символов" (PDF) . Обработка информации CJKV (2-е изд.). ISBN 978-0-596-51447-1.
  15. ^ Кодовая страница CPGID 01129 (pdf) (PDF) , IBM
  16. ^ Кодовая страница CPGID 01129 (txt), IBM
  17. ^ Международные компоненты для Unicode (ICU), ibm-1129_P100-1997.ucm, 2002-12-03
  18. ^ Кодовая страница CPGID 01163 (pdf) (PDF) , IBM
  19. ^ Кодовая страница CPGID 01163 (txt), IBM
  • Регистрация имени набора символов IANA для Windows-1258
  • Блог Майкла Каплана, описывающий поведение кодировки Windows 1258
Взято с "https://en.wikipedia.org/w/index.php?title=Windows-1258&oldid=1242296970#Code_page_1129"