MIME/IANA | окна-1258 |
---|---|
Псевдоним(ы) | cp1258 ( кодовая страница 1258) |
Язык(и) | Вьетнамский , английский , французский , немецкий , испанский , датский , норвежский , шведский , финский , ирландский , албанский , люксембургский , голландский . С комбинированными диакритическими знаками: эстонский , итальянский , португальский , йоруба , гуарани , игбо , науру , транслитерация деванагари . |
Создано | Майкрософт |
Стандарт | Стандарт кодирования WHATWG |
Классификация | расширенный ASCII , Windows-125x |
На основе | Windows-1252 |
Windows-1258 — кодовая страница , используемая в Microsoft Windows для представления вьетнамских текстов. Она использует комбинирование диакритических знаков .
Windows-1258 не совместим ни с вьетнамским стандартом ( TCVN 5712 / VSCII), ни с различными другими кодировками, используемыми на практике ( VISCII , VNI , VPS ). Скорее, он очень похож на Windows-1252 , с тем отличием, что s-caron и z-caron (которые были добавлены в Windows-1252 позже) отсутствуют, пять букв с диакритическими знаками были заменены комбинированными диакритическими знаками для вьетнамских тоновых знаков , одна была заменена знаком đông , а восемь других (по четыре на случай) были изменены на четыре вьетнамские буквы, которые иначе не поддерживались .
Использование комбинированных диакритических знаков означает, что Windows-1258 может охватывать большое количество комбинаций букв и тоновых знаков во вьетнамском языке, не ставя под угрозу покрытие управляющих кодов или символов. Однако это также означает, что программное обеспечение должно быть осторожным, чтобы обрабатывать преобразования между предварительно составленными символами и правильно комбинировать последовательности при преобразовании в/из других кодировок, и затрудняет определение видимой пользователем длины строки.
IBM использует кодовую страницу 1258 ( CCSID 1258 и расширенный CCSID знака евро 5354) для Windows-1258. [1] [2] [3]
UTF-8 является предпочтительной кодировкой для вьетнамского языка в современных приложениях. Windows-1258 не всегда может выполнять обратную передачу вьетнамского языка в кодировке Unicode из-за изменений, вызванных нормализацией Unicode . [4] Комбинированные диакритические знаки кодируются после буквы как в Windows-1258, так и в Unicode [4] (как VNI , в отличие от ANSEL ).
В следующей таблице показан Windows-1258. Каждый символ показан с его эквивалентом в Unicode .
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | А | Б | С | Д | Э | Ф | |
0x | НУЛЕВОЙ | САХ | СТХ | ЭТХ | ЭОТ | ENQ | АСК | БЕЛ | БС | ХТ | ЛФ | ВТ | ФФ | CR | ТАК | СИ |
1x | ДЛЕ | ДК1 | ДК2 | ДК3 | DC4 | НАК | СИН | ЭТБ | МОЖЕТ | ЭМ | СУБ | ЕСК | ФС | ГС | РС | НАС |
2x | СП | ! | " | # | $ | % | & | ' | ( | ) | * | + | , | - | . | / |
3x | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | : | ; | < | = | > | ? |
4x | @ | А | Б | С | Д | Э | Ф | Г | ЧАС | я | Дж. | К | Л | М | Н | О |
5x | П | В | Р | С | Т | У | В | Вт | Х | И | З | [ | \ | ] | ^ | _ |
6x | ` | а | б | с | г | е | ф | г | час | я | дж | к | л | м | н | о |
7x | п | д | г | с | т | ты | в | ж | х | у | з | { | | | } | ~ | ДЕЛ |
8x | € | ‚ | ƒ | „ | … | † | ‡ | ˆ | ‰ | ‹ | Œ | |||||
9x | ' | ' | « | » | • | – | — | ˜ | ™ | › | œ | Ÿ | ||||
Топор | НБСП | ¡ | ¢ | £ | ¤ | ¥ | ¦ | § | ¨ | © | ª | « | ¬ | ЗАСТЕНЧИВЫЙ | ® | ¯ |
Вх | ° | ± | ² | ³ | ´ | µ | ¶ | · | ¸ | ¹ | º | » | ¼ | ½ | ¾ | ¿ |
Сх | А | А | Â | Ă | Ä | Å | Æ | Ç | Э | Э | К | Ë | ◌̀ | Я | Я | Я |
Дкс | Ð | С | ◌̉ | О | Ô | Ơ | Ö | × | Ø | Ù | Ú | Û | Ü | Ư | ◌̃ | SS |
Бывший | а | а | в | а | д | å | æ | ç | è | é | ê | ë | ◌́ | я | я | я |
Фх | д | с | ◌̣ | ó | о | ơ | ö | ÷ | ø | ù | ú | û | ü | ư | ₫ | ÿ |
Отличия от Windows-1252 |
Кодовая страница IBM 1129 ( CCSID 1129 и расширенный CCSID знака евро 1163) [11] [12] [13] похожа на кодовую страницу 1258, но имеет следующие отличия:
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | А | Б | С | Д | Э | Ф | |
8x | ||||||||||||||||
9x | ||||||||||||||||
Топор | НБСП | ¡ | ¢ | £ | ¤ | ¥ | ¦ | § | œ | © | ª | « | ¬ | ЗАСТЕНЧИВЫЙ | ® | ¯ |
Вх | ° | ± | ² | ³ | Ÿ | µ | ¶ | · | Œ | ¹ | º | » | ¼ | ½ | ¾ | ¿ |
Отличия от Windows-1258 |