MIME/IANA | ИСО-8859-15 |
---|---|
Псевдоним(ы) | латинский-9, латинский-0, латинский-6 |
Стандарт | ИСО/МЭК 8859 |
На основе | ИСО-8859-1 |
Предшествовал | ИСО-8859-1 |
Преемник | UTF-8 |
ISO/IEC 8859-15:1999 , Информационные технологии — 8-битные однобайтовые кодированные графические наборы символов — Часть 15: Латинский алфавит № 9 , является частью серии ISO/IEC 8859 стандартных кодировок символов на основе ASCII , первое издание опубликовано в 1999 году. Его неофициально называют Latin-9 (и некоторое время Latin-0 ). Он похож на ISO 8859-1 , и поэтому также предназначен для «западноевропейских» языков, но заменяет некоторые менее распространенные символы знаком евро и некоторыми буквами, которые были сочтены необходимыми. [1]
А4 | А6 | А8 | В4 | В8 | до нашей эры | БД | БЫТЬ | |
---|---|---|---|---|---|---|---|---|
8859-1 | ¤ | ¦ | ¨ | ´ | ¸ | ¼ | ½ | ¾ |
8859-15 | € | Ш | š | Ž | ž | Œ | œ | Ÿ |
ISO-8859-15 — это предпочитаемое IANA название набора символов для этого стандарта при добавлении управляющих кодов C0 и C1 из ISO/IEC 6429 .
Microsoft присвоила кодовую страницу 28605 , также известную как Windows-28605, стандарту ISO-8859-15. IBM присвоила кодовую страницу 923 ( CCSID 923) стандарту ISO 8859-15. [2] [3]
Все печатные символы из ISO/IEC 8859-1 и ISO/IEC 8859-15 также присутствуют в Windows-1252 . С октября 2016 года менее 0,1% (фактически в настоящее время менее 0,02%) всех веб-сайтов используют ISO-8859-15. [4] [5]
В 1996 году для саамских языков был предложен идентификатор ISO 8859-15 , который в конечном итоге был отклонен, но принят как ISO-IR 197. [6] [7] [8 ]
ISO 8859-16 был предложен как аналогичная кодировка сегодняшнему ISO 8859-15, чтобы заменить 11 неиспользуемых или редко используемых символов ISO 8859-1 отсутствующими французскими Œ œ (на том же месте, что и DEC-MCS и Lotus International Character Set ) и Ÿ (который не был на том же месте, что и эти наборы, поскольку Ý был на том же месте для исландского языка), голландским IJ ij и турецким Ğ ğ İ ı Ş ş. Знак евро в то время не существовал. [9]
Проект был следующим:
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | А | Б | С | Д | Э | Ф | |
Топор | НБСП | ¡ | ¢ | £ | ¤ | № 0132 | ¦ | § | № 0133 | © | ª | « | ¬ | ЗАСТЕНЧИВЫЙ | ® | ¯ |
Вх | ° | ± | « 011E | ğ 011Ф | № 0130 | µ | ¶ | · | № 0131 | Ş 015E | º | » | ş 015F | ½ | Ÿ 0178 | ¿ |
Сх | А | А | Â | Ã | Ä | Å | Æ | Ç | Э | Э | К | Ë | Я | Я | Я | Я |
Дкс | Ð | С | Т | О | Ô | Х | Ö | 0152 | Ø | Ù | Ú | Û | Ü | Ý | Þ | SS |
Бывший | а | а | в | г | д | å | æ | ç | è | é | ê | ë | я | я | я | я |
Фх | ð | с | ò | ó | о | х | ö | œ 0153 | ø | ù | у | û | ü | ý | þ | ÿ |
Позднее название было изменено на ISO-8859-0 и реструктурировано к 1997 году. Турецкие символы были удалены, поскольку считалось, что это потенциально нанесет больший вред тогдашней турецкой практике, в то время как реализация UCS (Unicode) была не так уж далека, и голландская лигатура IJ была удалена, поскольку существующий диграф ij был признан адекватным. Также рассматривалось добавление валлийских Ŵ ŵ и Ŷ ŷ, но это было отложено до дальнейшего расследования. 4 неиспользуемых или редко используемых символа ISO 8859-1 ( ¤ , ¨ , ´ и ¸ ) были заменены на € , Ÿ , Œ и œ соответственно. [10] € стал необходим, когда был введен евро . Ÿ необходим для того, чтобы французский текст можно было преобразовать из строчных букв в заглавные и обратно без потерь, а Œ и œ являются французскими лигатурами. По иронии судьбы, последние три уже присутствовали в наборе символов Multinational Character Set (MCS) DEC в 1983 году, наборе символов, из которого произошли ECMA-94 (1985) и ISO-8859-1 (1987). Поскольку их исходные кодовые точки теперь были заняты другими символами, для их повторного введения пришлось выбирать менее логичные кодовые точки.
В том же предложении также рекомендовалось заменить еще 6 символов ( ¢ , ¦ , ± , ¼ , ½ , ¾ ) на «некоторые другие символы, чтобы охватить максимальное количество языков». Причины выбора этих символов были указаны в предложении. [10] Для знака евро некоторые хотели заменить знак плюс–минус вместо знака валюты. Знак валюты используется в некоторых приложениях как разделитель полей , а в некоторых других — для указания промежуточной суммы. Было сильное противодействие этому. Один человек сказал: «Предлагаемый «+-» не является адекватным запасным вариантом, поскольку эта последовательность, хотя и редко используемая, уже имеет фиксированное математическое значение, совершенно отличное от «±»; и, даже если читатель выведет предполагаемое значение «±», из контекста, «+-» вместо «±» оскорбит эстетические чувства физика по крайней мере так же, как «oe» вместо лигатуры oe франкофона». [11] В конце концов, ± был сохранен, а ¤ был удален (как и планировалось изначально).
Около 1997/1998 (когда был обновлен Windows-1252 ) были выбраны четыре символа: Š , š , Ž и ž , которые используются в финском и эстонском языках для транслитерации русских заимствованных слов и имен. В то же время предложение было переименовано в ISO 8859-15. В конце концов символы ¦ , ¼ , ½ и ¾ были удалены, а ¢ был сохранен, поскольку он был более распространен, чем остальные четыре.
Были попытки сделать ISO 8859-15 набором символов по умолчанию для 8-битной связи, но он так и не смог вытеснить популярный ISO 8859-1. Он нашел некоторое применение в качестве набора символов по умолчанию для текстовой консоли и терминальных программ под Linux, когда требовался знак евро, но использование полного Unicode было непрактичным, но с тех пор он был заменен на UTF-8 .
ISO 8859-15 кодирует то, что он называет « латинским алфавитом № 9». Этот набор символов используется в Америке , Западной Европе , Океании и большей части Африки . Он также широко используется в большинстве стандартных романизаций восточноазиатских языков.
Каждый символ кодируется как одно восьмибитное кодовое значение. Эти кодовые значения могут использоваться практически в любой системе обмена данными для общения на следующих языках:
|
|
Для некоторых языков, перечисленных выше, отсутствуют правильные типографские кавычки , поскольку включены только «, », ", и '.
Кроме того, эта кодировка не обеспечивает корректный символ для апострофа и ориентированных одинарных высоких кавычек, хотя в некоторых текстах вместо 6-/9-образных кавычек или апострофов используются пробельные гравис и пробельные акут, которые являются частью ISO 8859-1 (и это надежно работает с некоторыми стилями шрифтов, где все эти символы отображаются как наклонные клиновидные глифы).
Отличия от ISO-8859-1 заключаются в том, что кодовая точка Unicode отображается под символом.
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | А | Б | С | Д | Э | Ф | |
0x | ||||||||||||||||
1x | ||||||||||||||||
2x | СП | ! | " | # | $ | % | & | ' | ( | ) | * | + | , | - | . | / |
3x | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | : | ; | < | = | > | ? |
4x | @ | А | Б | С | Д | Э | Ф | Г | ЧАС | я | Дж. | К | Л | М | Н | О |
5x | П | В | Р | С | Т | У | В | Вт | Х | И | З | [ | \ | ] | ^ | _ |
6x | ` | а | б | с | г | е | ф | г | час | я | дж | к | л | м | н | о |
7x | п | д | г | с | т | ты | в | ж | х | у | з | { | | | } | ~ | |
8x | ||||||||||||||||
9x | ||||||||||||||||
Топор | НБСП | ¡ | ¢ | £ | € 20AC | ¥ | Ш 0160 | § | № 0161 | © | ª | « | ¬ | ЗАСТЕНЧИВЫЙ | ® | ¯ |
Вх | ° | ± | ² | ³ | Ž 017D | µ | ¶ | · | ž 017E | ¹ | º | » | 0152 | œ 0153 | Ÿ 0178 | ¿ |
Сх | А | А | Â | Ã | Ä | Å | Æ | Ç | Э | Э | К | Ë | Я | Я | Я | Я |
Дкс | Ð | С | Т | О | Ô | Х | Ö | × | Ø | Ù | Ú | Û | Ü | Ý | Þ | SS |
Бывший | а | а | в | г | д | å | æ | ç | è | é | ê | ë | я | я | я | я |
Фх | ð | с | ò | ó | о | х | ö | ÷ | ø | ù | у | û | ü | ý | þ | ÿ |
ISO 8859-15 также имеет следующие псевдонимы, зависящие от поставщика: