ИСО/МЭК 8859-15

Стандартные кодировки символов на основе ASCII в серии ISO/IEC 8859
ИСО/МЭК 8859-15:1999
MIME/IANAИСО-8859-15
Псевдоним(ы)латинский-9, латинский-0, латинский-6
СтандартИСО/МЭК 8859
На основеИСО-8859-1
ПредшествовалИСО-8859-1
ПреемникUTF-8

ISO/IEC 8859-15:1999 , Информационные технологии — 8-битные однобайтовые кодированные графические наборы символов — Часть 15: Латинский алфавит № 9 , является частью серии ISO/IEC 8859 стандартных кодировок символов на основе ASCII , первое издание опубликовано в 1999 году. Его неофициально называют Latin-9 (и некоторое время Latin-0 ). Он похож на ISO 8859-1 , и поэтому также предназначен для «западноевропейских» языков, но заменяет некоторые менее распространенные символы знаком евро и некоторыми буквами, которые были сочтены необходимыми. [1]

А4А6А8В4В8до нашей эрыБДБЫТЬ
8859-1¤¦¨´¸¼½¾
8859-15ШšŽžŒœŸ

ISO-8859-15 — это предпочитаемое IANA название набора символов для этого стандарта при добавлении управляющих кодов C0 и C1 из ISO/IEC 6429 .

Microsoft присвоила кодовую страницу 28605 , также известную как Windows-28605, стандарту ISO-8859-15. IBM присвоила кодовую страницу 923 ( CCSID 923) стандарту ISO 8859-15. [2] [3]

Все печатные символы из ISO/IEC 8859-1 и ISO/IEC 8859-15 также присутствуют в Windows-1252 . С октября 2016 года менее 0,1% (фактически в настоящее время менее 0,02%) всех веб-сайтов используют ISO-8859-15. [4] [5]

История

В 1996 году для саамских языков был предложен идентификатор ISO 8859-15 , который в конечном итоге был отклонен, но принят как ISO-IR 197. [6] [7] [8 ]

ISO 8859-16 был предложен как аналогичная кодировка сегодняшнему ISO 8859-15, чтобы заменить 11 неиспользуемых или редко используемых символов ISO 8859-1 отсутствующими французскими Œ œ (на том же месте, что и DEC-MCS и Lotus International Character Set ) и Ÿ (который не был на том же месте, что и эти наборы, поскольку Ý был на том же месте для исландского языка), голландским IJ ij и турецким Ğ ğ İ ı Ş ş. Знак евро в то время не существовал. [9]

Проект был следующим:

Предложенный ( но не принятый ) стандарт ISO/IEC 8859-15
0123456789АБСДЭФ
ТопорНБСП¡¢£¤
0132
¦§
0133
©ª«¬ЗАСТЕНЧИВЫЙ®¯
Вх°±«
011E
ğ
011Ф

0130
µ·
0131
Ş
015E
º»ş
015F
½Ÿ
0178
¿
СхААÂÃÄÅÆÇЭЭКËЯЯЯЯ
ДксÐСТОÔХÖ0152
ØÙÚÛÜÝÞSS
Бывшийаавгдåæçèéêëяяяя
Фхðсòóохöœ
0153
øùуûüýþÿ

Позднее название было изменено на ISO-8859-0 и реструктурировано к 1997 году. Турецкие символы были удалены, поскольку считалось, что это потенциально нанесет больший вред тогдашней турецкой практике, в то время как реализация UCS (Unicode) была не так уж далека, и голландская лигатура IJ была удалена, поскольку существующий диграф ij был признан адекватным. Также рассматривалось добавление валлийских Ŵ ŵ и Ŷ ŷ, но это было отложено до дальнейшего расследования. 4 неиспользуемых или редко используемых символа ISO 8859-1 ( ¤ , ¨ , ´ и ¸ ) были заменены на , Ÿ , Œ и œ соответственно. [10] стал необходим, когда был введен евро . Ÿ необходим для того, чтобы французский текст можно было преобразовать из строчных букв в заглавные и обратно без потерь, а Œ и œ являются французскими лигатурами. По иронии судьбы, последние три уже присутствовали в наборе символов Multinational Character Set (MCS) DEC в 1983 году, наборе символов, из которого произошли ECMA-94 (1985) и ISO-8859-1 (1987). Поскольку их исходные кодовые точки теперь были заняты другими символами, для их повторного введения пришлось выбирать менее логичные кодовые точки.

В том же предложении также рекомендовалось заменить еще 6 символов ( ¢ , ¦ , ± , ¼ , ½ , ¾ ) на «некоторые другие символы, чтобы охватить максимальное количество языков». Причины выбора этих символов были указаны в предложении. [10] Для знака евро некоторые хотели заменить знак плюс–минус вместо знака валюты. Знак валюты используется в некоторых приложениях как разделитель полей , а в некоторых других — для указания промежуточной суммы. Было сильное противодействие этому. Один человек сказал: «Предлагаемый «+-» не является адекватным запасным вариантом, поскольку эта последовательность, хотя и редко используемая, уже имеет фиксированное математическое значение, совершенно отличное от «±»; и, даже если читатель выведет предполагаемое значение «±», из контекста, «+-» вместо «±» оскорбит эстетические чувства физика по крайней мере так же, как «oe» вместо лигатуры oe франкофона». [11] В конце концов, ± был сохранен, а ¤ был удален (как и планировалось изначально).

Около 1997/1998 (когда был обновлен Windows-1252 ) были выбраны четыре символа: Š , š , Ž и ž , которые используются в финском и эстонском языках для транслитерации русских заимствованных слов и имен. В то же время предложение было переименовано в ISO 8859-15. В конце концов символы ¦ , ¼ , ½ и ¾ были удалены, а ¢ был сохранен, поскольку он был более распространен, чем остальные четыре.

Были попытки сделать ISO 8859-15 набором символов по умолчанию для 8-битной связи, но он так и не смог вытеснить популярный ISO 8859-1. Он нашел некоторое применение в качестве набора символов по умолчанию для текстовой консоли и терминальных программ под Linux, когда требовался знак евро, но использование полного Unicode было непрактичным, но с тех пор он был заменен на UTF-8 .

Покрытие

ISO 8859-15 кодирует то, что он называет « латинским алфавитом № 9». Этот набор символов используется в Америке , Западной Европе , Океании и большей части Африки . Он также широко используется в большинстве стандартных романизаций восточноазиатских языков.

Каждый символ кодируется как одно восьмибитное кодовое значение. Эти кодовые значения могут использоваться практически в любой системе обмена данными для общения на следующих языках:

Современные языки с полным охватом их алфавита
Примечания
  1. ^ Полная поддержка, за исключением Ǿ/ǿ, которые отсутствуют. Ǿ/ǿ можно заменить на Ø/ø ценой увеличения неоднозначности.
  2. ^ Обычно поддерживается почти полным охватом голландского алфавита, поскольку отсутствующие IJ , ij всегда должны быть представлены в виде двухсимвольных IJ или ij в электронной форме.
  3. ^ США и современная Британия
  4. ^ В 2017 году Совет по немецкой орфографии официально принял заглавную букву ⟨ẞ⟩ , еще до того, как поддержка немецкого языка была полностью завершена.
  5. ^ Новая орфография
  6. ^ ab Базовая классическая орфография
  7. ^ Письмо Руми
  8. ^ Букмол и нюнорск
  9. ^ Европейские и бразильские

Охват знаков препинания и апострофов

Для некоторых языков, перечисленных выше, отсутствуют правильные типографские кавычки , поскольку включены только «, », ", и '.

Кроме того, эта кодировка не обеспечивает корректный символ для апострофа и ориентированных одинарных высоких кавычек, хотя в некоторых текстах вместо 6-/9-образных кавычек или апострофов используются пробельные гравис и пробельные акут, которые являются частью ISO 8859-1 (и это надежно работает с некоторыми стилями шрифтов, где все эти символы отображаются как наклонные клиновидные глифы).

Макет кодовой страницы

Отличия от ISO-8859-1 заключаются в том, что кодовая точка Unicode отображается под символом.

ИСО/МЭК 8859-15 [12] [13] [14]
0123456789АБСДЭФ
0x
1x
2x СП !"#$%&'()*+,-./
3x0123456789:;<=>?
4x@АБСДЭФГЧАСяДж.КЛМНО
5xПВРСТУВВтХИЗ[\]^_
6x`абсгефгчасяджклмно
7xпдгсттывжхуз{|}~
8x
9x
ТопорНБСП¡¢£
20AC
¥Ш
0160
§
0161
©ª«¬ЗАСТЕНЧИВЫЙ®¯
Вх°±²³Ž
017D
µ·ž
017E
¹º»0152
œ
0153
Ÿ
0178
¿
СхААÂÃÄÅÆÇЭЭКËЯЯЯЯ
ДксÐСТОÔХÖ×ØÙÚÛÜÝÞSS
Бывшийаавгдåæçèéêëяяяя
Фхðсòóохö÷øùуûüýþÿ

Псевдонимы

ISO 8859-15 также имеет следующие псевдонимы, зависящие от поставщика:

Смотрите также

Ссылки

  1. ^ "ISO-8859-15". IANA . Получено 8 марта 2016 г. .
  2. ^ "Информационный документ о кодовой странице 923". Архивировано из оригинала 28.02.2013.
  3. ^ "Информационный документ CCSID 923". Архивировано из оригинала 2014-12-01.
  4. ^ «Исторические тенденции в использовании кодировок символов, ноябрь 2018 г.». w3techs.com .
  5. ^ «Часто задаваемые вопросы». w3techs.com .
  6. ^ TIEKE представляет Финскую ассоциацию стандартов SFS (1999-12-07). Дополнительный набор латинских символов для саамов № 2 (PDF) . ITSCJ/ IPSJ . ISO-IR -209.
  7. ^ Эверсон, Майкл. "Предложенный ISO 8859-15" . Получено 26 февраля 2017 г.
  8. ^ Эверсон, Майкл. "Предложенный ISO 8859-14 (позже 15)" . Получено 26 февраля 2017 г.
  9. ^ Эверсон, Майкл. "Предложенный ISO 8859-16" . Получено 26 февраля 2017 г.
  10. ^ ab Эверсон, Майкл. "Предложенный ISO 8859-0 (позже 15)" . Получено 26 февраля 2017 г. .
  11. ^ Штольц, Отто (11 июля 1997 г.). "Re: New Draft ISO 8859-0". Unicode Mail List (список рассылки).
  12. ^ Кодовая страница CPGID 00923 (pdf) (PDF) , IBM
  13. ^ Кодовая страница CPGID 00923 (txt), IBM
  14. ^ Международные компоненты для Unicode (ICU), ibm-923_P100-1998.ucm, 2002-12-03
  15. ^ Бэрд, Кэти; Чиба, Дэн; Чу, Уинсон; Фань, Джессика; Хо, Клэр; Лоу, Саймон; Ли, Джефф; Линсли, Питер; Мацуда, Кени; Оскрофт, Тамзин; Такеда, Шиге; Танака, Линус; Тозава, Макото; Трут, Барри; Цудзимото, Маюми; Ву, Ин; Яу, Майкл; Ю, Тим; Ван, Чао; Вонг, Саймон; Чжан, Вейран; Чжэн, Лэй; Чжу, Янь; Мур, Валери (2002) [1996]. "Приложение A: Данные о локали". Руководство по поддержке глобализации баз данных Oracle9i (PDF) (выпуск 2 (9.2) ред.). Корпорация Oracle . Oracle A96529-01. Архивировано (PDF) из оригинала 14.02.2017 . Получено 14.02.2017 .
  • ISO/IEC 8859-15:1999 — 8-битные однобайтовые кодированные графические наборы символов, Часть 15: Латинский алфавит № 9 (опубликовано 15 марта 1999 г.)
  • ISO/IEC 8859-15 (окончательный проект комитета от 1 августа 1997 г.)
  • ISO Latin 9 в сравнении с ISO Latin 1
  • ISO-IR 203 Европейский дополнительный латинский набор (16 сентября 1998 г.)
Взято с "https://en.wikipedia.org/w/index.php?title=ISO/IEC_8859-15&oldid=1246203561"