MIME/IANA | ИСО-8859-6 |
---|---|
Псевдоним(ы) | iso-ir-127, ECMA-114, ASMO-708, арабский, csISOLatinАрабский [1] |
Стандарт | ASMO 708, ECMA-114, ISO/IEC 8859-6 |
Классификация | расширенный ASCII , ISO 8859 |
Расширения | OEM-708, Mac OS арабский (почти) |
Предшествовал | АСМО 449 |
Преемник | Юникод |
Другие связанные кодировки | Windows-1256 (несовместимо, перемещает несколько букв) |
ISO/IEC 8859-6:1999 , Информационные технологии — 8-битные однобайтовые кодированные графические наборы символов — Часть 6: Латинский/арабский алфавит , является частью серии ISO/IEC 8859 стандартных кодировок символов на основе ASCII , первое издание опубликовано в 1987 году. Его неофициально называют латинским/арабским . Он был разработан для арабского языка . Кодируются только номинальные буквы, никаких предварительно сформированных форм букв, поэтому для отображения требуется обработка формирования. Он не включает дополнительные буквы, необходимые для записи большинства языков с арабской графикой, кроме самого арабского (например, персидского, урду и т. д.).
ISO-8859-6 — это предпочитаемое IANA название набора символов для этого стандарта, когда оно дополнено управляющими кодами C0 и C1 из ISO/IEC 6429. Текст находится в логическом порядке, поэтому для отображения требуется обработка BiDi . Номинально ISO-8859-6 ( кодовая страница 28596 ) предназначено для «визуального порядка», а ISO-8859-6-I ( кодовая страница 38596 ) — для логического порядка. Но на практике, и это требуется для документов HTML и XML, ISO-8859-6 также обозначает текст в логическом порядке. Существует также ISO-8859-6-E , который предположительно требует явного указания направленности с помощью специальных управляющих символов; этот последний вариант на практике не используется. IBM присвоила кодовую страницу/ CCSID 1089 для ISO 8859-6. [2] [3] Это эмуляция для их операционной системы AIX .
ISO-8859-6 использовался в качестве эталонного стандарта для кодирования арабского письма в Unicode [4] , но в настоящее время технологически устарел . [5] Unicode является предпочтительным в современных приложениях, особенно в Интернете; это означает доминирующую кодировку UTF-8 для веб-страниц (см. также Арабское письмо в Unicode , для полного охвата, в отличие от, например, ISO-8859-6 или Windows 1256 , которые не охватывают дополнительные возможности). Менее 0,0002% всех веб-страниц используют ISO-8859-6, [6] [7], и это даже не третий по популярности вариант кодировки для арабского языка в Интернете.
ASMO 708 был разработан ныне несуществующей Арабской организацией по стандартизации и метрологии [8] в 1986 году как 8-битный стандарт для использования в арабоязычных странах. Дизайн этого набора символов был вдохновлен предыдущим 7-битным стандартом — ASMO 449 — но это не просто 7-битный набор символов, перемещенный в верхнюю часть; есть некоторые различия.
ASMO 708 — это двунаправленный набор символов. Нижняя часть набора символов отличается от стандарта ISO 646 цифрами и некоторыми знаками препинания. В зависимости от контекста (находятся ли цифры в латинском или арабском алфавите) цифры отображаются либо как латинские, либо как арабские цифры. Кроме того, в зависимости от контекста симметричные знаки препинания меняются местами, т. е. всякий раз, когда есть открывающий знак препинания, форма отображается по-разному в соответствии с направлением алфавита.
Верхняя часть набора символов содержит только арабские буквы, арабскую пунктуацию, отличную от латинской, а также несколько других символов.
ASMO 708 был разработан в тесном сотрудничестве [9] с ECMA , которая приняла его в качестве своего собственного стандарта ECMA-114 в 1986 году. Он также был утвержден в качестве стандарта ISO как ISO 8859-6 . [10] Он также был зарегистрирован в Международном регистре кодированных наборов символов как IR 127 [11] в 1986 году.
Некоторые другие наборы символов связаны с ASMO 708:
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | А | Б | С | Д | Э | Ф | |
0x | ||||||||||||||||
1x | ||||||||||||||||
2x | СП | ! | " | # | $ | % / ٪ | & | ' | ( | ) | * / ٭ | + | , | - | . | / |
3x | 0/0 | 1/1 | 2/2 | 3/3 | 4/4 | 5/5 | 6/ф | 7/٧ | 8/ф | 9/٩ | : | ; | < | = | > | ? |
4x | @ | А | Б | С | Д | Э | Ф | Г | ЧАС | я | Дж. | К | Л | М | Н | О |
5x | П | В | Р | С | Т | У | В | Вт | Х | И | З | [ | \ | ] | ^ | _ |
6x | ` | а | б | с | г | е | ф | г | час | я | дж | к | л | м | н | о |
7x | п | д | г | с | т | ты | в | ж | х | у | з | { | | | } | ~ | |
8x | ||||||||||||||||
9x | ||||||||||||||||
Топор | НБСП | ¤ | , | ЗАСТЕНЧИВЫЙ | ||||||||||||
Вх | ; | ؟ | ||||||||||||||
Сх | ء | А | ã | ДА | å | А | ا | Б | ة | ت | Ь | Дж | ح | خ | د | |
Дкс | ذ | ر | ò | С | ش | х | ض | ط | ظ | ع | غ | |||||
Бывший | ـ | ف | ق | к | ل | м | н | х | و | ى | й | ◌ً | ◌ٌ | ◌ٍ | ◌َ | ◌ُ |
Фх | ◌ِ | ◌ّ | ◌ْ |
Комбинированным символам присваиваются кодовые значения 0xEB–0xF2 .