Кодировки символов KOI

Семейство из нескольких кодовых страниц для кириллицы

КОИ ( КОИ ) — семейство нескольких кодовых страниц для кириллицы . Название расшифровывается как « Код об бмена и нформацией » , что означает « Кодекс для обмена информацией » .

Особенностью кодовых страниц KOI является то, что текст остается читаемым человеком, когда самый левый бит удален, если он случайно проходит через оборудование или программное обеспечение, которые могут работать только с 7-битными символами. Это связано с тем, что символы располагаются в особом порядке (128 кодовых точек, кроме латинской буквы, на которую они наиболее похожи), что, однако, не соответствует алфавитному порядку ни в одном языке, использующем кириллицу, и требует использования таблиц поиска для выполнения сортировки .

Эти кодировки получены из ASCII на основе некоторого соответствия между латиницей и кириллицей (почти фонетического), которое уже использовалось в русском диалекте азбуки Морзе и в телеграфном коде МТК-2 . Первые 26 символов из А (0xE1) в KOI8-R — это А, Б, Ц, Д, Е, Ф, Г, Х, И, Й, К, Л, М, Н, О, П, Я, Р, С, Т, У, Ж, В, Ь, Ы, З.

КОИ-7

Первоначальная кодировка KOI (1967) представляла собой 7-битную кодовую страницу KOI-7 ( КОИ-7 ), не содержащую строчных букв. В KOI-7 коды 31 или 32 русских букв упорядочены в соответствии с латинскими буквами. Другие кодовые точки такие же, как в ASCII (однако знак доллара $ (кодовая точка 24 hex ) может быть заменен универсальным знаком валюты ¤).

КОИ-8

Кодировка KOI-8 (КОИ-8), стандартизированная в 1974 году как ГОСТ 19768, представляет собой 8-битное расширение ASCII . [1] [2] Первоначально она включала только 32 строчные и 31 заглавную русские буквы.

Более поздние производные KOI-8 образуют семейство кодировок, известных под разными названиями: KOI8 , KOI 8 и KOI-8 .

Члены семьи:

Кроме того, ГОСТ Р 34.303-92 определяет «KOI-8 V1», что соответствует ISO-IR-153 , а также «KOI-8 N1» и «KOI-8 N2», которые являются вариантами кодовой страницы 866. [ 16] Они не соответствуют макету KOI-8.

ДКОИ

DKOI — кодировка на основе EBCDIC, используемая в мэйнфреймах ЕС ЭВМ . Она определена несколькими стандартами: ГОСТ 19768-74 / СТ СЭВ 358–76, СТ СЭВ 358-88 / ГОСТ 19768–93, CSN 36 9103. [17]

Есть два варианта:

  • DKOI K1 (ДКОИ К1), каждой кириллической букве присвоен свой код.
  • ДКОИ К2 (ДКОИ К2), некоторые буквы кириллицы (А, В, Е, К, М, Н, О, Р, С, Т, Х, а, е, о, р, с, у, х) объединены с визуально идентичными латинскими буквами.

Латинские варианты

Некоторые кодировки называются KOI, но определяют латинские алфавиты:

  • KOI8-CS [18] / KOI8-CS2 [17] для чешского и словацкого языков (ČSN (чешский технический стандарт) 369103, разработанный СЭВ . Это закодированная латиница с диакритическими знаками , используемая в чешском и словацком языках, а не кириллица, но основная идея была той же — текст должен оставаться разборчивым при очищенном 8-м бите, например, Č становилась C и т. д.).
  • KOI8-L2 "Latin-2" (определено в CSN 36 9103), ISO IR 139 [19] (почти идентично ISO 8859-2 (1987), но в нем поменяны местами знак доллара и знак валюты)
  • DKOI CS2 (определено в CSN 36 9103) [17]
  • DKOI L2 (определено в CSN 36 9103) [17]

Ссылки

  1. ^ ab Czyborra, Roman (1998-11-30) [1998-05-25]. "The Cyrillic Charset Soup". Архивировано из оригинала 2016-12-03 . Получено 2016-12-03 .
  2. ^ Флор, Гвидо; Чернов, Андрей А. (2016) [2006]. «Locale::RecodeData::KOI_8 — процедуры преобразования для KOI-8». CPAN libintl-perl . 1.0. Архивировано из оригинала 15 января 2017 г. Проверено 15 января 2017 г.
  3. ^ ab da Cruz, Frank (2010-04-02). "Kermit and MIME Character-Set Names". Проект Kermit . Колумбийский университет , Нью-Йорк, США. Архивировано из оригинала 2016-12-03 . Получено 2016-12-02 .
  4. ^ Демченко, Юрий В. (1997-11-13). Регистрация украинского кириллического набора символов KOI8-RU (как расширения русского KOI8-R и ISO-IR-111) (Отчет). Internet Engineering Task Force.
  5. ^ Флор, Гвидо (2016) [2006]. "Locale::RecodeData::KOI8_RU - Процедуры преобразования для KOI8-RU". CPAN libintl-perl . Архивировано из оригинала 15 января 2017 г. Проверено 15 января 2017 г.
  6. ^ "Информация о кодовой странице SBCS - CPGID: 01167 / Название: Белорусский/Украинский KOI8-RU". IBM Software: Глобализация: Кодированные наборы символов и связанные с ними ресурсы: Кодовые страницы по CPGID: Идентификаторы кодовых страниц . IBM . CH 3-3220-050. Архивировано из оригинала 2017-02-18 . Получено 2017-02-18 .[1] [2]
  7. ^ "Информационный документ CCSID; CCSID 1167; KOI8-RU". IBM . Архивировано из оригинала 2017-02-18 . Получено 2017-02-18 .
  8. ^ Лейшер, Марк (2008) [1999-12-20]. "Таблица преобразования белорусской/украинской кириллицы в Unicode 2.1 KOI8-RU". Кафедра математических наук, Университет штата Нью-Мексико. Архивировано из оригинала 2017-02-19 . Получено 2017-02-18 .
  9. ^ Flohr, Guido; Davis, Michael (2016) [2006]. "Locale::RecodeData::KOI8_T - Процедуры преобразования для KOI8-T". CPAN libintl-perl . Архивировано из оригинала 2017-01-15 . Получено 2017-01-15 .
  10. ^ Обсуждение
  11. ^ «Наборы символов IANA».
  12. ^ ECMA-113. 8-битные однобайтовые кодированные графические наборы символов — латинский/кириллица (1-е изд., июнь 1986 г.)
  13. ^ "Кодировки кириллицы (Charsets). Краткое описание".
  14. ^ Лейшер, Марк (2008) [1998-03-05]. "KOI8 Unified Cyrillic to Unicode 2.1 mapping table". Кафедра математических наук, Университет штата Нью-Мексико. Архивировано из оригинала 2017-02-19 . Получено 2017-02-18 .
  15. ^ Виницки, Серж (29.01.2002). KOI8-C (Отчет). Internet Engineering Task Force.
  16. ^ ГОСТ Р 34.303-92. Наборы 8-битных кодированных символов. 8-битный код обмена и обработки информации. = 8-битные кодированные наборы символов. 8-битный код для обмена информацией.
  17. ^ abcd Петрлик, Лукас (1996-06-19). "Объяснение путаницы в кодировке чешских и словацких символов". cs-encodings-faq . 1.10. Архивировано из оригинала 21-06-2016 . Получено 21-06-2016 .
  18. ^ "Станислав Печа - ASCII". Архивировано из оригинала 2011-03-21 . Получено 2011-04-19 .
  19. ^ ISO-IR-139

Дальнейшее чтение

  • Корнаи, Андрас; Бирнбаум, Дэвид Дж.; да Круз, Фрэнк; Дэвис, Бер; Фаулер, Джордж; Пейн, Ричард Б.; Паперно, Слава; Симонсен, Келд Дж.; Тобе, Гленн Э.; Вулис, Дмитрий; ван Винген, Йохан В. (13 марта 1993 г.). «Часто задаваемые вопросы по кириллице версии 1.3». 1.3 . Проверено 18 февраля 2017 г.
  • «Kodierungen und Zeichensätze» [Кодировки и наборы символов]. Robotron Technik (Виртуальный компьютерный музей) (на немецком языке). 29 ноября 2016 г. ASCII-код/KOI-код . Проверено 21 февраля 2017 г.
  • «Дом KOI8-R с 1995 года». 1995 . Получено 2016-12-05 .
  • Хохлов, Ю. Е. "Представление кириллической информации в электронном виде - Таблицы наборов символов (кодовых страниц)". Архивировано из оригинала 2016-12-05 . Получено 2016-12-05 .
  • Нечаев, Валентин (2013) [2001]. "Обзор вселенной 8-битных кириллических кодировок". Архивировано из оригинала 2016-12-05 . Получено 2016-12-05 .
Взято с "https://en.wikipedia.org/w/index.php?title=KOI_character_encodings&oldid=1252323250#DEC8"