Семейство из нескольких кодовых страниц для кириллицы
КОИ ( КОИ ) — семейство нескольких кодовых страниц для кириллицы . Название расшифровывается как « Код об бмена и нформацией » , что означает « Кодекс для обмена информацией » .
Особенностью кодовых страниц KOI является то, что текст остается читаемым человеком, когда самый левый бит удален, если он случайно проходит через оборудование или программное обеспечение, которые могут работать только с 7-битными символами. Это связано с тем, что символы располагаются в особом порядке (128 кодовых точек, кроме латинской буквы, на которую они наиболее похожи), что, однако, не соответствует алфавитному порядку ни в одном языке, использующем кириллицу, и требует использования таблиц поиска для выполнения сортировки .
Эти кодировки получены из ASCII на основе некоторого соответствия между латиницей и кириллицей (почти фонетического), которое уже использовалось в русском диалекте азбуки Морзе и в телеграфном коде МТК-2 . Первые 26 символов из А (0xE1) в KOI8-R — это А, Б, Ц, Д, Е, Ф, Г, Х, И, Й, К, Л, М, Н, О, П, Я, Р, С, Т, У, Ж, В, Ь, Ы, З.
КОИ-7
Первоначальная кодировка KOI (1967) представляла собой 7-битную кодовую страницу KOI-7 ( КОИ-7 ), не содержащую строчных букв. В KOI-7 коды 31 или 32 русских букв упорядочены в соответствии с латинскими буквами. Другие кодовые точки такие же, как в ASCII (однако знак доллара $ (кодовая точка 24 hex ) может быть заменен универсальным знаком валюты ¤).
КОИ-8
Кодировка KOI-8 (КОИ-8), стандартизированная в 1974 году как ГОСТ 19768, представляет собой 8-битное расширение ASCII . [1] [2] Первоначально она включала только 32 строчные и 31 заглавную русские буквы.
Более поздние производные KOI-8 образуют семейство кодировок, известных под разными названиями: KOI8 , KOI 8 и KOI-8 .
KOI8-F , KOI-8 Unified. Включает в себя распределение букв из KOI8-U и KOI8-E, с подмножеством псевдографики из KOI8-R. [13] [14] (Кодовая страница FreeDOS 60270 )
KOI8-K1 «Кириллица-1» (определено в CSN 36 9103, ST SEV 358–88)
Кроме того, ГОСТ Р 34.303-92 определяет «KOI-8 V1», что соответствует ISO-IR-153 , а также «KOI-8 N1» и «KOI-8 N2», которые являются вариантами кодовой страницы 866. [ 16] Они не соответствуют макету KOI-8.
ДКОИ
DKOI — кодировка на основе EBCDIC, используемая в мэйнфреймах ЕС ЭВМ . Она определена несколькими стандартами: ГОСТ 19768-74 / СТ СЭВ 358–76, СТ СЭВ 358-88 / ГОСТ 19768–93, CSN 36 9103. [17]
Есть два варианта:
DKOI K1 (ДКОИ К1), каждой кириллической букве присвоен свой код.
ДКОИ К2 (ДКОИ К2), некоторые буквы кириллицы (А, В, Е, К, М, Н, О, Р, С, Т, Х, а, е, о, р, с, у, х) объединены с визуально идентичными латинскими буквами.
Латинские варианты
Некоторые кодировки называются KOI, но определяют латинские алфавиты:
KOI8-CS [18] / KOI8-CS2 [17] для чешского и словацкого языков (ČSN (чешский технический стандарт) 369103, разработанный СЭВ . Это закодированная латиница с диакритическими знаками , используемая в чешском и словацком языках, а не кириллица, но основная идея была той же — текст должен оставаться разборчивым при очищенном 8-м бите, например, Č становилась C и т. д.).
KOI8-L2 "Latin-2" (определено в CSN 36 9103), ISO IR 139 [19] (почти идентично ISO 8859-2 (1987), но в нем поменяны местами знак доллара и знак валюты)
DKOI CS2 (определено в CSN 36 9103) [17]
DKOI L2 (определено в CSN 36 9103) [17]
Ссылки
^ ab Czyborra, Roman (1998-11-30) [1998-05-25]. "The Cyrillic Charset Soup". Архивировано из оригинала 2016-12-03 . Получено 2016-12-03 .
^ Флор, Гвидо; Чернов, Андрей А. (2016) [2006]. «Locale::RecodeData::KOI_8 — процедуры преобразования для KOI-8». CPAN libintl-perl . 1.0. Архивировано из оригинала 15 января 2017 г. Проверено 15 января 2017 г.
^ ab da Cruz, Frank (2010-04-02). "Kermit and MIME Character-Set Names". Проект Kermit . Колумбийский университет , Нью-Йорк, США. Архивировано из оригинала 2016-12-03 . Получено 2016-12-02 .
^ Демченко, Юрий В. (1997-11-13). Регистрация украинского кириллического набора символов KOI8-RU (как расширения русского KOI8-R и ISO-IR-111) (Отчет). Internet Engineering Task Force.
^ Флор, Гвидо (2016) [2006]. "Locale::RecodeData::KOI8_RU - Процедуры преобразования для KOI8-RU". CPAN libintl-perl . Архивировано из оригинала 15 января 2017 г. Проверено 15 января 2017 г.
^ "Информация о кодовой странице SBCS - CPGID: 01167 / Название: Белорусский/Украинский KOI8-RU". IBM Software: Глобализация: Кодированные наборы символов и связанные с ними ресурсы: Кодовые страницы по CPGID: Идентификаторы кодовых страниц . IBM . CH 3-3220-050. Архивировано из оригинала 2017-02-18 . Получено 2017-02-18 .[1] [2]
^ "Информационный документ CCSID; CCSID 1167; KOI8-RU". IBM . Архивировано из оригинала 2017-02-18 . Получено 2017-02-18 .
^ Лейшер, Марк (2008) [1999-12-20]. "Таблица преобразования белорусской/украинской кириллицы в Unicode 2.1 KOI8-RU". Кафедра математических наук, Университет штата Нью-Мексико. Архивировано из оригинала 2017-02-19 . Получено 2017-02-18 .
^ Flohr, Guido; Davis, Michael (2016) [2006]. "Locale::RecodeData::KOI8_T - Процедуры преобразования для KOI8-T". CPAN libintl-perl . Архивировано из оригинала 2017-01-15 . Получено 2017-01-15 .
^ Обсуждение
^ «Наборы символов IANA».
^ ECMA-113. 8-битные однобайтовые кодированные графические наборы символов — латинский/кириллица (1-е изд., июнь 1986 г.)
^ Лейшер, Марк (2008) [1998-03-05]. "KOI8 Unified Cyrillic to Unicode 2.1 mapping table". Кафедра математических наук, Университет штата Нью-Мексико. Архивировано из оригинала 2017-02-19 . Получено 2017-02-18 .
^ Виницки, Серж (29.01.2002). KOI8-C (Отчет). Internet Engineering Task Force.
^ ГОСТ Р 34.303-92. Наборы 8-битных кодированных символов. 8-битный код обмена и обработки информации. = 8-битные кодированные наборы символов. 8-битный код для обмена информацией.
^ abcd Петрлик, Лукас (1996-06-19). "Объяснение путаницы в кодировке чешских и словацких символов". cs-encodings-faq . 1.10. Архивировано из оригинала 21-06-2016 . Получено 21-06-2016 .
Корнаи, Андрас; Бирнбаум, Дэвид Дж.; да Круз, Фрэнк; Дэвис, Бер; Фаулер, Джордж; Пейн, Ричард Б.; Паперно, Слава; Симонсен, Келд Дж.; Тобе, Гленн Э.; Вулис, Дмитрий; ван Винген, Йохан В. (13 марта 1993 г.). «Часто задаваемые вопросы по кириллице версии 1.3». 1.3 . Проверено 18 февраля 2017 г.
«Kodierungen und Zeichensätze» [Кодировки и наборы символов]. Robotron Technik (Виртуальный компьютерный музей) (на немецком языке). 29 ноября 2016 г. ASCII-код/KOI-код . Проверено 21 февраля 2017 г.
Внешние ссылки
«Дом KOI8-R с 1995 года». 1995 . Получено 2016-12-05 .
Хохлов, Ю. Е. "Представление кириллической информации в электронном виде - Таблицы наборов символов (кодовых страниц)". Архивировано из оригинала 2016-12-05 . Получено 2016-12-05 .