КОИ8-Р

Кодировка символов
КОИ8-Р
Псевдоним(ы)cp878 ( кодовая страница 878)
Язык(и)русский , болгарский
Классификация8-битный KOI , расширенный ASCII
РасширяетКОИ8-Б
На основеКОИ-8
Другие связанные кодировкиКОИ8-У , КОИ8-РУ

KOI8-R (RFC 1489) — это 8-битная кодировка символов , созданная на основе кодировки KOI-8 программистом Андреем Черновым в 1993 году и разработанная для русского языка , в котором используется кириллический алфавит. KOI8-R была основана на русской азбуке Морзе , созданной из фонетической версии латинской азбуки Морзе . В результате русские кириллические буквы располагаются в псевдолатинском порядке, а не в обычном кириллическом алфавитном порядке. Хотя это может показаться неестественным, если убрать 8-й бит, текст будет частично читаем в ASCII и может преобразоваться в синтаксически правильный KOI-7 . Например, «Код Обмена Информацией» в KOI8-R становится kOD oBMENA iNFORMACIEJ (русское значение аббревиатуры «KOI»).

КОИ8 расшифровывается как Код Обмена Информацией, 8 бит ( русский : Код Обмена Информацией, 8 бит ), что означает «Код обмена информацией, 8 бит». В Microsoft Windows KOI8-R присвоен номер кодовой страницы 20866. В IBM KOI8-R присвоена кодовая страница 878. [1] [2] KOI8-R также охватывает болгарский язык .

В нем отсутствуют надлежащие кавычки для этих языков: как «...», так и болгарский «...». Windows-1251 поддерживает их, а также больше букв, и поэтому стал более популярным. KOI8-R используется менее чем 0,004% веб-сайтов, в основном на русском и болгарском языках. [ необходима цитата ] Unicode и UTF-8 предпочтительнее однобайтовых кириллических кодировок в современных приложениях, Unicode содержит 436 кириллических букв, включая старую кириллицу .

Набор символов

В следующей таблице показана кодировка KOI8-R. Каждый символ показан с эквивалентной ему кодовой точкой Unicode .

KOI8-R [3] [4] [5] [6]
0123456789АБСДЭФ
0x
1x
2x СП !"#$%&'()*+,-./
3x0123456789:;<=>?
4x@АБСДЭФГЧАСяДж.КЛМНО
5xПВРСТУВВтХИЗ[\]^_
6x`абсгефгчасяджклмно
7xпдгсттывжхуз{|}~
8x
2500

2502

250С

2510

2514

2518

251С

2524

252С

2534

253С

2580

2584

2588

258С

2590
9x
2591

2592

2593

2320

25А0

2219

221А

2248

2264

2265
НБСП
2321
°
00B0
²
00B2
·
00B7
÷
00F7
Топор
2550

2551

2552
ё
0451

2553

2554

2555

2556

2557

2558

2559

255А

255Б

255С

255D

255E
Вх
255F

2560

2561
Ё
0401

2562

2563

2564

2565

2566

2567

2568

2569

256А

256Б

256С
©
00А9
Схю
044E
а
0430
б
0431
ц
0446
д
0434
е
0435
ф
0444
г
0433
х
0445
и
0438
©
0439
к
043А
л
043Б
м
043С
в
043D
о
043E
Дксп
043Ф
я
044F
р
0440
с
0441
т
0442
у
0443
ж
0436
в
0432
ь
044C
ы
044Б
з
0437
ш
0448
э
044D

0449
ч
0447
ъ
044A
БывшийЮ
042E
А
0410
Б
0411
Ц
0426
Д
0414
Е
0415
Ф
0424
Г
0413
Х
0425
И
0418
Й
0419
К
041А
Л
041Б
М
041С
Н
041Д
О
041E
ФхП
041Ф
Я
042F
Р
0420
С
0421
Т
0422
У
0423
Ж
0416
В
0412
Ь
042C
Ы
042Б
З
0417
Ш
0428
Э
042Д
Щ
0429
Ч
0427
Ъ
042А

Смотрите также

Ссылки

  1. ^ "Информация о кодовой странице SBCS - CPGID: 00878 / Название: Russian internet koi8-r". IBM Software: Глобализация: Кодированные наборы символов и связанные с ними ресурсы: Кодовые страницы по CPGID: Идентификаторы кодовых страниц . IBM . CH 3-3220-050. Архивировано из оригинала 2017-02-18 . Получено 2017-02-18 .
  2. ^ "Информационный документ CCSID; CCSID 878; KOI8-R CYRILLIC". IBM . Получено 2017-02-18 .
  3. ^ Рихтер, Хельмут (2016-01-04) [1999-08-18]. "KOI8-R.TXT". 2.0 . Получено 2016-12-09 .
  4. ^ Кодовая страница CPGID 00878 (pdf) (PDF) , IBM
  5. ^ Кодовая страница CPGID 00878 (txt), IBM
  6. ^ Международные компоненты для Unicode (ICU), ibm-878_P100-1996.ucm, 2002-12-03

Дальнейшее чтение

  • Флор, Гвидо; Поцелуй, Габор; Чернов, Андрей А. (2016) [2006]. «Locale::RecodeData::KOI8_R — процедуры преобразования для KOI8-R». CPAN libintl-perl . 1.0. Архивировано из оригинала 15 января 2017 г. Проверено 15 января 2017 г.
  • Костис, Коста. "koi8-r (русская кодировка U*IX, также используемая RELCOM)". 1.20. Архивировано из оригинала 2017-01-16 . Получено 2017-01-16 .
  • Запрос на изменение 1489
  • "KOI8-R (RFC 1489)". Кермит . Колумбийский университет . Получено 2020-06-24 .
  • Корнаи, Андрас; Бирнбаум, Дэвид Дж.; да Круз, Фрэнк; Дэвис, Бер; Фаулер, Джордж; Пейн, Ричард Б.; Паперно, Слава; Симонсен, Келд Дж.; Тобе, Гленн Э.; Вулис, Дмитрий; ван Винген, Йохан В. (13 марта 1993 г.). «Часто задаваемые вопросы по кириллице версии 1.3». 1.3 . Проверено 24 июня 2020 г.
  • Универсальный декодер кириллицы — онлайн-программа, которая может помочь восстановить кириллические тексты с поврежденной кодировкой KOI8-R или другими символами .
  • «Дом KOI8-R с 1995 года». 1995 . Получено 2016-12-05 .
  • Czyborra, Roman (1998-11-30) [1998-05-25]. "The Cyrillic Charset Soup". Архивировано из оригинала 2016-12-03 . Получено 2016-12-03 .
  • Хохлов, Ю. Е. "Представление кириллической информации в электронном виде - Таблицы наборов символов (кодовых страниц)". Архивировано из оригинала 2016-12-05 . Получено 2016-12-05 .
  • Нечаев, Валентин (2013) [2001]. "Обзор вселенной 8-битных кириллических кодировок". Архивировано из оригинала 2016-12-05 . Получено 2016-12-05 .
Взято с "https://en.wikipedia.org/w/index.php?title=KOI8-R&oldid=1273974128"