Шестибитный код символа

Компьютерное кодирование символов

Шестибитный код символа — это кодировка символов, разработанная для использования на компьютерах с длиной слова , кратной 6. Шесть бит могут кодировать только 64 различных символа, поэтому эти коды обычно включают только заглавные буквы, цифры, некоторые знаки препинания и иногда управляющие символы. Формат магнитной ленты с 7 дорожками был разработан для хранения данных в таких кодах вместе с дополнительным битом четности .

Типы шестибитных кодов

Ранний шестибитный двоичный код использовался для шрифта Брайля — системы чтения для слепых, разработанной в 1820-х годах.

Самые ранние компьютеры работали только с числовыми данными и не предусматривали символьные данные. Шестибитный BCD с несколькими вариантами использовался IBM на ранних компьютерах, таких как IBM 702 в 1953 году и IBM 704 в 1954 году. [1] : стр.35  Шестибитные кодировки были заменены 8-битным кодом EBCDIC , начиная с 1964 года, когда System/360 стандартизировала 8-битные байты . Существует несколько вариантов этого типа кода (см. ниже).

Шестибитные коды символов, как правило, пришли на смену пятибитному коду Бодо и предшествовали семибитному коду ASCII .

Шестибитные коды могли кодировать более 64 символов с помощью символов Shift Out и Shift In , по сути, объединяя два различных набора из 62 символов и переключаясь между ними. Например, популярный коммуникационный терминал IBM 2741 поддерживал различные наборы символов до 88 печатных символов плюс управляющие символы.

Код телетайпа

Специальное 6-уровневое расширение 5-уровневого Международного Телеграфного Алфавита использовалось для дистанционного управления линотипными машинами, начиная примерно с 1930 года. К 1950 году оно широко использовалось телеграфными службами для отправки предварительно отформатированных новостных статей в участвующие газеты. Оно поддерживало 90 печатных символов линотипной машины, а также пробельные символы .

Код TTS имел две пары кодов сдвига, что позволяло в общей сложности четыре состояния сдвига. Первый действовал во многом как клавиша Shift на клавиатуре и выбирал между строчными буквами и цифрами, а также заглавными буквами и символами. Вторая пара кодов сдвига Linotype "нижняя направляющая" и "верхняя направляющая" выбирала альтернативный (обычно курсивный) шрифт.

Шестибитный код BCD

Шестибитный код BCD был адаптацией кода перфокарт к двоичному коду . IBM применила термины двоично-десятичный и BCD к вариациям буквенно-цифровых кодов BCD , которые использовались в большинстве ранних компьютеров IBM, включая IBM 1620 , IBM 1400 series и недесятичные архитектурные элементы IBM 700/7000 series .

Базы данных COBOL шестибитный код

Шестибитный код также использовался в базах данных COBOL, где информация о конце записи хранилась отдельно. [ необходима цитата ]

Шестибитный код магнитной полосы карты

Шестибитный код с добавленным битом нечетности используется на дорожке 1 карт с магнитной полосой , как указано в стандарте ISO/IEC 7811-2 .

Код DEC SIXBIT

Популярным шестибитным кодом был DEC SIXBIT. Это просто коды символов ASCII от 32 до 95, закодированные как 0 до 63 путем вычитания 32 (т. е. столбцы 2, 3, 4 и 5 таблицы ASCII (16 символов в столбце), смещенные в столбцы 0-3 путем вычитания 2 из старших бит); он включает пробел, знаки препинания, цифры и заглавные буквы, но не содержит управляющих символов. Поскольку он не включал управляющих символов, даже конца строки, он не использовался для общей обработки текста. Однако шестисимвольные имена, такие как имена файлов и символы ассемблера, могли храниться в одном 36-битном слове PDP-10 , и три символа помещались в каждое слово PDP-1 , а два символа помещались в каждое слово PDP-8 . См. таблицу ниже.

Другой, менее распространенный вариант получается путем простого удаления старшего бита кода ASCII в диапазоне 32 - 95 (коды 32 - 63 остаются на своих позициях, более высокие значения имеют 64 вычитаемыми из них). Такой вариант иногда использовался на PDP-8 компании DEC (1965).

Шестибитный код ECMA

Шестибитный код, аналогичный DEC, но заменяющий несколько знаков препинания наиболее полезными управляющими символами, включая SO/SI , что позволяет расширять код, был определен как ECMA -1 в 1963 году (см. ниже).

Шестибитный код FIELDATA

FIELDATA представлял собой семибитный код (с опциональной четностью), из которого формально были определены только 64 кодовые позиции (занимающие шесть бит). [2] Вариант использовался компьютерами UNIVAC серии 1100. [3] Рассматривая код как шестибитный, эти системы использовали 36-битное слово (способное хранить шесть таких сокращенных символов FIELDATA). [4]

Шестибитный код Брайля

Символы Брайля представлены с помощью шести позиций точек, расположенных в прямоугольнике. Каждая позиция может содержать выпуклую точку или нет, поэтому Брайль можно считать шестибитным двоичным кодом. Некоторые более современные системы Брайля добавляют дополнительные две точки, что делает эти системы восьмибитным кодом.

Шестибитные коды для двоично-текстового кодирования

Передача двоичных данных через системы, которые предназначены только для текста, иногда может вызывать проблемы. Например, электронная почта исторически поддерживала только 7-битные коды ASCII и удаляла 8-й бит, тем самым повреждая двоичные данные, отправленные напрямую через любой проблемный почтовый сервер. Другие системы могут вызывать проблемы, неправильно интерпретируя управляющие символы во время хранения или передачи. Существует ряд схем для упаковки 8-битных данных в текстовые представления, которые могут проходить через системы текстовой почты для декодирования в пункте назначения. Примерами 6-битных подмножеств символов, используемых для упаковки двоичных данных, являются Uuencode и Base64 . Эти наборы не содержат управляющих символов (только печатные цифры, буквы, некоторые знаки препинания и, возможно, пробел) и позволяют передавать данные через любой носитель, который также способен передавать текст, понятный человеку.

Примеры шестибитных кодов BCD

Компания IBM, доминировавшая в области коммерческой обработки данных, использовала различные шестибитные коды, которые были привязаны к набору символов, используемому на перфокартах , см. BCD (кодировка символов) .

Ниже показаны другие коды символов поставщиков и их эквиваленты в Unicode .

CDC 1604: BCD-коды магнитной ленты
0123456789АБСДЭФ
0x1234567890#@
МАРКИРОВКА ЛЕНТЫ
1x СП /СТУВВтХИЗ
МАРКИРОВКА РЕК
,%
2x-Дж.КЛМНОПВР-0$*
3x&АБСДЭФГЧАСя+0.¤
МАРКА СТАБИЛИЗАТОРА
CDC 1604: Коды перфокарт
0123456789АБСДЭФ
0x1234567890=
1x СП /СТУВВтХИЗ,(
2xДж.КЛМНОПВР-0$*
3x+АБСДЭФГЧАСя+0.)
CDC 1612: Коды принтеров (бизнес-приложения)
0123456789АБСДЭФ
0x:1234567890=![
1x СП /СТУВВтХИЗ],(~
2xДж.КЛМНОПВР%$*>
3x+АБСДЭФГЧАСя<.)?;

Примеры шестибитных вариантов ASCII

ДЕК СИКШБИТ
0123456789АБСДЭФ
0x СП !"#$%&'()*+,-./
1x0123456789:;<=>?
2x@АБСДЭФГЧАСяДж.КЛМНО
3xПВРСТУВВтХИЗ[\]^_
ЭКМА-1
0123456789АБСДЭФ
0x СП   ХТ   ЛФ   ВТ   ФФ   CR   ТАК   СИ   ()*+,-./
1x0123456789:;<=>?
2x НУЛЕВОЙ АБСДЭФГЧАСяДж.КЛМНО
3xПВРСТУВВтХИЗ[\] ЕСК ДЕЛ
Мейнфреймы ICL
0123456789АБСДЭФ
0x0123456789:;<=>?
1x СП !"#£%&'()*+,-./
2x@АБСДЭФГЧАСяДж.КЛМНО
3xПВРСТУВВтХИЗ[$]
SixBit ASCII (используется AIS ) [5]
0123456789АБСДЭФ
0x@АБСДЭФГЧАСяДж.КЛМНО
1xПВРСТУВВтХИЗ[\]^_
2x СП !"#$%&'()*+,-./
3x0123456789:;<=>?

ГОСТ 6-битный код

ГОСТ 6-битный код
0123456789АБСДЭФ
0x0123456789+-/,. СП 
1x()×=;[]*''<>:
2xАБВГДЕЖЗИЙКЛМНОП
3xРСТУФХЦЧШЩЫЬЭЮЯДЕЛ

Пример шестибитных кодов Брайля

В следующей таблице показано расположение символов с шестнадцатеричным значением, соответствующим символом ASCII, 6-битными кодами Брайля (комбинациями точек), глифами Брайля Unicode и общим значением (фактическое значение может меняться в зависимости от контекста). [6] [7]

ШестигранникASCII-глифТочки БрайляГлиф БрайляЗначение шрифта Брайля
20(космос)⠀ (шаблон шрифта Брайля пустой)(космос)
21!2-3-4-6⠮ (точки Брайля-2346)the
22"5⠐ (точки Брайля-5)(сокращение)
23#3-4-5-6⠼ (точки Брайля-3456)(префикс номера)
24$1-2-4-6⠫ (точки Брайля-1246)ред
25%1-4-6⠩ (точки Брайля-146)ш
26&1-2-3-4-6⠯ (точки Брайля-12346)и
27'3⠄ (шрифт Брайля, точки-3)'
28(1-2-3-5-6⠷ (точки Брайля-12356)из
29)2-3-4-5-6⠾ (точки Брайля-23456)с
*1-6⠡ (шрифт Брайля, точки-16)ч
+3-4-6⠬ (точки Брайля-346)ing
,6⠠ (шрифт Брайля, точки-6)(префикс заглавными буквами)
2D-3-6⠤ (шрифт Брайля, точки-36)-
.4-6⠨ (точки Брайля-46)(курсивный префикс)
2эт./3-4⠌ (шрифт Брайля, точки-34)ул
3003-5-6⠴ (точки Брайля-356)"
3112⠂ (точки шрифта Брайля-2),
3222-3⠆ (точки Брайля-23);
3332-5⠒ (точки Брайля-25):
3442-5-6⠲ (точки Брайля-256).
3552-6⠢ (шрифт Брайля, точки-26)ru
3662-3-5⠖ (точки Брайля-235)!
3772-3-5-6⠶ (точки Брайля-2356)( или )
3882-3-6⠦ (точки Брайля-236)" или ?
3993-5⠔ (шрифт Брайля, точки - 35)в
:1-5-6⠱ (точки Брайля-156)WH
;5-6⠰ (точки Брайля-56)(буквенный префикс)
<1-2-6⠣ (шрифт Брайля, точки - 126)гх
3D=1-2-3-4-5-6⠿ (точки Брайля-123456)для
>3-4-5⠜ (точки Брайля-345)ар
3 этаж?1-4-5-6⠹ (точки Брайля-1456)й
 
ШестигранникASCII-глифТочки БрайляГлиф БрайляЗначение шрифта Брайля
40@4⠈ (точки Брайля-4)(ударение)
41А1⠁ (точки шрифта Брайля-1)а
42Б1-2⠃ (шрифт Брайля, точки-12)б
43С1-4⠉ (шрифт Брайля, точки-14)с
44Д1-4-5⠙ (шрифт Брайля, точки - 145)г
45Э1-5⠑ (шрифт Брайля, точки-15)е
46Ф1-2-4⠋ (шрифт Брайля, точки-124)ф
47Г1-2-4-5⠛ (точки Брайля-1245)г
48ЧАС1-2-5⠓ (шрифт Брайля, точки - 125)час
49я2-4⠊ (шрифт Брайля, точки-24)я
Дж.2-4-5⠚ (точки Брайля-245)дж
К1-3⠅ (шрифт Брайля, точки-13)к
Л1-2-3⠇ (точки Брайля-123)л
4DМ1-3-4⠍ (точки Брайля-134)м
Н1-3-4-5⠝ (точки Брайля-1345)н
4 этажО1-3-5⠕ (точки Брайля-135)о
50П1-2-3-4⠏ (точки Брайля-1234)п
51В1-2-3-4-5⠟ (точки Брайля-12345)д
52Р1-2-3-5⠗ (точки Брайля-1235)г
53С2-3-4⠎ (точки Брайля-234)с
54Т2-3-4-5⠞ (точки Брайля-2345)т
55У1-3-6⠥ (точки Брайля-136)ты
56В1-2-3-6⠧ (точки Брайля-1236)в
57Вт2-4-5-6⠺ (точки Брайля-2456)ж
58Х1-3-4-6⠭ (точки Брайля-1346)х
59И1-3-4-5-6⠽ (точки Брайля-13456)у
З1-3-5-6⠵ (точки Брайля-1356)з
[2-4-6⠪ (точки Брайля-246)вл
\1-2-5-6⠳ (точки Брайля-1256)ты
5D]1-2-4-5-6⠻ (точки Брайля-12456)э-э
^4-5⠘ (шрифт Брайля, точки - 45)(сокращение)
_4-5-6⠸ (точки Брайля-456)(сокращение)

Смотрите также

Ссылки

  1. ^ Корпорация IBM (1954). Электронная вычислительная машина 704: руководство по эксплуатации (PDF) .
  2. ^ Mackenzie, Charles E. (1980). Coded Character Sets, History and Development (PDF) . The Systems Programming Series (1-е изд.). Addison-Wesley Publishing Company, Inc. ISBN  978-0-201-14460-4. LCCN  77-90165. Архивировано (PDF) из оригинала 26 мая 2016 г. Получено 25 августа 2019 г.
  3. ^ Уокер, Джон (1996-08-06). "UNIVAC 1100 Series FIELDATA Code". UNIVAC Memories . Архивировано из оригинала 2016-05-22 . Получено 2016-05-22 .
  4. ^ Дженнингс, Томас Дэниел (2016-04-20) [1999]. "Аннотированная история некоторых кодов символов или ASCII: Американский стандартный код для проникновения информации". чувствительные исследования (SR-IX) . FIELDATA . Получено 01.06.2022 .
  5. ^ Рэймонд, Эрик С. (2023-06-24). "Декодирование протокола AIVDM/AIVDO". Типы данных полезной нагрузки AIS . Получено 2024-03-14 .
  6. ^ "Представление и отображение шрифта Брайля". DotlessBraille.org . 2002-02-20 . Получено 14.03.2024 .
  7. ^ Халлек, Джон (2000-08-24). "braille-ascii.ads". Braille.Ascii . Архивировано из оригинала 2010-06-13 . Получено 2009-08-10 .
  • «Справочное руководство по компьютеру Control Data 1604-C» (PDF) . (7,44 МБ)
  • «Стандарт ECMA для 6-битного входного/выходного кода символа». (1,53 МБ)
  • Справочник кодов символов SIXBIT на Wayback Machine (архив 2020-02-11) - Digital Equipment Corporation Система кодирования символов SIXBIT
Взято с "https://en.wikipedia.org/w/index.php?title=Шестибитный_код_символа&oldid=1244623477"