ASCII

ASCII
	Таблица ASCII из MIL-STD-188-100 (1972)
MIME/IANA	us-ascii
Псевдоним(ы)	ISO-IR-006, ANSI_X3.4-1968, ANSI_X3.4-1986, ISO_646.irv:1991, ISO646-US, США, IBM367, cp367
Язык(и)	Английский (создано для; поддерживает не все заимствованные слова), малайский , ротокас , интерлингва , идо и X-SAMPA
Классификация	Серия ИСО/МЭК 646
Расширения	Юникод; ИСО/МЭК 8859 (серия); КОИ-8; OEM (серия); Windows-125x (серия); Другие;
Предшествовал	ITA 2 , ПОЛЕВЫЕ ДАННЫЕ
Преемник	ISO/IEC 8859 , ISO/IEC 10646 ( Юникод )
	в; т; е;

Американский стандарт кодировки символов

ASCII ( / ˈ æ s k iː / ^ⓘ ASS -kee),^[3]^{: 6}аббревиатура отAmerican Standard Code for Information Interchange, являетсякодировки символовдля электронной связи. Коды ASCII представляют текст в компьютерах,телекоммуникационном оборудованиии других устройствах. ASCII имеет всего 128кодовых точек, из которых только 95 являются печатными символами, что серьезно ограничивает его область применения. Набор доступных знаков препинания оказал значительное влияние на синтаксис компьютерных языков и разметку текста. ASCII оказал огромное влияние на дизайн наборов символов, используемых современными компьютерами, включаяUnicode, который имеет более миллиона кодовых точек, но первые 128 из них совпадают с ASCII.

Администрация адресного пространства Интернета (IANA) предпочитает использовать для этой кодировки символов название US-ASCII . ^[2]

ASCII является одним из важнейших достижений IEEE . ^[4]

Обзор

ASCII был разработан частично из телеграфного кода . Его первое коммерческое использование было в Teletype Model 33 и Teletype Model 35 в качестве семибитного телетайпного кода, продвигаемого Bell data services. ^{[ когда? ]} Работа над стандартом ASCII началась в мае 1961 года с первого заседания подкомитета X3.2 Американской ассоциации стандартов (ASA) (теперь Американский национальный институт стандартов или ANSI). Первое издание стандарта было опубликовано в 1963 году, ^[5]^[6] подверглось существенному пересмотру в 1967 году, ^[7]^[8] и испытало свое последнее обновление в 1986 году. ^[9] По сравнению с более ранними телеграфными кодами, предложенный код Bell и ASCII были заказаны для более удобной сортировки (т. е. алфавитного расположения) списков и дополнительных функций для устройств, отличных от телетайпов. ^[9]

Использование формата ASCII для сетевого обмена данными было описано в 1969 году. ^[10] Этот документ был официально повышен до уровня стандарта Интернета в 2015 году. ^[11]

Первоначально основанный на (современном) английском алфавите , ASCII кодирует 128 указанных символов в семибитные целые числа, как показано в таблице ASCII в этой статье. ^[12] Девяносто пять из закодированных символов являются печатными: они включают цифры от 0 до 9 , строчные буквы от a до z , заглавные буквы от A до Z и знаки препинания . Кроме того, исходная спецификация ASCII включала 33 непечатаемых управляющих кода , которые возникли в моделях Teletype ; большинство из них сейчас устарели, ^[13] хотя некоторые все еще широко используются, такие как коды возврата каретки , перевода строки и табуляции .

Например, строчная буква i будет представлена в кодировке ASCII как двоичное число 1101001 = шестнадцатеричное число 69 ( i — девятая буква) = десятичное число 105.

Несмотря на то, что ASCII является американским стандартом, в нем нет кодовой точки для цента ( ¢). Он также не поддерживает английские термины с диакритическими знаками, такие как résumé и jalapeño , или собственные имена с диакритическими знаками, такие как Beyoncé (хотя на некоторых устройствах символы могут сочетаться со знаками препинания, такими как тильда (~) и обратный апостроф (`), чтобы аппроксимировать такие символы.)

История

ASCII (1963). Элемент управления Изображения эквивалентных элементов управления показаны там, где они есть, или серой точкой в противном случае.

Американский стандартный код для обмена информацией (ASCII) был разработан под эгидой комитета Американской ассоциации стандартов (ASA), называемого комитетом X3, его подкомитетом X3.2 (позже X3L2), а затем рабочей группой X3.2.4 этого подкомитета (теперь INCITS ). Позднее ASA стал Институтом стандартов Соединенных Штатов Америки (USASI) ^[3]^{: 211} и в конечном итоге стал Американским национальным институтом стандартов (ANSI).

После заполнения других специальных символов и управляющих кодов ASCII был опубликован как ASA X3.4-1963, ^[6]^[14] оставив 28 позиций кода без какого-либо назначенного значения, зарезервированных для будущей стандартизации, и один неназначенный управляющий код. ^[3]^{: 66, 245} В то время велись дебаты о том, должно ли быть больше управляющих символов вместо строчных букв. ^[3]^{: 435} Нерешительность длилась недолго: в мае 1963 года Рабочая группа CCITT по новому телеграфному алфавиту предложила назначить строчные символы палочкам [ ^a]^[15] 6 и 7, ^[16] а Международная организация по стандартизации TC 97 SC 2 проголосовала в октябре за включение изменения в свой проект стандарта. ^[17] Целевая группа X3.2.4 проголосовала за одобрение изменения в ASCII на своем заседании в мае 1963 года. ^[18] Расположение строчных букв в палочках ^[a]^[15] 6 и 7 привело к тому, что символы отличались по битовой схеме от заглавных на один бит, что упростило сопоставление символов без учета регистра и конструкцию клавиатур и принтеров.

Комитет X3 внес другие изменения, включая другие новые символы ( фигурные скобки и вертикальная черта ), ^[19] переименовав некоторые управляющие символы (SOM стал началом заголовка (SOH)) и переместив или удалив другие (RU был удален). ^[3]^{: 247–248} ASCII впоследствии был обновлен как USAS X3.4-1967, ^[7]^[20] затем USAS X3.4-1968, ^[21] ANSI X3.4-1977 и, наконец, ANSI X3.4-1986. ^[9]^[22]

Пересмотры

АСА X3.4-1963 ^[3]^[6]^[20]^[22]
ASA X3.4-1965 (одобрен, но не опубликован, тем не менее используется в дисплейных станциях IBM 2260 и 2265 и в системе управления дисплеем IBM 2848 ) ^[3]^{: 423, 425–428, 435–439}^[23]^[20]^[22]
USAS X3.4-1967 ^[3]^[7]^[22]
USAS X3.4-1968 ^[3]^[21]^[22]
ANSI X3.4-1977 ^[22]
ANSI X3.4-1986 ^[9]^[22]
ANSI X3.4-1986 (R1992)
ANSI X3.4-1986 (R1997)
ANSI INCITS 4-1986 (R2002) ^[24]
ANSI INCITS 4-1986 (R2007) ^[25]
INCITS 4-1986 (R2012) ^[26]
INCITS 4-1986 (R2017) ^[27]
INCITS 4-1986 (R2022) ^[28]

В стандарте X3.15 комитет X3 также рассматривал, как следует передавать ASCII ( сначала младший бит ) ^[3]^{: 249–253}^[29] и записывать на перфорированную ленту. Они предложили 9-дорожечный стандарт для магнитной ленты и попытались работать с некоторыми форматами перфокарт .

Соображения по дизайну

Ширина бита

Подкомитет X3.2 разработал ASCII на основе более ранних систем кодирования телетайпов. Как и другие кодировки символов , ASCII определяет соответствие между цифровыми битовыми шаблонами и символьными символами (то есть графемами и управляющими символами ). Это позволяет цифровым устройствам взаимодействовать друг с другом и обрабатывать, хранить и передавать ориентированную на символы информацию, такую как письменный язык. До разработки ASCII используемые кодировки включали 26 буквенных символов, 10 числовых цифр и от 11 до 25 специальных графических символов. Чтобы включить все это и управляющие символы, совместимые со стандартом Международного телеграфного алфавита № 2 (ITA2) Консультативного комитета по международной телефонии и телеграфии (CCITT) 1932 года ^[30]^[31]FIELDATA (1956 ^[^{требуется ссылка}^] ) и ранним EBCDIC (1963), для ASCII требовалось более 64 кодов.

ITA2, в свою очередь, был основан на коде Бодо , 5-битном телеграфном коде, изобретенном Эмилем Бодо в 1870 году и запатентованном в 1874 году. ^[31]

Комитет обсуждал возможность функции сдвига (как в ITA2 ), которая позволила бы представить более 64 кодов шестибитным кодом . В сдвинутом коде некоторые коды символов определяют выбор между вариантами для следующих кодов символов. Это позволяет компактное кодирование, но менее надежно для передачи данных , поскольку ошибка при передаче кода сдвига обычно делает длинную часть передачи нечитаемой. Комитет по стандартам принял решение против сдвига, и поэтому ASCII потребовал как минимум семибитный код. ^[3]^{: 215 §13.6, 236 §4}

Комитет рассматривал восьмибитный код, поскольку восемь бит ( октетов ) позволили бы двум четырехбитным шаблонам эффективно кодировать две цифры с помощью двоично-десятичного кода . Однако это потребовало бы, чтобы вся передача данных отправляла восемь бит, когда семи могло бы быть достаточно. Комитет проголосовал за использование семибитного кода, чтобы минимизировать затраты, связанные с передачей данных. Поскольку перфорированная лента в то время могла записывать восемь бит в одной позиции, она также допускала бит четности для проверки ошибок , если это было необходимо. ^[3]^{: 217 §c, 236 §5} Восьмибитные машины (с октетами в качестве собственного типа данных), которые не использовали проверку четности, обычно устанавливали восьмой бит в 0. ^[32]

Внутренняя организация

Сам код был структурирован таким образом, что большинство управляющих кодов были вместе, и все графические коды были вместе, для простоты идентификации. Первые две так называемые палочки ASCII ^[a]^[15] (32 позиции) были зарезервированы для управляющих символов. ^[3]^{: 220, 236 8, 9)} Символ «пробел» должен был идти перед графикой, чтобы упростить сортировку , поэтому он стал позицией 20 _hex ; ^[3]^{: 237 §10} по той же причине многие специальные знаки, обычно используемые в качестве разделителей, были помещены перед цифрами. Комитет решил, что важно поддерживать заглавные 64-символьные алфавиты , и решил структурировать ASCII так, чтобы его можно было легко сократить до пригодного для использования 64-символьного набора графических кодов, ^[3]^{: 228, 237 §14} , как это было сделано в коде DEC SIXBIT (1963). Поэтому строчные буквы не чередовались с заглавными . Чтобы сохранить опции, доступные для строчных букв и другой графики, специальные и числовые коды были расположены перед буквами, а буква A была помещена в позицию 41 _{в шестнадцатеричной системе счисления} , чтобы соответствовать проекту соответствующего британского стандарта. ^[3]^{: 238 §18} Цифры 0–9 имеют префикс 011, но оставшиеся 4 бита соответствуют их соответствующим значениям в двоичной системе счисления, что делает преобразование с двоично-десятичным кодом простым (например, 5 в кодировке 011 0101 , где 5 — это 0101 в двоичной системе счисления).

Многие из не буквенно-цифровых символов были расположены так, чтобы соответствовать их смещенному положению на пишущих машинках; важная тонкость заключается в том, что они были основаны на механических пишущих машинках, а не на электрических . ^[33] Механические пишущие машинки следовали фактическому стандарту , установленному Remington No. 2 (1878), первой пишущей машинкой с клавишей Shift, и смещенные значения были 23456789-– "#$%_&'() ранние пишущие машинки опускали 0 и 1 , используя вместо этого O (заглавную букву o ) и l (строчную букву L ), но 1!и 0)пары стали стандартными, как только 0 и 1 стали обычными. Таким образом, в ASCII !"#$%были помещены во вторую палочку, ^[a]^[15] позиции 1–5, соответствующие цифрам 1–5 на соседней палочке. ^[a]^[15] Однако скобки не могли соответствовать 9 и 0 , поскольку место, соответствующее 0, было занято символом пробела. Это было достигнуто путем удаления _(подчеркивания) из цифры 6 и сдвига оставшихся символов, что соответствовало многим европейским пишущим машинкам, которые ставили скобки перед цифрами 8 и 9. Это отличие от пишущих машинок привело к появлению клавиатур с парными битами , в частности, Teletype Model 33 , которая использовала смещенную влево раскладку, соответствующую ASCII, в отличие от традиционных механических пишущих машинок.

Электрические пишущие машинки, в частности IBM Selectric (1961), использовали несколько иную раскладку, которая стала фактическим стандартом для компьютеров — после IBM PC (1981), особенно Model M (1984) — и поэтому значения сдвига для символов на современных клавиатурах не так точно соответствуют таблице ASCII, как на более ранних клавиатурах. /?Пара также относится к № 2, и ,< .>пары использовались на некоторых клавиатурах (другие, включая № 2, не сдвигали ,(запятую) или .(точку), поэтому их можно было использовать в верхнем регистре без отмены сдвига). Однако ASCII разделила ;:пару (относящуюся к № 2) и переставила математические символы (различные соглашения, обычно -* =+) в :* ;+ -=.

Некоторые распространенные в то время символы пишущей машинки не были включены, в частности ½ ¼ ¢, в то время как ^ ` ~ были включены в качестве диакритических знаков для международного использования и < >для математического использования вместе с простыми линейными символами \ |(в дополнение к распространенному /). Символ @ не использовался в континентальной Европе, и комитет ожидал, что он будет заменен акцентированной À во французском варианте, поэтому @ был помещен в позицию 40 _hex , прямо перед буквой A. ^[3]^{: 243}

Управляющие коды, которые считались необходимыми для передачи данных, были: начало сообщения (SOM), конец адреса (EOA), конец сообщения (EOM), конец передачи (EOT), «кто вы?» (WRU), «вы?» (RU), зарезервированное управление устройством (DC0), синхронный холостой ход (SYNC) и подтверждение (ACK). Они были расположены так, чтобы максимизировать расстояние Хэмминга между их битовыми комбинациями. ^[3]^{: 243–245}

Порядок символов

Порядок ASCII-кода также называется ASCIIбетическим порядком. ^[34] Сопоставление данных иногда выполняется в этом порядке, а не в «стандартном» алфавитном порядке ( последовательность сопоставления ). Основные отклонения в порядке ASCII:

Все заглавные буквы ставятся перед строчными; например, «Z» предшествует «a».
Цифры и многие знаки препинания ставятся перед буквами.

Промежуточный порядок преобразует заглавные буквы в строчные перед сравнением значений ASCII.

Набор символов

ASCII-код (1977/1986)
	0	1	2	3	4	5	6	7	8	9	А	Б	С	Д	Э	Ф
0x	НУЛЕВОЙ	САХ	СТХ	ЭТХ	ЭОТ	ENQ	АСК	БЕЛ	БС	ХТ	ЛФ	ВТ	ФФ	CR	ТАК	СИ
1x	ДЛЕ	ДК1	ДК2	ДК3	DC4	НАК	СИН	ЭТБ	МОЖЕТ	ЭМ	СУБ	ЕСК	ФС	ГС	РС	НАС
2x	СП	!	"	#	$	%	&	'	(	)	*	+	,	-	.	/
3x	0	1	2	3	4	5	6	7	8	9	:	;	<	=	>	?
4x	@	А	Б	С	Д	Э	Ф	Г	ЧАС	я	Дж.	К	Л	М	Н	О
5x	П	В	Р	С	Т	У	В	Вт	Х	И	З	[	\	]	^	_
6x	`	а	б	с	г	е	ф	г	час	я	дж	к	л	м	н	о
7x	п	д	г	с	т	ты	в	ж	х	у	з	{	\|	}	~	ДЕЛ
Изменено или добавлено в версии 1963 года Изменено как в версии 1963 года, так и в проекте 1965 года.

Группы персонажей

Управляющие символы

ASCII резервирует первые 32 кодовых точки (числа 0–31 в десятичной системе) и последнюю (число 127 в десятичной системе) для управляющих символов . Это коды, предназначенные для управления периферийными устройствами (например, принтерами ) или для предоставления метаинформации о потоках данных, например, хранящихся на магнитной ленте. Несмотря на свое название, эти кодовые точки не представляют собой печатаемые символы (т. е. они вообще не являются символами, а являются сигналами). Для целей отладки им назначаются символы-"заполнители" (например, приведенные в ISO 2047 и его предшественниках).

Например, символ 0x0A представляет функцию «перевода строки» (которая заставляет принтер продвигать бумагу), а символ 8 представляет « возврат на одну позицию ». RFC 2822 называет управляющие символы, которые не включают возврат каретки, перевод строки или пробел , непробельными управляющими символами. ^[35] За исключением управляющих символов, которые предписывают элементарное строчно-ориентированное форматирование, ASCII не определяет никаких механизмов для описания структуры или внешнего вида текста в документе. Другие схемы, такие как языки разметки , адресная страница и макет документа и форматирование.

В исходном стандарте ASCII для каждого управляющего символа использовались только короткие описательные фразы. Неоднозначность, которую это вызывало, иногда была преднамеренной, например, когда символ использовался немного иначе в терминальной ссылке, чем в потоке данных , а иногда случайной, например, в стандарте неясно значение слова «удалить».

Вероятно, наиболее влиятельным устройством, повлиявшим на интерпретацию этих символов, был Teletype Model 33 ASR, который представлял собой печатающий терминал с возможностью считывания/перфорации бумажной ленты . Бумажная лента была очень популярным носителем для долгосрочного хранения программ до 1980-х годов, менее дорогостоящим и в некотором смысле менее хрупким, чем магнитная лента. В частности, назначения машины Teletype Model 33 для кодов 17 (control-Q, DC1, также известный как XON), 19 (control-S, DC3, также известный как XOFF) и 127 ( delete ) стали фактическими стандартами. Модель 33 также была примечательна тем, что буквально воспринимала описание control-G (код 7, BEL, что означает звуковое оповещение оператора), поскольку устройство содержало настоящий колокольчик, который звонил при получении символа BEL. Поскольку на верхней части клавиши O также был изображен символ стрелки влево (из ASCII-1963, в котором этот символ использовался вместо подчеркивания ), несоответствующее требованиям использование кода 15 (control-O, shift), интерпретируемое как «удаление предыдущего символа», также было принято многими ранними системами с разделением времени, но в конечном итоге от него отказались.

Когда Teletype 33 ASR, оснащенный автоматическим считывателем бумажной ленты, получал control-S (XOFF, сокращение от «передача выключена»), это приводило к остановке считывателя ленты; прием control-Q (XON, передача включена) приводил к возобновлению работы считывателя ленты. Этот так называемый метод управления потоком был принят несколькими ранними компьютерными операционными системами в качестве сигнала «рукопожатия», предупреждающего отправителя о необходимости остановить передачу из-за надвигающегося переполнения буфера ; он сохраняется и по сей день во многих системах как метод ручного управления выводом. В некоторых системах control-S сохраняет свое значение, но control-Q заменяется вторым control-S для возобновления вывода.

33 ASR также можно было настроить на использование control-R (DC2) и control-T (DC4) для запуска и остановки перфорации ленты; на некоторых устройствах, оснащенных этой функцией, соответствующие управляющие символы на колпачке клавиши над буквой были TAPE и ~~TAPE~~ соответственно. ^[36]

Удаление или возврат на одну позицию

Телетайп не мог двигать пишущую головку назад, поэтому на его клавиатуре не было клавиши для отправки BS (возврат на одну позицию). Вместо этого была клавиша, помеченная RUB OUTкак отправляющая код 127 (DEL). Целью этой клавиши было стирание ошибок на бумажной ленте с ручным вводом: оператор должен был нажать кнопку на перфораторе ленты, чтобы сделать резервную копию, затем набрать стирание, которое пробивало все отверстия и заменяло ошибку символом, который должен был игнорироваться. ^[37] Телетайпы обычно использовались с менее дорогими компьютерами от Digital Equipment Corporation (DEC); эти системы должны были использовать доступные клавиши, и поэтому символ DEL был назначен для стирания предыдущего символа. ^[38]^[39] Из-за этого видеотерминалы DEC (по умолчанию) отправляли символ DEL для клавиши, помеченной как «Backspace», в то время как отдельная клавиша, помеченная как «Delete», отправляла escape-последовательность ; многие другие конкурирующие терминалы отправляли символ BS для клавиши возврата на одну позицию.

Ранние драйверы tty Unix, в отличие от некоторых современных реализаций, позволяли устанавливать только один символ для стирания предыдущего символа в канонической обработке ввода (где доступен очень простой редактор строк); это могло быть установлено на BS или DEL, но не на оба, что приводило к повторяющимся ситуациям неоднозначности, когда пользователи должны были выбирать в зависимости от того, какой терминал они использовали ( оболочки , которые позволяют редактировать строки, такие как ksh , bash и zsh , понимают оба). Предположение, что ни одна клавиша не отправляет символ BS, позволяло использовать Ctrl+H для других целей, таких как команда префикса "help" в GNU Emacs . ^[40]

Побег

Многим другим управляющим символам были присвоены значения, сильно отличающиеся от их первоначальных. Например, символ «escape» (ESC, код 27) изначально предназначался для отправки других управляющих символов как литералов вместо вызова их значения, «escape-последовательности». Это то же самое значение «escape», которое встречается в кодировках URL, строках языка C и других системах, где определенные символы имеют зарезервированное значение. Со временем эта интерпретация была принята и в конечном итоге была изменена.

В современном использовании ESC, отправленный на терминал, обычно указывает на начало последовательности команд, которая может использоваться для обращения к курсору, прокрутки региона, установки/запроса различных свойств терминала и многого другого. Они обычно имеют форму так называемого " ANSI escape code " (часто начинающегося с " Control Sequence Introducer ", "CSI", " ESC [ ") из ECMA-48 (1972) и его последователей. Некоторые escape-последовательности не имеют вводных, например, "Reset to Initial State", "RIS" команда " ESC c ". ^[41]

Напротив, ESC, считанный с терминала, чаще всего используется как внеполосный символ, используемый для завершения операции или специального режима, как в текстовых редакторах TECO и vi . В графическом пользовательском интерфейсе (GUI) и оконных системах ESC обычно заставляет приложение прервать текущую операцию или выйти (завершить работу) вообще.

Конец строки

Присущая многим управляющим символам неоднозначность в сочетании с их историческим использованием создавала проблемы при передаче файлов «обычного текста» между системами. Лучшим примером этого является проблема новой строки в различных операционных системах . Телетайпы требовали, чтобы строка текста завершалась как «возвратом каретки» (который перемещает печатающую головку в начало строки), так и «переводом строки» (который перемещает бумагу на одну строку без перемещения печатающей головки). Название «возврат каретки» происходит от того факта, что на ручной пишущей машинке каретка, удерживающая бумагу, движется, в то время как пишущие планки, ударяющие по ленте, остаются неподвижными. Вся каретка должна была быть сдвинута (возвращена) вправо, чтобы расположить бумагу для следующей строки.

Операционные системы DEC ( OS/8 , RT-11 , RSX-11 , RSTS , TOPS-10 и т. д.) использовали оба символа для обозначения конца строки, чтобы консольное устройство (первоначально телетайпные машины) работало. К тому времени, когда появились так называемые «стеклянные TTY» (позже названные CRT или «немыми терминалами»), соглашение было настолько устоявшимся, что обратная совместимость требовала продолжения его соблюдения. Когда Гэри Килдалл создавал CP/M , он был вдохновлен некоторыми соглашениями интерфейса командной строки, используемыми в операционной системе RT-11 компании DEC.

До появления PC DOS в 1981 году IBM не имела никакого влияния на это, поскольку их операционные системы 1970-х годов использовали кодировку EBCDIC вместо ASCII, и они были ориентированы на ввод с перфокарт и вывод на строчный принтер, на котором концепция «возврата каретки» была бессмысленной. PC DOS от IBM (также продаваемая как MS-DOS корпорацией Microsoft) унаследовала это соглашение в силу того, что была в некоторой степени основана на CP/M, ^[42] а Windows , в свою очередь, унаследовала его от MS-DOS.

Требование двух символов для обозначения конца строки вносит ненужную сложность и двусмысленность в отношении того, как интерпретировать каждый символ, когда он встречается сам по себе. Для упрощения вопроса потоки данных обычного текста , включая файлы, на Multics использовали только перевод строки (LF) в качестве символа конца строки. ^[43]^{: 357} Драйвер tty будет обрабатывать преобразование LF в CRLF на выходе, чтобы файлы можно было напрямую печатать на терминале, а NL (новая строка) часто используется для обозначения CRLF в документах UNIX . Unix и Unix-подобные системы, а также системы Amiga переняли это соглашение от Multics. С другой стороны, оригинальные Macintosh OS , Apple DOS и ProDOS использовали только возврат каретки (CR) в качестве символа конца строки; однако, поскольку Apple позже заменила эти устаревшие операционные системы своей операционной системой macOS на основе Unix (ранее называвшейся OS X), теперь они также используют перевод строки (LF). Radio Shack TRS-80 также использовал одиночный CR для завершения строк.

Компьютеры, подключенные к ARPANET, включали машины, работающие под управлением операционных систем, таких как TOPS-10 и TENEX, использующих окончания строк CR-LF; машины, работающие под управлением операционных систем, таких как Multics, использующих окончания строк LF; и машины, работающие под управлением операционных систем, таких как OS/360 , которые представляли строки как количество символов, за которыми следовали символы строки, и которые использовали кодировку EBCDIC, а не ASCII. Протокол Telnet определял ASCII «сетевой виртуальный терминал» (NVT), так что соединения между хостами с различными соглашениями о завершении строк и наборами символов могли поддерживаться путем передачи стандартного текстового формата по сети. Telnet использовал ASCII вместе с окончаниями строк CR-LF, а программное обеспечение, использующее другие соглашения, могло выполнять перевод между локальными соглашениями и NVT. ^[44] Протокол передачи файлов принял протокол Telnet, включая использование сетевого виртуального терминала, для использования при передаче команд и передаче данных в режиме ASCII по умолчанию. ^[45]^[46] Это усложняет реализацию этих протоколов и других сетевых протоколов, таких как те, которые используются для электронной почты и Всемирной паутины, в системах, не использующих соглашение NVT об окончании строки CR-LF. ^[47]^[48]

Конец файла/потока

Монитор PDP-6 ^[38] и его преемник PDP-10 TOPS-10 ^[39] использовали control-Z (SUB) в качестве обозначения конца файла для ввода с терминала. Некоторые операционные системы, такие как CP/M, отслеживали длину файла только в единицах дисковых блоков и использовали control-Z для обозначения конца фактического текста в файле. ^[49] По этим причинам EOF, или конец файла , использовался в разговорной речи и традиционно как трехбуквенное сокращение для control-Z вместо SUBstitute. Символ конца текста ( ETX ), также известный как control-C , был неподходящим по ряду причин, в то время как использование control-Z в качестве управляющего символа для завершения файла аналогично положению буквы Z в конце алфавита и служит очень удобным мнемоническим средством . Исторически распространенное и до сих пор распространенное соглашение использует соглашение о символах ETX для прерывания и остановки программы посредством входного потока данных, обычно с клавиатуры.

Драйвер терминала Unix использует символ конца передачи ( EOT ), также известный как control-D, для обозначения конца потока данных.

В языке программирования C и в соглашениях Unix нулевой символ используется для завершения текстовых строк ; такие строки с нулевым символом в конце могут быть сокращенно известны как ASCIZ или ASCIIZ, где Z означает «ноль».

Таблица кодов

Таблица кодов управления

Двоичный	октябрь	Декабрь	Шестигранник	Аббревиатура			Управляющие изображения Unicode ^[b]	Обозначение вставки ^[c]	Последовательность C ^[d]	Имя (1967)
Двоичный	октябрь	Декабрь	Шестигранник	1963	1965	1967	Управляющие изображения Unicode ^[b]	Обозначение вставки ^[c]	Последовательность C ^[d]	Имя (1967)
000 0000	000	0	00	НУЛЕВОЙ	НУЛЕВОЙ		␀	^@	\0 ^[э]	Нулевой
000 0001	001	1	01	СОМ	САХ		␁	^А		Начало заголовка
000 0010	002	2	02	ЕОА	СТХ		␂	^Б		Начало текста
000 0011	003	3	03	МНВ	ЭТХ		␃	^С		Конец текста
000 0100	004	4	04	ЭОТ			␄	^D		Конец передачи
000 0101	005	5	05	ВРУ	ENQ		␅	^Э		Расследование
000 0110	006	6	06	RU	АСК		␆	^Ф		Признание
000 0111	007	7	07	КОЛОКОЛЬЧИК	БЕЛ		␇	^Г	\а	Белл
000 1000	010	8	08	ФЕ0	БС		␈	^Ч	\б	Возврат ^[f]^[g]
000 1001	011	9	09	ХТ/СК	ХТ		␉	^Я	\т	Горизонтальная табуляция ^[h]
000 1010	012	10	0А	ЛФ			␊	^J	\н	Перевод строки
000 1011	013	11	0Б	ВТАБ	ВТ		␋	^К	\v	Вертикальная вкладка
000 1100	014	12	0С	ФФ			␌	^Л	\ф	Форма подачи
000 1101	015	13	0D	CR			␍	^М	\р	Возврат каретки ^[i]
000 1110	016	14	0Э	ТАК			␎	^Н		Сдвиг наружу
000 1111	017	15	0Ф	СИ			␏	^О		Сдвиг в
001 0000	020	16	10	ДК0	ДЛЕ		␐	^П		Выход из канала передачи данных
001 0001	021	17	11	ДК1			␑	^Q		Управление устройством 1 (часто XON )
001 0010	022	18	12	ДК2			␒	^Р		Управление устройством 2
001 0011	023	19	13	ДК3			␓	^С		Управление устройством 3 (часто XOFF )
001 0100	024	20	14	DC4			␔	^Т		Управление устройством 4
001 0101	025	21	15	ОШИБКА	НАК		␕	^У		Отрицательное подтверждение
001 0110	026	22	16	СИНХРОНИЗАЦИЯ	СИН		␖	^В		Синхронный холостой ход
001 0111	027	23	17	ЛЕМ	ЭТБ		␗	^W		Конец блока передачи
001 1000	030	24	18	С0	МОЖЕТ		␘	^X		Отмена
001 1001	031	25	19	С1	ЭМ		␙	^Y		Конец среды
001 1010	032	26	1А	С2	SS	СУБ	␚	^Z		Заменять
001 1011	033	27	1Б	С3	ЕСК		␛	^[	\е ^[дж]	Побег ^[к]
001 1100	034	28	1С	С4	ФС		␜	^\		Разделитель файлов
001 1101	035	29	1D	С5	ГС		␝	^]		Разделитель групп
001 1110	036	30	1Э	С6	РС		␞	^^ ^[л]		Разделитель записей
001 1111	037	31	1 этаж	С7	НАС		␟	^_		Разделитель единиц
111 1111	177	127	7Ф	ДЕЛ			␡	^?		Удалить ^[м]^[г]

Специализированное оборудование может использовать и другие представления, например, графику ISO 2047 или шестнадцатеричные числа.

Таблица символов для печати

На момент принятия коды от 20 _hex до 7E _hex вызывали печать видимого символа (глифа) и поэтому были обозначены как «печатаемые символы». Эти коды представляют буквы, цифры, знаки препинания и несколько различных символов. Всего существует 95 печатных символов. ^[n]

Пустое пространство между словами, создаваемое пробелом на клавиатуре, имеет код символа 20 _hex . Поскольку символ пробела виден в печатном тексте, он считается «печатаемым символом», хотя он уникален тем, что не имеет видимого глифа. Он указан в таблице печатных символов, согласно стандарту ASCII, а не в таблице управляющих символов. ^[3]^{: 223}^[10]

Код 7F _hex соответствует непечатаемому управляющему символу «удалить» (DEL) и указан в таблице управляющих символов.

В более ранних версиях ASCII вместо каретки использовалась стрелка вверх (5E _hex ) и стрелка влево вместо подчеркивания (5F _hex ). ^[6]^[50]

Двоичный	октябрь	Декабрь	Шестигранник	Глиф
Двоичный	октябрь	Декабрь	Шестигранник	1963	1965	1967
010 0000	040	32	20	пробел (нет видимого глифа)
010 0001	041	33	21	!
010 0010	042	34	22	"
010 0011	043	35	23	#
010 0100	044	36	24	$
010 0101	045	37	25	%
010 0110	046	38	26	&
010 0111	047	39	27	'
010 1000	050	40	28	(
010 1001	051	41	29	)
010 1010	052	42	2А	*
010 1011	053	43	2Б	+
010 1100	054	44	2С	,
010 1101	055	45	2D	-
010 1110	056	46	2Е	.
010 1111	057	47	2эт.	/
011 0000	060	48	30	0
011 0001	061	49	31	1
011 0010	062	50	32	2
011 0011	063	51	33	3
011 0100	064	52	34	4
011 0101	065	53	35	5
011 0110	066	54	36	6
011 0111	067	55	37	7
011 1000	070	56	38	8
011 1001	071	57	39	9
011 1010	072	58	3А	:
011 1011	073	59	3Б	;
011 1100	074	60	3С	<
011 1101	075	61	3D	=
011 1110	076	62	3Е	>
011 1111	077	63	3 этаж	?
100 0000	100	64	40	@	`	@
100 0001	101	65	41	А
100 0010	102	66	42	Б
100 0011	103	67	43	С
100 0100	104	68	44	Д
100 0101	105	69	45	Э
100 0110	106	70	46	Ф
100 0111	107	71	47	Г
100 1000	110	72	48	ЧАС
100 1001	111	73	49	я
100 1010	112	74	4А	Дж.
100 1011	113	75	4Б	К
100 1100	114	76	4С	Л
100 1101	115	77	4D	М
100 1110	116	78	4Е	Н
100 1111	117	79	4 этаж	О
101 0000	120	80	50	П
101 0001	121	81	51	В
101 0010	122	82	52	Р
101 0011	123	83	53	С
101 0100	124	84	54	Т
101 0101	125	85	55	У
101 0110	126	86	56	В
101 0111	127	87	57	Вт
101 1000	130	88	58	Х
101 1001	131	89	59	И
101 1010	132	90	5А	З
101 1011	133	91	5Б	[
101 1100	134	92	5С	\	~	\
101 1101	135	93	5D	]
101 1110	136	94	5Е	↑	^
101 1111	137	95	5Ф	←	_
110 0000	140	96	60		@	`
110 0001	141	97	61		а
110 0010	142	98	62		б
110 0011	143	99	63		с
110 0100	144	100	64		г
110 0101	145	101	65		е
110 0110	146	102	66		ф
110 0111	147	103	67		г
110 1000	150	104	68		час
110 1001	151	105	69		я
110 1010	152	106	6А		дж
110 1011	153	107	6Б		к
110 1100	154	108	6С		л
110 1101	155	109	6D		м
110 1110	156	110	6Е		н
110 1111	157	111	6Ф		о
111 0000	160	112	70		п
111 0001	161	113	71		д
111 0010	162	114	72		г
111 0011	163	115	73		с
111 0100	164	116	74		т
111 0101	165	117	75		ты
111 0110	166	118	76		в
111 0111	167	119	77		ж
111 1000	170	120	78		х
111 1001	171	121	79		у
111 1010	172	122	7А		з
111 1011	173	123	7Б		{
111 1100	174	124	7С	АСК	¬	\|
111 1101	175	125	7D		}
111 1110	176	126	7Е	ЕСК	\|	~

Использование

ASCII впервые был использован в коммерческих целях в 1963 году как семибитный код телетайпа для сети TWX (TeletypeWriter eXchange) компании American Telephone & Telegraph . Первоначально TWX использовал более ранний пятибитный ITA2 , который также использовался конкурирующей системой телетайпа Telex . Боб Бемер представил такие функции, как escape-последовательность . ^[5] Его британский коллега Хью Макгрегор Росс помог популяризировать эту работу — по словам Бемера, «настолько, что код, который должен был стать ASCII, впервые был назван кодом Бемера–Росса в Европе». ^[51] Из-за его обширной работы над ASCII Бемера называют «отцом ASCII». ^[52]

11 марта 1968 года президент США Линдон Б. Джонсон постановил, что все компьютеры, приобретаемые федеральным правительством США, должны поддерживать ASCII, заявив: ^[53]^[54]^[55]

Я также одобрил рекомендации министра торговли [ Лютера Х. Ходжеса ] относительно стандартов записи стандартного кода для обмена информацией на магнитных лентах и бумажных лентах при их использовании в компьютерных операциях. Все компьютеры и сопутствующие конфигурации оборудования, внесенные в инвентарь Федерального правительства с 1 июля 1969 года, должны иметь возможность использовать стандартный код для обмена информацией и форматы, предписанные стандартами магнитной ленты и бумажной ленты при использовании этих носителей.

ASCII была самой распространённой кодировкой символов во Всемирной паутине до декабря 2007 года, пока её не превзошла кодировка UTF-8 ; UTF-8 обратно совместима с ASCII. ^[56]^[57]^[58]

Варианты и производные

По мере распространения компьютерных технологий по всему миру различные организации по стандартизации и корпорации разработали множество вариаций ASCII для облегчения выражения неанглийских языков, использующих алфавиты на основе латиницы. Некоторые из этих вариаций можно было бы классифицировать как « расширения ASCII », хотя некоторые неправильно используют этот термин для обозначения всех вариантов, включая те, которые не сохраняют таблицу символов ASCII в 7-битном диапазоне. Более того, расширения ASCII также были неправильно обозначены как ASCII.

7-битные коды

С самого начала своей разработки ^[59] ASCII задумывался как всего лишь один из нескольких национальных вариантов международного стандарта кодировки символов.

Другие международные органы по стандартизации ратифицировали кодировки символов, такие как ISO 646 (1967), которые идентичны или почти идентичны ASCII, с расширениями для символов за пределами английского алфавита и символов, используемых за пределами Соединенных Штатов, таких как символ фунта стерлингов Соединенного Королевства (£); например, с кодовой страницей 1104. Почти каждой стране требовалась адаптированная версия ASCII, поскольку ASCII соответствовала потребностям только США и нескольких других стран. Например, у Канады была своя версия, которая поддерживала французские символы.

Во многих других странах были разработаны варианты ASCII, включающие неанглийские буквы (например, é , ñ , ß , Ł ), символы валют (например, £ , ¥ ) и т. д. См. также YUSCII (Югославия).

Он бы разделял большинство общих символов, но назначал бы другие локально полезные символы нескольким кодовым точкам, зарезервированным для «национального использования». Однако четыре года, прошедшие между публикацией ASCII-1963 и первым принятием ISO международной рекомендации в 1967 году ^[60], привели к тому, что выбор ASCII для национальных символов стал фактическим стандартом для всего мира, что вызвало путаницу и несовместимость, когда другие страны начали делать свои собственные назначения для этих кодовых точек.

ISO/IEC 646, как и ASCII, представляет собой 7-битный набор символов. Он не предоставляет никаких дополнительных кодов, поэтому одни и те же кодовые точки кодировали разные символы в разных странах. Escape-коды были определены для указания того, какой национальный вариант применяется к фрагменту текста, но они редко использовались, поэтому часто было невозможно узнать, с каким вариантом работать и, следовательно, какой символ представляет код, и в целом системы обработки текста могли справиться только с одним вариантом.

Поскольку символы квадратных и фигурных скобок ASCII были назначены кодовым точкам «национального использования», которые использовались для букв с диакритическими знаками в других национальных вариантах ISO/IEC 646, немецкий, французский, шведский и т. д. программист, использующий свой национальный вариант ISO/IEC 646, а не ASCII, должен был написать и, следовательно, прочитать что-то вроде

ä aÄiÜ = 'Ön'; ü

вместо

{ a[i] = '\n'; }

Триграфы C были созданы для решения этой проблемы для ANSI C , хотя их позднее введение и непоследовательная реализация в компиляторах ограничивали их использование. Многие программисты использовали на своих компьютерах ASCII, поэтому простой текст на шведском, немецком и т. д. (например, в электронной почте или Usenet ) содержал "{, }" и подобные варианты в середине слов, к чему эти программисты привыкли. Например, шведский программист, отправляющий другому программисту письмо с вопросом, не пойти ли ему на обед, мог получить в качестве ответа "N{ jag har sm|rg}sar", что должно было быть "Nä jag har smörgåsar", что означает "Нет, у меня есть сэндвичи".

В Японии и Корее, по состоянию на 2020-е годы, ^{[обновлять]}используется вариация ASCII, в которой обратная косая черта (шестнадцатеричный код 5C) отображается как ¥ ( знак иены в Японии) или ₩ ( знак воны в Корее). Это означает, что, например, путь к файлу C:\Users\Smith отображается как C:¥Users¥Smith (в Японии) или C:₩Users₩Smith (в Корее).

В Европе наборы символов телетекста , которые являются вариантами ASCII, используются для субтитров вещательного телевидения, определенных Всемирной системой телетекста и транслируемых с использованием стандарта DVB-TXT для встраивания телетекста в передачи DVB. ^[61] В случае, если субтитры изначально были созданы для телетекста и преобразованы, производные форматы субтитров ограничены теми же наборами символов.

8-битные коды

В конце концов, когда 8-, 16- и 32-битные (а позже и 64-битные ) компьютеры начали заменять 12- , 18- и 36-битные компьютеры в качестве нормы, стало обычным использовать 8-битный байт для хранения каждого символа в памяти, предоставляя возможность для расширенных 8-битных родственников ASCII. В большинстве случаев они развивались как истинные расширения ASCII, оставляя исходное отображение символов нетронутым, но добавляя дополнительные определения символов после первых 128 (т. е. 7-битных) символов. Сам ASCII оставался семибитным кодом: термин «расширенный ASCII» не имеет официального статуса.

Для некоторых стран были разработаны 8-битные расширения ASCII, включающие поддержку символов, используемых в местных языках; например, ISCII для Индии и VISCII для Вьетнама. Компьютеры Kaypro CP/M использовали «верхние» 128 символов для греческого алфавита. ^{[ необходима цитата ]}

Даже для рынков, где не было необходимости добавлять много символов для поддержки дополнительных языков, производители ранних домашних компьютерных систем часто разрабатывали собственные 8-битные расширения ASCII для включения дополнительных символов, таких как символы рисования коробок , полуграфика и спрайты видеоигр . Часто эти дополнения также заменяли управляющие символы (индексы от 0 до 31, а также индекс 127) на еще более специфичные для платформы расширения. В других случаях дополнительный бит использовался для какой-то другой цели, например, для переключения инверсного видео ; этот подход использовался ATASCII , расширением ASCII, разработанным Atari .

Большинство расширений ASCII основаны на ASCII-1967 (текущий стандарт), но некоторые расширения основаны на более раннем ASCII-1963. Например, PETSCII , разработанный Commodore International для их 8-битных систем, основан на ASCII-1963. Аналогично, многие наборы символов Sharp MZ основаны на ASCII-1963.

IBM определила кодовую страницу 437 для IBM PC , заменив управляющие символы графическими символами, такими как смайлики , и сопоставив дополнительные графические символы с верхними 128 позициями. ^[62] Digital Equipment Corporation разработала набор многонациональных символов (DEC-MCS) для использования в популярном терминале VT220 как одно из первых расширений, предназначенных больше для международных языков, чем для блочной графики. Apple определила Mac OS Roman для Macintosh, а Adobe определила стандартную кодировку PostScript для PostScript ; оба набора содержали «международные» буквы, типографские символы и знаки препинания вместо графики, больше похожие на современные наборы символов.

Стандарт ISO/IEC 8859 (выведенный из DEC-MCS) предоставил стандарт, который большинство систем скопировали (или, по крайней мере, основывались на нем, когда не копировали в точности). Популярное дальнейшее расширение, разработанное Microsoft, Windows-1252 (часто ошибочно называемое ISO-8859-1 ), добавило типографские знаки препинания, необходимые для традиционной текстовой печати. ISO-8859-1, Windows-1252 и оригинальный 7-битный ASCII были наиболее распространенными методами кодирования символов во Всемирной паутине до 2008 года, когда их обогнал UTF-8 . ^[57]

ISO/IEC 4873 ввел 32 дополнительных управляющих кода, определенных в шестнадцатеричном диапазоне 80–9F, как часть расширения 7-битной кодировки ASCII до 8-битной системы. ^[63]

Юникод

Unicode и универсальный набор символов ISO/IEC 10646 (UCS) имеют гораздо более широкий набор символов, и их различные формы кодирования начали быстро вытеснять ISO/IEC 8859 и ASCII во многих средах. В то время как ASCII ограничен 128 символами, Unicode и UCS поддерживают больше символов, разделяя концепции уникальной идентификации (используя натуральные числа, называемые кодовыми точками ) и кодирования (в 8-, 16- или 32-битные двоичные форматы, называемые UTF-8 , UTF-16 и UTF-32 соответственно).

ASCII был включен в набор символов Unicode (1991) как первые 128 символов, поэтому 7-битные символы ASCII имеют одинаковые числовые коды в обоих наборах. Это позволяет UTF-8 быть обратно совместимым с 7-битным ASCII, поскольку файл UTF-8, содержащий только символы ASCII, идентичен файлу ASCII, содержащему ту же последовательность символов. Еще важнее то, что обеспечивается прямая совместимость , поскольку программное обеспечение, которое распознает только 7-битные символы ASCII как специальные и не изменяет байты с наивысшим набором бит (как это часто делается для поддержки 8-битных расширений ASCII, таких как ISO-8859-1), сохранит данные UTF-8 неизменными. ^[64]

Смотрите также

3568 ASCII – астероид, названный в честь кодировки символов
Alt-коды – метод ввода, используемый в MSDOS и WindowsСтраницы, отображающие краткие описания целей перенаправления
ASCII 8 – код ASCII 08, «BS» или Backspace
ASCII-искусство – компьютерная форма искусства, использующая текстовые символы.
Кампания ASCII Ribbon – кампания для писем с обычным текстом (только)Страницы, отображающие краткие описания целей перенаправления
Базовая латиница (блок Unicode) – ASCII как подмножество Unicode
Extended ASCII – псевдоним для 8-битных наборов символов, производных от ASCII.
Отображение десятичных символов HTML
Файл жаргона – глоссарий сленга программистов, включающий список распространенных сленговых названий для символов ASCII.
Список компьютерных наборов символов
Список символов Unicode

Примечания

^ abcde 128 символов 7-битного набора символов ASCII делятся на восемь групп по 16 символов, называемых палочками 0–7, которые связаны с тремя наиболее значимыми битами . ^[15] В зависимости от горизонтального или вертикального представления таблицы символов палочки могут соответствовать либо строкам, либо столбцам таблицы.
^ Символы Unicode из области "Control Pictures" U+2400 - U+2421 зарезервированы для представления управляющих символов, когда необходимо напечатать или отобразить их, а не заставить их выполнять свою предполагаемую функцию. Некоторые браузеры могут отображать их неправильно.
^ Обозначение вставки часто используется для представления управляющих символов на терминале. На большинстве текстовых терминалов удерживание клавиши при вводе второго символа приведет к вводу управляющего символа. Иногда клавиша Shift не нужна, например, можно набрать только Ctrl+2 или Ctrl+Space.Ctrl^@
^ Последовательности экранирования символов в языке программирования C и многих других языках, на которые он оказал влияние, таких как Java и Perl (хотя не все реализации обязательно поддерживают все последовательности экранирования).
^ Ввод любого однобайтового символа поддерживается путем экранирования его восьмеричного значения. Однако из-за роли NULL в C-строках этот случай имеет особое применение.
^ В некоторых системах символ Backspace можно также ввести, нажав клавишу.← Backspace
^ ab Неоднозначность Backspace обусловлена тем, что ранние терминалы были спроектированы с учетом того, что основным назначением клавиатуры будет ручная перфорация бумажной ленты без подключения к компьютеру. Чтобы удалить предыдущий символ, нужно было сделать резервную копию перфоратора бумажной ленты, что по механическим причинам и причинам простоты было кнопкой на самом перфораторе, а не на клавиатуре, а затем набрать символ rubout. Поэтому они поместили клавишу, производящую rubout, в место, используемое на пишущих машинках для backspace. Когда системы использовали эти терминалы и обеспечивали редактирование командной строки, им приходилось использовать код «rubout» для выполнения backspace и часто не интерпретировали символ backspace (они могли отображать « ^H » для backspace). Другие терминалы, не предназначенные для бумажной ленты, заставляли клавишу в этом месте производить Backspace, а системы, предназначенные для них, использовали этот символ для резервного копирования. Поскольку код удаления часто производил эффект backspace, это также вынуждало производителей терминалов заставлять любую клавишу производить что-то другое, нежели символ Delete.Delete
^ В большинстве систем символ табуляции можно также ввести, нажав клавишу.Tab ↹
^ Символ возврата каретки также можно ввести, нажав клавишу или в большинстве систем.↵ EnterReturn
^ Последовательность \e не является частью спецификаций ISO C и многих других языков. Однако она понимается несколькими компиляторами, включая GCC .
^ В некоторых системах символ Escape также можно ввести, нажав клавишу.Esc
^ ^^ означает + (нажатие клавиши «Ctrl» и клавиши курсора ).Ctrl^
^ В некоторых системах символ удаления иногда можно ввести, нажав клавишу.← Backspace

^ В распечатанном виде символы следующие:

 !"#$%&'()*+,-./0123456789:;<=>?@ABCDEFGHIJKLMNOPQRSTUVWXYZ[\]^_`abcdefghijklmnopqrstuvwxyz{|}~

Ссылки

^ ANSI (1 декабря 1975 г.). ISO-IR-6: Набор графических символов ASCII (PDF) . ITSCJ/ IPSJ .
^ ab "Наборы символов". Internet Assigned Numbers Authority (IANA) . 2007-05-14 . Получено 2019-08-25 .
^ abcdefghijklmnopqrs Mackenzie, Charles E. (1980). Coded Character Sets, History and Development (PDF) . The Systems Programming Series (1-е изд.). Addison-Wesley Publishing Company, Inc. стр. 6, 66, 211, 215, 217, 220, 223, 228, 236– 238, 243– 245, 247– 253, 423, 425– 428, 435– 439. ISBN 978-0-201-14460-4. LCCN 77-90165. Архивировано (PDF) из оригинала 26 мая 2016 г. Получено 25 августа 2019 г.
^ "Milestone-Proposal:ASCII Milestone - IEEE NJ Coast Section". IEEE Milestones Wiki . 2016-03-29 . Получено 2024-02-26 .
^ ab Brandel, Mary (1999-07-06). "1963: The Debut of ASCII". CNN . Архивировано из оригинала 2013-06-17 . Получено 2008-04-14 .
^ abcd "Американский стандартный код для обмена информацией, ASA X3.4-1963". Sensitive Research . Американская ассоциация стандартов . 1963-06-17 . Получено 2020-06-06 .
^ abc Стандартный код США для обмена информацией, USAS X3.4-1967 (Технический отчет). Институт стандартов Соединенных Штатов Америки . 1967-07-07.
^ Дженнингс, Томас Дэниел (2016-04-20) [1999]. "Аннотированная история некоторых кодов символов или ASCII: Американский стандартный код для проникновения информации". Sensitive Research (SR-IX) . Получено 2020-03-08 .
^ abcd Американский национальный стандарт для информационных систем — Наборы кодированных символов — 7-битный Американский национальный стандартный код для обмена информацией (7-битный ASCII), ANSI X3.4-1986 (Технический отчет). Американский национальный институт стандартов (ANSI). 1986-03-26.
^ ab Cerf, Vint (1969-10-16). Формат ASCII для сетевого обмена. Сетевая рабочая группа. doi : 10.17487/RFC0020 . RFC 20 . Получено 2016-06-13 .(Примечание. Практически идентичная формулировка с USAS X3.4-1968, за исключением вступления.)
^ Барри Лейба (2015-01-12). «Правильная классификация RFC 20 (формат ASCII) в соответствии со стандартом Интернета». IETF .
^ Ширли, Р. (август 2007 г.). Глоссарий по безопасности Интернета, версия 2. doi : 10.17487/RFC4949 . RFC 4949. Получено 13 июня 2016 г.
^ Майни, Анил Кумар (2007). Цифровая электроника: принципы, устройства и приложения. John Wiley and Sons . стр. 28. ISBN 978-0-470-03214-5. Кроме того, он определяет коды для 33 непечатаемых, в основном устаревших управляющих символов, которые влияют на обработку текста.
↑ Bukstein, Ed (июль 1964). «Двоичные компьютерные коды и ASCII». Electronics World . 72 (1): 28– 29. Архивировано из оригинала 2016-03-03 . Получено 2016-05-22 .
^ abcdef Бемер, Роберт Уильям (1980). "Глава 1: Внутри ASCII" (PDF) . Программное обеспечение общего назначения . Лучшее из века интерфейсов. Том 2. Портленд, штат Орегон, США: dilithium Press. стр. 1– 50. ISBN
978-0-918398-37-6. LCCN 79-67462. Архивировано из оригинала 2016-08-27 . Получено 2016-08-27 ,от:
- Бемер, Роберт Уильям (май 1978). «Внутри ASCII – Часть I». Interface Age . 3 (5): 96– 102.
- Бемер, Роберт Уильям (июнь 1978). «Внутри ASCII – Часть II». Interface Age . 3 (6): 64–74 .
- Бемер, Роберт Уильям (июль 1978). «Внутри ASCII – Часть III». Interface Age . 3 (7): 80–87 .
↑ Краткий отчет: Заседание рабочей группы МККТТ по новому телеграфному алфавиту, 13–15 мая 1963 г.
↑ Отчет ISO/TC/97/SC 2 – Заседание 29–31 октября 1963 г.
↑ Отчет целевой группы X3.2.4, 11 июня 1963 г., здание Пентагона, Вашингтон, округ Колумбия.
↑ Отчет о заседании № 8, Целевая группа X3.2.4, 17 и 18 декабря 1963 г.
^ abc Winter, Dik T. (2010) [2003]. "Американские и международные стандарты: ASCII". Архивировано из оригинала 2010-01-16.
^ ab Стандартный код США для обмена информацией, USAS X3.4-1968 (Технический отчет). Институт стандартов Соединенных Штатов Америки . 10 октября 1968 г.
^ abcdefg Salste, Tuomas (январь 2016 г.). "7-битные наборы символов: пересмотры ASCII". Aivosto Oy. urn : nbn:fi-fe201201011004. Архивировано из оригинала 2016-06-13 . Получено 2016-06-13 .
^ "Информация". Scientific American (специальный выпуск). 215 (3). Сентябрь 1966. JSTOR e24931041.
^ Корпела, Юкка К. (2014-03-14) [2006-06-07]. Unicode Explained – Internationalize Documents, Programs, and Web Sites (2-й выпуск 1-го издания). O'Reilly Media, Inc. стр. 118. ISBN 978-0-596-10121-3.
^ ANSI INCITS 4-1986 (R2007): Американский национальный стандарт для информационных систем – Наборы кодированных символов – 7-битный американский национальный стандартный код для обмена информацией (7-битный ASCII) , 2007 [1986]
^ "INCITS 4-1986[R2012]: Информационные системы - Наборы кодированных символов - 7-битный Американский национальный стандартный код для обмена информацией (7-битный ASCII)". 2012-06-15. Архивировано из оригинала 2020-02-28 . Получено 2020-02-28 .
^ "INCITS 4-1986[R2017]: Информационные системы - Наборы кодированных символов - 7-битный Американский национальный стандартный код для обмена информацией (7-битный ASCII)". 2017-11-02 [2017-06-09]. Архивировано из оригинала 2020-02-28 . Получено 2020-02-28 .
^ "INCITS 4-1986 (R2022)" . веб-магазин.ansi.org .
^ Последовательность бит Американского национального стандартного кода для обмена информацией при последовательной передаче данных , Американский национальный институт стандартов (ANSI), 1966, X3.15-1966
^ "Telegraph Regulations and Final Protocol (Madrid, 1932)" (PDF) . Архивировано из оригинала 2023-08-21 . Получено 2024-06-09 .
^ ab Smith, Gil (2001). "Коды телетайпной связи" (PDF) . Baudot.net. Архивировано (PDF) из оригинала 2008-08-20 . Получено 11-07-2008 .
^ Сойер, Стэнли А.; Кранц, Стивен Джордж (1995). Учебник TeX для ученых. CRC Press . стр. 13. Bibcode : 1995tps..book.....S. ISBN 978-0-8493-7159-2. Архивировано из оригинала 2016-12-22 . Получено 2016-10-29 .
^ Savard, John JG "Computer Keyboards". Архивировано из оригинала 2014-09-24 . Получено 2014-08-24 .
^ "ASCIIbetical definition". PC Magazine . Архивировано из оригинала 2013-03-09 . Получено 2008-04-14 .
^ Резник, Питер У., ред. (апрель 2001 г.). Формат сообщений в Интернете. doi : 10.17487/RFC2822 . RFC 2822 . Получено 13 июня 2016 г. .(Примечание. NO-WS-CTL.)
^ Макконнелл, Роберт; Хейнс, Джеймс; Уоррен, Ричард. «Понимание кодов ASCII». Архивировано из оригинала 27.02.2014 . Получено 11.05.2014 .
^ Барри Марголин (29.05.2014). "Re: история редактора и текстового процессора (было: Re: RTF для emacs)". help-gnu-emacs (список рассылки). Архивировано из оригинала 14.07.2014 . Получено 11.07.2014 .
^ ab "PDP-6 Multiprogramming System Manual" (PDF) . Digital Equipment Corporation (DEC). 1965. стр. 43. Архивировано (PDF) из оригинала 2014-07-14 . Получено 2014-07-10 .
^ ab "Справочник PDP-10, Книга 3, Связь с монитором" (PDF) . Digital Equipment Corporation (DEC). 1969. стр. 5-5. Архивировано (PDF) из оригинала 2011-11-15 . Получено 2014-07-10 .
^ "Справка - Руководство по GNU Emacs". Архивировано из оригинала 2018-07-11 . Получено 2018-07-11 .
^ "ANSI X3.64-1979" (PDF) . Получено 2024-10-27 .
^ Тим Патерсон (2007-08-08). "Является ли DOS плагиатом CP/M?". DosMan Drivel . Архивировано из оригинала 20-04-2018 . Получено 19-04-2018 .
^ Ossanna, JF ; Saltzer, JH (17–19 ноября 1970 г.). «Технические и инженерные проблемы человека при подключении терминалов к системе с разделением времени» (PDF) . Труды 17–19 ноября 1970 г., Fall Joint Computer Conference (FJCC) . AFIPS Press. стр. 355–362 . Архивировано (PDF) из оригинала 2012-08-19 . Получено 2013-01-29 . Использование функции «новой строки» (комбинированный возврат каретки и перевод строки) проще как для человека, так и для машины, чем требование обеих функций для начала новой строки; Американский национальный стандарт X3.4-1968 разрешает коду перевода строки нести значение новой строки.
^ О'Салливан, Т. (1971-05-19). Протокол TELNET. Internet Engineering Task Force (IETF). стр. 4–5. doi : 10.17487/RFC0158 . RFC 158 . Получено 28.01.2013 .
^ Нейгус, Нэнси Дж. (1973-08-12). Протокол передачи файлов. Internet Engineering Task Force (IETF). doi : 10.17487/RFC0542 . RFC 542. Получено 28.01.2013 .
^ Постел, Джон (июнь 1980 г.). Протокол передачи файлов. Internet Engineering Task Force (IETF). doi : 10.17487/RFC0765 . RFC 765. Получено 28.01.2013 .
^ "EOL translation plan for Mercurial". Mercurial. Архивировано из оригинала 2016-06-16 . Получено 2017-06-24 .
^ Бернстайн, Дэниел Дж. "Голые LF в SMTP". Архивировано из оригинала 29-10-2011 . Получено 28-01-2013 .
^ Руководство по интерфейсу CP/M 1.4 (PDF) . Цифровые исследования . 1978. стр. 10. Архивировано (PDF) из оригинала 2019-05-29 . Получено 2017-10-07 .
^ Хейнс, Джим (13.01.2015). "Из первых рук: Чад — наш самый важный продукт: воспоминания инженера о Teletype Corporation". Engineering and Technology History Wiki (ETHW) . Получено 14.02.2023 . Произошел переход с ASCII 1961 года на ASCII 1968 года. Некоторые компьютерные языки использовали символы в ASCII 1961 года, такие как стрелка вверх и стрелка влево. Эти символы исчезли из ASCII 1968 года. Мы работали с Фредом Мокингом, который к тому времени работал в отделе продаж в Teletype , над цилиндром набора, который бы скомпрометировал изменяющиеся символы, чтобы значения ASCII 1961 года не были полностью утеряны. Символ подчеркивания был сделан довольно клиновидным, чтобы он также мог служить стрелкой влево.
^ Бемер, Роберт Уильям . «Бемер встречает Европу (компьютерные стандарты) – виньетки компьютерной истории». Trailing-edge.com. Архивировано из оригинала 2013-10-17 . Получено 2008-04-14 .(Примечание. В то время Бемер работал в IBM .)
^ "Роберт Уильям Бемер: Биография". 2013-03-09. Архивировано из оригинала 2016-06-16.
^ Джонсон, Линдон Бейнс (1968-03-11). «Меморандум об одобрении принятия федеральным правительством стандартного кода для обмена информацией». Проект американского президентства. Архивировано из оригинала 2007-09-14 . Получено 2008-04-14 .
^ Ричард С. Шуфорд (1996-12-20). "Re: Ранняя история ASCII?". Группа новостей : alt.folklore.computers. Usenet: Pine.SUN.3.91.961220100220.13180C-100000@duncan.cs.utk.edu.
^ Folts, Harold C.; Karp, Harry, ред. (1982-02-01). Compilation of Data Communications Standards (2nd revisioned ed.). McGraw-Hill Inc. ISBN 978-0-07-021457-6.
^ Дубост, Карл (2008-05-06). "UTF-8 Growth on the Web". Блог W3C . Консорциум World Wide Web . Архивировано из оригинала 2016-06-16 . Получено 2010-08-15 .
^ ab Davis, Mark (2008-05-05). "Переход на Unicode 5.1". Официальный блог Google . Архивировано из оригинала 2016-06-16 . Получено 2010-08-15 .
^ Дэвис, Марк (28.01.2010). «Unicode приближается к 50% Интернета». Официальный блог Google . Архивировано из оригинала 16.06.2016 . Получено 15.08.2010 .
^ «Особые критерии», приложение к меморандуму от RW Reach, «X3-2 Meeting – September 14 and 15», 18 сентября 1961 г.
^ Марешаль, Р. (1967-12-22), ISO/TC 97 – Компьютеры и обработка информации: принятие проекта Рекомендации ISO № 1052
^ «Спецификация DVB-TXT (Телетекст) для передачи телетекста Системы B ITU-R в битовых потоках DVB».
^ Технический справочник (PDF) . Библиотека справочника по аппаратному обеспечению персональных компьютеров (первое издание). IBM. Август 1981 г. Приложение C. О символах, нажатиях клавиш и цвете.
^ Консорциум Unicode (2006-10-27). "Глава 13: Специальные области и символы формата" (PDF) . В Allen, Julie D. (ред.). Стандарт Unicode, версия 5.0 . Upper Saddle River, Нью-Джерси, США: Addison-Wesley Professional . стр. 314. ISBN 978-0-321-48091-0. Архивировано (PDF) из оригинала 2022-10-09 . Получено 2015-03-13 .
^ "utf-8(7) – Linux manual page". Man7.org. 2014-02-26. Архивировано из оригинала 2014-04-22 . Получено 2014-04-21 .

Дальнейшее чтение

Бемер, Роберт Уильям (1960). «Предложение о совместимости кодов символов». Сообщения ACM . 3 (2): 71– 72. doi : 10.1145/366959.366961 . S2CID 9591147.
Бемер, Роберт Уильям (2003-05-23). "Вавилон кодов до ASCII: обзор кодированных наборов символов 1960 года: причины для ASCII". Архивировано из оригинала 2013-10-17 . Получено 2016-05-09 ,от:
- Бемер, Роберт Уильям (декабрь 1960 г.). «Обзор кодированного представления символов». Сообщения ACM . 3 (12): 639– 641. doi : 10.1145/367487.367493 . S2CID 21403172.
- Смит, Х. Дж.; Уильямс, Ф. А. (декабрь 1960 г.). «Обзор кодов перфокарт». Сообщения ACM . 3 (12): 642. doi : 10.1145/367487.367491 .
"Американский национальный стандартный код для обмена информацией | ANSI X3.4-1977" (PDF) . Национальный институт стандартов. 1977. Архивировано (PDF) из оригинала 2022-10-09. (факсимильный, не машиночитаемый)
Робинсон, Г. С.; Каргилл, К. (1996). «История и влияние компьютерных стандартов». Компьютер . Т. 29, № 10. С. 79–85 . doi :10.1109/2.539725.
Mullendore, Ralph Elvin (1964) [1963]. Ptak, John F. (ред.). «О раннем развитии ASCII – История ASCII». JF Ptak Science Books (опубликовано в марте 2012 г.). Архивировано из оригинала 2016-05-26 . Получено 2016-05-26 .

Внешние ссылки

"C0 Controls and Basic Latin – Range: 0000–007F" (PDF) . Стандарт Unicode 8.0 . Unicode, Inc. 2015 [1991]. Архивировано (PDF) из оригинала 2016-05-26 . Получено 2016-05-26 .

[NB_Stick-16] 128 символов 7-битного набора символов ASCII делятся на восемь групп по 16 символов, называемых палочками 0–7, которые связаны с тремя наиболее значимыми битами . ^[15] В зависимости от горизонтального или вертикального представления таблицы символов палочки могут соответствовать либо строкам, либо столбцам таблицы.

[51] Символы Unicode из области "Control Pictures" U+2400 - U+2421 зарезервированы для представления управляющих символов, когда необходимо напечатать или отобразить их, а не заставить их выполнять свою предполагаемую функцию. Некоторые браузеры могут отображать их неправильно.

[52] Обозначение вставки часто используется для представления управляющих символов на терминале. На большинстве текстовых терминалов удерживание клавиши при вводе второго символа приведет к вводу управляющего символа. Иногда клавиша Shift не нужна, например, можно набрать только Ctrl+2 или Ctrl+Space.Ctrl^@

[53] Последовательности экранирования символов в языке программирования C и многих других языках, на которые он оказал влияние, таких как Java и Perl (хотя не все реализации обязательно поддерживают все последовательности экранирования).

[54] Ввод любого однобайтового символа поддерживается путем экранирования его восьмеричного значения. Однако из-за роли NULL в C-строках этот случай имеет особое применение.

[55] В некоторых системах символ Backspace можно также ввести, нажав клавишу.← Backspace

[bsp_del_mismatch-56] Неоднозначность Backspace обусловлена тем, что ранние терминалы были спроектированы с учетом того, что основным назначением клавиатуры будет ручная перфорация бумажной ленты без подключения к компьютеру. Чтобы удалить предыдущий символ, нужно было сделать резервную копию перфоратора бумажной ленты, что по механическим причинам и причинам простоты было кнопкой на самом перфораторе, а не на клавиатуре, а затем набрать символ rubout. Поэтому они поместили клавишу, производящую rubout, в место, используемое на пишущих машинках для backspace. Когда системы использовали эти терминалы и обеспечивали редактирование командной строки, им приходилось использовать код «rubout» для выполнения backspace и часто не интерпретировали символ backspace (они могли отображать « ^H » для backspace). Другие терминалы, не предназначенные для бумажной ленты, заставляли клавишу в этом месте производить Backspace, а системы, предназначенные для них, использовали этот символ для резервного копирования. Поскольку код удаления часто производил эффект backspace, это также вынуждало производителей терминалов заставлять любую клавишу производить что-то другое, нежели символ Delete.Delete

[57] В большинстве систем символ табуляции можно также ввести, нажав клавишу.Tab ↹

[58] Символ возврата каретки также можно ввести, нажав клавишу или в большинстве систем.↵ EnterReturn

[59] Последовательность \e не является частью спецификаций ISO C и многих других языков. Однако она понимается несколькими компиляторами, включая GCC .

[60] В некоторых системах символ Escape также можно ввести, нажав клавишу.Esc

[61] означает + (нажатие клавиши «Ctrl» и клавиши курсора ).Ctrl^

[62] В некоторых системах символ удаления иногда можно ввести, нажав клавишу.← Backspace

[63] В распечатанном виде символы следующие:
!"#$%&'()*+,-./0123456789:;<=>?@ABCDEFGHIJKLMNOPQRSTUVWXYZ[\]^_`abcdefghijklmnopqrstuvwxyz{|}~

[1] ANSI (1 декабря 1975 г.). ISO-IR-6: Набор графических символов ASCII (PDF) . ITSCJ/ IPSJ .

[IANA_2007-2] "Наборы символов". Internet Assigned Numbers Authority (IANA) . 2007-05-14 . Получено 2019-08-25 .

[Mackenzie_1980-3] qrs Mackenzie, Charles E. (1980). Coded Character Sets, History and Development (PDF) . The Systems Programming Series (1-е изд.). Addison-Wesley Publishing Company, Inc. стр. 6, 66, 211, 215, 217, 220, 223, 228, 236– 238, 243– 245, 247– 253, 423, 425– 428, 435– 439. ISBN 978-0-201-14460-4. LCCN 77-90165. Архивировано (PDF) из оригинала 26 мая 2016 г. Получено 25 августа 2019 г.

[4] "Milestone-Proposal:ASCII Milestone - IEEE NJ Coast Section". IEEE Milestones Wiki . 2016-03-29 . Получено 2024-02-26 .

[Brandel_1999-5] Brandel, Mary (1999-07-06). "1963: The Debut of ASCII". CNN . Архивировано из оригинала 2013-06-17 . Получено 2008-04-14 .

[ASCII-1963-6] "Американский стандартный код для обмена информацией, ASA X3.4-1963". Sensitive Research . Американская ассоциация стандартов . 1963-06-17 . Получено 2020-06-06 .

[ASCII-1967-7] Стандартный код США для обмена информацией, USAS X3.4-1967 (Технический отчет). Институт стандартов Соединенных Штатов Америки . 1967-07-07.

[Jennings_2016-8] Дженнингс, Томас Дэниел (2016-04-20) [1999]. "Аннотированная история некоторых кодов символов или ASCII: Американский стандартный код для проникновения информации". Sensitive Research (SR-IX) . Получено 2020-03-08 .

[ASCII-1986-9] Американский национальный стандарт для информационных систем — Наборы кодированных символов — 7-битный Американский национальный стандартный код для обмена информацией (7-битный ASCII), ANSI X3.4-1986 (Технический отчет). Американский национальный институт стандартов (ANSI). 1986-03-26.

[RFC-20_1968-10] Cerf, Vint (1969-10-16). Формат ASCII для сетевого обмена. Сетевая рабочая группа. doi : 10.17487/RFC0020 . RFC 20 . Получено 2016-06-13 .(Примечание. Практически идентичная формулировка с USAS X3.4-1968, за исключением вступления.)

[11] Барри Лейба (2015-01-12). «Правильная классификация RFC 20 (формат ASCII) в соответствии со стандартом Интернета». IETF .

[RFC-4949-12] Ширли, Р. (август 2007 г.). Глоссарий по безопасности Интернета, версия 2. doi : 10.17487/RFC4949 . RFC 4949. Получено 13 июня 2016 г.

[Maini_2007-13] Майни, Анил Кумар (2007). Цифровая электроника: принципы, устройства и приложения. John Wiley and Sons . стр. 28. ISBN 978-0-470-03214-5. Кроме того, он определяет коды для 33 непечатаемых, в основном устаревших управляющих символов, которые влияют на обработку текста.

[Bukstein_1964-14] Bukstein, Ed (июль 1964). «Двоичные компьютерные коды и ASCII». Electronics World . 72 (1): 28– 29. Архивировано из оригинала 2016-03-03 . Получено 2016-05-22 .

[Bemer_1980_Inside-15] Бемер, Роберт Уильям (1980). "Глава 1: Внутри ASCII" (PDF) . Программное обеспечение общего назначения . Лучшее из века интерфейсов. Том 2. Портленд, штат Орегон, США: dilithium Press. стр. 1– 50. ISBN 978-0-918398-37-6. LCCN 79-67462. Архивировано из оригинала 2016-08-27 . Получено 2016-08-27 ,от:
Бемер, Роберт Уильям (май 1978). «Внутри ASCII – Часть I». Interface Age . 3 (5): 96– 102.
Бемер, Роберт Уильям (июнь 1978). «Внутри ASCII – Часть II». Interface Age . 3 (6): 64–74 .
Бемер, Роберт Уильям (июль 1978). «Внутри ASCII – Часть III». Interface Age . 3 (7): 80–87 .

[30] Бемер, Роберт Уильям (май 1978). «Внутри ASCII – Часть I». Interface Age . 3 (5): 96– 102.

[31] Бемер, Роберт Уильям (июнь 1978). «Внутри ASCII – Часть II». Interface Age . 3 (6): 64–74 .

[32] Бемер, Роберт Уильям (июль 1978). «Внутри ASCII – Часть III». Interface Age . 3 (7): 80–87 .

[CCITT_1963-17] Краткий отчет: Заседание рабочей группы МККТТ по новому телеграфному алфавиту, 13–15 мая 1963 г.

[ISO_1963-18] Отчет ISO/TC/97/SC 2 – Заседание 29–31 октября 1963 г.

[19] Отчет целевой группы X3.2.4, 11 июня 1963 г., здание Пентагона, Вашингтон, округ Колумбия.

[20] Отчет о заседании № 8, Целевая группа X3.2.4, 17 и 18 декабря 1963 г.

[Winter_2010-21] Winter, Dik T. (2010) [2003]. "Американские и международные стандарты: ASCII". Архивировано из оригинала 2010-01-16.

[ASCII-1968-22] Стандартный код США для обмена информацией, USAS X3.4-1968 (Технический отчет). Институт стандартов Соединенных Штатов Америки . 10 октября 1968 г.

[Salste_2016-23] Salste, Tuomas (январь 2016 г.). "7-битные наборы символов: пересмотры ASCII". Aivosto Oy. urn : nbn:fi-fe201201011004. Архивировано из оригинала 2016-06-13 . Получено 2016-06-13 .

[SA_215-24] "Информация". Scientific American (специальный выпуск). 215 (3). Сентябрь 1966. JSTOR e24931041.

[Korpela_2014-25] Корпела, Юкка К. (2014-03-14) [2006-06-07]. Unicode Explained – Internationalize Documents, Programs, and Web Sites (2-й выпуск 1-го издания). O'Reilly Media, Inc. стр. 118. ISBN 978-0-596-10121-3.

[ANSI_INCITS_4-1986_2007-26] ANSI INCITS 4-1986 (R2007): Американский национальный стандарт для информационных систем – Наборы кодированных символов – 7-битный американский национальный стандартный код для обмена информацией (7-битный ASCII) , 2007 [1986]

[INCITS_4-1986_R2012-27] "INCITS 4-1986[R2012]: Информационные системы - Наборы кодированных символов - 7-битный Американский национальный стандартный код для обмена информацией (7-битный ASCII)". 2012-06-15. Архивировано из оригинала 2020-02-28 . Получено 2020-02-28 .

[INCITS_4-1986_R2017-28] "INCITS 4-1986[R2017]: Информационные системы - Наборы кодированных символов - 7-битный Американский национальный стандартный код для обмена информацией (7-битный ASCII)". 2017-11-02 [2017-06-09]. Архивировано из оригинала 2020-02-28 . Получено 2020-02-28 .

[29] "INCITS 4-1986 (R2022)" . веб-магазин.ansi.org .

[X3.15-1966-30] Последовательность бит Американского национального стандартного кода для обмена информацией при последовательной передаче данных , Американский национальный институт стандартов (ANSI), 1966, X3.15-1966

[31] "Telegraph Regulations and Final Protocol (Madrid, 1932)" (PDF) . Архивировано из оригинала 2023-08-21 . Получено 2024-06-09 .

[bdcode-32] Smith, Gil (2001). "Коды телетайпной связи" (PDF) . Baudot.net. Архивировано (PDF) из оригинала 2008-08-20 . Получено 11-07-2008 .

[Sawyer_1995-33] Сойер, Стэнли А.; Кранц, Стивен Джордж (1995). Учебник TeX для ученых. CRC Press . стр. 13. Bibcode : 1995tps..book.....S. ISBN 978-0-8493-7159-2. Архивировано из оригинала 2016-12-22 . Получено 2016-10-29 .

[Savard-34] Savard, John JG "Computer Keyboards". Архивировано из оригинала 2014-09-24 . Получено 2014-08-24 .

[35] "ASCIIbetical definition". PC Magazine . Архивировано из оригинала 2013-03-09 . Получено 2008-04-14 .

[RFC-2822-36] Резник, Питер У., ред. (апрель 2001 г.). Формат сообщений в Интернете. doi : 10.17487/RFC2822 . RFC 2822 . Получено 13 июня 2016 г. .(Примечание. NO-WS-CTL.)

[McConnell-37] Макконнелл, Роберт; Хейнс, Джеймс; Уоррен, Ричард. «Понимание кодов ASCII». Архивировано из оригинала 27.02.2014 . Получено 11.05.2014 .

[38] Барри Марголин (29.05.2014). "Re: история редактора и текстового процессора (было: Re: RTF для emacs)". help-gnu-emacs (список рассылки). Архивировано из оригинала 14.07.2014 . Получено 11.07.2014 .

[pdp-6-monitor-manual-39] "PDP-6 Multiprogramming System Manual" (PDF) . Digital Equipment Corporation (DEC). 1965. стр. 43. Архивировано (PDF) из оригинала 2014-07-14 . Получено 2014-07-10 .

[pdp-10-monitor-manual-40] "Справочник PDP-10, Книга 3, Связь с монитором" (PDF) . Digital Equipment Corporation (DEC). 1969. стр. 5-5. Архивировано (PDF) из оригинала 2011-11-15 . Получено 2014-07-10 .

[41] "Справка - Руководство по GNU Emacs". Архивировано из оригинала 2018-07-11 . Получено 2018-07-11 .

[42] "ANSI X3.64-1979" (PDF) . Получено 2024-10-27 .

[43] Тим Патерсон (2007-08-08). "Является ли DOS плагиатом CP/M?". DosMan Drivel . Архивировано из оригинала 20-04-2018 . Получено 19-04-2018 .

[44] Ossanna, JF ; Saltzer, JH (17–19 ноября 1970 г.). «Технические и инженерные проблемы человека при подключении терминалов к системе с разделением времени» (PDF) . Труды 17–19 ноября 1970 г., Fall Joint Computer Conference (FJCC) . AFIPS Press. стр. 355–362 . Архивировано (PDF) из оригинала 2012-08-19 . Получено 2013-01-29 . Использование функции «новой строки» (комбинированный возврат каретки и перевод строки) проще как для человека, так и для машины, чем требование обеих функций для начала новой строки; Американский национальный стандарт X3.4-1968 разрешает коду перевода строки нести значение новой строки.

[RFC-158-45] О'Салливан, Т. (1971-05-19). Протокол TELNET. Internet Engineering Task Force (IETF). стр. 4–5. doi : 10.17487/RFC0158 . RFC 158 . Получено 28.01.2013 .

[RFC-542-46] Нейгус, Нэнси Дж. (1973-08-12). Протокол передачи файлов. Internet Engineering Task Force (IETF). doi : 10.17487/RFC0542 . RFC 542. Получено 28.01.2013 .

[RFC-765-47] Постел, Джон (июнь 1980 г.). Протокол передачи файлов. Internet Engineering Task Force (IETF). doi : 10.17487/RFC0765 . RFC 765. Получено 28.01.2013 .

[48] "EOL translation plan for Mercurial". Mercurial. Архивировано из оригинала 2016-06-16 . Получено 2017-06-24 .

[49] Бернстайн, Дэниел Дж. "Голые LF в SMTP". Архивировано из оригинала 29-10-2011 . Получено 28-01-2013 .

[50] Руководство по интерфейсу CP/M 1.4 (PDF) . Цифровые исследования . 1978. стр. 10. Архивировано (PDF) из оригинала 2019-05-29 . Получено 2017-10-07 .

[Haynes_2015-64] Хейнс, Джим (13.01.2015). "Из первых рук: Чад — наш самый важный продукт: воспоминания инженера о Teletype Corporation". Engineering and Technology History Wiki (ETHW) . Получено 14.02.2023 . Произошел переход с ASCII 1961 года на ASCII 1968 года. Некоторые компьютерные языки использовали символы в ASCII 1961 года, такие как стрелка вверх и стрелка влево. Эти символы исчезли из ASCII 1968 года. Мы работали с Фредом Мокингом, который к тому времени работал в отделе продаж в Teletype , над цилиндром набора, который бы скомпрометировал изменяющиеся символы, чтобы значения ASCII 1961 года не были полностью утеряны. Символ подчеркивания был сделан довольно клиновидным, чтобы он также мог служить стрелкой влево.

[65] Бемер, Роберт Уильям . «Бемер встречает Европу (компьютерные стандарты) – виньетки компьютерной истории». Trailing-edge.com. Архивировано из оригинала 2013-10-17 . Получено 2008-04-14 .(Примечание. В то время Бемер работал в IBM .)

[thocp-66] "Роберт Уильям Бемер: Биография". 2013-03-09. Архивировано из оригинала 2016-06-16.

[Johnson_1968-67] Джонсон, Линдон Бейнс (1968-03-11). «Меморандум об одобрении принятия федеральным правительством стандартного кода для обмена информацией». Проект американского президентства. Архивировано из оригинала 2007-09-14 . Получено 2008-04-14 .

[68] Ричард С. Шуфорд (1996-12-20). "Re: Ранняя история ASCII?". Группа новостей : alt.folklore.computers. Usenet: Pine.SUN.3.91.961220100220.13180C-100000@duncan.cs.utk.edu.

[Folts_1982-69] Folts, Harold C.; Karp, Harry, ред. (1982-02-01). Compilation of Data Communications Standards (2nd revisioned ed.). McGraw-Hill Inc. ISBN 978-0-07-021457-6.

[Dubost_2008-70] Дубост, Карл (2008-05-06). "UTF-8 Growth on the Web". Блог W3C . Консорциум World Wide Web . Архивировано из оригинала 2016-06-16 . Получено 2010-08-15 .

[UTF-8_2008-71] Davis, Mark (2008-05-05). "Переход на Unicode 5.1". Официальный блог Google . Архивировано из оригинала 2016-06-16 . Получено 2010-08-15 .

[Davis_2010-72] Дэвис, Марк (28.01.2010). «Unicode приближается к 50% Интернета». Официальный блог Google . Архивировано из оригинала 16.06.2016 . Получено 15.08.2010 .

[73] «Особые критерии», приложение к меморандуму от RW Reach, «X3-2 Meeting – September 14 and 15», 18 сентября 1961 г.

[Maréchal_1967-74] Марешаль, Р. (1967-12-22), ISO/TC 97 – Компьютеры и обработка информации: принятие проекта Рекомендации ISO № 1052

[75] «Спецификация DVB-TXT (Телетекст) для передачи телетекста Системы B ITU-R в битовых потоках DVB».

[76] Технический справочник (PDF) . Библиотека справочника по аппаратному обеспечению персональных компьютеров (первое издание). IBM. Август 1981 г. Приложение C. О символах, нажатиях клавиш и цвете.

[Unicode-5.0_2006-77] Консорциум Unicode (2006-10-27). "Глава 13: Специальные области и символы формата" (PDF) . В Allen, Julie D. (ред.). Стандарт Unicode, версия 5.0 . Upper Saddle River, Нью-Джерси, США: Addison-Wesley Professional . стр. 314. ISBN 978-0-321-48091-0. Архивировано (PDF) из оригинала 2022-10-09 . Получено 2015-03-13 .

[78] "utf-8(7) – Linux manual page". Man7.org. 2014-02-26. Архивировано из оригинала 2014-04-22 . Получено 2014-04-21 .