Пробельный символ

Символ текстового файла компьютера, представляющий собой пробел.

Пробельный символ — это символьный элемент данных , представляющий собой пробел при отображении текста на компьютере .

Например, символ пробела ( U+0020 SPACE , ASCII 32) представляет собой пустое пространство, например разделитель слов в западном письме . 

Печатный символ приводит к выводу при отображении, а пробельный символ — нет. Вместо этого пробельные символы определяют макет текста в ограниченной степени, прерывая обычную последовательность отображения символов рядом друг с другом. Вывод последующих символов обычно смещается вправо (или влево для письма справа налево ) или в начало следующей строки. Эффект нескольких последовательных пробельных символов является кумулятивным, так что следующий печатный символ отображается в месте, основанном на накопленном эффекте предыдущих пробельных символов.

Термин «пробел» берет свое начало в общепринятой практике отображения текста на белой бумаге . Обычно символ пробела не отображается как белый. Он влияет на отображение, но сам не отображается.

Обзор

Ширина различных символов пробела Unicode

Символ пробела обычно вставляет горизонтальный пробел, который примерно такой же ширины, как буква. Для моноширинного шрифта ширина равна ширине буквы, а для шрифта переменной ширины ширина зависит от шрифта. Некоторые шрифты поддерживают несколько символов пробела, которые имеют разную ширину.

Символ табуляции обычно вставляет горизонтальное пространство, которое основано на позициях табуляции , которые различаются в зависимости от приложения .

Последовательность символов новой строки обычно перемещает место вывода рендеринга в начало следующей строки. Если она следует за текстом, она фактически не приводит к появлению пробела. Но две последовательные последовательности новой строки между текстовыми блоками приводят к появлению пустой строки между блоками. Высота пустой строки зависит от приложения.

Использование пробельных символов для разметки текста является соглашением. Приложения иногда отображают пробельные символы как видимую разметку, чтобы пользователь мог видеть то, что обычно не видно.

Обычно пользователь вводит символ пробела, нажимая spacebar, символ табуляции, нажимая , а символ новой строки, нажимая .Tab ↹↵ Enter

Юникод

В таблице ниже перечислены двадцать пять символов, определенных как пробельные символы ("WSpace=Y", "WS") в базе данных символов Unicode . [1] Семнадцать используют определение пробельных символов, соответствующее алгоритму двунаправленного письма ("Bidirectional Character Type=WS"), и известны как символы "Bidi-WS". Остальные символы также могут использоваться, но не относятся к этому типу "Bidi".

Примечание: в зависимости от браузера и шрифтов, используемых для просмотра следующей таблицы, не все пробелы могут отображаться правильно.

ИмяКодовая точкаШирина коробкиМожет сломаться ?В
IDN ?
СценарийБлокироватьОбщая
категория
Примечания
табуляция символовU+00099ДаНетОбщийБазовая латыньДругое,
контроль
HT, Горизонтальная табуляция . Именованная сущность HTML/XML : 	, LaTeX : \tab, C escape:\t
подача строкиУ+000А10Является ли переносом строкиОбщийБазовая латыньДругое,
контроль
LF, Перевод строки . Именованная сущность HTML/XML: 
, C escape:\n
строка табуляцииУ+000Б11Является ли переносом строкиОбщийБазовая латыньДругое,
контроль
VT, вертикальная табуляция . C escape:\v
подача формыУ+000С12Является ли переносом строкиОбщийБазовая латыньДругое,
контроль
FF, подача страницы . C escape:\f
возврат кареткиУ+000Д13Является ли переносом строкиОбщийБазовая латыньДругое,
контроль
CR, Возврат каретки . C escape:\r
космосU+002032 ДаНетОбщийБазовая латыньРазделитель,
пространство
Наиболее распространенный (обычный пробел ASCII). LaTeX:
следующая строкаU+0085133Является ли переносом строкиОбщий
Дополнение Latin-1
Другое,
контроль
NEL, Следующая строка . LaTeX:\\
пространство без перерываУ+00А0160 НетНетОбщий
Дополнение Latin-1
Разделитель,
пространство
Неразрывный пробел : идентичен U+0020, но не является точкой, в которой может быть разорвана строка.
HTML/XML именованная сущность:  ,  , LaTeX:~
огамический знак пространстваУ+16805760ДаНетОгамОгамРазделитель,
пространство
Используется для разделения слов в тексте огамом . Обычно вертикальная линия в вертикальном тексте или горизонтальная линия в горизонтальном тексте, но может также быть пустым пространством в шрифтах «без основы». Требуется шрифт огамом.
вчетверомУ+20008192 ДаНетОбщийОбщая
пунктуация
Разделитель,
пространство
Ширина одного en . U+2002 канонически эквивалентен этому символу; U+2002 предпочтительнее.
эм квадроУ+20018193ДаНетОбщийОбщая
пунктуация
Разделитель,
пространство
Также известен как «баранина квадратная». Ширина в один em . U+2003 канонически эквивалентен этому символу; U+2003 предпочтительнее.
в пространствеУ+20028194ДаНетОбщийОбщая
пунктуация
Разделитель,
пространство
Также известен как «орех». Ширина одного en . U+2000 En Quad канонически эквивалентен этому символу; предпочтительнее U+2002.
HTML/XML именованная сущность:  , LaTeX: \enspace(пробел en LaTeX является неразрывным)
эм пространствоУ+20038195ДаНетОбщийОбщая
пунктуация
Разделитель,
пространство
Также известен как «баран». Ширина одного em . U+2001 Em Quad канонически эквивалентен этому символу; U+2003 предпочтительнее.
HTML/XML именованная сущность:  , LaTeX:\quad
пространство из трех штукУ+20048196ДаНетОбщийОбщая
пунктуация
Разделитель,
пространство
Также известен как «толстый пробел». Ширина — одна треть em.
HTML/XML-именованная сущность:  , LaTeX: \;(толстый пробел LaTeX — это неразрывный пробел)
пространство из четырех клетокУ+20058197ДаНетОбщийОбщая
пунктуация
Разделитель,
пространство
Также известно как «промежуток между строками». Ширина — одна четвертая часть em.
HTML/XML-именованная сущность: 
пространство из шести клетокУ+20068198ДаНетОбщийОбщая
пунктуация
Разделитель,
пространство
Одна шестая часть em в ширину. В компьютерной типографике иногда приравнивается к U+2009.
пространство для фигурУ+20078199НетНетОбщийОбщая
пунктуация
Разделитель,
пространство
Интервал между цифрами . В шрифтах с моноширинными цифрами, равный ширине одной цифры.
HTML/XML именованная сущность: 
пробел пунктуацииУ+20088200ДаНетОбщийОбщая
пунктуация
Разделитель,
пространство
Ширина узкой пунктуации в шрифте, т.е. ширина точки или запятой. [2]
Именованная сущность HTML/XML: 
тонкое пространствоУ+20098201ДаНетОбщийОбщая
пунктуация
Разделитель,
пространство
Тонкий пробел ; одна пятая (иногда одна шестая) ширины em. Рекомендуется использовать в качестве разделителя тысяч для измерений, выполненных в единицах СИ . В отличие от U+2002 до U+2008, его ширина может быть скорректирована при наборе. [3]
Именованный объект HTML/XML:  ,  , LaTeX: \,(тонкий пробел LaTeX является неразрывным пробелом)
пространство для волосУ+200А8202ДаНетОбщийОбщая
пунктуация
Разделитель,
пространство
Тоньше тонкого пробела. HTML/XML именованная сущность:  , 
разделитель строкУ+20288232Является ли переносом строкиОбщийОбщая
пунктуация
Разделитель,
линия
разделитель абзацевУ+20298233Является ли переносом строкиОбщийОбщая
пунктуация
Разделитель,
абзац
узкое пространство без перерывовУ+202Ф8239НетНетОбщийОбщая
пунктуация
Разделитель,
пространство
Узкий неразрывный пробел . По функциям схож с U+00A0 Неразрывный пробел. При использовании с монгольским его ширина обычно составляет одну треть обычного пробела; в другом контексте его ширина иногда напоминает ширину тонкого пробела (U+2009). LaTeX:\,
среднее математическое пространствоУ+205Ф8287ДаНетОбщийОбщая
пунктуация
Разделитель,
пространство
MMSP. Используется в математических формулах. Четыре восемнадцатых em. [4] В математической типографике ширина пробелов обычно указывается в целых кратных восемнадцатой em, и 4/18 em может использоваться в нескольких ситуациях, например, между a и + и между + и b в выражении a + b . [5]
HTML/XML именованная сущность:  , LaTeX: \:(средний пробел LaTeX является неразрывным пробелом)
идеографическое пространствоУ+300012288 ДаНетОбщий
Символы и
пунктуация CJK
Разделитель,
пространство
Ширина ячейки символа CJK ( полная ширина ). Используется, например, в тай тоу .
 Имя Кодовая точкаШирина коробкиМожет сломаться ?В
IDN ?
СценарийБлокироватьОбщая
категория
Примечания
монгольский разделитель гласныхУ+180Е6158ДаНетмонгольскиймонгольскийДругое,
Формат
MVS. Узкий символ пробела, используемый в монгольском языке для придания двум последним символам слова разных форм. [6] Он больше не классифицируется как символ пробела (т. е. в категории Zs) в Unicode 6.3.0, хотя и классифицировался в предыдущих версиях стандарта.
пространство нулевой шириныУ+200Б8203ДаНет?Общая
пунктуация
Другое,
Формат
ZWSP, пробел нулевой ширины . Используется для обозначения границ слов в системах обработки текста при использовании скриптов, не использующих явные интервалы. Он похож на мягкий дефис , с той разницей, что последний используется для обозначения границ слогов и должен отображать видимый дефис, когда строка прерывается на нем. Именованный объект
HTML/XML : [7] [c]​
нулевая ширина несоединительный элементУ+200С8204ДаКонтекстно-зависимый [12]?Общая
пунктуация
Другое,
Формат
ZWNJ, несоединитель нулевой ширины . При размещении между двумя символами, которые в противном случае были бы соединены, ZWNJ заставляет их печататься в их конечной и начальной формах соответственно.
Именованная сущность HTML/XML:‌
соединитель нулевой шириныУ+200Д8205ДаКонтекстно-зависимый [13]?Общая
пунктуация
Другое,
Формат
ZWJ, соединитель нулевой ширины . При размещении между двумя символами, которые в противном случае не были бы соединены, ZWJ заставляет их печататься в их соединенных формах. Может также использоваться для отображения соединяющихся форм изолированно. В зависимости от того, ожидается ли лигатура или конъюнкт по умолчанию, может либо вызывать (как в эмодзи и в сингальском языке ), либо подавлять (как в деванагари ) замену одним глифом, при этом все еще разрешая использование отдельных соединяющихся форм (в отличие от ZWNJ).
Именованная сущность HTML/XML:‍
соединитель словУ+20608288НетНет?Общая
пунктуация
Другое,
Формат
WJ, соединитель слов . Аналогично U+200B, но не является точкой, в которой может быть разорвана строка.
Именованная сущность HTML/XML:⁠
неразрывный пробел нулевой шириныУ+FEFF65279НетНет?Арабские формы
представления
-B
Другое,
Формат
Неразрывный пробел нулевой ширины . Используется в основном как знак порядка байтов . Использование в качестве указания на неразрывность устарело, начиная с Unicode 3.2; вместо этого см. U+2060.
  1. ^ White_Space — это двоичное свойство Unicode. [14]
  2. ^ "PropList-16.0.0.txt". Unicode . 2024-05-31 . Получено 2024-09-13 .
  3. ^ Хотя ​это одна именованная сущность HTML5 для U+200B, дополнительные имена NegativeMediumSpace, NegativeThickSpace, NegativeThinSpaceи NegativeVeryThinSpace(которые являются именами, используемыми в Wolfram Language для отрицательных-продвинутых пробелов, которые он сопоставляет с областью частного использования ) [8] [9] [10] [11] также определены HTML5 как псевдонимы для U+200B (например, ​). [7]

Заменить изображения

Unicode также предоставляет некоторые видимые символы, которые можно использовать для представления различных пробельных символов в контекстах, где должен отображаться видимый символ:

Символы Unicode, иллюстрирующие пробелы (видимые)
КодДесятичная дробьИмяБлокироватьОтображатьОписание
U+00B7183Средняя точкаДополнение Latin-1·Interpunct
Именованная сущность:·
У+21А18609Двусторонняя стрелка внизСтрелкиСимвол ECMA-17 / ISO 2047 для перевода страницы (разрыва страницы) [15]
U+22618810ИдентиченМатематические
операторы
Среди прочего, это символ ECMA-17 / ISO 2047 для перевода строки [15]
У+237Д9085Открытый ящик с плечомРазное техническоеИспользуется для обозначения NBSP
U+23CE9166Возврат символаРазное техническоеСимвол клавиши возврата , которая вводит разрыв строки
U+24099225Символ для горизонтальной табуляцииКонтрольные картинкиЗаменяет символ табуляции
У+240А9226Символ перевода строкиКонтрольные картинкиЗаменители перевода строки
У+240Б9227Символ для вертикальной табуляцииКонтрольные картинкиЗаменяет вертикальную табуляцию (линейную табуляцию)
У+240С9228Символ для подачи формыКонтрольные картинкиЗаменяет подачу страницы (разрыв страницы)
У+240Д9229Символ возврата кареткиКонтрольные картинкиЗаменители возврата каретки
U+24209248Символ космосаКонтрольные картинкиЗаменяет пробел ASCII
U+24229250Пустой символКонтрольные картинкитакже известный как «заменитель пробела», [16] используемый в BCDIC , [16] EBCDIC , [16] ASCII-1963 [16] [17] и т. д. как символ для разделителя слов
U+24239251Открытая коробкаКонтрольные картинкиИспользуется в печатном письме по крайней мере с 1980-х годов, когда необходимо явно указать количество пробелов (например, при программировании с помощью ручки и бумаги). Используется в учебнике (опубликованном в 1982, 1984, 1985, 1988 годах издательством Springer-Verlag) по Modula-2 [18] — языку программирования , где коды пробелов требуют явного указания. Также используется в клавиатуре [n 1] графических калькуляторов серии TI-8 x компании Texas Instruments . Именованная сущность:
␣
U+24249252Символ новой строкиКонтрольные картинкиЗаменяет перенос строки
У+25Б39651Белый треугольник вершиной вверхГеометрические фигурыСреди прочего, это символ ECMA-17 / ISO 2047 для пространства ASCII [15]
У+2А5Б10843Логическое «ИЛИ» со средней основойДополнительные
математические
операторы
Среди прочего, это символ ECMA-17 / ISO 2047 для вертикальной табуляции (линейная табуляция) [15]
У+2ААА10922Меньше чемДополнительные
математические
операторы
Среди прочего, это символ возврата каретки ECMA-17 / ISO 2047 [15]
У+2ААБ10923Больше чемДополнительные
математические
операторы
Среди прочего, это символ ECMA-17 / ISO 2047 для символа табуляции [15]
U+303712343Идеографический телеграфный
символ-разделитель перевода строки

Символы и пунктуация CJK
Графическое обозначение, используемое для кода 9999 в китайском телеграфном коде , представляющее перевод строки
  1. ^ Над клавишей нуля «0» или отрицательной «(‒)».
Точное пространство
  • Cambridge Z88 предоставлял специальный «точный пробел» (кодовая точка 160, также известная как 0xA0) (вызываемый сочетанием клавиш + [19] ), отображаемый как «…» драйвером дисплея операционной системы. [20] [21] Поэтому он также был известен как «точечный пробел» в сочетании с BBC BASIC . [20] [21]SPACE
  • Под кодовой точкой 224 (0xE0) компьютер также предоставил специальный символ ПРОБЕЛ шириной в три ячейки "SPC"(аналогичный символу Юникода U+2420 шириной в одну ячейку). [20] [21]

Непробелы

  • Блок Unicode Braille Patterns содержит U+2800BRAILLE PATTERN BLANK , шаблон Брайля без выступающих точек. Некоторые шрифты отображают символ как пробел фиксированной ширины, однако стандарт Unicode явно указывает, что он не действует как пробел. [22]
  • Охват корейского алфавита Unicode включает несколько кодовых точек, которые представляют отсутствие письменной буквы и, таким образом, не отображают глиф:
    • Unicode включает символ Hangul Filler в блоке Hangul Compatibility Jamo ( U+3164HANGUL FILLER ). Он классифицируется как буква, но отображается как пустое пространство, как блок Hangul, не содержащий jamo. Он используется в последовательностях комбинирования Hangul KS X 1001 для их введения или обозначения отсутствия буквы в позиции, но не в системе комбинирования jamo Unicode. [23]
    • Система комбинирования джамо в Unicode использует похожие символы Hangul Choseong Filler и Hangul Jungseong Filler для обозначения отсутствия буквы в начальной или средней позиции в блоке слога, которые включены в блок Hangul Jamo ( U+115FHANGUL CHOSEONG FILLER , U+1160HANGUL JUNGSEONG FILLER ). [24]
    • Кроме того, в формы половинной и полной ширины включен полуширинный заполнитель хангыль ( U+FFA0HALFWIDTH HANGUL FILLER ), который используется при отображении из кодировок, которые включают символы как из Johab (или Wansung ), так и из N-байтового Hangul (или его аналога EBCDIC ), например IBM-933, который включает как заполнители Johab, так и EBCDIC. [25] [26]

Пробелы и цифровая типографика

В Чикагском руководстве по стилю изложены правила использования пробелов разного размера.

Отображение на экране

Текстовые редакторы , текстовые процессоры и программное обеспечение для настольных издательских систем различаются тем, как они представляют пробелы на экране и как они представляют пробелы в концах строк, длиннее ширины экрана или столбца. В некоторых случаях пробелы отображаются просто как пустое пространство; в других случаях они могут быть представлены интерпунктом или другими символами. Для создания пробелов можно использовать множество различных символов (описанных ниже), а несимвольные функции (такие как поля и настройки табуляции) также могут влиять на пробелы.

Многие из символов пробела Unicode были созданы для совместимости с классической печатной типографикой. [27]

Даже если в цифровой типографии есть алгоритмический кернинг и выравнивание, эти пробельные символы можно использовать для дополнения электронного форматирования при необходимости.

Универсальное пространство переменной ширины

В компьютерных кодировках символов есть обычный пробел общего назначения (символ Unicode U+0020), ширина которого будет варьироваться в зависимости от дизайна гарнитуры. Типичные значения варьируются от 1/5 em до 1/3 em (в цифровой типографике em равен номинальному размеру шрифта, поэтому для шрифта размером 10 пунктов пробел, вероятно, будет между 2 и 3,3 пунктами). Сложные шрифты могут иметь пробелы разного размера для жирных, курсивных и капительных шрифтов, и часто наборщики вручную регулируют ширину пробела в зависимости от размера и заметности текста.

В дополнение к этому универсальному пространству, можно закодировать пространство определенной ширины. Полный список см. в таблице ниже.

Пробелы вокруг тире

Длинные тире, используемые в качестве разделителей в скобках, и короткие тире , используемые в качестве соединителей слов, обычно устанавливаются непрерывно с текстом. [28] Однако такое тире может быть опционально окружено тонким пробелом , U+200A, или тонким пробелом , U+2009. Тонкий пробел может быть записан в HTML с помощью числовых ссылок на символы   или  , или именованной сущности  , хотя это не поддерживается повсеместно в браузерах по состоянию на 2016 год. [ требуется обновление ] Тонкий пробел — это именованная сущность и числовые ссылки или . Эти пробелы намного тоньше обычного пробела (за исключением моноширинного (непропорционального) шрифта ), при этом тонкий пробел в частности является самым тонким из горизонтальных пробельных символов.[обновлять]   

Нормальное пространство против волосяных и тонких пространств (как отображается в вашем браузере)
Обычный пробел с длинным тирелево — право
Тонкий пробел с длинным тирелево право
Пространство для волос с длинным тирелево — право
Нет пробела с длинным тирелево—право

Вычислительные приложения

Языки программирования

В большинстве языков программирования синтаксис пробельные символы могут использоваться для разделения токенов . Для языка свободной формы пробельные символы игнорируются процессорами кода (т. е. компилятором ). Даже когда синтаксис языка требует пробельных символов, часто несколько пробельных символов обрабатываются так же, как один. В языке правил «вне игры» пробельные символы отступа синтаксически значимы. В сатирическом и противоречивом языке , называемом Whitespace , пробельные символы являются единственными значимыми символами, а обычный текст игнорируется.

Правильное использование пробелов в исходном коде может группировать связанную логику и сделать код более понятным. Чрезмерное использование пробелов, в том числе в конце строки, где они не обеспечивают никакого поведения рендеринга, считается помехой.

Большинство языков распознают только пробельные символы, имеющие код ASCII. Они запрещают большинство или все перечисленные выше коды Unicode. Язык C определяет пробельные символы как «пробел, горизонтальную табуляцию, новую строку, вертикальную табуляцию и перевод страницы». [29] Сетевой протокол HTTP требует использования различных типов пробельных символов в разных частях протокола, например: только символ пробела в строке состояния , CRLF в конце строки и «линейный пробел» в значениях заголовков. [30]

Анализ командной строки

Типичные парсеры командной строки используют символ пробела для разделения аргументов . Значение со встроенным символом пробела является проблематичным, поскольку оно приводит к тому, что значение анализируется как несколько аргументов. Обычно парсер позволяет избежать обычного анализа аргументов, заключив текст в кавычки.

Предположим, что требуется перечислить файлы в каталоге с именем "foo bar". Эта команда вместо этого перечисляет файлы, соответствующие "foo" или "bar":

ls  foo  бар

Эта команда правильно указывает один аргумент:

ls "foo bar" 

Языки разметки

Некоторые языки разметки , такие как SGML , сохраняют пробелы в том виде, в котором они написаны.

Языки веб-разметки, такие как XML и HTML, обрабатывают пробельные символы особым образом, включая пробельные символы, для удобства программистов. Один или несколько пробельных символов, считываемых соответствующими процессорами отображения времени этих языков разметки, сворачиваются в 0 или 1 пробел в зависимости от их семантического контекста. Например, двойные (или более) пробелы в тексте сворачиваются в один пробел, а пробелы, которые появляются по обе стороны от " =", разделяющего имя атрибута от его значения, не оказывают никакого влияния на интерпретацию документа. Теги конца элемента могут содержать конечные пробелы, а теги пустых элементов в XML могут содержать пробелы перед " />". В этих языках ненужные пробелы увеличивают размер файла и, таким образом, могут замедлять сетевую передачу данных. С другой стороны, ненужные пробелы также могут незаметно отмечать код, аналогично комментариям в коде, но менее очевидно. Это может быть желательно для доказательства нарушения лицензии или авторских прав, которое было совершено путем копирования и вставки .

В значениях атрибутов XML последовательности пробельных символов обрабатываются как один пробел, когда документ считывается парсером. [31] Пробелы в содержимом элемента XML не изменяются таким образом парсером, но приложение, получающее информацию от парсера, может выбрать применение аналогичных правил к содержимому элемента. Автор документа XML может использовать атрибут xml:space="preserve"в элементе, чтобы дать парсеру указание воспрепятствовать нижестоящему приложению изменять пробелы в содержимом этого элемента.

В большинстве элементов HTML последовательность пробельных символов обрабатывается как один разделитель между словами , который может проявляться как один пробельный символ при отображении текста на языке, который обычно вставляет такой пробел между словами. [32] Соответствующие HTML-рендеры должны применять более буквальную обработку пробелов в пределах нескольких предписанных элементов, таких как preтег и любой элемент, для которого CSS использовался для применения preобработки пробелов по типу . В таких элементах пробельные символы не будут «сворачиваться» в разделители между словами.

Как в XML, так и в HTML символ неразрывного пробела , наряду с другими нестандартными пробелами, не рассматривается как сворачиваемый «пробел», поэтому на него не распространяются приведенные выше правила.

Имена файлов

Такое использование похоже на многословные имена файлов, написанные для операционных систем и приложений, которые путаются из-за встроенных пробельных кодов — такие имена файлов вместо этого используют подчеркивание (_) в качестве разделителя слов, как_в_этой_фразе.

Другим таким символом был U+2422ПУСТОЙ СИМВОЛ . Он использовался в ранние годы компьютерного программирования при написании на формах кодирования. Операторы перфоратора сразу же распознали этот символ как «явный пробел». [16] Он использовался в BCDIC , [16] EBCDIC , [16] и ASCII-1963 . [16]

Смотрите также

Ссылки

  1. ^ "Стандарт Unicode". Консорциум Unicode.
  2. ^ "Стандарты дизайна персонажей – космические персонажи". Стандарты дизайна персонажей . Microsoft . 1998–1999. Архивировано из оригинала 14 марта 2010 г. Получено 2009-05-18 .
  3. ^ The Unicode Standard 5.0, печатное издание, стр. 205; также доступно в "Глава 6 — Системы письма и пунктуация" (PDF) . The Unicode Standard 5.0, электронное издание. Unicode Consortium . 2006-07-14. стр. 11 (205) . Получено 2022-12-22 .
  4. ^ "Общая пунктуация" (PDF) . Стандарт Unicode 5.1 . Unicode Inc . 1991–2008 . Получено 2009-05-13 .
  5. ^ Сарджент , Мюррей III (2006-08-29). «Unicode Almostly Plain Text Encoding of Mathematics (Version 2)». Unicode Technical Note #28 . Unicode Inc . стр.  19–20 . Получено 2009-05-19 .
  6. ^ Гиллам, Ричард (2002). Unicode Demystified: A Practical Programmer's Guide to the Encoding Standard . Addison-Wesley. ISBN 0-201-70052-2.
  7. ^ ab Hickson, Ian . "12.5 Ссылки на именованные символы". Стандарт HTML . WHATWG .
  8. ^ Wolfram . "\[NegativeThickSpace]". Документация по языку Wolfram .
  9. ^ Вольфрам . "\[NegativeMediumSpace]". Документация по языку Wolfram .
  10. ^ Вольфрам . "\[NegativeThinSpace]". Документация по языку Wolfram .
  11. ^ Вольфрам . "\[NegativeVeryThinSpace]". Документация по языку Wolfram .
  12. ^ Faltstrom, P., ред. (август 2010 г.). "Zero Width Non-Joiner". Кодовые точки Unicode и интернационализированные доменные имена для приложений (IDNA). IETF . раздел A.1. doi : 10.17487/RFC5892 . RFC 5892. Получено 4 сентября 2019 г.
  13. ^ Фальтстром, П., ред. (август 2010 г.). "Zero Width Joiner". Кодовые точки Unicode и интернационализированные доменные имена для приложений (IDNA). IETF . раздел A.2. doi : 10.17487/RFC5892 . RFC 5892. Получено 4 сентября 2019 г.
  14. ^ «Приложение № 44 к стандарту Unicode, База данных символов Unicode».
  15. ^ abcdef Европейская ассоциация производителей компьютеров (1968-11-28). Графическое представление управляющих символов 7-битного кодированного набора символов ECMA для обмена информацией (PDF) . ECMA-17.
  16. ^ abcdefgh Маккензи, Чарльз Э. (1980). Coded Character Sets, History and Development (PDF) . The Systems Programming Series (1-е изд.). Addison-Wesley Publishing Company, Inc. стр. 41, 47, 52, 102– 103, 117, 119, 130, 132, 141, 148, 150– 151, 212, 424. ISBN 978-0-201-14460-4. LCCN  77-90165. Архивировано (PDF) из оригинала 26 мая 2016 г. Получено 25 августа 2019 г.
  17. ^ "Американский стандартный код для обмена информацией, ASA X3.4-1963". Американская ассоциация стандартов (ASA). 1963-06-17.
  18. ^ Вирт, Никлаус (1988). Программирование в Модуле-2 (PDF) . дои : 10.1007/978-3-642-83565-0. ISBN 978-3-642-83567-4.
  19. ^ "Cambridge Z88 User Guide". 4.7 (4-е изд.). Cambridge Computer Limited . 2016 [1987]. Основные понятия - Клавиатура. Архивировано из оригинала 2016-12-12 . Получено 2016-12-12 .
  20. ^ abc "Cambridge Z88 User Guide". 4.0 (4-е изд.). Cambridge Computer Limited . 1987. Приложение D. Архивировано из оригинала 2016-12-12 . Получено 2016-12-12 .
  21. ^ abc "Cambridge Z88 User Guide". 4.7 (4-е изд.). Cambridge Computer Limited . 2015 [1987]. Приложение D. Архивировано из оригинала 2016-12-12 . Получено 2016-12-12 .
  22. ^ Таблица Unicode U+2800, образцы Брайля
  23. ^ Чунг, Джаэмин (2017-03-30). Предложение добавить информативное примечание к U+3164 HANGUL FILLER (PDF) . Консорциум Unicode . UTC L2/17-081.
  24. ^ Хангыль Джамо (PDF) . Консорциум Юникод . 2020-10-25.
  25. ^ "ibm-933_P110-1995". Демонстрация ICU - Converter Explorer . Международные компоненты для Unicode .
  26. ^ "ibm-933_P110-1995 (ведущие байты 0E84)". Демонстрация ICU - Converter Explorer . Международные компоненты для Unicode .
  27. ^ "Глава 6 — Системы письма и пунктуация" (PDF) . Стандарт Unicode 15.0, электронное издание. Консорциум Unicode . 2022-09-13. стр. 12–13 (267–268) . Получено 2022-12-23 . Символы пробела фиксированной ширины (U+2000..U+200A) получены из обычной (горячеканальной) типографики. Алгоритмический кернинг и выравнивание в компьютерной типографике не используют эти символы. Однако там, где они используются (например, при наборе математических формул), их ширина обычно указывается шрифтом, и они, как правило, не расширяются во время выравнивания. Исключением является тонкий пробел U+2009, который иногда корректируется.
  28. ^ Использование различных типов тире проиллюстрировано, например, в The Chicago Manual of Style , §§ 6.80, 6.83–6.86.
  29. ^ http://www.open-std.org/jtc1/sc22/wg14/www/docs/n1548.pdf Раздел 6.4, абзац 3
  30. ^ Филдинг, Р. и др. (июнь 1999 г.), «2.2 Основные правила», Протокол передачи гипертекста — HTTP/1.1 , doi : 10.17487/RFC2616, RFC 2616 
  31. ^ "3.3.3 Нормализация атрибутов и значений". Extensible Markup Language (XML) 1.0 (пятое издание) . World Wide Web Consortium.
  32. ^ "9.1 Пробелы". Спецификация W3CHTML 4.01 . Консорциум Всемирной паутины.
  • Список свойств базы данных символов Unicode
Взято с "https://en.wikipedia.org/w/index.php?title=Пробел_символ&oldid=1273742240"