Эта страница справки представляет собой практическое руководство . Он объясняет концепции или процессы, используемые сообществом Википедии. Он не является политикой или руководством Википедии и может отражать различные уровни консенсуса . |
Многие специальные символы (отсутствующие на стандартной компьютерной клавиатуре) полезны — а иногда и необходимы — в статьях Википедии. Даже статьи, в которых используются только английские слова, могут использовать знаки препинания, такие как длинное тире (—), и символы, такие как знак раздела (§) или зарегистрированный знак (®). Статьи о европейских людях или местах или в них упоминаются многие расширенные латинские символы , а статьи о других людях и местах могут потребовать символы из совершенно других алфавитов. В этой статье описывается несколько методов ввода таких символов.
Существует несколько способов ввести специальный символ в викитекст.
Используйте ссылку специального символа для ввода символа Unicode ( UTF-8 ). Ссылки доступны в разделе Специальные символы над окном редактирования и под кнопками в нижней части окна редактирования (для получения дополнительной информации о последнем см. Help:CharInsert ). Щелчок по ссылке специального символа вводит этот символ в текущую позицию курсора в окне редактирования, поэтому вам нужно установить курсор в нужное место, прежде чем щелкнуть ссылку.
Щелчок по стрелке слева от Special characters над окном редактирования открывает список групп изображений специальных символов (см. рисунок 1 ниже); повторный щелчок по стрелке (которая теперь указывает вниз) закрывает список. Щелкните по имени группы (например, Symbols ), чтобы отобразить эту группу; щелкните по изображению соответствующего символа, чтобы ввести этот символ в текущую позицию курсора в окне редактирования. Некоторые изображения разных символов очень похожи по внешнему виду, поэтому важно использовать правильное изображение. Например, изображения для закрывающей одинарной кавычки (') и закрывающей двойной кавычки (”) очень похожи на изображения для символов одинарного штриха (′) и двойного штриха (″).
Группы для ссылок на специальные символы под окном редактирования отображаются по одной; группа по умолчанию — Вставить , которая включает знаки препинания и некоторые другие общие символы (см. Рисунок 2 ниже), но может отображаться и другая группа, если вы ее предварительно выбрали. Щелкните стрелку вниз справа от этого поля, чтобы отобразить другие группы; щелкните соответствующую группу, чтобы выбрать ее. Когда курсор наводится на ссылку на специальные символы, ссылка подчеркивается; щелчок по подчеркнутой ссылке вводит этот символ в текущую позицию курсора в окне редактирования.
Русские буквы находятся в группе кириллицы ; большинство других европейских букв находятся в группе латиницы . Вам может потребоваться нажать на несколько категорий в обоих местах, чтобы найти свой специальный символ, особенно если он не является алфавитным: математические символы могут быть в Symbols , Insert или Math and logic (последние два находятся только в нижней ссылке) или в Wikipedia:Mathematical symbols и связанных с ней статьях.
Некоторые изображения символов и ссылки включают пары открывающих и закрывающих кавычек. По умолчанию пара символов вводится в текущей позиции курсора; если отрывок текста был выбран до щелчка по изображению или ссылке, кавычки вводятся в начале и конце выделения.
Эта функциональность обеспечивается расширением MediaWiki CharInsert, которое было установлено администраторами Википедии.
Введите символ Unicode, используя клавишу Alt ( операционная система Windows ), клавишу Option ( компьютер Macintosh ) или комбинацию символов Unicode (Linux).
На некоторых клавиатурах есть клавиша «Композитор» , которая обеспечивает схожую функциональность в некоторых других операционных системах.
Списки кодов Alt и комбинаций клавиш Option приведены в источниках, ссылки на которые приведены в разделе Внешние ссылки.
На iPhone и iPad ( IOS ) специальные символы вводятся с использованием шаблона {{Unicode|&#x любое-четырехзначное-шестнадцатеричное - число ;}} . (Пробел между { { следует удалить.) Это будет отображаться более точно в некоторых браузерах по сравнению с просто &#x любое-четырехзначное-шестнадцатеричное-число ; . В этой операционной системе меню символов в нижней части страниц WP Edit более ограничены, чем в Windows.
В Windows Altклавиша нажимается и удерживается, пока на цифровой клавиатуре вводится десятичный код символа ; затем клавиша отпускается, и символ появляется. Цифровой код соответствует кодовой точке символа в кодовой странице Windows 1252 с начальным нулем; например, короткое тире (–) вводится с помощью + . Начальный ноль обязателен; если он опущен, вводится символ, соответствующий кодовой точке в кодовой странице OEM по умолчанию. Например, если кодовая страница OEM по умолчанию — 437 , + дает û.Alt Alt0150
Alt150
На компьютере под управлением операционной системы Microsoft Windows многие специальные символы, имеющие десятичные эквивалентные кодовые номера ниже 256, можно вводить с помощью клавиш клавиатуры + десятичные эквивалентные кодовые номера.Alt
Например, символ é (маленькая e с острым ударением, HTML-код сущности é
) можно получить, нажав + . Сначала нажмите клавишу (и удерживайте ее нажатой) левой рукой, затем последовательно нажмите цифровые клавиши , , , одну за другой в правой части цифровой клавиатуры , затем отпустите клавишу.Alt130Alt130Alt
Однако многие специальные символы, например λ (маленькая лямбда), не могут быть получены из их десятичного кода 955 (или 0955) с помощью клавиши в Блокноте или Internet Explorer . Вы получите неправильный символ, «╗» или «»». Alt
Редактор WordPad принимает значения (десятичные числовые кодовые точки сущностей) выше 255, поэтому его можно использовать для получения специальных/Unicode-символов, которые затем можно скопировать и вставить туда, где эти символы необходимы.
Чтобы правильно получить специальные символы, которые имеют десятичные кодовые точки выше 255, другой вариант (недоступный в Internet Explorer) — сначала использовать или ввести шестнадцатеричный эквивалент кодовой точки символа, а затем нажать клавиши + . Чтобы создать λ, например, откройте или запустите WordPad, Notepad , Word , LibreOffice Writer и т. д. программное обеспечение для редактирования, затем введите (шестнадцатеричный эквивалент числового кода символа ), затем нажмите + . Шестнадцатеричный код 3BB преобразуется/превращается в символ λ , который теперь можно скопировать и вставить туда, где вы хотите его использовать. (В IE используйте его шестнадцатеричный эквивалентный код HTML или его десятичный эквивалентный код HTML .)AltX
3BB
λ
AltX
λ
λ
На компьютере Macintosh клавиша (иногда и другая клавиша) нажимается и удерживается, пока нажимается другая клавиша; затем клавиша (и, если применимо, другая клавиша) отпускается, и появляется символ. Например, короткое тире вводится с помощью + ; длинное тире (—) вводится с помощью + + .⌥ Opt⌥ Opt⌥ Opt-
⇧ Shift⌥ Opt-
Кроме того, на компьютерах Macintosh нажатие и удерживание определенных букв (гласных и нескольких других) вызывает всплывающее меню соответствующих специальных символов, таких как акцентированные версии гласных, которые можно выбрать щелчком мыши или с помощью числового кода.
В Linux должен сработать один из трех методов:
В LibreOffice , OpenOffice.org и Inkscape , например, работает только второй метод. В GTK работает только третий метод.
В операционной системе iOS, используемой на iPhone и iPad , символы с ударением, используемые в западноевропейских языках, генерируются путем удержания пальца на символе, требующем диакритического знака , что открывает меню. Некоторые из наиболее распространенных специальных символов также генерируются таким образом. Удержание пальца на клавише $, например, позволяет получить доступ к ₽ ( испанская песета , испанские деньги до введения евро), ¥ ( иена ), € ( евро ), ¢, £ и ₩. Для доступа к короткому тире , длинному тире и • необходимо удерживать клавишу дефиса . Для доступа к § необходимо удерживать клавишу &. Кроме того, существует 308 альтернативных клавиатур, которые устанавливаются через Настройки - Общие - Язык и регион - Добавить язык. К ним относятся арабская, русская, иврит, пенджабская и многие малоизвестные, такие как идиш , тайская и армянская .
Невозможно напрямую установить новый системный шрифт в iOS. Сторонние приложения предлагают шрифты, в основном декоративные шрифты без засечек, не подходящие для текста, в виде альтернативных клавиатур. Эти программы напоминают программу TSR Terminate and Stay Resident под MS-DOS: вы запускаете программу для установки шрифта/клавиатуры, затем выходите из программы. Установленные клавиатуры выбираются земным шаром слева от пробела. Поскольку эти программы могут при определенных условиях получать доступ к набору текста пользователями, они могут представлять угрозу безопасности. Другие сторонние приложения предлагают шрифты, которые можно использовать только в приложении.
Выберите, скопируйте и вставьте символ из приложения «Таблица символов» .
Существует два внешних варианта:
Выберите, скопируйте и вставьте символ с помощью GNOME Character Map. Если он еще не установлен вместе с GNOME, он обычно доступен как "gucharmap" (который можно установить с помощью "yum install gucharmap" как root в дистрибутиве Linux, похожем на Redhat, например).
В KDE похожее приложение называется "KCharSelect". В частности, в Debian Linux вы можете ввести "sudo apt install kcharselect", чтобы установить его.
Используйте ссылку на символ HTML . Ссылка может быть как именованной , так и числовой ; любой тип начинается с амперсанда ( &
) и заканчивается точкой с запятой ( ;
). Именованная ссылка имеет форму &
имя;
; например, à
ссылается на строчную латинскую букву a с тупым ударением (à). Поскольку имена достаточно мнемоничны, их обычно легче запомнить, чем числовые коды, и, соответственно, их легче распознавать другим редакторам.
Некоторые символы Unicode, такие как турецкие буквы, не имеют имен HTML, поэтому числовая ссылка иногда является единственным вариантом с использованием HTML. Числовая ссылка на символ HTML имеет форму &#
D;
или &#x
H;
; D и H являются кодовой точкой символа Unicode в десятичном и шестнадцатеричном формате. Например, можно ввести —
или , —
чтобы получить U+2014, длинное тире (—). Поскольку кодовая точка символа Unicode обычно указывается в шестнадцатеричном формате с префиксом "U+", шестнадцатеричный код, возможно, более удобен. Конечно, когда имя существует, именованная ссылка (например, —
для длинного тире) обычно удобнее (и легче распознается), чем любой из числовых кодов.
Имена символов HTML (и соответствующие шестнадцатеричные и десятичные коды) приведены в Списке ссылок на сущности символов XML и HTML .
Поскольку ссылка на символ использует только символы ASCII , она не требует, чтобы веб-браузер поддерживал Unicode, и она однозначна, когда веб-страница не объявляет свою кодировку символов, когда кодировка браузера установлена вручную неправильно и даже когда символ не отображается должным образом в некоторых браузерах. Соответственно, это обычно наиболее «веб-безопасный» подход. Однако ссылки на символы отвлекают многих редакторов и могут вызвать трудности с поиском в Википедии (см. ниже).
Некоторые старые браузеры неправильно интерпретируют коды в диапазоне 128–159 как ссылки на собственный набор символов. Поскольку кодовые точки 128–159 не используются для отображаемых глифов ни в ISO-8859-1 , ни в Unicode , ссылки на символы в этом диапазоне (например, ƒ
) являются незаконными в HTML и неоднозначными, хотя они обычно используются многими веб-сайтами. Почти все браузеры рассматривают ISO-8859-1 как Windows-1252, в котором есть печатные символы в этом пространстве, и они часто попадали в заголовки статей в англоязычных проектах, что действительно вызывало путаницу при попытке создания интервики-ссылок на указанные страницы.
В целом, западноевропейские языки, такие как испанский, французский и немецкий, не представляют особых проблем. Для получения подробной информации о языке в Турции см.: Help:Turkish characters . (В этот список могут быть добавлены другие элементы по мере появления участников на других языках, хотя, согласно этому удалению и этому обсуждению , в будущем такие списки могут быть мало востребованы.)
Например, <hiero>P2</hiero>
дает
|
См . Справка:Синтаксис WikiHiero .
Это не зависит от возможностей браузера, поскольку использует изображения на серверах.
Иероглифы также могут быть представлены в Unicode с использованием шрифта Aegyptus.
в поле редактирования | в базе данных и выводе |
---|---|
S | С |
Sx | Ŝ |
Sxx | Скс |
Sxxx | Ŝx |
Sxxxx | Скс |
Sxxxxx | Ŝxx |
Установки MediaWiki, настроенные для эсперанто, используют UTF-8 для хранения и отображения. Однако при редактировании текст преобразуется в форму, которая разработана для более удобного редактирования с помощью стандартной клавиатуры.
Символы, к которым это применимо: Ĉĉ, Ĝĝ, Ĥĥ, Ĵĵ, Ŝŝ, Ŭŭ
. Вы можете ввести их непосредственно в поле редактирования, если у вас есть для этого возможности. Однако при повторном редактировании страницы вы увидите их закодированными как Sx. Эта форма называется "x-sistemo" или "x-kodo". Чтобы сохранить возможность кругового обхода, когда один или несколько x следуют за этими символами или их формами без ударения ( Cc, Gg, Hh, Jj, Ss, Uu
), количество x в поле редактирования вдвое больше, чем в фактическом сохраненном тексте статьи.
Например, межъязыковая ссылка [[en:Luxury car]]
на en:Роскошный автомобиль должна быть введена в поле редактирования как [[en:Luxxury car]]
на eo:. Это вызывало проблемы с ботами обновления интервики в прошлом.
Известно, что некоторые браузеры делают гадости с текстом в поле редактирования. Чаще всего они преобразуют его в кодировку, родную для платформы (хотя линейка NT Windows внутренне UCS-2LE — 2-байтовое подмножество UTF-16 — у нее есть полный набор дублирующих API в кодовой странице Windows ANSI, и многие старые приложения, как правило, используют их, особенно для таких вещей, как поля редактирования). Затем они позволяют пользователю редактировать его с помощью стандартного элемента управления редактированием и преобразовывать его обратно. В результате любые символы, которых нет в кодировке, используемой для редактирования, заменяются чем-то, что есть (часто это вопросительный знак, хотя, как сообщается, по крайней мере один браузер на самом деле транслитерирует текст!).
В Google Chrome и Chromium есть кроссплатформенная ошибка, которая не позволяет использовать замену шрифтов . [1] Это означает, что даже если у пользователя установлен правильный шрифт для определенного сценария, он может отображаться неправильно или вообще не отображаться.
Lynx , Links (в текстовом режиме) и W3M преобразуют в консольный набор символов (Lynx и Links на самом деле используют механизм транслитерации) для редактирования и преобразуют обратно при сохранении. Если консольный набор символов — UTF-8, то эти браузеры безопасны для Unicode, но если нет, то они небезопасны. С Lynx и Links возможным методом обнаружения было бы добавление еще одного поля редактирования в форму входа, но это не сработает для W3M, поскольку он не преобразует текст в консольный набор символов, пока пользователь фактически не попытается его отредактировать.
В базе данных и поле редактирования для обычных браузеров | В поле редактирования для проблемных браузеров |
---|---|
œ | œ |
œ | œ |
œ | œ |
После того, как английская Википедия перешла на UTF-8, а интервики-боты начали заменять HTML-сущности в интервики на буквальный текст Unicode, правки, которые нарушали символы Unicode, стали настолько распространенными, что их больше нельзя было игнорировать. Был разработан обходной путь, позволяющий проблемным браузерам безопасно редактировать при условии, что MediaWiki знает об их проблемах.
Браузеры, перечисленные в настройке $wgBrowserBlackList (список регулярных выражений, соответствующих строкам агента пользователя), предоставляют текст для редактирования в специальной форме. Существующие шестнадцатеричные HTML-сущности на странице имеют дополнительный начальный ноль, не-ASCII-символы, которые хранятся в вики-тексте, представлены как шестнадцатеричные HTML-сущности без начальных нулей.
В настоящее время в настройках по умолчанию в черном списке есть только IE Mac и определенная версия Netscape 4.x для Linux. Тем не менее, похоже, это остановило большинство проблем. Надеюсь, что список по умолчанию будет расширен в будущем, но это зависит от того, сможет ли кто-то с доступом к CVS внести изменения.
У многих пользователей есть настройки, дающие подчеркнутые ссылки. При связывании специального символа в некоторых случаях результат может быть ошибочно принят за другой символ с другим значением:
Связывание + − < > ⊂ ⊃ дает + − < > ⊂ ⊃ , что может выглядеть как ± = ≤ ≥ ⊆ ⊇. В таких случаях лучше использовать отдельную ссылку:
Риск путаницы меньше, если связано более одного символа, например, x > 3 .
Поиск в Википедии упрощается , если ввести специальный символ в виде Unicode. Если используется HTML-сущность, то такое слово, как Odiliënberg, можно найти только с помощью поиска по Odili
, или их комбинации; на самом деле это ошибка, которую следует исправить — сущности следует свернуть в их необработанные эквиваленты символов, чтобы все поиски по ним были эквивалентны. См. также Help:Searching .euml
nberg