Соединитель нулевой ширины

Непечатаемый символ, используемый в компьютерном наборе
Символ клавиатуры ISO для ZWJ

Соединитель нулевой ширины ( ZWJ , / ˈ z w ɪ / ; [1] отображается: ; HTML сущность : или ) — непечатаемый символ, используемый в компьютерном наборе систем письма , в которых форма или расположение графемы зависит от ее отношения к другим графемам ( сложные письменности ), таким как арабская письменность или любая индийская письменность . Иногда латинское письмо считается сложным, например, при использовании шрифта Fraktur . При размещении между двумя символами, которые в противном случае не были бы связаны, ZWJ заставляет их печататься в их связанных формах.‍‍

Точное поведение ZWJ варьируется в зависимости от того, ожидается ли по умолчанию использование соединительной согласной или лигатуры (где несколько символов отображаются одним глифом ); например, он подавляет использование союзов в деванагари (при этом все еще позволяя использовать индивидуальную соединительную форму мертвой согласной, в отличие от формы halant , как это требовалось бы для несоединительного символа нулевой ширины ), но вызывает использование союзов в сингальском (который не использует их по умолчанию). [2] [3] Аналогично сингальскому, когда ZWJ помещается между двумя символами эмодзи (или вкрапляется между несколькими), это может привести к отображению одного глифа, например, семейного эмодзи, состоящего из двух взрослых эмодзи и одного или двух детских эмодзи. [4]

В некоторых случаях, например, во втором примере деванагари ниже, ZWJ можно использовать для отображения соединительной формы отдельно, если он включен после символа и кода сочетания halant.

Кодовая точка символа — U+200D ZERO WIDTH JOINER ( ). В раскладке клавиатуры InScript для индийских языков он набирается комбинацией клавиш Ctrl+Shift+1 . Однако многие раскладки используют позицию клавиши ']' QWERTY для этого символа. [5]

Примеры

Использование ZWNJ и ZWJ для выбора альтернативных форм деванагари , тамильского , каннада , сингальского и эмодзи .
бенгальский
Последовательность символовПоявление
[ра র] [вирама ্ ] [йа য]র্য
[ра র] [ZWJ] [вирама ্ ] [йа য]র‍্য
Деванагари
Последовательность символовПоявление
[ка क] [вирама ्]к
[ка क] [вирама ्] [ZWJ]к
[ка क] [вирама ्] [ша ष]क्ष
[ка क] [вирама ्] [ZWJ] [ṣa ष]क्‍ष
каннада
Последовательность символовПоявление
[ра ರ‍] [вирама ್] [ка ಕ]рк
[ра ರ‍] [ZWJ] [вирама ್] [ка ಕ]ರ‍್ಕ
сингальский
Последовательность символовПоявление
[ша ශ] [вирама ්] [ра ර]ශ්ර
[ша ශ] [вирама ්] [ZWJ] [ра ර]ශ්‍ර
Малаялам
(до Unicode 5.0; в более поздних версиях выделяются специальные кодовые точки [6] )
Последовательность символовПоявление
[На ണ] [вирама ്] [ZWJ]ണ്‍
[на ന] [вирама ്] [ZWJ]нет
[ра ര] [вирама ്] [ZWJ]ര്‍
[ла ല] [вирама ്] [ZWJ]ല്‍
[Ла ള] [вирама ്] [ZWJ]ള്‍
Эмодзи
Последовательность символовПоявлениеОписание
[Мужчина] [ZWJ] [Женщина] [ZWJ] [Мальчик]👨‍👩‍👦Семья: Мужчина, Женщина, Мальчик
[Размахивая белым флагом] [ZWJ] [Радуга]🏳️‍🌈Радужный флаг
[Бегун] [Модификатор эмодзи Фицпатрик Тип-1-2] [ZWJ] [Женский знак]🏃🏻‍♀️Женщина бежит: светлый тон кожи
[Бегун] [Модификатор эмодзи Фицпатрик Тип-6] [ZWJ] [Женский знак]🏃🏿‍♀️Женщина бежит: темный оттенок кожи
[Мужчина] [ZWJ] [Рыжие волосы]👨‍🦰Мужчина: Рыжие волосы
[Человек] [ZWJ] [Сноп риса]👨‍🌾фермер

Смотрите также

Ссылки

  1. ^ "113 новых эмодзи Unicode (плюс оттенки кожи)". Блог Unicode . 2016-11-28 . Получено 2021-01-14 .
  2. ^ Констебль, Питер (2004-06-30). "Предложение по разъяснению и консолидации функции ZERO WIDTH JOINER в индийских письменностях" (PDF) . Консорциум Unicode . UTC L2 /04-279, выпуск Public Review № 37.
  3. ^ "13.2. Сингальский (§ Вирама (аль-лакуна) и формы согласных)". Стандарт Unicode, Основная спецификация . Консорциум Unicode . Если не сочетать с U+200D ZERO WIDTH JOINER , аль-лакуна всегда видна и не соединяет согласные для формирования орфографических согласных кластеров. […] Обратите внимание, как использование ZWJ в сингальском языке отличается от использования в типичных индийских письменностях.
  4. ^ "Zero Width Joiner". Emojipedia . Получено 21.09.2015 .
  5. ^ "ചിത്രം:Inscript.jpg - малаяламские вычисления" (на малаялам). Malayalam.kerala.gov.in. Архивировано из оригинала 11 октября 2011 г. Проверено 22 октября 2011 г.
  6. ^ "Изменения, связанные с малаялам в Unicode 5.1.0 по сравнению с 5.0" (PDF) . Unicode.org . Получено 2015-06-12 .
  • Предложение по разъяснению и консолидации функции НУЛЕВОГО ШИРИННОГО СОЕДИНИТЕЛЯ в индийских письменностях
Взято с "https://en.wikipedia.org/w/index.php?title=Zero-width_joiner&oldid=1230942743"