Z-вариант

Глифы с незначительными типографскими различиями

В Unicode два глифа называются Z-вариантами (часто пишутся как zVariants ), если они имеют одинаковую этимологию, но немного отличаются по внешнему виду и имеют разные кодовые точки Unicode . Например, символы Unicode U+8AAA說 и U+8AAC説 являются Z-вариантами. Понятие Z-вариантности применимо только к « письменам CJKV » — китайскому, японскому, корейскому и вьетнамскому — и является подразделом объединения Хань .

Различия по оси Z

Философия Unicode по распределению кодовых точек для языков CJK организована по трем « осям ». Ось X представляет различия в семантике; например, латинская заглавная буква A ( U+0041 A) и греческая заглавная буква alpha ( U+0391 Α) представлены двумя различными кодовыми точками в Unicode и могут быть названы «X-вариантами» (хотя этот термин не является общепринятым). Ось Y представляет существенные различия во внешнем виде, но не в семантике; например, традиционный китайский иероглиф māo «кошка» ( U+8C93貓) и упрощенный китайский иероглиф ( U+732B猫) являются Y-вариантами. [1]

Ось Z отображает незначительные типографские различия. Например, китайские иероглифы ( U+838A莊) и ( U+8358荘) являются Z-вариантами, как и ( U+8AAA說) и ( U+8AAC説). Глоссарий на сайте Unicode.org определяет «Z-вариант» как «Два унифицированных идеограммы CJK с одинаковой семантикой и унифицируемыми формами» [1] , где «унифицируемый» понимается в смысле унификации Хань.

Таким образом, если бы объединение Хань было полностью успешным, Z-вариантов бы не существовало. Они существуют в Unicode, потому что считалось полезным иметь возможность «кругового перемещения» документов между Unicode и другими кодировками CJK, такими как Big5 и CCCII . Например, символ 莊 имеет кодировку CCCII 21552D, тогда как его Z-вариант 荘 имеет кодировку CCCII 2D552D. Поэтому этим двум вариантам были даны различные кодовые точки Unicode, так что преобразование документа CCCII в Unicode и обратно было бы операцией без потерь .

Путаница

Существует некоторая путаница в точном определении «Z-варианта». Например, в интернет-проекте ( RFC  3743) от 2002 года [2] можно найти «no» ( U+4E0D不) и ( U+F967不︀), описанные как «варианты шрифта», термин «Z-вариант», по-видимому, зарезервирован для межъязыковых пар, таких как мандаринское китайское «кролик» ( U+5154兔) и японское to «кролик» ( U+514E兎). Однако база данных Unihan Консорциума Unicode [3] [ проверка не пройденасм. обсуждение ] рассматривает обе пары как Z-варианты.

Смотрите также

Ссылки

  1. ^ ab "Глоссарий". www.unicode.org .
  2. ^ Хуан, К.; Ко, И.; Кониши, К.; Цянь, Х. (апрель 2004 г.). «Руководящие принципы Объединенной инженерной группы (JET) по регистрации и администрированию интернационализированных доменных имен (IDN) для китайского, японского и корейского языков». tools.ietf.org .
  3. ^ "Поиск в базе данных Unihan". www.unicode.org .
Взято с "https://en.wikipedia.org/w/index.php?title=Z-вариант&oldid=1244693053"