В Unicode два глифа называются Z-вариантами (часто пишутся как zVariants ), если они имеют одинаковую этимологию, но немного отличаются по внешнему виду и имеют разные кодовые точки Unicode . Например, символы Unicode U+8AAA說 и U+8AAC説 являются Z-вариантами. Понятие Z-вариантности применимо только к « письменам CJKV » — китайскому, японскому, корейскому и вьетнамскому — и является подразделом объединения Хань .
Философия Unicode по распределению кодовых точек для языков CJK организована по трем « осям ». Ось X представляет различия в семантике; например, латинская заглавная буква A ( U+0041 A) и греческая заглавная буква alpha ( U+0391 Α) представлены двумя различными кодовыми точками в Unicode и могут быть названы «X-вариантами» (хотя этот термин не является общепринятым). Ось Y представляет существенные различия во внешнем виде, но не в семантике; например, традиционный китайский иероглиф māo «кошка» ( U+8C93貓) и упрощенный китайский иероглиф ( U+732B猫) являются Y-вариантами. [1]
Ось Z отображает незначительные типографские различия. Например, китайские иероглифы ( U+838A莊) и ( U+8358荘) являются Z-вариантами, как и ( U+8AAA說) и ( U+8AAC説). Глоссарий на сайте Unicode.org определяет «Z-вариант» как «Два унифицированных идеограммы CJK с одинаковой семантикой и унифицируемыми формами» [1] , где «унифицируемый» понимается в смысле унификации Хань.
Таким образом, если бы объединение Хань было полностью успешным, Z-вариантов бы не существовало. Они существуют в Unicode, потому что считалось полезным иметь возможность «кругового перемещения» документов между Unicode и другими кодировками CJK, такими как Big5 и CCCII . Например, символ 莊 имеет кодировку CCCII 21552D, тогда как его Z-вариант 荘 имеет кодировку CCCII 2D552D. Поэтому этим двум вариантам были даны различные кодовые точки Unicode, так что преобразование документа CCCII в Unicode и обратно было бы операцией без потерь .
Существует некоторая путаница в точном определении «Z-варианта». Например, в интернет-проекте ( RFC 3743) от 2002 года [2] можно найти bù «no» ( U+4E0D不) и ( U+F967不︀), описанные как «варианты шрифта», термин «Z-вариант», по-видимому, зарезервирован для межъязыковых пар, таких как мандаринское китайское tù «кролик» ( U+5154兔) и японское to «кролик» ( U+514E兎). Однако база данных Unihan Консорциума Unicode [3] [ проверка не пройдена – см. обсуждение ] рассматривает обе пары как Z-варианты.