Символы-призраки ( яп .幽霊文字, Хепбёрн : yūrei moji ) — ошибочные кандзи, включённые в Японский промышленный стандарт JIS X 0208. 12 из 6355 символов-кандзи являются символами-призраками.
В 1978 году Министерство торговли и промышленности установило стандарт JIS C 6226 (позднее JIS X 0208 ). Этот стандарт определил 6349 символов как символы кандзи уровня JIS 1 и 2. Этот набор символов кандзи называется «JIS Basic Kanji». В то время в качестве источников использовались следующие четыре списка символов кандзи. [1] : 269f
Во время установления стандарта авторитет каждого символа не был четко указан, и было отмечено, что некоторые символы имели неизвестные значения и примеры использования. Термин «призрачный символ» был образован от « призрачное слово », означающее слово, которое включено в словари, но не имеет практического применения. [2] Наиболее распространенными примерами являются «妛» и «彁». Эти символы никогда не упоминались в словаре Канси или в « Дай Кан-Ва Цзитэн» , всеобъемлющем собрании древних китайских книг о иероглифах.
В 1997 году редакционный комитет пересмотренного стандарта во главе с его председателем Кодзи Шибано и Хироюки Сасахарой из Национального института японского языка и лингвистики исследовал литературу, упомянутую при разработке стандарта 1978 года. Было обнаружено, что многие из символов, которые считались символами-призраками, на самом деле были кандзи, используемыми в топонимах.
Согласно исследованию, до разработки стандарта 1978 года Агентство административного управления составило восемь списков иероглифов кандзи, включая вышеуказанные 1–3, в 1974 году под названием «Частота использования и результаты анализа соответствия иероглифов кандзи для выбора стандартных иероглифов кандзи для обработки административной информации». Он сопровождается списком иероглифов кандзи и их первоисточниками. Результаты этого анализа соответствия, а не первоисточники, были использованы при выборе базовых иероглифов JIS в то время. Из них многие иероглифы-призраки были включены в те, которые основаны на Полном списке административных делений национальных земель и Списке иероглифов кандзи для личных имен компании Nippon Life Insurance Company . В частности, Список иероглифов кандзи для личных имен не имел первоисточника на момент разработки первого стандарта, и его содержание было признано недостаточным. [3]
В ответ на эти результаты Комитет по пересмотру стандартов восстановил издание 1972 года « Полного списка административных единиц национальной земли» по истории его корректуры и проверил все кандзи, встречающиеся в книге, по всем страницам, чтобы подтвердить примеры. Кроме того, в качестве замены Списка иероглифов кандзи для личных имен , который больше не существует, они провели исчерпывающий поиск литературы, включая сравнительное исследование баз данных телефонных справочников NTT и Nippon Telegraph and Telephone Public Corporation и обзор более 30 древних и современных книг иероглифов.
12 символов кандзи остаются неопознанными. 3 из них, по всей видимости, являются опечатками. Возможно, по совпадению, есть восемь символов, которые были перечислены в японском древнем словаре или китайском древнем словаре. Что касается "彁" - это Ка, то никаких конкретных источников не найдено. [1] : 269f
Символы-призраки уже приняты в международных стандартах, таких как Unicode , и изменения в этих стандартах, скорее всего, вызовут проблемы совместимости, что сделает практически невозможным изменение или удаление символов-призраков.
Результаты вышеупомянутого исследования Хироюки Сасахары и др. обобщены в Приложении 7 «Подробное описание местоположений отделений» JIS X 0208:1997. В этом разделе приведены некоторые из них.
JIS X 0208:1997 собирает сведения об источниках 72 персонажей, чьи источники были идентифицированы, в основном те, которые не указаны ни в Dai Kan-Wa Jiten Морохаси, ни в Shin Jigen Кадокавы . Однако сюда также входят персонажи, которые были обнаружены с ошибками в оригинальных источниках.
Список разделителей, прилагаемый в качестве «источника источника» в Приложении 7 к JIS X 0208:1997, содержит 72 символа, но в подробном тексте не указан «鰛(82-60)», который содержит всего 71 символ.
Характер | Адрес | Источник/Использование |
---|---|---|
Да | 52-18 | Примеры можно найти в Национальном справочнике земельных административных округов. 藤垈 (Фудзинута), 相垈 (Айнута), 大垈 (Онута), все в префектуре Яманаси [4] |
彁 | 55-27 | Неправильное прочтение «彊» из-за низкого разрешения при оцифровке. Опубликовано в утреннем выпуске «Асахи Симбун» от 23 февраля 1923 г. (Тайсё 12). |
垉 | 52-21 | Примеры можно найти в Национальном справочнике земельных административных округов. 垉六 (Хороку), префектура Айти [5] |
岾 | 54-19 | Примеры можно найти в Национальном справочнике земельных административных округов. 広岾 (Хирояма), префектура Киото [6] |
恷 | 55-78 | На основе таблицы фамилий Ниппон Сэймэй. Также есть примеры в телефонном справочнике NTT. [7] |
橸 | 60-81 | Словарь японских топонимов. 石橸 (Исидару), префектура Сидзуока . [8] |
汢 | 61-73 | Примеры есть в Национальном справочнике земельных административных округов. 汢の川 (Нутанокава), префектура Коти . [9] |
碵 | 66-83 | На основе таблицы фамилий Ниппон Сэймэй. Также есть примеры в телефонном справочнике NTT. [10] |
穃 | 67-46 | Пример использования есть в Национальном справочнике земельных административных округов, но это опечатка в оригинальном источнике. 穃原 (Youbaru, 榕原) в префектуре Окинава . [11] |
粐 | 68-68 | Примеры можно найти в Национальном справочнике земельных административных округов. 粐蒔沢 (Нукамакидзава), префектура Акита . [12] |
粭 | 68-70 | Примеры можно найти в Национальном справочнике земельных административных округов. 粭島 (Сукумодзима), префектура Ямагути . [13] |
粫 | 68-72 | Пример есть в Национальном справочнике земельных административных округов, но это опечатка в первоисточнике. 粫田 (Уручида, 糯田) в префектуре Фукусима . [13] |
糘 | 68-84 | Примеры можно найти в Национальном справочнике земельных административных округов. 糘尻 (Sukumojiri), префектура Хиросима . [14] |
膤 | 71-19 | Примеры имеются в Национальном справочнике земельных административных округов. 膤割 (Юкивари), префектура Кумамото . [14] |
軅 | 77-32 | Пример есть в Национальном справочнике земельных административных округов, но его не существует. 軅飛 (Такатобу), префектура Фукусима . [15] |
鍄 | 78-93 | Примеры можно найти в Национальном справочнике земельных административных округов. 小鍄 (Когасугай), префектура Ямагата . [16] |
鵈 | 82-94 | Пример есть в Национальном справочнике земельных административных округов, но это опечатка в первоисточнике. 鵈沢 (Мисагосава, 鵃沢), префектура Фукусима . [17] |
В стандарте JIS X 0208:1997 12 символов в таблице ниже рассматриваются как «Авторство неизвестно», «Неизвестно» или «Неидентифицируемо», поскольку неизвестно, какой из четырех вышеупомянутых списков кандзи является источником этих символов.
Поскольку призрачные символы — это «кандзи, которых не существует», их значения приведены «для удобства».
Характер | Код | Предполагаемое произношение | Источник | Другие выступления |
---|---|---|---|---|
墸 | 52-55 | チョ cho | Происхождение неизвестно. [18] | Это есть в сокращении Цзиюнь , но, возможно, текст написан неправильно. [19] |
壥 | 52-63 | デン ден | Происхождение неизвестно. Возможно, опечатка "㕓". [20] | Написано в Вагокухен . [21] |
妛 | 54-12 | シ ши | Этот персонаж упоминается в Национальном справочнике земельных административных округов, но его там нет. Возможно, опечатка "𡚴". [22] | Он есть в сокращении Дзикёсю , но, возможно, написан неправильно. [22] |
Да | 57-43 | ウ u トチ точи | Сайт упоминается в Национальном справочнике земель и административных округов, но его там нет. Возможно, это вариант или опечатка "栩" и т. д. [23] | Чжунхуа Цзыхай и др. [24] |
Да | 58-83 | ヒ привет | Сайт упоминается в Национальном справочнике земель и административных округов, но его там нет. Возможно, опечатка "杲" и т. д. [25] | Он встречается в японском «Hokke Sandaibu Nanjiki» , но, возможно, является вариантом или опечаткой «罪». [25] |
椦 | 59-91 | ケン кен | Сайт указан в Национальном справочнике земель и административных округов, но его там нет. Возможно, опечатка "橳" и т. д. [24] | Он встречается в Ицецзин иньи . [26] |
槞 | 60-57 | ル ru ロウ rou | Сайт упоминается в Национальном справочнике земель и административных округов, но его там нет. Возможно, опечатка «境». [27] | 宋元以來俗字譜академии в 1930 году. [28] | («Популярная каллиграфия со времен династий Сун и Юань»), опубликованная Институтом истории и лингвистики Китайской
蟐 | 74-12 | ジョウ jou モム мому | В качестве источника используются основные кандзи для обработки административной информации ( таблица кодов кандзи компании Meiji Mutual Life Insurance Company ), но примеры отсутствуют. | Он встречается в Shinsen Jikyō . [29] |
袮 | 74-57 | ネ ne Да, да | Сайт упоминается в Национальном справочнике земель и административных округов, но его там нет. Возможно, опечатка «祢». [26] | Синсэн Джикё , Руиджу Мёгисё и другие. [30] |
閠 | 79-64 | ギョク gyoku ニン нин | Сайт упоминается в Национальном справочнике земель и административных округов, но его там нет. Возможно, неправильное написание "閏". [31] | Он указан на Guangyun , но, вероятно, это опечатка. [32] |
駲 | 81-50 | シュウ shu ジュン джун | Источником информации является таблица Nihon Seimei Jinmei , но первоисточник недоступен. [33] | Он встречается в « Руйдзю Мёгисё» . [34] |
Предполагается, что некоторые символы неизвестного происхождения были неправильно написаны создателем стандарта.
С момента создания стандарта политика составления словарей заключалась в публикации книг символов, основанных на предположении, что все основные символы JIS Kanji перечислены. Для символов-призраков невозможно ссылаться на прошлые источники. Поэтому их трактовка различалась в зависимости от словарей и отдельных символов следующим образом.
В оборудовании, реализующем основные символы кандзи JIS, им часто присваивается фонетическое чтение. Некоторые словари также перечисляют эти импровизированные чтения. Хироюки Сасахара указывает, что эти чтения могли быть даны на основе исследовательского отчета Ассоциации японской электроники и информационных технологий (1982) и опубликованных материалов NEC (1982) и IBM Japan (1983). [36]
Некоторые относят «駲» к варианту «馴» [37] , а «軅» к варианту «軈». [38] Ни один из этих источников не указывает источник.
Символ "妛" может быть опечаткой очень похожего символа " 𡚴 " (верхняя "山" становится "屮"), и он найден в словаре Dai Kan-Wa Jiten и Kangxi . [39] Это также представлено в обзоре JIS X 0208:1997 с примером неявного слияния с авторитетным источником. Эти два символа также объединены в одну и ту же кодовую точку в Unicode .
Поскольку «竜» — это вариант «龍», существует интерпретация, что «槞» — это вариант «櫳». [28] Некоторые словари считают «鵈»="耳(ухо)"+"鳥(птица)» иероглифом, обозначающим чёрных коршунов . [40]
После публикации результатов вышеуказанного исследования, эти содержания были в целом приняты в словарях. Dai Kan-Wa Jiten опубликовал дополнительный том в 2000 году; буквы 垈, 垉, 岾, 橸, 汢, 粭, 糘, 膤, 軅 и 鵈 были записаны там. [41] А Shin Jigen (Новый источник символов) Кадокавы был пересмотрен в 2017 году, чтобы включить все стандарты JIS с первого по четвертый, включая персонажей-призраков. [42]
Юникод 1.1 | JIS X 0208 (Япония) | GB2312 (материковый Китай) | CNS 11643 (Китайская Республика на Тайване) | KS C 5601 (Южная Корея) |
---|---|---|---|---|
妛 U+599B | 妛 (562C) | 妛 (265A) | 妛 (2553) | - |
U+ 95A0 | 閠 (6F60) | ( 4368 ) | ( 457B ) | - |
岾 U+5CBE | 岾 (5633) | 岾 (7D5A) | - | 岾 (6F40) |
Поскольку китайские иероглифы (включая японские кандзи ) использовались в странах Восточной Азии с древних времен и передавались в основном посредством рукописного письма, появились иероглифы с немного отличающимися стилями письма от страны к стране или в пределах одной страны, так называемые вариантные китайские иероглифы . Unicode не принял все вариации, и иероглифы с небольшими различиями были включены и зарегистрированы. [44]
С другой стороны, объединение простых частей китайских иероглифов для создания другого иероглифа также делалось в разных странах и регионах. В результате одни и те же китайские иероглифы могут быть изобретены в разных странах по совпадению с разными (иногда идентичными) значениями. [45]
Как упоминалось выше, предполагается, что японский символ-призрак "妛" изначально был просто "𡚴", что является комбинацией "山" и "女", но со случайным "一" между ними. С другой стороны, в Китае есть китайский символ "妛", который является комбинацией "屮", "一" и "女", который также является вариантом "媸". Однако в Unicode "妛", который изначально не существовал в Японии, был охвачен, потому что он оказался похож на "妛". [44] Более того, японский символ "妛", что является ошибкой, был зарегистрирован как символ Unicode. [46]
Также японский иероглиф-призрак «閠» (нижняя часть — «玉») считается неправильным написанием «閏» (нижняя часть — «王»). (В рукописи XVI века японского Вагокухэна XV века также есть иероглиф «閠», но это единственный пример.) С другой стороны, китайский иероглиф в Китае «閠» — это своего рода вариант «閏», который не является неправильным написанием. [31] Это также было унифицировано в Unicode. [43]
Некоторые полагают, что японский иероглиф-призрак «岾» — это кокудзи (уникальный японский кандзи), означающий лысые горы, и изначально был неправильным написанием «岵». В Корее, однако, этот иероглиф был создан как китайский иероглиф, означающий горный перевал . [47] Это также было унифицировано в Unicode. [43]
С момента публикации стандарта появились примеры символов-призраков и их широкое использование.
«祢宜», титул заместителя управляющего японским храмом, иногда неправильно используется как «袮宜» (используется радикал衣вместо правильного示). В некоторых случаях японская фамилия «栩谷» ошибочно принимается за «挧谷» (используется радикал手вместо правильного木). [1] : 292, 304 Японский фольклорист Мотодзи Нива ввел в свою книгу фамилию «妛芸凡» (Акиоси). [2] [48]
База данных Асахи Симбун содержала имя «埼玉自彊会», напечатанное в выпуске «Асахи Симбун» от 23 февраля 1923 года , но когда оно было оцифровано, оно было неправильно помечено как «埼玉自彁会». Теперь это исправлено. [49]
Японский токусацу -сериал Gosei Sentai Dairanger представляет персонажа по имени "嘉挧" (Каку). Имя взято у древнего китайского государственного деятеля Цзя Сюй (賈詡), но персонажи были заменены персонажами-призраками, поскольку персонаж "詡" не зарегистрирован в JIS X 0208 .
Книга 5A73 японского писателя-детектива Юдзи Ёмисаки начинается с серии убийств, на телах жертв которых написан иероглиф «暃». [50]
Музыкальная игра Beatmania IIDX включает песню под названием «閠槞彁の願い», в которой используются персонажи-призраки. Судя по комментариям к песне, ее произношение «непроизносимо для людей» и предварительно называется «Gyokurōka no Negai» (ぎょくろうかのねがい), что является атэджи- чтением персонажей-призраков. [51]
Унифицированные идеограммы CJK Unicode также содержат символы, история включения которых неизвестна, и иногда их также называют «символами-призраками». Например, было отмечено, что символ «螀» (U+8780), который также был зарегистрирован в Unicode, поскольку он был включен в CCITT Chinese Primary Set , может быть типографской ошибкой, которая была принята без достаточной проверки источника. [52]
U+237C ⍼ ПРЯМОЙ УГОЛ С ЗИГЗАГООБРАЗНОЙ СТРЕЛКОЙ ВНИЗ был добавлен Monotype Imaging в свои математические наборы в 1972 году по неизвестным причинам. С тех пор он был включен в Unicode.
В блоке совместимости CJK Unicode 1.0 есть квадратная версия японского слова « бат », написанная катаканой . [53] Японское слово «бат» —バーツ( bā tsu ). Однако ссылочный глиф ⟨㌬⟩ и имя символа соответствуютパーツ( pā tsu , от английского «parts»). [53] Кодовая точка CJK, U+332C ㌬ SQUARE PAATU , задокументирована в последующих версиях стандарта как «ошибочное, неиспользуемое представление», и пользователи вместо этого направляются к U+0E3F฿THAI CURRENCY SYMBOL BAHT . [54] Следовательно, только несколько компьютерных шрифтов имеют какое-либо содержимое для этой кодовой точки, и ее использование устарело. [53]