Персонажи-призраки

Ошибочный кандзи

Символы-призраки ( яп .幽霊文字, Хепбёрн : yūrei moji ) — ошибочные кандзи, включённые в Японский промышленный стандарт JIS X 0208. 12 из 6355 символов-кандзи являются символами-призраками.

Обзор

Адресный знак Акенбары (𡚴原, Оаза-Кавачи 大字河内, Тага-Таун多賀町). Призрачный кандзи «妛» может быть ошибкой в ​​написании «𡚴».

В 1978 году Министерство торговли и промышленности установило стандарт JIS C 6226 (позднее JIS X 0208 ). Этот стандарт определил 6349 символов как символы кандзи уровня JIS 1 и 2. Этот набор символов кандзи называется «JIS Basic Kanji». В то время в качестве источников использовались следующие четыре списка символов кандзи. [1] : 269f 

  1. Таблица кандзи для стандартных кодов (проект): Комитет по кодам кандзи IPSJ (1971)
  2. Национальный справочник земельных административных округов: Географическое общество Японии (1972)
  3. Таблица фамилий Ниппон Сэймэй: Nippon Life (1973, не сохранилась)
  4. Базовые кандзи для обработки административной информации: Административное агентство управления (1975)

Во время установления стандарта авторитет каждого символа не был четко указан, и было отмечено, что некоторые символы имели неизвестные значения и примеры использования. Термин «призрачный символ» был образован от « призрачное слово », означающее слово, которое включено в словари, но не имеет практического применения. [2] Наиболее распространенными примерами являются «妛» и «彁». Эти символы никогда не упоминались в словаре Канси или в « Дай Кан-Ва Цзитэн» , всеобъемлющем собрании древних китайских книг о иероглифах.

В 1997 году редакционный комитет пересмотренного стандарта во главе с его председателем Кодзи Шибано и Хироюки Сасахарой ​​из Национального института японского языка и лингвистики исследовал литературу, упомянутую при разработке стандарта 1978 года. Было обнаружено, что многие из символов, которые считались символами-призраками, на самом деле были кандзи, используемыми в топонимах.

Согласно исследованию, до разработки стандарта 1978 года Агентство административного управления составило восемь списков иероглифов кандзи, включая вышеуказанные 1–3, в 1974 году под названием «Частота использования и результаты анализа соответствия иероглифов кандзи для выбора стандартных иероглифов кандзи для обработки административной информации». Он сопровождается списком иероглифов кандзи и их первоисточниками. Результаты этого анализа соответствия, а не первоисточники, были использованы при выборе базовых иероглифов JIS в то время. Из них многие иероглифы-призраки были включены в те, которые основаны на Полном списке административных делений национальных земель и Списке иероглифов кандзи для личных имен компании Nippon Life Insurance Company . В частности, Список иероглифов кандзи для личных имен не имел первоисточника на момент разработки первого стандарта, и его содержание было признано недостаточным. [3]

В ответ на эти результаты Комитет по пересмотру стандартов восстановил издание 1972 года « Полного списка административных единиц национальной земли» по истории его корректуры и проверил все кандзи, встречающиеся в книге, по всем страницам, чтобы подтвердить примеры. Кроме того, в качестве замены Списка иероглифов кандзи для личных имен , который больше не существует, они провели исчерпывающий поиск литературы, включая сравнительное исследование баз данных телефонных справочников NTT и Nippon Telegraph and Telephone Public Corporation и обзор более 30 древних и современных книг иероглифов.

12 символов кандзи остаются неопознанными. 3 из них, по всей видимости, являются опечатками. Возможно, по совпадению, есть восемь символов, которые были перечислены в японском древнем словаре или китайском древнем словаре. Что касается "彁" - это Ка, то никаких конкретных источников не найдено. [1] : 269f 

Символы-призраки уже приняты в международных стандартах, таких как Unicode , и изменения в этих стандартах, скорее всего, вызовут проблемы совместимости, что сделает практически невозможным изменение или удаление символов-призраков.

Список персонажей-призраков

Результаты вышеупомянутого исследования Хироюки Сасахары и др. обобщены в Приложении 7 «Подробное описание местоположений отделений» JIS X 0208:1997. В этом разделе приведены некоторые из них.

JIS X 0208:1997 собирает сведения об источниках 72 персонажей, чьи источники были идентифицированы, в основном те, которые не указаны ни в Dai Kan-Wa Jiten Морохаси, ни в Shin Jigen Кадокавы . Однако сюда также входят персонажи, которые были обнаружены с ошибками в оригинальных источниках.

Список разделителей, прилагаемый в качестве «источника источника» в Приложении 7 к JIS X 0208:1997, содержит 72 символа, но в подробном тексте не указан «鰛(82-60)», который содержит всего 71 символ.

Персонажи-призраки и их источники примеров
ХарактерАдресИсточник/Использование
Да52-18Примеры можно найти в Национальном справочнике земельных административных округов. 藤垈 (Фудзинута), 相垈 (Айнута), 大垈 (Онута), все в префектуре Яманаси [4]
55-27Неправильное прочтение «彊» из-за низкого разрешения при оцифровке. Опубликовано в утреннем выпуске «Асахи Симбун» от 23 февраля 1923 г. (Тайсё 12).
52-21Примеры можно найти в Национальном справочнике земельных административных округов. 垉六 (Хороку), префектура Айти [5]
54-19Примеры можно найти в Национальном справочнике земельных административных округов. 広岾 (Хирояма), префектура Киото [6]
55-78На основе таблицы фамилий Ниппон Сэймэй. Также есть примеры в телефонном справочнике NTT. [7]
60-81Словарь японских топонимов. 石橸 (Исидару), префектура Сидзуока . [8]
61-73Примеры есть в Национальном справочнике земельных административных округов. 汢の川 (Нутанокава), префектура Коти . [9]
66-83На основе таблицы фамилий Ниппон Сэймэй. Также есть примеры в телефонном справочнике NTT. [10]
67-46Пример использования есть в Национальном справочнике земельных административных округов, но это опечатка в оригинальном источнике. 穃原 (Youbaru, 榕原) в префектуре Окинава . [11]
68-68Примеры можно найти в Национальном справочнике земельных административных округов. 粐蒔沢 (Нукамакидзава), префектура Акита . [12]
68-70Примеры можно найти в Национальном справочнике земельных административных округов. 粭島 (Сукумодзима), префектура Ямагути . [13]
68-72Пример есть в Национальном справочнике земельных административных округов, но это опечатка в первоисточнике. 粫田 (Уручида, 糯田) в префектуре Фукусима . [13]
68-84Примеры можно найти в Национальном справочнике земельных административных округов. 糘尻 (Sukumojiri), префектура Хиросима . [14]
71-19Примеры имеются в Национальном справочнике земельных административных округов. 膤割 (Юкивари), префектура Кумамото . [14]
77-32Пример есть в Национальном справочнике земельных административных округов, но его не существует. 軅飛 (Такатобу), префектура Фукусима . [15]
78-93Примеры можно найти в Национальном справочнике земельных административных округов. 小鍄 (Когасугай), префектура Ямагата . [16]
82-94Пример есть в Национальном справочнике земельных административных округов, но это опечатка в первоисточнике. 鵈沢 (Мисагосава, 鵃沢), префектура Фукусима . [17]

Неизвестные источники

В стандарте JIS X 0208:1997 12 символов в таблице ниже рассматриваются как «Авторство неизвестно», «Неизвестно» или «Неидентифицируемо», поскольку неизвестно, какой из четырех вышеупомянутых списков кандзи является источником этих символов.

Поскольку призрачные символы — это «кандзи, которых не существует», их значения приведены «для удобства».

ХарактерКодПредполагаемое произношениеИсточникДругие выступления
52-55チョ choПроисхождение неизвестно. [18]Это есть в сокращении Цзиюнь , но, возможно, текст написан неправильно. [19]
52-63デン денПроисхождение неизвестно. Возможно, опечатка "㕓". [20]Написано в Вагокухен . [21]
54-12シ шиЭтот персонаж упоминается в Национальном справочнике земельных административных округов, но его там нет. Возможно, опечатка "𡚴". [22]Он есть в сокращении Дзикёсю , но, возможно, написан неправильно. [22]
Да57-43ウ u

トチ точи

Сайт упоминается в Национальном справочнике земель и административных округов, но его там нет. Возможно, это вариант или опечатка "栩" и т. д. [23]Чжунхуа Цзыхай и др. [24]
Да58-83ヒ приветСайт упоминается в Национальном справочнике земель и административных округов, но его там нет. Возможно, опечатка "杲" и т. д. [25]Он встречается в японском «Hokke Sandaibu Nanjiki» , но, возможно, является вариантом или опечаткой «罪». [25]
59-91ケン кенСайт указан в Национальном справочнике земель и административных округов, но его там нет. Возможно, опечатка "橳" и т. д. [24]Он встречается в Ицецзин иньи . [26]
60-57ル ru

ロウ rou

Сайт упоминается в Национальном справочнике земель и административных округов, но его там нет. Возможно, опечатка «境». [27]宋元以來俗字譜 [ж; ja] («Популярная каллиграфия со времен династий Сун и Юань»), опубликованная Институтом истории и лингвистики Китайской академии в 1930 году. [28]
74-12ジョウ jou

モム мому

В качестве источника используются основные кандзи для обработки административной информации ( таблица кодов кандзи компании Meiji Mutual Life Insurance Company ), но примеры отсутствуют.Он встречается в Shinsen Jikyō . [29]
74-57ネ ne

Да, да

Сайт упоминается в Национальном справочнике земель и административных округов, но его там нет. Возможно, опечатка «祢». [26]Синсэн Джикё , Руиджу Мёгисё и другие. [30]
79-64ギョク gyoku

ニン нин

Сайт упоминается в Национальном справочнике земель и административных округов, но его там нет. Возможно, неправильное написание "閏". [31]Он указан на Guangyun , но, вероятно, это опечатка. [32]
81-50シュウ shu

ジュン джун

Источником информации является таблица Nihon Seimei Jinmei , но первоисточник недоступен. [33]Он встречается в « Руйдзю Мёгисё» . [34]

Возможные опечатки

Предполагается, что некоторые символы неизвестного происхождения были неправильно написаны создателем стандарта.

  • Возможно, что «壥» было написано неправильно, поскольку «㕓», который похож на «壥», не включен в базовый кандзи JIS. «㕓» также не включен в JIS X 0213 .
  • Возможно, что «妛» было написано неправильно, потому что «𡚴», которое похоже на «妛», не включено в JIS Basic Kanji. В Национальном указателе земельных административных округов, источнике этого документа, есть теневой отпечаток на накладке, который, по-видимому, был создан путем вырезания и склеивания частей разных символов при создании блока, и предполагается, что это было ошибочно транскрибировано как горизонтальная черта. [1] : 288, 289f, 292  [35]
  • Возможно, что «椦» было написано неправильно, поскольку «橳», которое похоже на «椦», не включено в базовый набор кандзи JIS.

Трактовка в словарях

С момента создания стандарта политика составления словарей заключалась в публикации книг символов, основанных на предположении, что все основные символы JIS Kanji перечислены. Для символов-призраков невозможно ссылаться на прошлые источники. Поэтому их трактовка различалась в зависимости от словарей и отдельных символов следующим образом.

Временные показания назначены

В оборудовании, реализующем основные символы кандзи JIS, им часто присваивается фонетическое чтение. Некоторые словари также перечисляют эти импровизированные чтения. Хироюки Сасахара указывает, что эти чтения могли быть даны на основе исследовательского отчета Ассоциации японской электроники и информационных технологий (1982) и опубликованных материалов NEC (1982) и IBM Japan (1983). [36]

Рассматриваются как вариации схожих персонажей

Некоторые относят «駲» к варианту «馴» [37] , а «軅» к варианту «軈». [38] Ни один из этих источников не указывает источник.

Символ "妛" может быть опечаткой очень похожего символа " 𡚴 " (верхняя "山" становится "屮"), и он найден в словаре Dai Kan-Wa Jiten и Kangxi . [39] Это также представлено в обзоре JIS X 0208:1997 с примером неявного слияния с авторитетным источником. Эти два символа также объединены в одну и ту же кодовую точку в Unicode .

Индивидуальные интерпретации

Поскольку «竜» — это вариант «龍», существует интерпретация, что «槞» — это вариант «櫳». [28] Некоторые словари считают «鵈»="耳(ухо)"+"鳥(птица)» иероглифом, обозначающим чёрных коршунов . [40]

Объяснено как неизвестное

После публикации результатов вышеуказанного исследования, эти содержания были в целом приняты в словарях. Dai Kan-Wa Jiten опубликовал дополнительный том в 2000 году; буквы 垈, 垉, 岾, 橸, 汢, 粭, 糘, 膤, 軅 и 鵈 были записаны там. [41] А Shin Jigen (Новый источник символов) Кадокавы был пересмотрен в 2017 году, чтобы включить все стандарты JIS с первого по четвертый, включая персонажей-призраков. [42]

Останки персонажа

Национальные стандарты [43]
Юникод 1.1JIS X 0208
(Япония)
GB2312
(материковый Китай)
CNS 11643
(Китайская Республика на Тайване)
KS C 5601
(Южная Корея)

U+599B

(562C)

(265A)

(2553)
-

U+ 95A0

(6F60)
( 4368
)
( 457B
)
-

U+5CBE

(5633)

(7D5A)
-
(6F40)

Поскольку китайские иероглифы (включая японские кандзи ) использовались в странах Восточной Азии с древних времен и передавались в основном посредством рукописного письма, появились иероглифы с немного отличающимися стилями письма от страны к стране или в пределах одной страны, так называемые вариантные китайские иероглифы . Unicode не принял все вариации, и иероглифы с небольшими различиями были включены и зарегистрированы. [44]

С другой стороны, объединение простых частей китайских иероглифов для создания другого иероглифа также делалось в разных странах и регионах. В результате одни и те же китайские иероглифы могут быть изобретены в разных странах по совпадению с разными (иногда идентичными) значениями. [45]

Как упоминалось выше, предполагается, что японский символ-призрак "妛" изначально был просто "𡚴", что является комбинацией "山" и "女", но со случайным "一" между ними. С другой стороны, в Китае есть китайский символ "", который является комбинацией "屮", "一" и "女", который также является вариантом "媸". Однако в Unicode "妛", который изначально не существовал в Японии, был охвачен, потому что он оказался похож на "". [44] Более того, японский символ "妛", что является ошибкой, был зарегистрирован как символ Unicode. [46]

Также японский иероглиф-призрак «閠» (нижняя часть — «玉») считается неправильным написанием «閏» (нижняя часть — «王»). (В рукописи XVI века японского Вагокухэна XV века также есть иероглиф «閠», но это единственный пример.) С другой стороны, китайский иероглиф в Китае «閠» — это своего рода вариант «閏», который не является неправильным написанием. [31] Это также было унифицировано в Unicode. [43]

Некоторые полагают, что японский иероглиф-призрак «岾» — это кокудзи (уникальный японский кандзи), означающий лысые горы, и изначально был неправильным написанием «岵». В Корее, однако, этот иероглиф был создан как китайский иероглиф, означающий горный перевал . [47] Это также было унифицировано в Unicode. [43]

Современное использование

С момента публикации стандарта появились примеры символов-призраков и их широкое использование.

«宜», титул заместителя управляющего японским храмом, иногда неправильно используется как «宜» (используется радикалвместо правильного). В некоторых случаях японская фамилия «谷» ошибочно принимается за «谷» (используется радикалвместо правильного). [1] : 292, 304  Японский фольклорист Мотодзи Нива ввел в свою книгу фамилию «妛芸凡» (Акиоси). [2] [48]

База данных Асахи Симбун содержала имя «埼玉自彊会», напечатанное в выпуске «Асахи Симбун» от 23 февраля 1923 года , но когда оно было оцифровано, оно было неправильно помечено как «埼玉自会». Теперь это исправлено. [49]

Примеры использования в художественной литературе

Японский токусацу -сериал Gosei Sentai Dairanger представляет персонажа по имени "嘉挧" (Каку). Имя взято у древнего китайского государственного деятеля Цзя Сюй (賈詡), но персонажи были заменены персонажами-призраками, поскольку персонаж "詡" не зарегистрирован в JIS X 0208 .

Книга 5A73 японского писателя-детектива Юдзи Ёмисаки начинается с серии убийств, на телах жертв которых написан иероглиф «暃». [50]

Музыкальная игра Beatmania IIDX включает песню под названием «閠槞彁の願い», в которой используются персонажи-призраки. Судя по комментариям к песне, ее произношение «непроизносимо для людей» и предварительно называется «Gyokurōka no Negai» (ぎょくろうかのねがい), что является атэджи- чтением персонажей-призраков. [51]

Похожие случаи в Unicode

Унифицированные идеограммы CJK Unicode также содержат символы, история включения которых неизвестна, и иногда их также называют «символами-призраками». Например, было отмечено, что символ «螀» (U+8780), который также был зарегистрирован в Unicode, поскольку он был включен в CCITT Chinese Primary Set , может быть типографской ошибкой, которая была принята без достаточной проверки источника. [52]

U+237C ПРЯМОЙ УГОЛ С ЗИГЗАГООБРАЗНОЙ СТРЕЛКОЙ ВНИЗ был добавлен Monotype Imaging в свои математические наборы в 1972 году по неизвестным причинам. С тех пор он был включен в Unicode.

В блоке совместимости CJK Unicode 1.0 есть квадратная версия японского слова « бат », написанная катаканой . [53] Японское слово «бат» —ーツ( tsu ). Однако ссылочный глиф ⟨㌬⟩ и имя символа соответствуютーツ( tsu , от английского «parts»). [53] Кодовая точка CJK, U+332CSQUARE PAATU , задокументирована в последующих версиях стандарта как «ошибочное, неиспользуемое представление», и пользователи вместо этого направляются к U+0E3F฿THAI CURRENCY SYMBOL BAHT . [54] Следовательно, только несколько компьютерных шрифтов имеют какое-либо содержимое для этой кодовой точки, и ее использование устарело. [53]

Ссылки

  1. ^ абвг 7 ビット及び8ビットの2バイト情報交換用符号化漢字集合[ 7-битный и 8-битный 2-байтовый набор кандзи для обмена информацией ] (на японском языке). Японская ассоциация стандартов . 1997.
  2. ^ ab 笹原宏之 (Хироюки Сасахара) (2007). 国字の位相展開[ Этапы и развитие национальной письменности ] (на японском языке). Сансэйдо . С. 212, 788. ISBN 978-4-385-36263-2.
  3. ^ 笹原宏之 (Хироюки Сасахара) (9 апреля 2019 г.). 第9回 民間の名字ランキング ——日本に多い名字とは?(4) [Том. 9: Рейтинг фамилий в частном секторе. Какие фамилии в Японии наиболее распространены? (4)]. Тайшукан (на японском языке) . Проверено 3 сентября 2023 г.
  4. ^ Сасахара 2007, стр. 780.
  5. ^ Сасахара 2007, стр. 781.
  6. ^ Сасахара 2007, стр. 789.
  7. ^ Сасахара 2007, стр. 826.
  8. ^ Сасахара 2007, стр. 133.
  9. ^ Сасахара 2007, стр. 799.
  10. ^ Сасахара 2007, стр. 827.
  11. ^ Сасахара 2007, стр. 801.
  12. ^ Сасахара 2007, стр. 803.
  13. ^ ab Sasahara 2007, стр. 804.
  14. ^ ab Sasahara 2007, стр. 805.
  15. ^ Сасахара 2007, стр. 808.
  16. ^ Сасахара 2007, стр. 810.
  17. ^ Сасахара 2007, стр. 811.
  18. ^ Сасахара 2007, стр. 834.
  19. ^ Сасахара 2007, стр. 835.
  20. ^ Сасахара 2007, стр. 836.
  21. ^ Сасахара 2007, стр. 837.
  22. ^ ab Sasahara 2007, стр. 786.
  23. ^ Сасахара 2007, стр. 137.
  24. ^ ab Sasahara 2007, стр. 138.
  25. ^ ab Sasahara 2007, стр. 130.
  26. ^ ab Sasahara 2007, стр. 140.
  27. ^ Сасахара 2007, стр. 797.
  28. ^ ab Sasahara 2007, стр. 798.
  29. ^ Сасахара 2007, стр. 839.
  30. ^ Сасахара 2007, стр. 143.
  31. ^ ab Sasahara 2007, стр. 124.
  32. ^ Сасахара 2007, стр. 125.
  33. ^ Сасахара 2007, стр. 830.
  34. ^ Сасахара 2007, стр. 831.
  35. ^ 笹原宏之 (Хироюки Сасахара) (2006). 日本の漢字[ Японское кандзи ]. Иванами Синсё (на японском языке). Иванами Шотен . п. 82. ИСБН 4-00-430991-3.
  36. ^ 比留間直和 (Наокадзу Хирума) (22 августа 2011 г.). 幽霊文字の読み、どこから — 変換辞書のはなし5 [Откуда берутся персонажи-призраки?]. Асахи Симбун (на японском языке) . Проверено 24 сентября 2023 г.
  37. ^ 戸川芳郎 (Ёсио Тогава) (2016). 漢辞海(на японском языке) (4-е изд.). Сансейдо . ISBN 978-438-5-14048-3.
  38. ^ 鎌田正, 米山寅太郎 (Тадаши Камада и Торатаро Ёнеяма) (2011). Переводчик Google(на японском языке) (2-е изд.). Тайшукан Шотэн. ISBN 978-446-9-03163-8.
  39. ^ Изуру, Синмура (1998). Кодзиен (на японском языке) (5-е изд.). Иванами Шотен . ISBN 978-400-0-80111-9.
  40. ^ Сасахара 2007, стр. 812.
  41. ^ "文字情報基盤検索システム / 垈" [Система поиска информации о персонажах / 垈]. 文字情報技術促進協議会. Проверено 30 июня 2024 г.
  42. ^ "全面改訂で『新字源』のここが進化" [ Син Джиген эволюционировал в этом полностью переработанном издании.]. 角川書店. Архивировано из оригинала 16 апреля 2024 года . Проверено 30 июня 2024 г.
  43. ^ abc "ISO/IEC 10646:2003 (E)" (PDF) . Получено 27 июня 2024 г. .
  44. ^ аб Икеда, Сёдзю (1 октября 2003 г.). «篆隷万象名義 データベースの改訂» [Пересмотр базы данных Тенрей Бансё Мэйги ] (PDF) . Журнал ЖАЭТ . 4 : 4–11 .Проверено 29 июня 2024 г.
  45. Сасахара, Хироюки (25 марта 2019 г.). «字体に生じる偶然の一致: 「JIS X0208」と他文献における字体の「暗合」と「衝突」» [Совпадение в Глифы: Глифы в «JIS X0208» и другой литературе «Смысл» и «Конфликт».].日本語科学. 1 : 7–24 .Проверено 29 июня 2024 г.
  46. ^ "Стандарт Unicode / Версия 15.1.0 Индекс радикальных штрихов" (PDF) . Unicode, Inc. 2023 . Получено 29 июня 2024 .
  47. ^ Сасахара 2007, стр. 790.
  48. ^ 丹羽基二 (Мотодзи Нива) (1998). Русский: 2[ Без фамилии 2 ] (на японском). Houbunkan. стр. 165. ISBN 978-4-990-05847-0.
  49. ^ 比留間 直和 (Наокадзу Хирума) (5 сентября 2011 г.). 大正十二年の幽霊文字 [Персонажи-призраки 1923 года] (на японском языке) . Проверено 10 сентября 2023 г.
  50. ^ 詠坂雄二 (Юдзи Ёмисака) (2022). 5А73 (на японском языке). Кобунша . ISBN 9784334914745.
  51. ^ «Электронные развлечения» 閠槞彁の願い. Beatmania IIDX 28 БИСТРОВЕР (на японском языке) . Проверено 10 сентября 2023 г.
  52. ^ Ясуока, Коичи; Ясуока, Мотоко (1997). 「唡」はなぜJIS X 0221に含まれているのか —Unicode幽霊字研究— [Почему «唡» включено в JIS X 0221?] (PDF) (на японском языке). Общество обработки информации Японии .
  53. ^ abc Lunde, Ken (26 марта 2016 г.). "CJK Type | CJK Fonts, Character Sets & Encodings. All CJK. All of the time". Adobe Inc. Архивировано из оригинала 29 июня 2016 г.
  54. ^ "CJK-совместимость 3300–33FF" (PDF) . Стандарт Unicode, версия 15.1 . стр. 3327–334C.
  • Сасахара, Хироюки (2007).国字の位相と展開[ Фазы и развитие национального сертификата ] (на японском языке). Сансейдо . ISBN 978-4-385-36263-2.
Взято с "https://en.wikipedia.org/w/index.php?title=Призрачные_персонажи&oldid=1269425442"