Расширение имени файла | .ged |
---|---|
Тип интернет-СМИ | приложение/vnd.familysearch.gedcom [1] приложение/vnd.familysearch.gedcom+zip [1] |
Разработано | СПД ФХД |
Первоначальный выпуск | 1984 ( 1984 ) |
Последний релиз | 7.0.14 8 февраля 2024 г. [2] ( 2024-02-08 ) |
Тип формата | Обмен генеалогическими данными |
Стандарт | Де-факто [3] |
Открытый формат ? | да |
Свободный формат ? | нет |
Веб-сайт | gedcom.io github.com/familysearch/GEDCOM |
FamilySearch GEDCOM , или просто GEDCOM ( / ˈdʒɛdkɒm / JED -kom , аббревиатура от Genealogical Data Communication ), является открытым форматом файла и стандартной спецификацией де-факто для хранения генеалогических данных. [ 3] Он был разработан Церковью Иисуса Христа Святых последних дней ( LDS, также известной как Церковь мормонов), операторами FamilySearch , для помощи в исследовании и обмене генеалогической информацией. [4] Обычно используется как стандартный формат для резервного копирования и передачи данных генеалогического древа между различным генеалогическим программным обеспечением и веб-сайтами , большинство из которых поддерживают импорт из формата GEDCOM и экспорт в него. [5]
GEDCOM определяется как простой текстовый файл, использующий кодировку UTF-8 , начиная с версии 7.0. Этот файл содержит генеалогическую информацию о людях, такую как имена, события и отношения; метаданные связывают эти записи вместе.
GEDCOM 7.0, выпущенный в 2021 году, является последней версией спецификации GEDCOM по состоянию на июль 2024 года [обновлять]. [6] Однако его предшественник, GEDCOM 5.5.1, остается отраслевым стандартом формата для обмена генеалогическими данными. [ требуется ссылка ] Впервые выпущенный в качестве проекта стандарта в 1999 году, GEDCOM 5.5.1 получил лишь незначительные обновления в последующие 20 лет, приведшие к выпуску финальной версии 5.5.1 в 2019 году. Чтобы устранить его недостатки, некоторые генеалогические программы ввели фирменные расширения GEDCOM, которые не всегда распознаются другими программами, такими как GEDCOM 5.5 EL (Extended Locations). [7] [8] [9] Были предприняты усилия для более широкого принятия 7.0 с момента его выпуска. FamilySearch планирует стать совместимым с GEDCOM 7.0 в третьем квартале 2022 года, а Ancestry.com планирует совместимость с 7.0, но пока не указала дату внедрения. [ необходима цитата ]
GEDCOM использует модель данных, связанную с родословной, основанную на концептуальной модели нуклеарной семьи . Таким образом, тип записи «семья» ( FAM
) является единственным источником связей между лицами ( INDI
) в файле, назначая родителей (как HUSB
и WIFE
) и детей (как ) путем ссылки на уникальные идентификационные номера CHIL
лиц . [10] Эти исторические истоки описаны в документе спецификации 7.0: « Изначально запись была структурирована для представления семей, в которых мужчина (муж или отец) и женщина (жена или мать) производят (детей)». [11]FAM
HUSB
WIFE
CHIL
Хотя ссылки в семейной записи GEDCOM по-прежнему используют исходное наименование, указывающее на мужа и жену, спецификация теперь гласит, что «пол, гендер, титулы и роли партнеров не должны выводиться на основе партнера, на которого указывает структура HUSB
or WIFE
», и что эти лица в семейной структуре совместно именуются «партнерами», «родителями» или «супругами». Запись FAM
также может использоваться для «сожительства, воспитания, усыновления и т. д., независимо от пола партнеров». [11]
Файл GEDCOM состоит из раздела заголовка , записей и раздела трейлера . В этих разделах записи представляют людей (запись INDI), семьи (записи FAM), источники информации (записи SOUR) и другие разнообразные записи, включая заметки. Каждая строка файла GEDCOM начинается с номера уровня, где все записи верхнего уровня (HEAD, TRLR, SUBN и каждая INDI, FAM, OBJE, NOTE, REPO, SOUR и SUBM) начинаются со строки с уровнем 0, в то время как другие номера уровней являются положительными целыми числами .
Хотя можно написать файл GEDCOM вручную, этот формат был разработан для использования с программным обеспечением и, таким образом, не особенно удобен для человека. Валидатор GEDCOM [12] , который может использоваться для проверки структуры файла GEDCOM, включен как часть проекта PhpGedView , хотя он не предназначен для использования в качестве отдельного валидатора. Для отдельной валидации можно использовать "The Windows GEDCOM Validator" [13] или более старый неподдерживаемый Gedcheck [14] от Церкви СПД.
В 2001 году проект GEDCOM TestBook оценил, насколько хорошо четыре популярные генеалогические программы соответствуют стандарту GEDCOM 5.5 с помощью программы Gedcheck. [15] Результаты показали, что существует ряд проблем и что «наиболее часто встречающейся ошибкой, приводящей к потере данных, была невозможность прочитать тег NOTE на всех возможных уровнях, на которых он может появиться». [16] В 2005 году была оценена карта отчетов по генеалогическому программному обеспечению (Биллом Мамфордом, который участвовал в первоначальном проекте GEDCOM Testbook ) [17] , и она включала тестирование стандарта GEDCOM 5.5 с помощью программы Gedcheck. [18]
Чтобы помочь с принятием GEDCOM 7.0, теперь существуют инструменты проверки и для этого стандарта. [19]
Ниже приведен пример файла GEDCOM.
образец.ged |
0 ГОЛОВ1 КИСЛЫЙ ПАФ2 ИМЯ Персональный родовой файл2 ВЕРСИЯ 5.01 ДАТА 30 НОЯБРЯ 2000 ГОДА1 GEDC2 ВЕРСИЯ 5.52 ФОРМА, СВЯЗАННАЯ С ПРОИСХОЖДЕНИЕМ1 СИМВОЛ АНСЕЛЬ1 SUBM @U1@0 @I1@ ИНДИ1 ИМЯ Джон /Смит/1 СЕКС М1 ФАМС @F1@0 @I2@ ИНДИ1 ИМЯ Элизабет /Стэнсфилд/1 СЕКС Ж1 ФАМС @F1@0 @I3@ ИНДИ1 ИМЯ Джеймс /Смит/1 СЕКС М1 FAMC @F1@0 @F1@ ФАМ1 HUSB @I1@1 ЖЕНА @I2@1 МАРР1 РЕБЕНОК @I3@0 @U1@ СУБМ1 ИМЯ Отправитель0 ТРЛР |
Заголовок (HEAD) включает исходную программу и версию (Personal Ancestral File, 5.0), версию GEDCOM (5.5), кодировку символов ( ANSEL ) и ссылку на информацию об отправителе файла.
Отдельные записи (INDI) определяют Джона Смита (ID I1), Элизабет Стэнсфилд (ID I2) и Джеймса Смита (ID I3).
Семейная запись (FAM) связывает мужа (HUSB), жену (WIFE) и ребенка (CHIL) по их идентификационным номерам.
Текущая версия спецификации, которая широко используется, — это GEDCOM 5.5.1 final , выпущенная 15 ноября 2019 года. Ее предшественник, проект GEDCOM 5.5.1 [20] , был выпущен в 1999 году, введя девять новых атрибутов, тегов и добавив UTF-8 в качестве утвержденной кодировки символов . Проект не был официально утвержден, но его положения были приняты в некоторой части рядом генеалогических программ [21] [22] [23] , включая FamilySearch.org. [20]
Связанный с происхождением GEDCOM является преднамеренным фактическим общим знаменателем. [3] Несмотря на то, что версия 5.5 стандарта GEDCOM была впервые опубликована в 1996 году, многие поставщики генеалогического программного обеспечения никогда полностью не поддерживали функцию многоязычного текста Unicode (вместо набора символов ANSEL), введенную в этой версии спецификации. Единообразное использование Unicode позволило бы использовать международные наборы символов. Примером является хранение восточноазиатских имен в их оригинальных китайских, японских и корейских (CJK) символах, без которых они могли бы быть неоднозначными и малопригодными для генеалогических или исторических исследований. [24] PAF 5.2 является примером программного обеспечения, которое использует UTF-8 в качестве своего внутреннего набора символов и может выводить GEDCOM UTF-8. [24] [25]
GEDCOM 7.0 требует кодировки UTF-8 повсюду [26] и решает другие давние проблемы с GEDCOM 5.5.1. Поддержка мультимедиа в форме связанного .zip-файла, называемого GEDZip, является еще одним включением. Ведутся работы по принятию 7.0 в качестве нового стандарта обмена. [27] GEDCOM 7.0 позволяет явно определять, какие стандарты, отличные от GEDCOM, могут применяться к определенному файлу. GEDCOM всегда был расширяемым , но до 7.0 не было стандартного способа определения таких расширений. Кроме того, GEDCOM 7.0 позволяет явно отмечать событие как несуществующее. Это позволяет, например, документировать, что определенное лицо никогда не было женато. [28] GEDCOM 7.0 была первой версией, использующей семантическое управление версиями , и является самой последней второстепенной версией спецификации.
По состоянию на июль 2024 года [обновлять]следующим запланированным второстепенным релизом будет v7.1, который находится в стадии разработки. [29]
GEDCOM-версия | Дата выпуска | Примечания |
---|---|---|
Старая версия, больше не поддерживается:1.0 [30] | 1984 [31] | – |
Старая версия, больше не поддерживается:2.0 [30] | Декабрь 1985 г. [32] | ПАФ 2.0 |
Старая версия, больше не поддерживается:2.1 | Февраль 1987 г. [32] | GEDCOM для PAF 2.1 |
Старая версия, больше не поддерживается:2.3 Проект | 7 августа 1985 г. [33] | с соглашениями о реализации PAF2.0 GEDCOM |
Старая версия, больше не поддерживается:2.4 Проект | 13 декабря 1985 г. [33] | с соглашениями о реализации PAF2.0 GEDCOM |
Старая версия, больше не поддерживается:3.0 Стандарт [30] | 9 октября 1987 г. [34] | Реализация PAF 2.0 и 2.1 версии 3.0 |
Старая версия, больше не поддерживается:4.0 Стандарт | Август 1989 г. | ПАФ 2.1 – 2.31 |
Старая версия, больше не поддерживается:4.1 Проект [35] | – | – |
Старая версия, больше не поддерживается:4.2 Проект [36] | 25 января 1990 г. [37] | – |
Старая версия, больше не поддерживается:5.0 Проект [30] | 31 декабря 1991 г. [33] | Были введены структуры, связанные с родословной. [38] |
Старая версия, больше не поддерживается:5.1 Проект | 18 сентября 1992 г. [32] | – |
Старая версия, больше не поддерживается:5.2 Проект | 22 января 1992 г. [39] | – |
Старая версия, больше не поддерживается:5.3 Проект | 4 ноября 1993 г. [40] | Стандарт Unicode ( ISO/IEC 10646 ) был представлен как дополнительный набор символов. |
Старая версия, больше не поддерживается:5.4 Проект | 21 августа 1995 г. [41] | – |
Старая версия, больше не поддерживается:5.5 Стандарт | 11 декабря 1995 г. [42] | ПАФ 3, 4 и 5 |
Старая версия, но она все еще поддерживается:5.5 Стандарт | 2 января 1996 г. [43] [44] | PAF 3, 4 и 5 / 5.5 Стандарт [45] |
Старая версия, больше не поддерживается:Проект GEDCOM (будущее направление) [38] [46] | 1 мая 1998 г. [47] [48] | «он использовал совершенно новую модель данных» [49] |
Старая версия, больше не поддерживается:5.5.1 Проект [50] [51] | 2 октября 1999 г. [20] | Используется FamilySearch.org [20] UTF-8 добавлена в качестве одобренной кодировки символов. |
Старая версия, но она все еще поддерживается:5.5.1 Выпуск [52] | 15 ноября 2019 г. | Действующий стандарт, незначительные изменения текста в 5.5.1 Проект. |
Старая версия, больше не поддерживается:5.6 Частный проект | - [53] | «Джед Аллен отправил эти два файла нескольким людям только для своего рода «личных комментариев» [54] |
Старая версия, больше не поддерживается:6.0 XML-проект | 28 декабря 2001 г. [55] | Не является полной спецификацией и не рекомендуется для начала реализации программного обеспечения. |
Старая версия, больше не поддерживается:7.0.0-rc1 Черновик | Февраль 2021 г. [56] | Кандидат на релиз был представлен на RootsTech 2021, но затем все доклады, спецификации и веб-сайт были удалены 25 февраля 2021 года [57] |
Старая версия, больше не поддерживается:7.0 [58] | 27 мая 2021 г. | Модернизация кодировки символов, прояснение двусмысленностей в спецификации 5.5.1, введение семантического управления версиями, улучшение обработки мультимедиа |
Текущая стабильная версия: 7.0.13 [59] | 4 августа 2023 г. | |
Легенда: Старая версия, не поддерживается Старая версия, все еще поддерживается Последняя версия Последняя предварительная версия Будущий релиз |
Эту статью необходимо обновить . Причина такова: этот раздел необходимо проверить на точность в соответствии с GEDCOM 7.0 и указать источник, если он все еще верен. ( Июль 2022 г. ) |
Файл GEDCOM может содержать информацию о таких событиях, как рождения, смерти, записи переписи, судовые записи, браки и т. д.; эмпирическое правило заключается в том, что событие — это то, что произошло в определенное время, в определенном месте (даже если время и место неизвестны). Файлы GEDCOM также могут содержать атрибуты, такие как физическое описание, род занятий и общее количество детей; в отличие от событий, атрибуты, как правило, не могут быть связаны с определенным временем или местом.
Спецификация GEDCOM требует, чтобы каждое событие или атрибут были связаны только с одним лицом или семьей. [60] Это приводит к избыточности для таких событий, как записи переписи, где фактическая запись переписи часто содержит информацию о нескольких лицах. В файле GEDCOM для записей переписи необходимо добавить отдельное событие переписи «CENS» для каждого упомянутого лица. Некоторые генеалогические программы, такие как Gramps и The Master Genealogist , имеют сложные структуры баз данных для источников, которые используются, среди прочего, для представления событий с участием нескольких лиц. Когда базы данных экспортируются из одной из этих программ в GEDCOM, эти структуры баз данных не могут быть представлены в GEDCOM из-за этого ограничения, в результате чего информация о событии или источнике, включая всю соответствующую информацию о ссылках на цитаты, должна дублироваться в каждом месте, где она используется. Это дублирование затрудняет для пользователя поддержание информации, связанной с источниками.
В спецификации GEDCOM события, связанные с семьей, такие как информация о браке, сохраняются в GEDCOM только один раз, как часть записи о семье (FAM), а затем оба супруга привязываются к этой единой записи о семье. [60]
Спецификация GEDCOM была специально сделана гибкой для поддержки многих способов кодирования данных, особенно в области источников. Эта гибкость привела к большой двусмысленности и создала побочный эффект, заключающийся в том, что некоторые генеалогические программы, импортирующие GEDCOM, не импортируют все данные из файла. [61]
Спецификация GEDCOM не предлагает явной поддержки для сохранения известного порядка событий. В частности, порядок отношений (FAMS) для человека и порядок детей в отношениях (FAM) могут быть утеряны. Во многих случаях последовательность событий можно вывести из связанных дат. Но даты не всегда известны, в частности, при работе с данными за столетия. Например, в случае, если у человека было два отношения, оба с неизвестными датами, но из описаний известно, что второе действительно является вторым. Порядок, в котором эти FAMS записываются в запись INDI GEDCOM, будет зависеть от экспортирующей программы. Например, в Aldfaer [62] последовательность зависит от упорядочивания данных пользователем (алфавитный, хронологический, справочный и т. д.). Предлагаемый стандарт XML GEDCOM [55] также не решает эту проблему.
GEDCOM имеет много функций, которые обычно не используются. Некоторые программные пакеты не поддерживают все функции, которые допускает стандарт GEDCOM.
Стандарт GEDCOM поддерживает включение объектов мультимедиа (например, фотографий людей). [63] Такие объекты мультимедиа могут быть включены либо в сам файл GEDCOM (называемый «встроенной формой»), либо во внешний файл, где имя внешнего файла указано в файле GEDCOM (называемый «связанной формой»). Встраивание мультимедиа непосредственно в файл GEDCOM упрощает передачу данных, поскольку вся информация (включая данные мультимедиа) находится в одном файле, но полученный файл может быть огромным. Связывание мультимедиа позволяет контролировать размер файла GEDCOM, но затем при передаче файла объекты мультимедиа должны либо передаваться отдельно, либо архивироваться вместе с GEDCOM в один более крупный файл. Поддержка встраивания мультимедиа напрямую была исключена в проекте стандарта 5.5.1. [64]
Стандарт GEDCOM позволяет указывать несколько мнений или противоречивых данных, просто указав несколько записей одного типа. Например, если дата рождения человека записана как 10 января 1800 года в свидетельстве о рождении, но 11 января 1800 года в свидетельстве о смерти, будут включены две записи BIRT для этого человека, первая с датой 10 января 1800 года и указанием свидетельства о рождении в качестве источника, а вторая с датой 11 января 1800 года и указанием свидетельства о смерти в качестве источника. Предпочтительная запись обычно указывается первой.
Этот пример, закодированный в GEDCOM, может выглядеть так:
0 @I1@ ИНДИ1 ИМЯ Джон /Доу/1 РОЖДЕНИЕ2 ДАТА 10 ЯНВАРЯ 1800 ГОДА2 КИСЛЫЙ @S1@3 ДАННЫЕ4 ТЕКСТ Транскрипция свидетельства о рождении будет здесь3 ПРИМЕЧАНИЕ. Эта запись о рождении предпочтительнее, поскольку она взята из свидетельства о рождении.3 НАБЕРЕЖНАЯ 21 РОЖДЕНИЕ2 ДАТА 11 ЯНВАРЯ 1800 ГОДА2 КИСЛЫЙ @S2@3 ДАННЫЕ4 ТЕКСТ Транскрипция свидетельства о смерти будет здесь3 НАБЕРЕЖНАЯ 2
Противоречивые данные также могут быть результатом ошибок пользователя. Стандарт никоим образом не определяет, что содержимое должно быть согласованным. Дата рождения, например, «10 APR 1819», могла быть ошибочно записана как «10 APR 1918» спустя долгое время после смерти человека. Единственный способ выявить такие несоответствия — это строгая проверка данных содержимого .
Стандарт GEDCOM поддерживает интернационализацию несколькими способами. Во-первых, более новые версии стандарта позволяют хранить данные в Unicode (или, в последнее время, UTF-8), поэтому можно хранить текст на любом языке. [65] Во-вторых, так же, как можно иметь несколько событий для человека, GEDCOM позволяет иметь несколько имен для человека, [66] поэтому имена могут храниться на нескольких языках, хотя нет стандартизированного способа указать, какой экземпляр на каком языке. Наконец, в версии 5.5.1 поле NAME также поддерживает фонетическую вариацию (FONE) и романизированную вариацию (ROMN) имени. [67]
В феврале 2012 года на конференции RootsTech 2012 FamilySearch представила новый крупный проект вокруг генеалогических стандартов под названием GEDCOM X и пригласила к сотрудничеству. [68] Он включает программное обеспечение, разработанное по лицензии Apache с открытым исходным кодом . Он включает форматы данных, которые облегчают создание генеалогических деревьев на основе источников и записей (как физических, так и цифровых артефактов), поддержку обмена и связывания данных в Интернете, а также API. [68] [69] [70]
В августе 2012 года сотрудник FamilySearch и руководитель проекта GEDCOM X Райан Хитон отказался от утверждения, что GEDCOM X является новым отраслевым стандартом, и перепозиционировал GEDCOM X как еще один проект FamilySearch с открытым исходным кодом . [71]
После выпуска GEDCOM 7 компания FamilySearch позиционировала GEDCOM X как полезную для взаимодействия с программным обеспечением FamilySearch Family Tree. [72]
Commsoft, авторы серии генеалогического программного обеспечения Roots [73] и Ultimate Family Tree, определили версию, называемую Event-Oriented GEDCOM (также известную как «Event GEDCOM» и первоначально называвшуюся InterGED [74] ), [75] которая включала события как элементы первого класса (нулевого уровня). Хотя она основана на событиях, она все еще является моделью, построенной на предполагаемой реальности, а не на доказательствах. Event GEDCOM была более гибкой, поскольку допускала некоторое разделение между предполагаемыми событиями и участниками. Однако Event GEDCOM не был широко принят другими разработчиками из-за его семантических различий. [ необходима цитата ] Поскольку Roots и Ultimate Family Tree больше не доступны, сегодня очень немногие люди используют Event GEDCOM. [76]
Gramps XML — открытый формат на основе XML, созданный генеалогическим проектом с открытым исходным кодом Gramps и используемый также PhpGedView .
Организация по стандартам информации о семейной истории была создана в 2012 году с целью разработки международных стандартов для семейной истории и генеалогической информации. [77] Одним из стандартов, предложенных организацией, был Extended Legacy Format (ELF), совместимый с GEDCOM 5.5(.1), но включающий механизм расширяемости. Организация запросила публичные комментарии по предлагаемому стандарту в 2017 году. [78] Она отозвала предложение, поскольку версия 7.0 GEDCOM устранила многие из проблем организации. [28]