Начал писать неделю назад про записи типа INDI, забыл, что написал часть, выключил комп, написанное пропало.
Ну что-же, придется начинать заново.
Как и любой другой тип записи, запись о персоне начинается со строки нулевого уровня, в которой содержится тип строки (INDI) и уникальный номер.
Уникальный номер в GEDCOM-файлах всегда обрамляется символами @ (в простонародье - "собака") и состоит из буквы и цифры, например нулевая строка записи с идентификатором "3" выглядит так:
Как нумеруются записи персон (как впрочем, и записи других типов).
Чаще всего, нумерация записей в файле идет по порядку, хотя мне встречались и исключения. Порядок следования самих персон произвольный.
Здесь и далее я буду реже обращаться к документации и описывать формат не столько так, как описано в стандарте, а так, как он используется на самом деле. Просто автор каждой программы, выполняя экспорт данных в GEDCOM, может трактовать их по своему. Иногда, я так подозреваю, потому-что не хочет "заморачиваться", иногда сам формат хранения его данных не позволяет это сделать по-другому, а иногда и в стандарте четко не прописаны все ньюансы.
Поэтому будем смотреть "как есть", а не "как должно быть".
В любом случае, в любой записи INDI от разных программ всегда есть данные с тегом NAME. Без имени - никуда, даже если оно неизвестно
Вот пример минимально возможной записи персоны:
0 @I2618@ INDI
1 NAME Vladlen /LIPOVENKO/
1 SEX M
Это значит, что персону звали Vladlen, фамилия LIPOVENKO, мужчина.
Даже если пол персоны неизвестен, тэг SEX (пол) есть всегда. Во всяком случае, я не встречал другого.
При персоне неизвестного пола будет просто
Что такое "1" перед полом, Это значит, что это тег первого уровня. Двойка ("2") значит, что тег второго уровня и это детализация информации первого уровня.
Рассмотрим это на примере тега BIRT - рождение.
Чаще всего этот тег тоже присутствует, хотя бывает, если дата рождения персоны неизвестна, то его опускают.
Вот пример данных о рождении:
Как мы видим, сама дата рождения - данные второго уровня, то есть это означает, что это детализация информации первого уровня (в данном случае - рождения).
Если рассмотреть информацию о смерти (DEAT), то она будет иметь похожую структуру, например:
1 DEAT
2 DATE 23 JUN 1848
2 NOTE Umer v Ozerâne, Radomysl', Kiev, Ukraina
3 CONT Žitel' Severinovki Vasil'kovskogo uezda
Здесь - смерть - информация первого уровня, дата смерти - второго, NOTE - примечание, описание, заметка - информация тоже второго уровня, но относится к смерти, а CONT - информация третьего уровня, из чего делаем вывод, что это детализация информации второго уровня, в данном случае - описания к смерти.
Здесь я привел пример, когда данные приведены в латинице. Но это вовсе не обязательно.
Они запросто бывают в любой кодировке (в том числе в кириллице) или даже в юникоде (UTF-8).
Информация о кодировке расположена в заголовке файла.
Какие еще есть полезные теги в записях типа INDI (персоны).
Одни из самых важных - это информация о связях персоны, а именно родителях и детях.
А если быть более точным - то о семьях персоны.
Есть 2 основных типа семьи для персоны.
Эта семья его родителей (где он был ребенком) - обозначаются тегом FAMC
И семья (или семьи), где он сам был родителем - обозначаются тегом FAMS.
Сами записи типа "Семья" мы рассмотрим позже, сейчас только разберем как ссылаются персоны на свои семьи.
Лучше сразу приведу пример персоны со связями, заодно и рассмотрим еще несколько новых тегов:
0 @I682@ INDI
1 _UID qTgGBh0yfz
1 NAME Филипп Григорьев /ЯЦЕНКО/
2 GIVN Филипп Григорьев
1 SEX M
1 BIRT
2 DATE 1845
2 PLAC Украина, Киевская область, Юзефовка
1 FAMC @F393@
1 DEAT
2 DATE 17 SEP 1914
2 PLAC Украина, Киевская область, Рокитне
2 CAUS от старости
2 NOTE 435об-436 68 (ош) 1914 09.17/09.18 Юзефовка кр Филипп Гри
3 CONC гориев ЯЦЕНКО 69 от старости свящ. И. Дурдуковск
3 CONC ий с дьяконом Фаддеем Донцем на приход. кладб. Ф.127 Оп.10
3 CONC 79 Д.555 Ч.3 Л.420об-441 Олег 10.2011
1 FAMS @F138@
1 FAMS @F480@
1 FAMS @F712@
1 NOTE 1843-1847 рождения в Рокитном нет
2 CONT 1842(1897-55) /
2 CONT PC1850(16)-4
2 CONT 1858-12
2 CONT ИР1866-20
2 CONT Брака нет, проверить по фамилии Роскокошенко(Роскокоха)
Как видим из этой записи, семья в которой родился Филипп Григориев ЯЦЕНКО:
А семей, в которых он был родителем (с разными женами) - три. Вот они все:
1 FAMS @F138@
1 FAMS @F480@
1 FAMS @F712@
Мы видим новые теги
PLAC - место, это тег, как правило, второго уровня и обозначает место, где произошло событие. То есть запись:
1 BIRT
2 DATE 1845
2 PLAC Украина, Киевская область (Киевская губерния), Юзефовка
Означает, что рождение было в 1845 году в Юзефовке.
А смерть- 17.09.1914 - в Рокитном, причина - от старости (тег CAUS)
1 DEAT
2 DATE 17 SEP 1914
2 PLAC Украина, Киевская область, Рокитне
2 CAUS от старости
Мы видим еще теги CONT и CONC - это продолжение информации, которая началась в теге более высокого уровня, но не поместилась в строку или был принудительный перенос.
Разница между этими двумя тегами - CONT (от continue) - информация начинается с новой строки, а CONC (concatenation) - продолжается предыдущая строка (разрыв может попасть на середину слова).
Еще остановлюсь на непонятном теге
Как правило, с подчеркивания начинаются пользовательские поля. Это могут быть как поля, которые сам определил пользователь (если программа это позволяет) или поля программы, которые не предусмотрены стандартом GEDCOM
В данном случае - это внутренний идентификатор записей из Древа жизни.
Я встречал, когда внутренний идентификатор программы является и идентификатором записей в GEDCOM. Это возможно в тех случаях, когда такой идентификатор числовой (GEDCOM иного не позволяет). В таком случае, как правило, нумерация записей не является последовательной.
Ну и последние теги, которые сегодня рассмотрим, это GIVN и SURN
1 NAME Филипп Григорьев /ЯЦЕНКО/
2 GIVN Филипп Григорьев
В данном случае - GIVN это имя персоны. Причем, так как в стандарте GEDCOM не предусмотрены отдельно теги для имени и отчества (один из главных недостатков формата), то имя и отчество расположены в одном теге.
С фамилией (SURN) еще сложнее.
Например, "Древо жизни" этот тег использует для обозначения фамилии при рождении (девичьей), а для мужчин этот тег отсутствует. Другие программы пишут туда фамилию вне зависимости от пола. Причем, это может быть как девичья фамилия, так и фамилия, полученная после замужества.
Вот пример из ДЖ для женщин:
1 NAME Анна Францевна /РЕМБЕЦКАЯ (МЕДЫНСКАЯ)/
2 GIVN Анна Францевна
2 SURN МЕДЫНСКАЯ
В этом примере фамилию после замужества (РЕМБЕЦКАЯ) мы видим только в теге NAME, так как в SURN - ее девичья фамилия. В общем, как видим, в этом вопросе "возможны варианты", что не может радовать.
А некоторые программы (например Ahnenblatt) вообще обходятся тегом NAME и не используют ни GIVN ни SURN
В NAME фамилия заключена в косые скобки (слеши) и это накладывает ограничение на использование данного символа в фамилиях. Например, я раньше очень любил писать варианты фамилий, которые могут встречаться у одной персоны в разных документах, через слеш, например:
КОНОНЕНКО/ЗИНЧЕНКО
ТКАЧ/МОСКАЛИК/ЛЫЧАНЕНКО/ТАРАСЕНКО
Сейчас я такого стараюсь избегать, так как разные программы могут истолковать лишние слеши неправильно.
Вот почему бывает важно знать особенности формата обмена данными - GEDCOM.
В имени (тегах второго уровня) есть еще разные суффиксы(NSFX), префиксы (NPFX), но так как у славян они не используются, то я их не буду расписывать
Следующий обзор будет по способу предоставления дат в формате GEDCOM - тоже важная и интересная тема.
Васильківський, Київський, Звенигородський повіти Київської губернії
Ніжинський повіт Чернігівської губернії
Сайт програми GedcomReport
go.inf.ua