Sådan finder GEDCOMP de identiske personer

På grund af den svingende kvalitet af slægtshistoriske oplysninger kan identiske personer i almindelighed ikke identificeres med 100% sikkerhed. GEDCOMP tildeler derfor et givet par af personer et antal points, således at et voksende antal points giver en voksende chance for at der er rent faktisk er tale om personsammenfald. Disse points udregnes på basis af de personnavne og datoer med videre, der indgår i GEDCOM-filerne.

Sammenligning via slægtninge

Når 2 personer sammenlignes, bruges ikke kun deres egne navne og datoer, men også navne og datoer fra deres forældre, søskende, ægtefæller og børn. Dette gøres rekursivt, således at også bedsteforældre, svigerfamilie, fætre, kusiner, børnebørn osv. indgår i vurderingen. Som udgangspunkt bruges de nærmeste slægtninge og deres nærmeste slægtninge i vurderingen, men dette kan ændres efter behov. Den store fordel ved dette er, at en person i en GEDCOM-fil næsten altid har noget familie, således at der som oftest er et godt sammenligningsgrundlag.

Forskellige personnavne

For at tage hensyn til forskellig stavemåde af personnavne, konverteres alle personnavne til en slags fonetisk stavning, dvs. stavemåden ændres til noget, der minder om den måde navnet udtales på. En person kan ændre efternavn, og i nogle sammenhænge undlade at bruge/opgive et eller flere fornavne. GEDCOMP vil derfor sammenligne 2 personer, hvis de bare har et enkelt fornavn til fælles.

Stednavne

GEDCOMP sammenligner også stednavne i søgningen efter identiske personer. Når GEDCOMP sammenligner to stednavne, så anvendes sammenligningens resultat forskelligt alt efter hvilke typer af stednavne, der er tale om:
Med GEDCOM angives et sted som et (kommasepareret) hierarki af stednavne. I Danmark består dette hierarki (før kommunalreformen i 1970) af:
et sogn, sognets herred, herredets amt, Danmark; f.eks.
Torsted sogn, Hind herred, Ringkøbing amt, Danmark
Andre eksempler på gode angivelser af stednavne er:
GEDCOMP vil i langt de fleste tilfælde være i stand til at forstå stedsangivelser, som ikke (helt) følger GEDCOM-standarden. Stednavne som de følgende er derfor væsentligt bedre end ingenting:DIS-Danmarks udmærkede Amt-Herred-Sogn-portal finder du nemt en korrekt kombination af sogn, herred og amt.
GEDCOMP genkender pt. over 50.000 danske og udenlandske stednavne, som de bl.a. er stavet i: De mange udenlandske stednavne er medtaget, da GEDCOMP efterhånden rummer ganske mange oplysninger om udenlandske slægter. De udenlandske stednavne forhindrer primært forveksling mellem danske og udenlandske personer, men muliggør også identificering af identiske personer uden for Danmark.

GEDCOMPs stednavnedatabase er konstrueret så den nemt kan udvides med flere stednavne. Derfor må det forventes at ovenstående liste vokser med tiden.

Manglende datoer

Den logiske kontrol af datoerne, der er beskrevet ovenfor, bruges også til at sætte grænser for hvornår en person er født og død. Dette gøres rekursivt, således at fødselsdagen for en given person (løseligt) kan estimeres udfra f.ex. en fætters fødselsdag. Dette reducerer antallet af forkerte bud på personsammenfald betragteligt.

Dette eksempel på et resultat af en GEDCOMP-sammenligning viser med stor tydelighed hvorledes GEDCOMP kan identificere personsammenfald på trods af uoverenstemmelser mellem navne og datoer. De to filer indeholder 1870 henholdsvis 4437 personer.