Nedenstående blev bragt i DIS-Sverige's medlemsblad Diskulogen, december 2004.

Find Dine Danske Aner via Internettet.

GEDCOMP er nu på 8. år en søgefacilitet for slægtsforskere med interesse i Danmark. Du får gratis udført en GEDCOMP-søgning efter de personer du forsker i ved at e-mail'e en GEDCOM-fil med dine slægtshistoriske oplysninger til GEDCOMP.

GEDCOMP benyttes altså på samme måde som det velkendte DIS-BYT/Treff/Træf.

Læseren kan nu spørge sig selv, hvilken nytte kan GEDCOMP have, når der eksisterer en DIS-service for Danmark - og det øvrige Skandinavien?

DIS-Treffs norske Alf Christophersen skrev i DIS-Danmarks 'Slægt & Data' 2000 Nr. 1 en artikel med titel 'GEDCOMP eller DISBYT, eller Ja takk, begge deler?' hvor han anbefaler at vi slægtsforskere indsender vore data til både GEDCOMP og DIS-BYT (DIS-Treff/Træf).

Prøv begge dele.

Fem af mine otte oldeforældre er svenske, og derfor sendte jeg for knapt et år siden min nyeste GEDCOM-fil til DIS-BYT - som må antages at benytte omtrent samme teknologi som DIS-Treff/Træf. Baseret på mine erfaringer med DIS-BYT og GEDCOMP vil jeg nedenfor nævne en håndfuld forskelle mellem DIS-BYT og GEDCOMP, som kan retfærdiggøre anbefalingen om at prøve begge dele:

1) Efter at have indsendt sin GEDCOM-fil til DIS-BYT modtager man en liste over de stednavne som er uforståelige for DIS-BYT, eller som ligger uden for Sverige. Dette er for så vidt udmærket. I mit tilfælde var der ikke andre kontrol-resultater. I modsætning hertil analyserer GEDCOMP nøje din indsendte fil. Denne kontrol er væsentligt mere grundig, end den kontrol, som mange slægtsforskningsprogrammer kan udføre, og den kan opdage omkring 250 forskellige typer af fejl i dine oplysninger. GEDCOMP sender dig resultatet af denne kontrol, så du får muligheden for at rette de fejl, der er blevet fundet.

2) Hver gang GEDCOMP finder et overlap mellem din GEDCOM-fil og en anden, så får både du og indsenderen af den anden fil besked via e-mail om overlappet. Herefter kan I sammen udveksle oplysninger. Dvs. længe efter at du har indsendt din fil til GEDCOMP, vil du få tilsendt en ny e-mail hver gang GEDCOMP finder et overlap med en nyindsendt GEDCOM-fil. Det giver dig større mulighed for at få udbytte af de overlap GEDCOMP finder med filer, der bliver indsendt efter din egen.

3) Alle kan indsende en GEDCOM-fil til GEDCOMP, og derfor kan GEDCOMP sætte dig i kontakt med en meget bred kreds af slægtsforskere. I april bragte den elektroniske udgave af New York Times en artikel om GEDCOMP, hvorefter et større antal efterkommere til udvandrede til Amerika og Australien sendte deres bidrag til GEDCOMP.

4) GEDCOMP anvender en avanceret søgeteknik, der anvender profession-, sted- og dato- og navne-oplysninger, og som finder overlappet mellem to GEDCOMP-filer i grupper af hele slægter.
Sted-oplysningerne analyseres ved hjælp af GEDCOMPs interne stednavne-database som indeholder over 50.000 stednavne, som primært er danske, men som f.eks. inkluderer de svenske län, kommuner och församlingar. De udenlandske stednavne er medtaget for at GEDCOMP bedre kan skelne mellem danske og udenlandske personer. Men udenlandske stednavne hjælper også GEDCOMP til at identificere overlap mellem personer, der er bosat uden for Danmark, f.eks. danskere, der er udvandret til Amerika. Faktisk finder GEDCOMP efterhånden ofte overlappende information om personer, der aldrig har været i Danmark!

5) DIS-BYT angiver med omkring 6 forskellige niveauer kvaliteten af hvert overlap. Mit bidrag til DIS-BYT gav således godt 400 linjer med personer, som kunne være identiske med mine egne, dvs. een for ca. hver fjerde person jeg indsendte. Hver af disse over 400 resultat-linjer måtte jeg herefter gennemgå manuelt for at se hvilke der vitterligt så ud til at passe. Selvom det kan være spændende nok, er det alligevel er større manuelt arbejde, hvor man risikerer at begå fejl, og som faktisk ikke behøver at være så stort.
GEDCOMP angiver nemlig overlap slægtsvis, og bruger en åben skala til at angive kvaliteten af hvert overlap. De to ting tilsammen betyder, at det er meget nemt at se at et overlap er reelt, og hvor omfattende det er. Af samme grund kan GEDCOMP uden menneskelig indgriben afgøre at et sammenfald er reelt, og derfor nøjes med at afsende en email om overlap, når der er meget stor sikkerhed for at der er tale om et reelt overlap. Det betyder, at man som modtager ikke skal bruge tid på at undersøge et stort antal mulige overlap, men at man istedet kan koncentrere sig om de faktiske overlap, som man får email om.

6) GEDCOMP indeholder godt 3 millioner person-oplysninger. Selvom en del af disse personer ikke stammer fra Danmark, så er GEDCOMP så langt den største database hvad angår danskere.

GEDCOMP Garanterer.

Jeg kan love at enhver, der indsender en GEDCOM-fil med mere end en snes personer i det mindste vil have fordelen af at blive gjort opmærksom på en eller flere fejl i sine oplysninger. Derudover kan du, hvis du har information om bare nogle få hundrede danskere i din database regne med at blive sat i kontakt med mindst en anden slægtsforsker, som har overlap med dit arbejde. Hvis GEDCOMP alligevel ikke skulle leve op til dine forventninger kan du til enhver tid lade dit bidrag udgå af GEDCOMP.

Da GEDCOMP er et privat initiativ (dog med en symbolsk økonomisk støtte fra DIS-Danmark) vil jeg slå fast at jeg fra starten i 1997 har lovet brugerne at deres data ikke vil blive anvendt kommercielt og at deres GEDCOM-filer ikke vil blive videregivet. Dette står stadig fast.

Du kan få mere at vide om GEDCOMP på:
http://www.lklundin.dk/gedcomp/


Status af GEDCOMP pr. 2004-11-11.

Indsendte personoplysninger: 3.134.000
Indsendte GEDCOM-filer: 1.841
Udsendte E-mails om personsammenfald: 95.544

Alle indsendte filer med oplysninger om mere end 252 personer har givet indsenderen mindst een email om personsammenfald med en fil indsendt af en anden slægtsforsker.

Blandt de øvrige, mindre filer er den observerede gevinsthyppighed ved indsendelse af oplysninger om X antal personer, hvor X højst er 252:

XXGevinst
MindstHøjst%
19325296
14019296
9513984
489481
14743
Tallene i tabellen er fremkommet på følgende måde: De indtil nu indsendte filer til GEDCOMP med oplysninger om højst 252 personer er inddelt efter antal personer i 5 lige store grupper.
%-satsen i hver gruppe er andelen af filer i denne gruppe, hvor indsenderen har fået mindst een email om personsammenfald med en fil indsendt af en anden slægtsforsker.

Med venlig hilsen,
Lars Kr. Lundin
gedcomp@lklundin.dk