Thy Tingbogsekstrakter på Nettet - OCR

Thy Tingbogsekstrakter på Nettet - OCR

Med OCR behandlingen har jeg dannet et tekst-materiale, som fylder 3.4MB.
Pga. fejl i OCR er tekst-materialet ikke en helt præcis gengivelse af teksten i bogen.
Derfor har jeg læst korrektur på tekst-materialet.
Hver sides overskrift og sidenummer er således korrekt gengivet, og de eneste tal, der står alene på en linje, er sidenumre.
Jeg har også rettet nogle datoer, men udover sidenumre er tal (inklusiv beløb og arealer) ofte forkerte.
Til gengæld har jeg forsøgt at rette så mange fejl som muligt i tekstens egennavne.
På trods af det er der med sikkerhed stadig fejl i tekst-materialet.
Bl.a. er der en del fejlagtige kommaer, punktummer og apostroffer.

OCR af ekstraktet af Thisted tingbog 1638 er af (lidt) højere kvalitet end de øvrige. Det skyldes at hæftet kunne skilles ad og hæftets ark scannes enkeltvis, således at scanningen blev mere præcis.

Jeg føler mig overbevist om at mere end 99% af tekst-materialets ord er korrekt gengivet.

På grund af de fejl, der er i tekst-materialet, anbefaler jeg følgende fremgangsmåde ved brug af materialet:
  • Hent de tekster du har interesse i.
  • Lad IKKE din tekst-søgning skelne mellem store og små bogstaver.
  • Brug det simplest mulige søgeudtryk, som ikke viser sig at passe på for meget uvedkommende. Brug f.eks. zo istedet for Zoega og omas istedet for Tomas/Thomas.
  • Find ud af hvilket sidenummer en given interessant tekst befinder sig på.
  • Hent billed-filen med den interessante side og læs teksten der.
  • Send en email til ThyTB@lklundin.dk med rettelser til de fejl du måtte finde. Angiv den korrekte tekst med tilhørende sidenummer

    Lars Kr. Lundin
    Last modified: Fri Oct 5 21:21:22 CEST 2001