lectaurep-bronod

Lectaurep-Bronod, ground truth for Maitre Bronod's documents (French 18th century)

https://github.com/htr-united/lectaurep-bronod

Science Score: 49.0%

This score indicates how likely this project is to be science-related based on various indicators:

  • CITATION.cff file
  • codemeta.json file
    Found codemeta.json file
  • .zenodo.json file
    Found .zenodo.json file
  • DOI references
    Found 1 DOI reference(s) in README
  • Academic publication links
    Links to: zenodo.org
  • Academic email domains
  • Institutional organization owner
  • JOSS paper metadata
  • Scientific vocabulary similarity
    Low similarity (3.7%) to scientific vocabulary

Keywords

french ground-truth handwritten htr lectaurep trainset
Last synced: 6 months ago · JSON representation

Repository

Lectaurep-Bronod, ground truth for Maitre Bronod's documents (French 18th century)

Basic Info
  • Host: GitHub
  • Owner: HTR-United
  • License: cc-by-4.0
  • Default Branch: master
  • Homepage:
  • Size: 362 MB
Statistics
  • Stars: 0
  • Watchers: 2
  • Forks: 0
  • Open Issues: 2
  • Releases: 5
Topics
french ground-truth handwritten htr lectaurep trainset
Created over 4 years ago · Last pushed about 2 years ago
Metadata Files
Readme License Citation

README.md

Notaires de Paris - Bronod

CC BY 4.0

DOI

Files Badges Regions Badges Lines Badges Chars Badges

Contexte de production

Le projet LECTAUREP (LECTure Automatique de REPertoires), qui a dbut en 2018, est une initiative conjointe du Minutier central des notaires de Paris des Archives Nationales, de lquipe ALMAnaCH (Automatic Language Modeling and Analysis & Computational Humanities) Inria et de lEPHE (Ecole Pratique des Hautes Etudes), en partenariat avec le Ministre de la Culture.

Le projet vise repenser lutilisation actuellement faite des registres des actes notaris, lune des sources historiques les plus consultes aux Archives nationales, par les chercheurs et les utilisateurs des fonds darchives notariales. Pour ce faire, le projet a instaurer un workflow de traitement de ces manuscrits laide de la reconnaissance automatique des documents manuscrits (HTR) et d'extraction dinformation (NER) en adoptant notamment l'application eScriptorium pour produire la vrit de terrain, entraner des modles de reconnaissance et corriger les transcriptions rsultants.

Le corpus lectaurep-bronod rassemble 100 pages issues du rpertoire de Matre Louis Bronod (1719-1765), notaire Paris du 13 dcembre 1719 au 23 juillet 1765. Les pages concernes ont t rdigs au cours des annes 1742 1745.

:arrow_right: voir la fiche dtaille de Louis Bronod

Rgles de transcription

illus_segmentation

  • bien que suivant une structure tabulaire, les segments ont t tracs en continu, ligne par ligne. Une srie de ....., prsente sur l'image, signale le changement de colonne.

illus_superscript

  • le texte suscrit a t signal par un ^ liminaire. Le phnomne "Made" (Madame) est donc transcrit par "Mad^e".

illus_abreviation

  • les symboles d'abrviation, en particulier les ~ ont t conservs. Le phnomne "Mr" (Monseigneur) est donc transcrit par "M~gr".

illus_upper

  • l'emploi des minuscules et majuscule a t respect.

Les autres dpts LECTAUREP

Lectaurep-repertoires <!-- Lectaurep-bronod -->

Lectaurep-mariages-et-divorces


| Inria | Archives nationales | | :---------------------------------: | :-------------------------------------------------------------: | | inria | archives nationales |

Owner

  • Name: HTR United
  • Login: HTR-United
  • Kind: organization
  • Location: France

GitHub Events

Total
Last Year

Dependencies

.github/workflows/htr-united-workflows.yml actions
  • actions/checkout v2 composite
  • actions/setup-python v2 composite
  • andymckay/get-gist-action master composite
  • rymndhng/release-on-push-action master composite