corpus_prevot_farine_fr

Corpus comprenant images et transcription en français de procédures criminelles des XVIe et XVIIe siècles de l'ancien Évêché de Bâle.

https://github.com/aaeb-porrentruy/corpus_prevot_farine_fr

Science Score: 26.0%

This score indicates how likely this project is to be science-related based on various indicators:

  • CITATION.cff file
  • codemeta.json file
    Found codemeta.json file
  • .zenodo.json file
    Found .zenodo.json file
  • DOI references
  • Academic publication links
  • Academic email domains
  • Institutional organization owner
  • JOSS paper metadata
  • Scientific vocabulary similarity
    Low similarity (1.2%) to scientific vocabulary
Last synced: 7 months ago · JSON representation

Repository

Corpus comprenant images et transcription en français de procédures criminelles des XVIe et XVIIe siècles de l'ancien Évêché de Bâle.

Basic Info
  • Host: GitHub
  • Owner: aaeb-porrentruy
  • Language: XSLT
  • Default Branch: main
  • Size: 471 MB
Statistics
  • Stars: 0
  • Watchers: 1
  • Forks: 0
  • Open Issues: 1
  • Releases: 0
Created about 4 years ago · Last pushed over 3 years ago
Metadata Files
Readme Citation

README.md

Corpus du prvt Farine en franais

Corpus en franais comprenant images et transcription de procdures criminelles des XVIe et XVIIe sicles de l'ancien vch de Ble.

L'objectif du corpus est de permettre le dveloppement d'un modle HTR.

Ce corpus et les modles qui en sont issus font l'objet d'une prsentation dans le cadre du colloque Ancient documents and automatic recognition of handwriting. Conference on HTR, 23-24 juin 2022, cole nationale des chartes, Paris. La prsentation est disponible ici.

Prsentation et contenu du corpus

Images

Les pices appartiennent toutes la srie B 168 conserve par les Archives de l'ancien vch de Ble (accs au plan d'archivage).

| Numro d'inventaire | Nombre de pages | -- | -- | B 168/15-2.1 | 3 | B 168/15-2.2 | 11 | B 168/15-2.3 | 4 | B 168/15-2.4 | 4 | B 168/15-9.2 | 11 | B 168/15-9.4 | 4 | B 168/15-10.3 | 1 | B 168/15-23.1 | 4 | B 168/15-23.2 | 4 | B 168/15-23.3 | 4 | B 168/15-23.4 | 4 | B 168/15-23.5 | 3

Les ruptures de numrotation dans les fichiers .jpeg s'explique par le fait que les pages vierges n'ont pas t numrises.

Fichiers des transcriptions

Les transcriptions sont donnes en format ALTO dans le mme dossier que les images. Elles ont t gnre partir des donnes introduites dans FoNDUE (instance genevois d'escriptorium). La qualit des fichiers a t contrle l'aide de htrvw de HTR-United.

Particularits du corpus

Le corpus est constitu d'une seule main, celle du prvt Henri Farine. Les pices sont dates entre 1603 et 1610.

Il s'agit de procs de sorcellerie crit en franais (lange d'ol) dans une cursive franaise assez rgulire. On note toutefois les particularits suivantes: * partir de 1610, les finaux sont accentus; * quelques traits sont communs avec la Kurrentschift germanique ( minuscule ou diacritique occasionnel sur le )

w:1000 En rouge, <r> minuscule ("perpetrez"; "Par"); en vert, signe diacritique sur (nom de famille "fouvent") ; en jaune, diffrents <s>; en violet, abrviations "par" et "present". AAEB B 168/15-10.3 p. 1

Modalits de transcription

Compte tenu des objectifs du projet, la transcription nest pas allographtique : * les lettres aux formes variables selon leur position dans le mot sont transcrites par une forme unique (cf. fig. ci-dessus en jaune, les <s> dans "Reconfessions"). * les majuscules se divisent en deux groupes: * celles qui ont une morphologie distincte de la lettre minuscule ne posent pas de problme (B, E, P, Q, R, S, T...). * celles qui ne se distinguent des minuscules que par la taille (A, C, D, G, V...) et sont donc difficiles diffrencier. * Les sont identiques et rendus systmatiquement sous forme majuscule au dbut dun mot. * On peut galement noter quil manque souvent un jambage au groupe "mm", comme dans le nom de famille Hmmerlin.

"Hmmerlin" avec six jambages |"Hmmerlin" avec cinq jambages --- |--- w:200 |w:200 AAEB B 168/15-23.3 p. 2 |AAEB B 168/15-23.3 p. 1

  • Les abrviations sont toutes dveloppes.
  • Les csures et apostrophes sont rendues d'aprs l'original.

Citer le dpt

AAEB, Corpus du prvt Farine en franais, Porrentruy, 2022.

Owner

  • Name: AAEB
  • Login: aaeb-porrentruy
  • Kind: user

GitHub Events

Total
Last Year