htr-setaf-jean-michel

Données OCR dans le cadre du projet SETAF

https://github.com/setafdh/htr-setaf-jean-michel

Science Score: 36.0%

This score indicates how likely this project is to be science-related based on various indicators:

  • CITATION.cff file
  • codemeta.json file
    Found codemeta.json file
  • .zenodo.json file
    Found .zenodo.json file
  • DOI references
  • Academic publication links
    Links to: zenodo.org
  • Academic email domains
  • Institutional organization owner
  • JOSS paper metadata
  • Scientific vocabulary similarity
    Low similarity (3.5%) to scientific vocabulary
Last synced: 10 months ago · JSON representation

Repository

Données OCR dans le cadre du projet SETAF

Basic Info
  • Host: GitHub
  • Owner: SETAFDH
  • Default Branch: main
  • Homepage:
  • Size: 1.5 GB
Statistics
  • Stars: 0
  • Watchers: 0
  • Forks: 0
  • Open Issues: 0
  • Releases: 1
Created about 3 years ago · Last pushed 10 months ago
Metadata Files
Readme Citation

README.md

HTR-SETAF-Jean-Michel

characters badge regions badge lines badge files badge

Ce dpt contient les donnes OCR des ouvrages publis par Jean Michel, matre-imprimeur Genve de 1538 1544 qui rachte le matriel typographique de Pierre de Vingle. Les textes sont des imprims franais du XVIe sicle en caractres gothiques et la liste des textes avec plus de dtails se trouve dans le tableau CSV du dpt.

L'dition des Faits de Jsus Christ et du pape imprime par J. Michel se trouve dans le dpt HTR-SETAF-LesFaictzJCH.

Projet SETAF

GitHub du projet : https://github.com/SETAFDH

Site du projet : https://www.unige.ch/setaf

Financeur

Ce projet est financ par le Fonds national suisse (FNS). Numro de projet : 205056.

Donnes

Les donnes se trouvent au chemin ./data//.xml et sont au format ALTO. Elles suivent les normes de segmentation de SegmOnto et sont catalogues sur HTR-United. Les fichiers sont corrigs manuellement : la qualit de la segmentation des pages et de la transcription produite par l'OCR est indiqu dans le tableau CSV du dpt ("gold" ou "en cours").

Le contrle de la transcription produite par l'OCR se base sur un guide redig par l'quipe du projet : Solfrini et al., Guide de transcription pour les imprims franais du XVIe sicle en caractres gothiques, Version A, 2023, https://hal.science/hal-04281804.

Notre modle d'OCR, CATMuS Gothic Print, est disponible en ligne : https://zenodo.org/records/10599911.

Infrastructure

Les donnes pour l'OCR sont produites l'aide de linstance genevoise FoNDUE d'eScriptorium.

Les calculs sont effectus l'Universit de Genve en utilisant le service HPC.

Licence

Les transcriptions sont CC-BY, et les images suivent les rgles de diffrentes bibliothques numriques : e-rara, ONB, Gallica, BSB, MDZ, Manchester Library Digital Collections, Rro Doc.

Citer le dpt

  • Version 1.0: Sonia Solfrini, Genevive Gross, Pierre-Olivier Beaulnes, Aurlia Marques Oliveira, Mylne Dejouy, Simon Gabay et Daniela Solfaroli Camillocci, Donnes OCR et segmentation des imprims de Jean Michel (projet SETAF), version 1.0, Genve, universit de Genve, 2023-2026, https://github.com/SETAFDH/HTR-SETAF-Jean-Michel.

bibtex @misc{solfrini_MichelSETAF_2023, author={Solfrini, Sonia and Gross, Genevive and Beaulnes, Pierre-Olivier and Marques Oliveira, Aurlia and Dejouy, Mylne and Gabay, Simon and Solfaroli Camillocci, Daniela}, title={Donnes OCR et segmentation des imprims de Jean Michel (projet SETAF)}, version={1.0}, address={Genve}, publisher={universit de Genve}, year={2023-2026}, url={https://github.com/SETAFDH/HTR-SETAF-Jean-Michel}, }

Citer le projet

venir

Owner

  • Name: SETAFDH
  • Login: SETAFDH
  • Kind: organization

GitHub Events

Total
  • Member event: 1
  • Push event: 71
Last Year
  • Member event: 1
  • Push event: 71

Dependencies

.github/workflows/htr-united-workflows.yml actions
  • actions/checkout v2 composite
  • actions/setup-python v2 composite
  • andymckay/get-gist-action master composite