A Monk's Legacy: OCR, Lemmatization, and Computational Exploration of Some of the Works of Johannes Scheckmann of Trier (†1531)

Research output: External Thesis Master's Thesis

Abstract

Le mémoire aborde un thème des sciences humaines par le biais d'une enquête numérique.
En prenant l'exemple de Johannes Scheckmann de Trèves, un auteur latin du début du XVIe siècle, le projet a pour ambition de créer un corpus numérique de textes afin de le traiter avec R, un environnement de calcul statistique et graphique.
Dans un premier chapitre, différents outils de reconnaissance optique de caractères (Kraken, Calamari, et Transkribus) sont testés pour éditer automatiquement l'héritage imprimé du moine. Une deuxième partie est consacrée à la lemmatisation des textes à l'aide de TreeTagger et d'un fichier de paramètres pour le latin médiéval.
Le deuxième chapitre est consacré à deux études de cas :
1. Une première analyse a pour ambition d'identifier les sources de Scheckmann au moyen de comparaisons automatisées de ses œuvres imprimées avec un corpus de textes hagiographiques de la région de Trèves. Des liens intéressants et insoupçonnés sont identifiés, ce qui contribue à la compréhension historique de la culture hagiographique de la fin du Moyen Âge et du début de l'époque moderne.
2. La seconde enquête utilise le même package sur R pour mener une étude stylométrique afin d'évaluer si Scheckmann fut ou non l'auteur d'une série de textes contestés. À l'aide de l'analyse en composantes principales, de l'analyse des correspondances, des arbres/réseaux de consensus Bootstrap et de la méthode des imposteurs généraux, de nouveaux arguments sont mis en lumière afin de remettre en question ce qui avait déjà été mis en évidence par la littérature scientifique au sujet de la paternité de Scheckmann.
En soi, la thèse sert de laboratoire expérimental pour l'application des technologies numériques apprises tout au long de l'année universitaire. Elle montre l'utilité de ces outils lorsqu'ils sont appliqués à un sujet de recherche traditionnel en sciences humaines.
Translated title of the contributionL'héritage d'un moine: ROC, lemmatisation et exploration informatique de certaines œuvres de Johannes Scheckmann de Trèves (†1531)
Original languageEnglish
QualificationMaster
Awarding Institution
  • KULeuven
Supervisors/Advisors
  • Speelman, Dirk, Supervisor, External person
  • Bertrand, Paul, Co-supervisor, External person
  • de Valeriola, Sébastien, Jury Member, External person
Publication statusUnpublished - 2019

Cite this