logo Lettres-en-Lumières
Contexte
Analyse
Transcriptions
Généralités
Transcriptions
type Arcins
Transcriptions
Pages simples
Transcriptions
Pages doubles

Etudes pour la transcription des inventaires de l'ordre de Malte par Intelligence Articielle

Raphaël LEFEVRE, le 2 février 2025

Contexte

Les archives départementales de Haute-Garonne (AD31) souhaitent obtenir la transcription de 49 inventaires de l'ordre de Malte actuellement dans leurs fonds.

Une transcription par Intelligence Artificielle (LLM) des premières pages de l'inventaire de la commanderie d'Arcins a été réalisée et présentée aux AD31 le 29 janvier 2025. Les résultats ont été jugés très satisfaisants et une étude plus poussée a été demandée pour (i) vérifier la reproductibilité des premiers résultats sur des échantillons plus importants et (ii) tester la possibilité de réutiliser la même chaîne de transcription que celle utilisée pour la commanderie d'Arcins afin de maîtriser les coûts finaux.

Constatant une importante diversité des inventaires, tant par leur structure que par leurs écritures, il est proposé de commencer par les inventaires "proches" de celui de la commanderie d'Arcins

Etude réalisée

17 inventaires de type Arcins ont été identifiés, comprenant au total plus de 9.000 pages soit plus de 50% de la totalité de 49 inventaires.

Ils se caractérisent par une écriture assez régulière, plusieurs sections comprenant un titre suivi de plusieurs descriptions de liasses, chaque description est suivie par son N° de liasse. Ces inventaires ont tous été scannés en simple page.

L'étude a porté sur :

En complément au Type Arcins, nous avons également réalisé la transcription de six (6) inventaires scannés en pages simples mais dont le type semble assez différent de celui d'Arcins, ainsi que quatre (4) inventaires scannés en pages doubles.

Méthodologie

La chaîne de transcription utilisée pour la commanderie d'Arcins a été réutilisée sans chercher à l'optimiser pour tenir compte de quelques variations entre les inventaires sélectionnés.