Le centenaire de la guerre 14-18 inspire immanquablement de multiples célébrations et projets destinés à conserver la trace de cette funeste période pour les générations futures. Parmi ces projets, l’archivage de documents en tous genres occupe évidemment une place de choix.
C’est ainsi que Numen Europe, à la demande de ProQuest, société américaine spécialisée dans l’édition d’archives sur supports électroniques ou microfilms, Numen Europe a réalisé la numérisation d’une partie des fonds documentaires se rapportant à la Guerre 14-18. Ces documents, une fois numérisés, seront versés dans une nouvelle base de données baptisée “Trench Journals and Unit Magazines of the First World War” qui répertoriera une panoplie de revues, magazines et journaux de tranchée qui étaient destinés, voire dans certains cas, produits par les combattants eux-mêmes. Dans ce dernier cas, ils ont souvent été réalisés avec des moyens de fortune.
“Le Claque au Fond”
Plusieurs grands musées et bibliothèques européens ont confié leurs fonds d’archives à ProQuest, pour devoir de mémoire. Parmi eux, l’Imperial War Museum de Duxford, près de Cambridge, au Royaume-Uni. Sa collection compte pas moins de 720 titres de journaux de tranchées et de revues d’unité, des magazines rédigés par et pour les anciens combattants des forces armées, de tous bords, qui ont hanté les tranchées.
Au total, 120.000 pages ont ainsi été numérisées en l’espace de 5 mois, provenant de “revues” et “ouvrages” anglais, allemands, français, belges, polonais, italiens, russes….
L’exercice de numérisation opéré sur les archives de Duxford a donc notamment concerné des combattants belges. On y retrouve en effet des titres tels que “Le Claque au Fond”, un journal belge de tranchées (7ème Brigade d’Infanterie), le Bulletin Luxembourgeois de l’Armée Belge (revue éditée par l’Union des Militaires Grand-Ducaux au Service de la Belgique), “Inter-Nos Revue”, une production bimensuelle des “internés” belges (militaires et civils) du camp de Harderwijk aux Pays-Bas, ou encore la revue “Les Sports”.
Un exercice périlleux
Numériser des documents anciens, surtout lorsqu’ils ont été produits dans des conditions souvent loin d’être idéales, s’avère un travail périlleux. Nombre de ces documents n’ont d’ailleurs guère de ressemblance avec les journaux classiques. Une quantité non négligeable ont en effet été rédigés à la main, sur toutes sortes de support papier, selon ce que les combattants trouvaient à leur portée. Certains ressemblaient beaucoup à de simples lettres, couvertes d’une écriture serrée. Certains étaient plus “soignés”. Même produits au coeur des tranchées, leurs auteurs avaient pris soin de les relier. Tel cet exemplaire d’un journal de tranchée allemand qui fait pas moins de 12 centimètres d’épaisseur mais qui est constituée de feuilles de taille et de nature hétéroclites.
Numen a donc dû prendre certaines précautions, recourir à des scanners spéciaux qui évitaient les trop lourdes manipulations. Le travail de numérisation a en outre dû se faire sur site, à l’Imperial War Museum. Pour ce faire, Numen a conçu le laboratoire de numérisation dans ses propres locaux, l’a démonté et reconstitué dans l’atelier du musée.
Les images scannées, non compressées (“pour en préserver la qualité”), ont ensuite été transférées en vue du processus d’extraction de texte (dans 10 langues différentes) et d’indexation thématique. Une phase qui s’est, elle, déroulée dans les locaux luxembourgeois de Numen.
Elle a notamment concerné le typage des contenus, l’identification des zones réservées aux publicités et l’indexation proprement dite. Ce travail a d’ailleurs été affiné en cours de projet. Numen a en effet découvert que le contenu des documents était plus hétéroclite que prévu. IL a ainsi fallu prévoir des couches d’indexation supplémentaires afin d’identifier, référencer et décrire divers types d’illustrations, en ce compris de simples dessins, voire des portions de bandes dessinées.
A l’issue de ce travail, grâce aux descriptions et à l’encodage des métadonnées, toute personne consultant l’archive pourra effectuer une recherche non seulement sur les textes mais aussi sur les images.
Par contre, le processus de numérisation ne fut pas l’occasion de redonner à des pages et passages parfois abîmés ou estompés une meilleure lisibilité. En effet, le commanditaire – ProQuest – avait émis le voeu que les documents numérisés soient une copie fidèle des originaux.
Découvrez-nous sur Facebook
Suivez-nous sur Twitter
Retrouvez-nous sur LinkedIn
Régional-IT est affilié au portail d’infos Tribu Médias.