La mémoire numérique des journaux

Par Christian BlockLex Kleren Changer en allemand pour l'article original

Écouter cet article

Ouvrir le couvercle du scanner, insérer le journal, appuyer sur un bouton, c'est tout ? L'archivage numérique des journaux est plus complexe que cela. Au printemps, la Bibliothèque nationale a entamé les préparatifs pour intégrer le Lëtzebuerger Journal, publié entre 1948 et 2020, dans la plateforme eluxemburgensia.

Cet article est mis à ta disposition gratuitement. Si tu veux soutenir notre équipe et le journalisme de qualité, abonne-toi maintenant.

Décrire cela comme une tâche herculéenne n'est probablement pas une exagération. Il y a plus de 20 ans, la Bibliothèque nationale (BnL) s'est fixé l'objectif ambitieux de numériser le patrimoine culturel imprimé du pays et de le rendre accessible via le portail eluxemburgensia. Il faut s'en rendre compte pour comprendre l'ampleur de l'objectif fixé en 2002. Les romans, les livres spécialisés, les quotidiens, les hebdomadaires, les mensuels, toutes les publications des communes, des associations, des institutions touchant à l'intérêt public, les cartes postales ainsi que les affiches, c'est-à-dire tous les documents qui tombent sous le dépôt légal fixée par la loi (voir encadré), doivent être conservés pour la postérité.

Le hasard veut que la numérisation du Journal coïncide avec l'année du 75e anniversaire du quotidien publié entre 1948 et 2020. L'ensemble du processus, de l'analyse du journal à la publication en ligne, en passant par la numérisation et la préparation des métadonnées, s'étend sur deux bonnes années. Les utilisateur·rice·s peuvent d'ores et déjà fouiller dans les journaux précurseurs dont est issu le Lëtzebuerger Journal 1948, à savoir l'Obermosel-Zeitung (paru de 1881 à 1941 et de 1945 à 1948) et la D'Unio'n (1944 à 1948), sur la plateforme en ligne eluxemburgensia.

Les travaux de planification pour la numérisation du Journal ont débuté il y a environ neuf mois. "La phase de préparation est très importante. Elle détermine le reste du projet", explique Ralph Marschall. Il est chef de projet, coordinateur de l'appel d'offres (nous y reviendrons plus tard) et développeur de la plateforme eluxemburgensia.

"La phase de préparation est très importante. Elle détermine le reste du projet."

Ralph Marschall, chef de projet et coordinateur de l'appel d'offres

"Le Lëtzebuerger Journal comprend au total 73 années. Cela correspond à environ 20.000 numéros et 363.000 pages qui sont maintenant numérisés", explique Martine Mathay. Elle coordonne la phase de planification ainsi que la préparation des documents pour la numérisation. Analyser signifie tenir un compte scrupuleux de chaque numéro, du nombre de pages, des suppléments, des errata, de l'état du numéro, des noms des rédacteur·rice·s. En bref, il s'agit de dresser un inventaire détaillé du titre en termes d'exhaustivité et d'état de conservation, ainsi que de son histoire rédactionnelle et éditoriale, ajoute Mme Mathay. Ce sont des collaborateur·rice·s et des étudiant·e·s qui effectuent ce travail fastidieux. Passer en revue les quelque 300.000 pages du Journal a occupé une personne pendant plus de six mois.

Différents critères (voir infobox) influencent la sélection et la priorisation dans le cadre du projet de numérisation. En particulier pour les journaux historiques publiés sur une longue période, comme c'est le cas pour les journaux qui ont précédé le Journal, la BnL a tendance à procéder de manière chronologique, "c'est-à-dire à partir des documents les plus anciens et parfois aussi les plus fragiles pour remonter jusqu'au 20e siècle", poursuit Mme Mathay. La Bibliothèque nationale poursuit ainsi l'objectif de conserver les publications qui sont les plus fragiles en raison de leurs conditions de stockage antérieures, de leur âge et/ou de la qualité du papier. Car tôt ou tard, tous les journaux "tombent en poussière". Cela a également l'avantage de simplifier la question des droits. Les droits d'image et d'auteur·rice expirent 70 ans après leur décès. La Bibliothèque nationale part du principe que les œuvres publiées avant 1881 tomberont dans le domaine public à partir de 2023. "Pour les journaux historiques, où les droits des auteurs et des producteurs se sont éteints, la situation des droits est relativement simple et les contenus sont librement accessibles. Pour tous les autres titres, il est nécessaire d'établir des conventions complètes avec les maisons d'édition et une déclaration de droits avec les auteurs, journalistes, photographes, illustrateurs, caricaturistes ou leurs ayants droit." Pour ce faire, la BnL mène, en coopération avec les éditeurs et Luxorr, des recherches approfondies afin d'identifier et de contacter les ayants droit et d'obtenir leur accord. L'expérience d'une libération systématique des droits avec la revue d'histoire luxembourgeoise Hémecht (qui paraît sous ces noms depuis 1964) ou le Lëtzebuerger Land (depuis 1954) a montré que les oppositions sont l'exception absolue.

"Comme les journaux publient souvent un grand nombre d'articles, de photographies et d'illustrations non signés, l'identification des auteurs s'avère souvent difficile, voire impossible, de sorte qu'un risque résiduel subsiste", explique Mme Mathay. Si une plainte est néanmoins déposée ultérieurement, les textes correspondants peuvent être noircis dans la version en ligne et rendus à nouveau visibles 70 ans après la mort de l'auteur·rice.

Pourquoi l'âge ne permet-il pas forcément de tirer des conclusions sur l'état de conservation ?

Martine Mathay va chercher un carton et le soulève sur la table. "C'est un exemple typique de la manière dont nous recevons les dons." Dans la boîte en carton s'empilent des exemplaires pliés du journal luxembourgeois (1868 à 1941). Comme si quelqu'un avait dû les y mettre il y a des décennies pour les ranger plus tard dans un grenier ou une cave. Le journal concurrent du Luxemburger Wort fait partie de la campagne de numérisation actuelle et est attendu avec impatience par les chercheur·euse·s des domaines les plus divers. Au premier coup d'œil, on constate que l'édition de 1916 s'est fendue au niveau des pliures. "Le papier journal est composé de cellulose, souvent à base de bois ou de vieux papiers. Les acides qui pénètrent dans le papier en raison de la fabrication dégradent la cellulose, qui est responsable de la résistance mécanique du papier. Cela a pour conséquence que le papier devient fragile et cassant. Les déchirures et les cassures du papier peuvent être partiellement restaurées, même si des passages de texte ont été perdus au niveau des points de pliage."

À propos d'eluxemburgensia

  • Plus de 500 livres, biographies, ouvrages spécialisés ou monographies historiques, 113.000 revues, 700 affiches, 17.000 cartes postales, qui représentent en tout un fonds de plus d'un million de pages, se trouvent déjà dans la collection numérique. Selon Mme Mathay, le processus de numérisation des livres n'en est "qu'à ses débuts". "En ce qui concerne les livres, nous prescrivons désormais un à deux millions de pages par an et l'année prochaine, nous récupérerons des projets d'un volume d'un million de pages. C'est à peu près le rythme que nous devrons maintenir à l'avenir", explique Ralph Marschall. Le travail d'archivage est rendu plus difficile par des livres épuisés ou des séries incomplètes. De temps en temps, des revues oubliées depuis longtemps par le grand public réapparaissent soudainement.

  • Toutes les publications éditées au Luxembourg et concernant la vie politique, économique, sociale, culturelle, scientifique, religieuse ou touristique doivent être déposées à la Bibliothèque nationale sous forme de dépôt légal. Le dépôt légal concerne les livres, les brochures, les journaux, les revues spécialisées, les affiches, les calendriers, les partitions ou les pièces de théâtre, qu'il s'agisse d'imprimés ou de publications numériques. Dans des biographies nationales établies chaque année, qui ne sont actuellement pas consultables en ligne, la BnL tient en quelque sorte le compte de la vie éditoriale du pays.

  • Pour sélectionner les publications susceptibles d'être numérisées, la BnL se base sur une multitude de critères allant de l'état général à l'intérêt historique et scientifique, en passant par la valeur de rareté, l'exhaustivité et la demande du public ou des chercheur·euse·s.

    La phase de préparation, à laquelle s'ajoute parallèlement la libération des droits des différents titres, peut être divisée en quatre étapes de travail :

    • La sélection et la hiérarchisation des titres selon les critères de sélection précités
    • L'analyse des titres
    • Le complément des éditions manquantes par des prêts ou des dons d'institutions culturelles, de maisons d'édition et de particuliers.
    • La restauration et le conditionnement dans des boîtes d'archives (transport et stockage).

Ralph Marschall, Martine Mathay

L'âge d'un journal – hormis les conditions de conservation – ne permet pas forcément de tirer des conclusions sur son état de conservation. "Nous avons des journaux du XIXe siècle qui ont encore un très bel aspect aujourd'hui, simplement parce qu'il s'agissait d'un tout autre type de papier." Jusqu'au début du 19e siècle, la fibre de papier était obtenue à partir du lin, en utilisant des textiles ou des chiffons. Contrairement au papier fabriqué industriellement à base de bois, ce papier historique est plus résistant. Pour sa conservation, c'est un avantage.

Les premières éditions du Journal n'ont plus forcément l'air très fraîches non plus. Une grande tâche orne la première page d'un exemplaire de la première édition – peut-être due à une tasse de café ou parce que le journal a été mouillé – et des cornes en marquent les bords. "Dans l'après-guerre, le papier était cher et la qualité du papier utilisé par le Journal n'était pas la meilleure dans les premières années."

Les volumes retenus doivent être préparés et restaurés pour le processus de numérisation. À cette fin, les pages sont détachées de la couverture du livre, les coins cornés et les plis sont éliminés, puis les piles sont lissées dans des presses pendant une nuit. Plus tard, les pages détachées sont placées dans des boîtes d'archives qui empêchent le papier d'être davantage attaqué par les influences environnementales. "Nous essayons de conserver le plus longtemps possible les journaux sur papier dans ce format."

Avant cela, il faut s'assurer que le produit imprimé est complet et, dans l'idéal, remplacer les numéros manquants ou endommagés par des exemplaires en meilleur état. Une tâche pas toujours facile, car d'un point de vue purement matériel, la durée de vie ne jouait en fait aucun rôle dans la fabrication des journaux. C'était un objet d'usage courant dont la valeur historique contemporaine n'a été reconnue que bien plus tard. Le papier journal étant un support fragile, cette phase pouvait s'avérer très longue selon les titres, rapporte Mme Mathay.

"Nous avons des journaux du 19ᵉ siècle qui sont encore très beaux aujourd'hui, simplement parce qu'il s'agissait d'un tout autre type de papier."

Martine Mathay, coordinatrice de la phase de planification et de préparation des documents

En août, les travaux préparatoires pour la numérisation du Lëtzebuerger Journal n'étaient pas encore terminés, "au plus tard fin octobre", cela devrait être prêt. "Nous voulons lancer l'appel d'offres avant la fin de l'année." La BnL confie aussi bien la restauration que le travail de numérisation proprement dit à des entreprises externes spécialisées. Le cahier des charges, sous forme imprimée, comprend deux petits classeurs. Tout est réglé dans les moindres détails. "Ce sont surtout des entreprises d'Europe ainsi que d'Inde qui participent. Mais les journaux restent en Europe et sont scannés ici", explique M. Marschall. De cette manière, la BnL veut limiter les risques et l'impact du transport. "C'est important pour nous, car nous investissons beaucoup dans la restauration et l'archivage des documents, et ce sera plus tard notre copie d'archives", ajoute Mme Mathay. Jusqu'à présent, cela n'a pas posé de problèmes – même si, en raison de la guerre en Ukraine, le transporteur a dû faire un grand détour dans un cas. Comme tous les autres documents, la copie d'archive sera ensuite conservée à 18° Celsius et 50% d'humidité – les conditions optimales pour la conservation du papier – dans l'entrepôt du nouveau bâtiment de la BnL inauguré en 2019. Il est clair que l'accès aux originaux sera limité dès que les journaux seront consultables en ligne.

C'est probablement au début de l'année prochaine que les boîtes d'archives des quatre titres – l'appel d'offres comprend, outre le Journal, le Tageblatt de 1951 à 2014, les Cahiers Luxembourgeois et les Annales de la Société d'agriculture et d'horticulture – commenceront leur voyage. Environ huit mois et bien plus de temps de vie de journalistes, de photographes et de nombreux autres participant·e·s se trouvent dans un carton. "Nous atteignons ainsi presque un million de pages", explique Mme Mathay. L'ensemble du fonds en ligne d'eluxemburgensia va ainsi doubler dans un avenir proche pour atteindre plus de deux millions de pages.

La saisie numérique d'un produit d'impression est à nouveau une "tâche gigantesque" en soi, selon M. Marschall. Page après page, tous les documents sont numérisés. Ensuite, les pages numérisées passent par un processus semi-automatisé qui reconnaît le texte et les différents éléments de mise en page (titres, articles, illustrations, annonces et bien plus encore). Néanmoins, toutes les pages sont à nouveau examinées individuellement afin de s'assurer que les différents éléments sont correctement structurés. Une fois le projet terminé (probablement au printemps 2025), les articles du passé récent du Journal, qui ont dû céder la place à la nouvelle présentation web du magazine numérique suite à sa réorientation, au grand dam de certains contributeur·rice·s et observateur·rice·s, reprendront également vie.

De nouveaux outils d'IA sur la ligne de départ

D'ici 2030, la Bibliothèque nationale espère avoir numérisé au moins la majeure partie des quotidiens et des hebdomadaires luxembourgeois. Mais même alors, il reste encore beaucoup à faire. "Le Luxembourg se trouve dans la situation unique d'être un pays qui a extrêmement publié. Aux 19e et 20e siècles, une nouvelle publication paraît presque chaque mois. Certaines étaient des éphémères qui disparaissaient après quelques numéros ou après quelques années", sait Mme Mathay, qui révèle également lors de la visite sur place que la mise à jour des journaux du national-socialisme et des mouvements de résistance de l'époque de la Seconde Guerre mondiale est prévue dans les années à venir, tout comme le reste des quotidiens et hebdomadaires luxembourgeois. La numérisation de la Zeitung vum Lëtzebuerger Vollek, du woxx et de son prédécesseur, le GréngeSpoun, est pareillement prévue.

"D'ici 2030, nous essayons de numériser la majorité des quotidiens et des hebdomadaires luxembourgeois."

Martine Mathay

Tôt ou tard, la numérisation des documents historiques rejoint le présent. Les articles actuels dans les journaux des maisons d'édition luxembourgeoises ne seront pas accessibles à tous dès demain. Des conventions avec la Bibliothèque nationale prévoient un "moving wall", c'est-à-dire un intervalle de temps entre la date de publication et la mise à disposition des éditions actuelles.

Pendant ce temps, la plateforme eluxemburgensia continue d'être développée. Enfin, la plate-forme ne veut pas être un simple espace d'exposition virtuel, mais permettre de travailler avec les versions électroniques. Selon Ralph Marschall, la BnL participe à plusieurs projets d'intelligence artificielle. Ainsi, la technique OCR, qui lit le texte à partir des images scannées, permet d'obtenir un résultat nettement meilleur qu'il y a une dizaine d'années à partir de textes avec des polices gothiques ou d'articles multilingues. La reconnaissance automatique d'objets sur les images ou le regroupement automatique d'articles thématiques (modélisation thématique) sont également en phase de projet, afin d'améliorer encore l'expérience de l'utilisateur·rice devant son écran.

Malgré une nette tendance à la numérisation, la publication imprimée est loin d'avoir fait son temps. "Chaque mois, on trouve au moins un nouveau titre dans le dépôt légal de la Bibliothèque nationale", rapporte Mme Mathay. D'une manière ou d'une autre, la BnL n'est donc pas près de manquer de travail.