Les métamorphoses numériques du Livre

Les 30 novembre et 1er décembre 2009. Cité du Livre, Aix-en-Provence


Colloque organisé par l’Agence régionale du livre PACA, mené sous la direction d’Alain Giffard.

Mardi 1er décembre 2009 : 2ème journée de colloque : la matinée : Bibliothèques, librairies, éditeurs : la chaîne du livre en question.

Après l’intervention de Gilles Eboli Les bibliothèques avec le numérique, Isabelle Le Masne – adjointe au directeur des collections à la bibliothèque nationale de France (BnF) – était là pour présenter La numérisation à la BnF, et plus précisément La bibliothèque numérique de la BnF (l’historique, les programmes en cours et les pistes de travail à venir).

Le numérique a investi pas à pas toutes les bibliothèques. Les bibliothèques sont devenues hybrides avec des collections matérielles et immatérielles, des services sur place et à distance.

Chaque bibliothèque vit ce changement selon ses spécificités : bibliothèque universitaire ou bibliothèque municipale…, selon sa tutelle, selon son environnement et selon ses moyens.

La BnF s’est elle aussi adaptée au numérique :

les métamorphoses du dépôt légal : la BnF propose désormais un extranet pour les formalités du dépôt légal et la BnF est aussi chargée du dépôt légal du web (avec les collectes ciblées).

– les métamorphoses des services : la possibilité de réserver place et documents à distance, le service SINDBAD (questions/réponses avec bibliothécaire), l’accessibilité à distance de multiples données.

– les métamorphoses des collections : les collections papier coexistent avec des collections numériques.

La bibliothèque numérique de la BnF va émerger depuis la fin des années 80, avec le projet de la BnF, jusqu’en 2000 avec la mise en ligne de Gallica 2000.

Le 14 juillet 1988, lors de l’annonce par François Mitterrand du grand projet de la BnF, la mission d’innovation technologique de cette future bibliothèque est déjà présente dans le discours.

Une direction innovation numérique sera créée, avec un groupe de travail, avec la collaboration notamment d’Alain Giffard. Les cabines de travail avec un ordinateur : les PLAO (poste de lecture assistée par ordinateur) seront conçues essentiellement pour le traitement de texte à l’époque, mais tout de même avec l’idée de réseau. C’est surtout une période de réflexion.

L’idée de numérisation va venir plus tard. En 1992, les expériences de numérisation sont encore très artisanales.

En octobre 1997, une version pilote de bibliothèque numérique voit le jour. La volonté politique est évidente à l’époque. Une première proposition est faite suite aux réactions des usagers.

En janvier 2000 apparaît Gallica 2000 : une bibliothèque accessible, libre et gratuite (135 000 documents imprimés à l’époque).

Gallica 2000 se veut une bibliothèque encyclopédique avec les disciplines phares liées à la BnF. Cette première version de bibliothèque numérique propose essentiellement les collections physiques de la BnF. La littérature représente environ la moitié du fonds, l’histoire environ un tiers du fonds, le fonds est surtout francophone au départ, avec une forte dominante XIXème siècle (pour des questions de droit le XXème siècle est écarté et le XIXème siècle est important quantitativement à la BnF par rapport aux siècles précédents).

Les documents rares et précieux sont également très présents dans cette première version.

Gallica 2000 suit une politique de sélection structurée, une logique de corpus.

Dès la fin des années 90, avec l’appui de spécialistes, des corpus de référence sont constitués, très axés pour un public de chercheurs à l’époque ; sont retenus les ouvrages d’orientation (dictionnaires…) et les textes fondamentaux de chaque discipline.

Divers modes d’accès sont proposés : l’interrogation classique (catalogue), l’interface découverte, les dossiers thématiques.

Pour la première mise en ligne, Gallica classique propose 1000 textes fondamentaux de la littérature classique et une bibliothèque des utopies. Suivront Voyages en Afrique

En 2002, une enquête d’usages de Gallica 2000 montre un bon taux de satisfaction ; l’outil semble adapté aux usages des publics à qui il est destiné.

Aujourd’hui, les limites de Gallica 2000 sont de trois ordres. Des limites techniques : Gallica 2000 est essentiellement en mode image (seulement certains en mode texte) ce qui empêche la navigation dans le document. Des limites documentaires : le problème de la masse critique ; début 2000, 10 000 titres par an. Et enfin des limites de fonctionnalités : le contenu des fonctionnalités, les services aux usagers doivent évoluer.

Actuellement, la BnF travaille à l’augmentation de la masse de documents disponibles avec trois gros chantiers menés simultanément.

Un programme sur la numérisation de la presse commence en 2004. Le corpus de la presse de la BnF est une des collections les plus riches du monde et une des plus consultées par le public, avec des problèmes de conservation dûs au format et à l’acidité du papier. Un programme au coût très lourd : 3,3 millions d’euros, effectué sur les chaînes internes de la BnF, avec de multiples manipulations. Ce programme est en cours d’achèvement. Les effets sont déjà visibles sur le web : possibilité de consulter en ligne Le temps, Le Matin… la presse quotidienne jusqu’en 1944.

Le deuxième programme en cours concerne les imprimés hors presse. Ce programme de grande ampleur arrivera à échéance en septembre 2010. Là aussi un coût très lourd : quatre millions d’euros par an pendant quatre ans (très lourd pour la puissance publique, grâce aux crédits du CNL). Ce programme concerne toutes les disciplines, reflète la structure des collections : une part importante à l’histoire, la littérature et aux sciences.

Les livres numérisés sont choisis selon trois critères :

– Cadre strict du domaine public (impasse sur le XXème siècle).

– État physique du document : on n’envoie pas à la numérisation un document qui risque d’être dégradé.

– Si aspect physique propre à numérisation.

La numérisation se fait en mode image puis passage en OCR : reconnaissance de caractères.

Ce programme de numérisation de masse concerne notamment la littérature (romans, poésie, théâtre).

Pour les romans, le but est de mettre à disposition les chefs d’œuvre et la littérature industrielle pour montrer la variété de la création littéraire (roman d’aventure, roman d’anticipation…)

Pour la poésie, ce qui émerge comme corpus ce sont les grands textes, les entrées royales, les pamphlets, la poésie de circonstances, la poésie féminine, la poésie ouvrière, la poésie politique, la poésie régionale… : la forme poétique dans tous ses genres.

Pour le théâtre, et plus largement les arts du spectacle ; les œuvres complètes de dramaturge, les études sur les arts du théâtre, l’opéra-bouffe…

Gallica ne cherche plus à s’adresser seulement aux historiens. L’offre qui apparaît en ligne favorise la recherche pluridisciplinaire et ouvre le champ de la recherche aux curieux.

Un troisième programme, lancé à l’été 2009 pour trois ans, concerne la numérisation des trésors, les documents rares et précieux (manuscrits, estampes, photos, ouvrages rares, partitions…), notamment pour mettre de l’image à disposition. Ce programme est en cours de définition, en concertation avec des programmes universitaires de recherche.

4500 manuscrits en ligne sur Gallica aujourd’hui.

La BnF travaille également au développement des nouvelles fonctionnalités.

Le tournant fondamental est le passage au mode texte, avec, depuis 2007-2008, la conversion en mode texte des documents en mode image et la campagne de numérisation en mode texte.

Récemment, les documents Gallica deviennent moissonnables ; il est possible de récupérer les documents de Gallica. L’adresse et le lien de chaque document Gallica sont pérennes.

Les internautes peuvent se créer un espace personnel, se créer leur propre bibliothèque numérique, après inscription. Les documents conservés peuvent être classer en sous-dossier, marquer, tagger. Désormais il est possible de dialoguer avec le blog Gallica, de s’abonner à la lettre électronique d’information, de s’abonner au flux RSS pour les nouveautés, de signaler une anomalie, une insatisfaction ou de faire la proposition de tel document à numériser.

Gallica est également adaptée pour les non-voyants ou malvoyants : mode écoute des documents, possibilité d’augmenter les caractères…

Le 23 novembre 2009, un nouveau visualiseur a été mis en place pour un feuilletage plus simple, plus rapide, plus puissant, pour une lecture avec plus de repères (possibilité de mettre pages en face à face).

Pour la BnF, plusieurs questions demeurent.

Le programme SPAR (Système de Préservation et d’Archivage Réparti) a été lancé pour l’archivage pérenne des documents numériques. Tout un travail de coopération, de concertation est envisagé concernant l’archivage en France, avec les grands centres d’archivages et les grands établissements universitaires.

La question du coût de la numérisation avec la masse de données à numériser et le niveau de sécurité requis nécessite également des actions de coopération : coopération nationale (programmes de numérisation concertée, notamment avec les pôles associés) et internationale (notamment pour Europeana, la bibliothèque numérique européenne). La BnF recherche de nouvelles sources de financement (fondations américaines, programmes européens, CNRS …)

Et la BnF est toujours en réflexion sur la question de mise en ligne des ouvrages sous droit.

(Concernant les discussions de la BnF avec Google pour la numérisation de ses collections, le sujet ne sera abordé qu’après une question du public :

Pour Isabelle Le Masne : les bibliothèques nationales discutent entre elles des différents projets de numérisation de leurs collections et discutent donc aussi avec Google. Il existe une volonté d’avoir une position commune entre les bibliothèques nationales européennes avec des partenariats possibles mais la BnF travaille surtout sur les possibles partenariats européens, les financements européens.)

Pour d’autres compte-rendus des conférences de ces deux journées, vous pouvez aller sur les blogs suivants :

– la conférence de Bernard Stiegler « Les grammatisations du lecteur » sur Abracadabrabibliothèque

– la conférence d’Alain Giffard « La lecture numérique peut-elle se substituer à la lecture publique ? » sur Bibliorev
et sur Bibliophage

– la conférence de  Hervé Le Crosnier « Pratiques de lecture à l’ère de l’ubiquité, de la communication et du partage de la connaissance » sur Bibliocompagnie

– la conférence de Gilles Eboli « Les bibliothèques avec le numérique » sur Bibliopholie

– la conférence de Marin Dacos « Read/write Book. Le livre devient inscriptible. » sur Bibulles

– la conférence de Brigitte Simonnot « Nouvelles médiations, nouveaux médiateurs de la lecture numérique. » sur Bibévolution et sur  Encrinet

– la conférence de Thierry Baccino « Les lectures numériques : réalité augmentée ou diminuée ? » sur  Tâche d’encre 00

Publicités

Tous les renseignements pour s’inscrire à cette licence professionnelle sont disponibles sur le blog de l’IUT d’Aix-en-provence (département information-communication) et sur le site de l’IUT d’Aix-en-Provence.