Des nouvelles du livre à la demande

Le 2 mai 1997, au cours du Salon du livre de Genève, une démonstration fascinante a eu lieu : le temps d’une conférence, un livre ancien de 1776 a été réimprimé en fac-simile à partir de la numérisation de l’original, les pages encollées et recouvertes d’une reliure souple, grâce une imprimante numérique Xerox Docutech[1].

Vingt-cinq ans plus tard, il nous a semblé intéressant d’évoquer le développement de ce que l’on pouvait considérer alors comme une petite révolution. Comment a évolué cette technique? A-t-elle tenu ses promesses? A-t-elle été un succès? Comme souvent, le bilan provisoire – l’histoire n’est certainement pas achevée – est nuancé.

Relation de différents voyages dans les Alpes du Faucigny, couverture
Relation de différents voyages dans les Alpes du Faucigny, ex-libris et faux-titre

Evénément au Salon du livre de Genève le 2 mai 1997: réimpression à la demande de Relation de différents voyages dans les Alpes du Faucigny, paru en 1776

La promesse

A l’époque, l’impression à la demande, ou le livre à la demande, était un concept novateur, le meilleur de la modernité au service de la tradition. Elle devait résoudre plusieurs problèmes de l’édition:

  • La réduction constante des tirages. Dans un article très commenté, l’historien spécialiste du livre Robert Darnton expliquait déjà cette crise de l’édition de monographies, notamment en sciences humaines[2]. Des recherches, même importantes, risquaient de ne plus être publiées en raison de ventes trop faibles.
  • La volatilité des ventes. C’est une difficulté qui tourmente tous les éditeurs: à combien d’exemplaires faut-il tirer ce livre? Trop, et l’éditeur se retrouve avec des stocks inutiles sur les bras. Trop peu, et il rate des ventes. Dans les deux cas, ce sont des pertes financières.
  • L’accès aux textes épuisés. Cette technique permet de faire revivre d’anciens textes introuvables, comme l’a montré l’expérience du Salon du livre de Genève. L’original est numérisé dans une bibliothèque, puis imprimé en fac-similé par une chaîne automatisée pour réduire les coûts unitaires. La Bibliothèque nationale suisse, comme d’autres bibliothèques, offre d’ailleurs ce service depuis 2010, en lien avec un partenaire, et pour autant que les livres soient dans le domaine public[3].

Un automate à livres dans les librairies

Outre l’exemple du Salon du livre genevois, je me souviens avoir vu une Espresso Book Machine (EBM) à la librairie américaine à La Haye en octobre 2010. Cet automate permettant de fabriquer des livres à l’unité a été inventée par un écrivain et éditeur américain, Jason Epstein, récemment disparu, qui créa en 2003 une société On Demand Books dans le but de dynamiser la commercialisation des livres anciens.

Espresso Book Machine à la librairie américaine de La Haye, 05.10.2011

Une Espresso Book Machine à la librairie américaine de La Haye, 05.10.2011

On pourrait penser que cette machine, avec son côté artisanal sympathique, sorte de boîte vitrée remplie de composants électroniques et de câbles, adossée à une grosse imprimante, s’est largement répandue depuis. D’après mes recherches, cela ne semble pas être le cas: aux dernières nouvelles, seule la librairie American Book Centre dispose toujours de machines EBM – surnommées “Betty”–, une dans sa succursale de La Haye et une autre à Amsterdam. Elles impriment à la demande les livres d’un catalogue sélectif et également des livres auto-édités, apportés par des particuliers.

En 2016 une Espresso Book Machine est installée dans la nouvelle librairie des PUF à Paris. Mais seuls les titres de cette maison universitaire peuvent être imprimés, comme la collection phare Que sais-je? Ainsi nul besoin de disposer un fond de stock avec tous les titres du catalogue. On s’approche ici de ce que pourrait être une “librairie sans livres”.

A part ces exemples, la machine ne semble pas avoir eu de succès. Une des raisons est donnée par le cas de la librairie des PUF:  il n’est pas possible d’imprimer les livres d’autres éditeurs, car ils ne mettent pas leurs fichiers à disposition. Pour une librairie généraliste, c’est tout simplement rédhibitoire.

Brooke Warner, une éditrice américaine, avance aussi une autre raison: l’EBM ne prend pas car la machine est coûteuse, demande beaucoup de maintenance et la qualité du livre ainsi imprimé n’est pas fameuse[4].

Du côté des imprimeurs

Le fait est que ce sont plutôt les imprimeries industrielles qui ont compris et exploité tout le potentiel de l’impression à la demande. En-dessous d’un certain niveau de stock, une requête permet automatiquement de retirer en petit nombre un titre, de sorte que celui-ci est toujours disponible malgré un stock minimal.

Si le titre appartient plutôt à la “longue traîne”, c’est-à-dire que les demandes sont rares et ponctuelles, il sera alors imprimé à l’unité lorsque le besoin s’en fera sentir.

Dans tous les cas le nombre d’exemplaires reste modeste. Pour les best-sellers dont la demande est continue, l’impression offset traditionnelle est plus avantageuse.

Pour être rentable, le processus doit pouvoir intégrer toutes les étapes (impression, couverture, encollage et reliure) sans intervention manuelle.

Neomedia, une start-up française, a développé en 2015 un robot imprimeur, le Gutenberg One, d’une qualité supérieure à l’EBM. Quelques éditeurs comme L’Harmattan, PUF, Belin, Les Equateurs, Tallandier, etc. ont mis à disposition leurs catalogues.

D’autres systèmes d’impression de dimension industrielle existent, comme Copernics, lancé en 2017 par le distributeur Interforum. Celui-ci peut imprimer en flux tendu des séries assez importantes de 2’000 à 3’000 exemplaires pour le compte d’éditeurs majeurs (groupe Editis). Un autre acteur important est Dupliprint.

Le livre à la demande répond à une stratégie entrepreneuriale de diminution des coûts, tout en se parant de vertus écologiques: moins de gaspillage de matière première, moins de stocks qui occupent de la place et immobilisent le capital.

Enseignements

Que dire en définitive de cette évolution du livre à la demande?

  1. La force symbolique du livre dans notre culture est telle qu’elle peut générer beaucoup d’enthousiasme, sans être toujours suivie de succès[5]. On l’a vu par exemple avec l’échec du livre numérique Cytale, dont l’aventure entrepreneuriale se situe aussi autour des années 2000 (cf blog…).

A l’origine, l’Espresso Book Machine est conçue au service d’une utopie: permettre aux libraires de devenir les acteurs d’un accès universel aux livres. Mais cette démarche s’est effacée au profit d’une dimension industrielle et commerciale: l’optimisation des stocks et des délais. Le livre à la demande est un procédé dont le lecteur n’est pas conscient. Il doit d’ailleurs être suffisamment élaboré pour que le client ne voie aucune différence entre un exemplaire produit de cette façon ou de manière traditionnelle.

 2. L’imprimé conserve un statut considérable, surtout en France, où les ebooks sont tenus pour des ersatz de livres. Il n’est pas étonnant que Gutenberg One soit une invention française: son créateur Hubert Pédurand, après un voyage aux Etats-Unis où il fait connaissance de l’EBM, dit clairement: “Je suis alors convaincu que la France peut faire mieux.” (L’Yonne Républicaine, 14.12.2021).

Un autre acteur de l’impression à la demande, Norbert Legait de Dupliprint exprime bien cette différence de statut: “En France, on nous commande trois cents formats différents ! Aux Etats-Unis, ils en ont une poignée.”

En fin de compte, l’impression à la demande représente le triomphe de la rationalité économique. Il est devenu un outil industriel au service du livre imprimé, auquel on cherche à préserver à tout prix son prestige.

[1] Première mondiale est une notion usurpée: François Bon raconte une expérience semblable en 1995 au Banquet du Livre de l’Abbaye de Lagrasse (Aude).

[2] “Le nouvel âge du livre”, Le Débat, n. 105, 1999, p 176‑184.

[3] eBooks on Demand (EOD). EOD est un réseau de 40 bibliothèques européennes. L’utilisateur peut demander un fichier PDF ou, moyennant un supplément, un fac-similé papier.

[4] “What It Would Take to Disrupt the Publishing Industry”, Publisher’s Weekly, 08.10.2021

[5] François Bon, infatigable défricheur du libre numérique et observateur aiguisé de ce milieu a la remarque la plus juste en convient volontiers: ” nous n’avons jamais pu conquérir pour le livre numérique la valeur symbolique attachée à l’objet imprimé” . https://www.tierslivre.net/spip/spip.php?article4376

De la numérisation des journaux

Mon institution, la Bibliothèque de Genève, vient de mettre en ligne une partie de La Tribune de Genève. C’est le premier pas vers une offre plus étoffée. Convertir des millions de pages sous forme numérique est une nécessité parce que c’est ainsi que l’on accède désormais aux archives des journaux, mais cette opération est tout sauf anodine.

En 1918, la grippe espagnole impose des mesures proches de celles que nous connaissons aujourd’hui. Un renseignement parmi d’autres que nous fournit la presse ancienne numérisée (Tribune de Genève 18.10.1918).

La « magie » du numérique et de son accès, le nombre quasiment illimité de pages à disposition, font facilement perdre de vue que le processus pour produire ces documents est d’abord matériel. Comme on finit par oublier que le pain acheté au supermarché, banal par sa familiarité et son abondance, est le résultat d’une complexe chaîne de production qui débute par des semailles.

Il s’agit d’abord d’une prouesse logistique: il faut vérifier les collections des bibliothèques, contrôler qu’elles soient complètes et aptes à être numérisées. On remercie au passage la chaîne de collègues qui, pendant des générations, les ont constituées. La continuité historique d’une mission de collecte donne toute sa valeur aux institutions patrimoniales.

Ensuite il faut envisager le processus de numérisation: l’externalisation est généralement la solution la plus avantageuse, car un tel volume de pages ne peut être traité que par des entreprises spécialisées. Cela implique de pouvoir déplacer de très grandes quantités de volumes.

Le transport doit être préparé, et nécessite un constat d’état précis. Il s’agit en effet d’ensembles patrimoniaux rares: il n’existe en général que 2 ou 3 collections complètes. Des tonnes de papier sont ainsi massivement déplacées, alors qu’auparavant les publications ne quittaient leur lieu de dépôt que sporadiquement, pour être consultées en salle de lecture, sans sortir du bâtiment.

Après la numérisation, les volumes reviennent et il faut les replacer en rayon.

Une gamme de traitements

Une fois converties en pixels, les pages des journaux subissent encore plusieurs transformations.

Il faut s’assurer de la qualité de la numérisation, faire des vérifications à l’écran, afin de s’assurer de la complétude de l’information.

Ensuite, les données obtenues doivent être traitées. On parle alors de structuration ou de segmentation. C’est un peu une sorte de « reverse engineering »: à partir d’une image qui n’est encore qu’un amas de pixels, on reconstruit la logique du journal: on identifie le bandeau de titre, les colonnes, les blocs formant un article, une illustration, une publicité… et bien sûr le texte lui-même. A l’heure actuelle ces traitements sont semi-automatiques, c’est-à-dire que des armées d’opérateur.trice.s doivent vérifier patiemment les métadonnées de toutes les pages scannées.

Enfin, toutes ces informations, données et métadonnées, sont chargées sur un serveur, puis indexées, ce qui permettra de les offrir au public, ou à de nouvelles exploitations informatiques grâce au « data mining ».

Le poids du virtuel

Le torrent numérique qui défile sur nos écrans nous le fait souvent oublier: un serveur est fragile; les données peuvent s’altérer. Saura-t-on les conserver? L’archivage numérique est désormais un thème bien étudié et des normes existent depuis de nombreuses années. Elles sont cependant exigeantes et coûteuses, difficiles à respecter totalement. Est-ce que cela met en cause la pérennité de ces réalisations numériques?

Pas nécessairement. Osons une comparaison avec le papier. Il y a cent ou deux cents ans, les locaux des bibliothèques n’avaient pas de climatisation contrôlée, n’étaient pas comme aujourd’hui protégés contre les dégâts d’eau, les incendies ou encore le vol. Pour autant, une bonne partie de notre patrimoine nous est parvenu, grâce à des mesures simples : la reliure protège les feuilles et évite qu’elles ne se dispersent et se perdent. Cela peut faire sourire, mais dans l’ensemble cela a plutôt bien fonctionné.

Nous en sommes peut-être à un même stade aujourd’hui avec le numérique. Nos dispositifs sont peut-être insuffisants, et nous serons vraisemblablement considérés comme inconscients par nos successeurs. Ce qui n’empêchera pas, nous l’espérons, à la plupart de nos numérisations de traverser le temps.

Le retour de Google Books

La nouvelle est tombée dans la torpeur de l’été, entre deux épisodes caniculaires: plusieurs bibliothèques alémaniques vont numériser leurs collections grâce à Google. Depuis l’annonce fracassante il y a maintenant 15 ans du programme Google Books [1] avec la numérisation en masse de prestigieuses bibliothèques anglo-saxonnes (New York, Harvard, Stanford, Michigan et Oxford) et la polémique qu’il suscita, notamment en France, après l’émoi suscité en 2007 par la première bibliothèque suisse et francophone à se lancer dans cette aventure (Lausanne), Google est devenu une bibliothèque numérique presque comme les autres et qui a fini par se fondre dans le paysage.

A tel point que beaucoup d’observateurs ont pu penser que le projet, était avec 35 millions de livres numérisés, si ce n’est achevé, du moins sur la voie de l’être et que Google se consacrait désormais à d’autres explorations stratégiques.

C’est dire que le 15 juillet dernier, le communiqué de presse de la Bibliothèque universitaire de Berne a été quand même une surprise pour ceux qui suivent les programmes de numérisation dans ce pays [2]. L’annonce a été relayée par les médias, mais n’a soulevé cette fois aucune polémique.

Quels enseignements pouvons-nous en tirer ?

1. Une des vertus managériales principales de notre temps est le “pragmatisme”. Les porteurs du projet servent cet argument: Google est un partenaire industriel capable de traiter en quelques semestres des centaines de milliers de livres. C’est donc un accélérateur de la numérisation et un bienfait pour les usagers qui vont pouvoir accéder à un patrimoine conséquent avec les outils de leur temps, un des objectifs majeurs de toute bibliothèque, avec un coût négligeable pour le contribuable, puisque Google prend en charge l’essentiel des frais. De plus il donne de sérieuses garanties quant au transport et la manutention des livres qui rejoignent les standards en vigueur pour les collections précieuses. Hubert Villard, directeur de la Bibliothèque cantonale et universitaire de Lausanne à l’initiative du projet Googlos (Google-Lausanne) s’enthousiasmait: “Les gens de Google sont terriblement pros et efficaces.” [3] Cela répond, dix bonnes années plus tard, au regret exprimé par la directrice de la Bibliothèque nationale, qui déclarait dans Le Temps: “La numérisation des bibliothèques publiques avance à pas d’escargot” [4]

A. von Haller, Les Alpes
A. von Haller, Die Alpen

Pages de titre d’une édition bilingue du poème “Les Alpes”, par le naturaliste bernois Albrecht von Haller (1795). Exemplaire de la Bibliothèque nationale autrichienne, numérisé par Google

2. Mine de rien, la Suisse est en passe de devenir avec cette opération un des pays qui a le plus ouvert les portes à Google, avec des bibliothèques partenaires dans les deux principales régions, germanophone et francophone. D’autant que le communiqué laisse la porte ouverte à d’autres institutions.

3. Le parallèle initiatives publiques vs Google livres est cruel: voilà bientôt dix ans aussi que la bibliothèque numérique e-rara.ch est ouverte. Elle a fonctionné d’abord avec de l’argent de la confédération, puis n’est financée que par les bibliothèques membres. L’avancée est loin d’être négligeable: le portail est réputé pour l’importance des documents et la qualité des images. Mais tous ces efforts n’ont conduit qu’à 75’000 titres offerts au public, et la reconnaissance de caractères (qui permet la recherche en texte intégral) n’est possible que pour les imprimés postérieurs à 1800… Google traite avec les bibliothèques des centaines de milliers de livres.

Est-ce à dire que seul un opérateur privé est capable, en Suisse, de s’occuper massivement de numérisation? En France Gallica héberge tout de même 642’000 livres, sans compter bien d’autres documents.

[1] Le communiqué de l’Université de Berne: “100’000 Bücher der Universitätsbibliothek Bern werden durch Google Books digitalisiert, Universität Bern, 15.07.2019.
Celui de la bibliothèque de Lucerne: “Google Books digitalisiert 60’000 Bücher der ZHB”. ZHB Zentral- und Hochschulbibliothek Luzern, 06.08.2019.
Un article pour celle de Zurich: “Zentralbibliothek Zürich lässt Google an ihre Sammlung”, dans la Netzwoche du 16.07.2019.
Ainsi qu’un sujet d’une émission de la radio suisse alémanique: “Schnelleres Digitalisieren – Google Books spannt mit Schweizer Bibliotheken zusammen”, SRF, 30.07.2019.
[2] Lire par exemple la tribune de Michael Gorman, “Google and God’s Mind. The problem is, information isn’t knowledge”, Los Angeles Times, 17.12. 2004.

[3] 24 Heures, 16.05.2007. H. Villard retrace sa carrière dans le volume Entretiens, aux éditions L’Esprit de la Lettre, coll. Bibliothéchos.

[4] Le Temps, 04.05.2007

Numérisation des bibliothèques: réactions

Mon dernier billet Bibliothèques: un état de la numérisation à propos d’une étude d’Europeana [1] a attiré l’attention d’un collègue de la Bibliothèque cantonale et universitaire de Lausanne, Théophile Naito [2]. Avec sa permission, il m’a paru intéressant de réagir ici-même. Voici donc notre échange.

Les responsables expliquent alors que la numérisation est une entreprise de longue haleine, coûteuse, qui se fait en réseau avec d’autres institutions dont la mission est comparable et qu’il est à peu près certain que tout ne sera pas numérisé.

TN: Cela dépend aussi de ce que l’on entend par “tout”. Tous les exemplaires? Un exemplaire de chaque publication? Un exemplaire de chaque œuvre?

AR: De même qu’il y a des exemplaires d’un même livre à différents endroits afin que les utilisateurs puissent les atteindre aisément, le même livre peut être numérisé dans différentes bibliothèques numériques. Toutefois, dans la mesure où le libre accès est la règle, l’intérêt pour une bibliothèque A de numériser un livre déjà traité par la bibliothèque B est limité.

V. Bérard et F. Boissonnas, l'Odyssée

Valorisation de la numérisation à la Bibliothèque de Genève. L’Odyssée, du mythe à la photographie. Victor Bérard et Fred Boissonnas sur les traces d’Ulysse. https://www.unige.ch/sciences-societe/geo/ulysse/fr

Elle ne se justifie que si l’exemplaire a des particularités intéressantes: annotations manuscrites, reliure, ex-libris… La mauvais qualité ou l’accessibilité insuffisante de certaines anciennes numérisation peuvent également la justifier.

TN: Oui, mais vérifier qu’un document a déjà été numérisé ailleurs peut être compliqué!

AR: Il existe des sites qui facilitent cette vérification, comme le Karlsruher Virtueller Katalog (KVK) qui effectue une recherche fédérée dans de nombreuses bibliothèques numériques dont les plus importantes (Gallica, Europeana, Google Livres, Internet Archives, e-rara.ch). Ce qui vaut pour les exemplaires vaut a fortiori pour les œuvres: le contenu de différentes éditions d’une même œuvre sont rarement totalement identiques: préface, introduction, notes, ou encore illustrations. Là aussi ces variantes peuvent justifier plusieurs numérisations.Sauf erreur, ces distinctions ne sont pas prises en compte dans l’étude d’Europeana. Le formulaire fait mention de “digital object” et il semble que c’est aux institutions de donner à ce “digital object” la définition qui leur convient, laquelle peut tenir compte des remarques ci-dessus.

TN: De mon côté, je suis plutôt optimiste: si on regarde les documents publiés, je pense que les documents qui suscitent un intérêt sont déjà numérisés ou le seront assez rapidement, avec la grosse réserve lié au droit d’auteur.En résumé, je fais l’hypothèse que chaque document publié qui est dans le domaine public et qui suscite un ‘intérêt est déjà numérisé et disponible en ligne ou le sera assez rapidement (c’est une question d’années, ou peut-être un peu plus), au moins dans l’environnement suisse. Ceci dit, cela laisse du travail, d’autant plus que le domaine public s’élargit chaque année.

AR: Optimisme partagé! Le livre a ceci d’intéressant que différents acteurs peuvent vouloir sa numérisation: d’abord plusieurs bibliothèques peuvent souhaiter la mise en ligne d’un même document détenu dans sa collection. Mais il y a aussi les éditeurs – je pense notamment aux sociétés savantes – et des acteurs commerciaux qui vendent des abonnements numériques aux bibliothèques académiques. Ou encore des opérateurs mégalomaniaques, tel Google.

…58% des contenus numérisés sont accessibles en ligne

TN: Ce chiffre est bien intéressant, parce qu’il suggère que l’effort devrait petit à petit se déplacer de la numérisation vers la mise en ligne. Et l’étape suivante/parallèle serait de créer les fonctionnalités nécessaires pour exploiter au mieux les ressources en ligne (par exemple, certaines requêtes légitimes sur la presse numérisée sont impossibles dans la plupart des bibliothèques numériques).

AR: Je suis d’accord. On voit bien qu’il y a deux défis à surmonter. D’abord la numérisation des contenus et celui de la mise en ligne adaptée à la typologie des contenus et aux besoins des utilisateurs. Et ces besoins évoluent souvent plus vite que les outils.

…ou dont les droits sont détenus par l’institution (30%)

TN: Ce chiffre m’étonne un peu.

AR: Je comprends ta réaction. Je pense que ce chiffre recouvre deux situations: d’abord une bibliothèque acquiert une collection avec des droits d’exploitation, comme cela est souvent le cas pour les collections spéciales (documents d’archives ou iconographiques, par exemple). Ensuite, la bibliothèque a pu obtenir des autorisations auprès des ayants-droit pour diffuser des œuvres numérisés qui n’ont plus de potentiel économique. Il est finalement compréhensible que la numérisation porte avant tout sur des contenus que l’on pourra diffuser en ligne, soit parce qu’ils sont dans le domaine public, soit parce que l’institution dispose des droits.

Ce qui est certain, c’est que la numérisation va continuer à structurer pendant longtemps les activités de ces institutions…

TN: Je suis d’accord.

AR: Mais tout dépend des priorités des organisations. Une bibliothèque pourrait décider qu’elle ne poursuit plus la numérisation, afin de se consacrer à d’autres projets, même si elle n’a pas achevé ce travail.

… et les usagers devront continuer à consulter les supports matériels.

TN: Je suis peut-être un peu moins d’accord, surtout pour les titres dans le domaine public. Les usagers ne trouveront peut-être pas ce qu’ils cherchent sous forme numérique dans leur bibliothèque. Mais en cherchant un peu, ils trouveront probablement ce document numérique auprès d’une autre bibliothèque ou dans une méga-bibliothèque numérique du type “Google” ou “Internet archive”. Ou dans une librairie numérique (contre payement dans ce cas).

Mais je suis d’accord avec toi pour le cas des documents protégés par le droit (et c’est vrai, ça en fait beaucoup). Pour ces situations, il est encore difficile de se passer du papier, surtout si l’usager ne souhaite pas payer.

AR: Oui, les motivations d’usage du papier deviennent diverses: usage contraint, car il n’y a pas d’alternative ou qu’elle est trop coûteuse, usage délibéré par choix, ou encore usage de niche, spécialisé.

Les responsables politiques demandent aussi qu’elle profite au grand public, alors que son intérêt n’est pas toujours évident.

TN: Il me semble c’est une vraie question: est-ce que la mobilisation de moyens relativement importants se justifie alors que seul un petit nombre d’usagers en profite?

AR: Par le passé, un musée pouvait concevoir une exposition visitée par une poignée de visiteurs. Aujourd’hui cela ne semble plus défendable. Faut-il pour autant s’interdire de numériser des fleurons du patrimoine sous prétexte qu’ils ne sont pas “vendables” au plus grand nombre? Je trouve qu’on ne devrait pas avoir à opposer ces publics…

TN: Oui, mais en pratique les budgets ne sont pas illimités et il faut bien faire des arbitrages.

[1] Europeana DSI 2 – Access to Digital Resources of European Heritage. D4.4. Report on ENUMERATE Core Survey 4, Europeana Foundation, 31.08.2017. https://pro.europeana.eu/files/Europeana_Professional/Projects/Project_list/Europeana_DSI-2/Deliverables/d4.4-report-on-enumerate-core-survey-4.pdf

[2] Théophile Naito est l’auteur de “Choisir un format d’images numériques dans le cadre de la numérisation patrimoniale”, in: Gilbert Coutaz (éd.), Informationswissenschaft: Theorie, Methode und Praxis : Arbeiten aus dem Master of Advanced Studies in Archival, Library and Information Science, 2010 – 2012 = Sciences de l’information: théorie, méthode et pratique, Baden, hier + jetzt, 2014, p. 47‑74.

Bibliothèques: un état de la numérisation

Scanner pour livre ancien

Scanner pour livre fragile et ancien à Zurich en 2010

Le mythe de la bibliothèque universelle reste vivace. La visite des collections d’une grande bibliothèque patrimoniale fait forte impression auprès du public, probablement à mesure que les livres désertent progressivement nos étagères à la maison. Mais une question revient inlassablement: « Est-ce que vous numérisez tous ces livres? »

Les responsables expliquent alors que la numérisation est une entreprise de longue haleine, coûteuse, qui se fait en réseau avec d’autres institutions dont la mission est comparable et qu’il est à peu près certain que tout ne sera pas numérisé.

Les bibliothèques estiment qu’elles sont dans une phase de transition, que le numérique gagne du terrain, mais que les livres résistent  [1]. C’est moins vrai pour les usages. La recherche se fait toujours plus massivement et exclusivement avec de la documentation numérique. Ce qui fait courir le risque du biais de perspectives: ce qui n’existe pas numériquement a moins de chance d’être identifié et exploité. La commodité du numérique est plus qu’un simple confort: c’est une orientation extrêmement puissante dont il faut tenir compte . Même les travaux universitaires font pour la plupart l’impasse sur des ressources imprimées pertinentes, mais d’accès un peu moins facile.

C’est pourquoi, après une vingtaine d’années de pratique, il est intéressant de savoir jusqu’à quel point la numérisation des bibliothèques est avancée. Philippe Colombet, ancien responsable du programme Google Livre pour la France déclarait il y a quelques années: « 15% du savoir se trouve sur le Web et 85% dans les livres » [2].

L’année dernière, Europeana a publié une enquête (Core Survey 4) sur l’état de la numérisation dans les institutions patrimoniales du vieux continent [3]. Selon cette étude 22% des collections patrimoniales des répondants a été numérisé (tous types confondus: bibliothèques, musées, archives, centres de conservation audiovisuels. Si on se limite aux bibliothèques cette proportion est de 17%. On serait donc encore bien loin du compte même si ce chiffre doit être considéré avec une bonne marge d’erreur, en raison du mode de calcul et du nombre limité d’institutions ayant répondu à l’enquête.

Les institutions déclarent que 24% en moyenne de leurs collections patrimoniales ne sont pas destinées à être numérisées. Il aurait été intéressant d’en connaître les critères: fragilité extrême de l’original ou trop grande complexité? Doublons? Inintérêt du contenu?

Mentionnons encore quelques chiffres de ce rapport. 58% des contenus numérisés sont accessibles en ligne. On imagine que le reste ne l’est pas pour des raisons techniques ou de copyright. Si la numérisation porte essentiellement sur des œuvres du domaine public (38%) ou dont les droits sont détenus par l’institution (30%), le reste (32%) est détenu par des tiers ou a un statut qui n’est pas clair.

Enfin les raisons invoquées pour donner un accès numérique à ces contenus sont limpides: il s’agit majoritairement de la recherche académique, de finalités pédagogiques et de réduire les risques sur les objets physiques en les soustrayant à la consultation.

Quels sont les enseignements de cette étude ? J’en vois trois:

  1. D’abord un utile rappel que nous sommes toujours dans une phase de transition et qu’une partie encore assez faible de notre héritage est numérisé. Peu importe finalement les réserves méthodologiques sur la façon d’obtenir ce pourcentage, c’est l’ordre de grandeur qui compte. Ce qui est certain, c’est que la numérisation va continuer à structurer pendant longtemps les activités de ces institutions et les usagers devront continuer à consulter les supports matériels.
  2. L’observateur est frappé du profond décalage entre cette réalité de la numérisation patrimoniale et la production du savoir actuel. La Suisse, comme les autres pays européens, s’est donnée un objectif ambitieux: à l’horizon de 2020, toutes les recherches financées par de l’argent public doivent être publiées en open access [4]. Cette volonté politique forte n’est pas motivée seulement par l’accès aux résultats de la recherche et au progrès de la science, mais témoigne également d’une intention de transparence. On ne s’attend guère à ce que le « grand public » s’empare d’études de physique théorique, mais on lui dit: « Voici ce qui est fait avec votre argent ».
  3. Cette question de l’usage de la numérisation manifeste un autre écart, entre les professionnels et leur tutelle cette fois. Pour les premiers, l’enquête indique que la communauté académique est la principale bénéficiaire de l’accès aux collections numérisées. Les responsables politiques demandent aussi qu’elle profite au grand public, alors que son intérêt n’est pas toujours évident. La presse numérisée est certainement une exception, car son attrait est très large. D’autres contenus demandent un accompagnement particulier pour pouvoir sortir d’un cercle restreint de connaisseurs. Ce qui relève de la médiation. Son objectif nouveau est difficile à jauger: comment inciter à découvrir ces documents, et jusqu’où aller? Ce n’est pas l’objet de ce billet, mais il est clair que les bibliothèques se mettent à réinventer leur rôle de passerelle entre collections et usagers. A ce titre leurs actions se rapprochent du journalisme (établissement et compréhension des faits) et de l’enseignement (formation au cours de la vie).

Décidément le numérique n’a pas fini de reconfigurer nos organisations…

[1] La Bibliothèque nationale a intitulé ainsi son plan stratégique pour la période 2012-2019: “L’avenir est numérique, mais le papier subsistera.” Rapport annuel. Bibliothèque nationale suisse. 2012. http://dx.doi.org/10.5169/seals-362342.

[2] D’après Alain Jacquesson, “La Bibliothèque numérique”, in: Réseau Patrimoines, n. 13, 11.2012, p. 47‑54.

[3] Europeana DSI 2 – Access to Digital Resources of European Heritage. D4.4. Report on ENUMERATE Core Survey 4, Europeana Foundation, 31.08.2017. https://pro.europeana.eu/files/Europeana_Professional/Projects/Project_list/Europeana_DSI-2/Deliverables/d4.4-report-on-enumerate-core-survey-4.pdf

[4] À partir de 2020, la recherche du FNS devient 100 % Open Access, 13.12.2017. http://www.snf.ch/fr/pointrecherche/newsroom/Pages/news-171213-recherche-du-fns-devient-100-pour-cent-open-access.aspx