Lekti-ecriture.com, littérature et maisons d'éditions sur Internet
Contre-feux, revue littéraire de Lekti-ecriture.com

« Ce n'est pas ce qui est, mais ce qui pourrait et devrait être, qui a besoin de nous »
Cornelius Castoriadis


Contre-feux, revue littéraire > Édition et vie littéraire > Livre et numérique > Portrait du pirate en conservateur de bibliothèque

Portrait du pirate en conservateur de bibliothèque

Version revue et augmentée

Joël Faucilhon

Publié le vendredi 20 mars 2009

Compte tenu du succès, assez inattendu, rencontré par la parution de trois billets intitulés « Portraits du pirate en conservateur de bibliothèque », sur le bloc-notes Lekti-ecriture.com, une version revue et augmentée de ces trois textes est ici proposée à la lecture.


Le titre de ce billet peut paraître provocateur. Il l’est certainement en partie, mais il correspond à une réalité dont on parle peu, une réalité qui émerge encore à peine, mais dont les conséquences paraissent immenses, du point de vue du droit d’auteur, de l’économie de l’ensemble de la chaîne du livre, et des problèmes de conservation et du partage du savoir à l’ère du support numérique.

Les réseaux Peer-to-peer

Beaucoup d’entre nous connaissent ou ont expérimenté le protocole Bittorrent, réseau Peer to peer (pairs à pairs en bon français) qui s’est nettement développé depuis deux ou trois ans, surtout depuis le « flicage » du réseau eDonkey, et des clients utilisés pour y accéder, dont le plus important est évidemment Emule.

Emule est en perte de vitesse, mais les réseaux Peer to peer liés au protocole Bittorrent n’ont jamais été aussi actifs. En témoignent certains sites de partage liés à Bittorrent, qui présentent la plupart du temps des contenus encore sous droit, et font partie des cent sites les plus visités au monde, selon le baromètre annuel Google. Mininova est entré ainsi en 2007 au rang 97 concernant le nombre de visiteurs, selon les données qui proviennent d’Alexa, alors que d’autres sites de partage Bittorrent qui proposent (presque) uniquement des contenus encore sous droit figurent dans le top 500 des sites les plus visités : c’est le cas pour ThePirateBay, toujours très populaire, Torrentz ou encore Demonoïd.

Les livres sur les réseaux Peer-to-peer

Ces sites de partage sont uniquement constitués de contenus sous droit, qu’il s’agisse de musique, de films, mais également de PDF de livres encore sous droit.

La surprise est immense : certains catalogues d’éditeurs sont totalement mis à la disposition des internautes. C’est tout particulièrement le cas pour les ouvrages scientifiques et techniques. Ainsi, il est très facile de rapatrier en quelques heures sur son disque dur l’ensemble ou presque du catalogue des éditions O’Reilly, un éditeur particulièrement réputé, spécialisé aux États-Unis et en Europe dans la publication de livres techniques. À portée de clics et en quelques heures, c’est près de quatre cent livres de cet éditeur que l’on peut voir apparaître sur son écran d’ordinateur. À partir de ce moment-là, le doute apparaît : comment les éditions O’Reilly arrivent-elles encore à vendre des livres, puisque certains, tels que Denis Olivennes, auteur du rapport éponyme, affirment que la piraterie est responsable de la crise actuelle, en ce qui concerne l’industrie musicale et cinématographique ? Si l’on suit le cheminement et la pensée de Denis Olivennes, les éditions O’Reilly, piratées de manière massive, auraient déjà du déposer le bilan. Or, ce n’est pas le cas. Pire encore, le fondateur des éditions O’Reilly, le très respecté Tim O’Reilly, inventeur de la célèbre formule « Web 2.0 », affirme depuis quatre ans que la piraterie, en ce qui concerne ses livres, n’est pas un problème, et parfois même représente un vecteur de vente de livres physiques (voir le lien suivant, un article qui a fait sensation au moment de sa parution, pour plus de détails : http://www.openp2p.com/pub/a/p2p/2002/12/11/piracy.html).

Apparemment, le lien qui paraît évident aux yeux de certains, entre la piraterie et la crise des industries dont la dématérialisation est rendue possible, n’est pas si évident.

Mais tout ceci n’est guère nouveau : la piraterie, en ce qui concerne les livres techniques, est un phénomène assez ancien.
Ce qui est nouveau, en revanche, est l’extension du phénomène aux livres de sciences humaines et de littérature, et à la bande dessinée.

La mise à disposition de livres numérisés, dans ce dernier cas, n’est pas forcément apparent sur des grands sites de partage Torrent, tels que The Pirate Bay ou Mininova. Ils sont le fait de sites moins visibles, sur lesquels il n’est possible d’accéder que sur invitation d’un membre, et le nombre mais également la qualité des livres numérisés par ces petites équipes est proprement impressionnant. Parmi tous ces livres, certains n’ont pas été scannés par les petites équipes liées à un site de partage Bittorrent. Il peut s’agir, tout simplement, de copies de PDF d’imprimeurs, facilement reconnaissables par la présence des traits de coupe.
Il n’est pas très difficile, par exemple, de récupérer en ce moment sur certains sites, l’ensemble ou presque des " Very short introduction ", collection de référence d’Oxford University Press, équivalente aux Que Sais-je ? publiés par les PUF, soit près de 1 300 titres.
Les éditeurs français, selon les affirmations récentes de certains, pensent être à l’abri du phénomène. Sans vouloir être un facteur d’inquiétude, voilà, parmi tant d’exemples, certaines listes de livres, en langue française, qu’il est possible de télécharger sur certains sites Internet Torrent de partage : — L’ensemble de l’œuvre de Jacques Derrida, notamment ses livres publiés chez Gallimard et chez Gallilée. — La totalité des ouvrages de Gilles Deleuze publiés aux éditions de Minuit. — Une partie de la collection Bibliothèque des Sciences humaines, publiée chez Gallimard, notamment certains ouvrages anciens, non réédités. — L’abécédaire de Gilles Deleuze publié par les éditions Montparnasse. Bien des livres d’informatique publiés par les éditions Eyrolles. — Beaucoup de livres de chez Librio, que cela soit ceux de michel houellebecq, de Franz Kafka, et cetera. — L’ensemble des livres de Bernard Werber, de Frédéric Beigbeder, ou encore d’Amélie Nothomb.

Ce ne sont là que quelques exemples, pris au hasard, mais qui témoignent de la diversité, et de la vitalité de ces petites équipes, souvent composées de seulement de quelques dizaines de membres, qui décident de numériser et de mettre à disposition ces livres au format numérique, directement sur l’Internet.

Mais le plus étonnant est encore ailleurs : à partir des éléments ci-dessus, il serait assez facile de considérer qu’il s’agit de simples pirates qui contournent la législation sur le droit d’auteur, mettent à mal (c’est une hypothèse) la pérennité économique des éditeurs, dont la condamnation par les tribunaux serait éminemment souhaitable. 
La réalité n’est pas si simple... En effet, ces petits groupes se comportent, ont des réflexes de bibliothécaires : ils classent les livres en fonction de leur pertinence, créent des dossiers de manière élaborée, et il est difficile de considérer qu’il s’agit simplement de groupes d’activistes qui veulent « mettre à bas le système capitaliste ». Bien au contraire, ces groupes semblent considérer les livres en fonction de leurs qualités intrinsèques, non pas en fonction de leur valeur commerciale. Ainsi, certains sites Internet de partage, privés, mettent à disposition de leurs membres des ensembles dédiés par exemple à l’étude de la Turquie, de l’Égypte, qui vont rassembler « le meilleur » de la littérature historique, géographique, sociologique, par rapport à ces États, écrits depuis un siècle. Ces pirates-là ont des réflexes innés (je doute que tous aient suivi des cursus universitaires de documentalistes), de bibliothécaires qui trient, classent, référencent, avant de mettre à disposition toute cette matière sur Internet. 
Et il manque des sociologues pour étudier ce phénomène, dont la portée paraît considérable, en même temps qu’il est nécessaire que les éditeurs réfléchissent à ce phénomène, inéluctable dans la mesure où il suffit d’une copie papier pour que ces groupes diffusent le livre dans sa forme numérique, la plupart du temps avec une qualité bien supérieure à celle offerte par Google Recherche de Livres ou le projet Gallica de la Bibliothèque Nationale de France.

Le goût de la « collection » chez les pirate

Il existe donc sur Internet des « pirates », qui organisent des « collections », rassemblent différents éléments audio, textes et vidéo, pour les mettre à disposition sur l’Internet, sans jamais tenir compte, évidemment, du droit de la propriété intellectuelle (ou du Copyright anglo-saxon). Ce non-respect de la propriété intellectuelle rend ce genre de démarche particulièrement efficaces : pas de demandes à effectuer aux ayant droits, pas de refus à respecter de leur part, tout ceci rend la démarche qui vise à constituer une collection réellement rapide et efficace. Bien plus efficace que la mise en place de fonds par des bibliothèques patrimoniales qui doivent, de leur côté, respecter le Code de la propriété intellectuelle, ou la législation en vigueur sur le copyright. Pas de problèmes non plus liés à la recherche des ayant-droits dans le cas des oeuvres orphelines. Ignorer les droits de la propriété intellectuelle est d’une grande efficacité, au niveau de la rapidité de la mise à disposition des oeuvres.

Et les pirates réorganisent sans cesse les morceaux épars dont ils disposent. Les collections qu’ils mettent à disposition sur les réseaux pair à pair (peer-to-peer) sont sans cesse en cours de réorganisation et de montée en puissance. S’il était rare, il y a deux ans, de voir des ensembles de documents dépasser 1Go, il est désormais courant d’obtenir de larges collections de textes qui font près de 10Go, voire plus pour certaines d’entre elles. Tout ceci représente un phénomène déjà connu. Ce qui l’est moins, c’est la volonté des pirates de numériser avec des formats ouverts, qu’ils estiment « pérennes » et sûrs. Autrement dit, ils ont la volonté de mettre à disposition des documents audio, vidéo, ou textes, dont ils s’assurent qu’ils pourront être exploités sur le long terme. Dans ce sens également, ce sont de véritables « conservateurs de bibliothèque », disposés dans leur projet à vouloir assurer une pérennité dans leur travail. Dans le domaine de l’audio par exemple, alors que le format mp3 (format propriétaire, ne l’oublions pas, qui entraîne une dégradation par rapport à une copie originale) était systématiquement privilégié sur les anciens réseaux pairs à pairs, tels que Gnutella, la nouvelle génération de pirates s’attache à « ripper » les CD, notamment ceux de musique classique, mais pas seulement, dans des formats ouverts ¬— donc pérennes — qui n’entraînent aucune dégradation au niveau du signal, tels que le FLAC. Puisque c’est bien de cela dont il s’agit : d’une nouvelle génération de pirates, qui n’a sans doute pas grand chose à voir avec ceux qui téléchargeaient des morceaux MP3 sous Napster, il y a seulement dix ans. Cette nouvelle génération préfère la rareté : les films d’auteurs, les vieux enregistrements vinyle considérés comme des « classiques », ou encore des livres de référence en sciences humaines ou en philosophie. Ils n’agissent jamais au hasard, procèdent à un tri « intelligent », comme un bibliothécaire, avant de mettre à disposition leurs réalisations sur l’Internet. Ces pirates-là sont animés par une volonté manifeste de « faire partager », et ne sont pas motivés simplement par une haine farouche contre les grands producteurs, en matière audio et/ou vidéo. Aucun discours haineux contre les « Majors », aucune volonté de « détruire » l’industrie du disque, du DVD ou de l’édition, au sein des forums des groupes fermés ou semi-fermés qui pratiquent la mise à disposition de « collections », via le protocole Bittorrent. Ce qui n’était pas le cas de la génération précédente de pirates.

Cette volonté acharnée de « faire partager » se traduit par la mise en place de certaines règles assez sévères : la plupart du temps, il est obligatoire de maintenir un ratio entre la réception de données et l’émission qui soit supérieur à deux. En d’autres termes, il est nécessaire de diffuser deux fois plus de données que celles qui ont été reçues, pour éviter d’être « banni » , puisque c’est là le terme consacré. Une expression qui n’est pas sans rappeler la notion de bannissement dans les communautés de pirates des Caraïbes, au XVIIIe siècle. D’ailleurs, comme au sein des communautés de pirates du XVIIIe siècle, il s’agit de groupes « fermés », qui se renouvellent assez peu, de nouveaux membres étant intégrés seulement par affinités électives, et devant prouver qu’ils sont membres d’autres groupes, que leur ratio de partage est très élevé dans ces derniers, généralement supérieur à deux.

Différentes générations de « pirates »

Ce n’est plus la même génération de pirate, ce n’est plus, également, le même type d’« économie », au niveau du piratage des œuvres. Il y a encore trois ans, le piratage sur Internet était un « marché de l’offre », dans la mesure où les internautes « prenaient ce qu’ils trouvaient ». Par un pur réflexe « consumériste », pourrait-on dire. Actuellement, le phénomène s’inverse, sous l’influence de ces petits groupes qui utilisent le protocole Bittorrent. En effet, certains de leurs membres procèdent à des « demandes », sur un domaine précis, concernant un texte ou un CD déterminé, et les autres membres essaient de répondre le plus rapidement possible à cette demande. Le marché s’organise désormais selon le modèle de la demande, non plus de l’offre. Et il est de plus en plus difficile de trouver des documents audio, vidéo et/ou textuels qu’ils ne sont pas en mesure de diffuser rapidement. La généralisation du prêt en bibliothèque (non pas en France, mais plus généralement en Europe et dans tous les pays occidentaux), joue un rôle majeur, puisque de nombreux pirates profitent d’une période de prêt pour « ripper » CD et DVD, et les mettre à disposition au sein de leurs groupes. Quant à la problématique du respect de la législation sur le droit d’auteur, il s’agit là d’un élément qui a été définitivement « évacué ». Ce problème n’est jamais abordé, sauf par certaines communautés liées à la bande dessinée, qui répètent sans cesse ces mots : « si vous aimez cet auteur, alors achetez la bande dessinée ». Ailleurs, il n’est jamais fait mention d’un quelconque débat sur la notion de « propriété intellectuelle » et de « droit d’auteur ». Pas la moindre justification, même grossière. Non, toute référence au droit d’auteur est absente, comme si cette notion n’avait jamais existé. Pas plus qu’il n’existe nulle part, au sein de ces « communautés », de débat autour de la crise actuelle rencontrée par l’industrie du disque ou celle du DVD, ou la moindre mention d’un texte à ce propos. En réalité, c’est l’ensemble du contexte économique lié à la création, qu’elle soit phonographique, audiovisuelle ou textuelle, dont il n’est jamais question.

DRM mon amour...

Face à de tels comportements, les industriels de la musique et du cinéma avaient mis en place il y a quelques années des pratiques coercitives basées sur la protection des oeuvres via les DRM (Digital Rights Management), qui étaient censées « empêcher » toute diffusion de contenus sur les réseaux pair à pair. Ce fut un échec, puisque les verrous numériques (DRM) peuvent être facilement « cassés », et ont entraîné une vague d’impopularité massive. En effet, pourquoi est-il possible de pouvoir prêter un CD acheté légalement à des amis, et ne pas pouvoir faire la même chose pour une copie numérique protégée via des DRM ? Les verrous numériques appellent le piratage, par la frustation qu’ils entraînement, et leur complexité intrinsèque. Il est d’ailleurs surprenant, et paradoxal, qu’au moment où l’emploi de DRM est abandonné de manière massive par l’industrie musicale, les groupes d’édition lancent des plate-formes de ventes de livres numériques protégés par des verrous numériques, que cela soit avec Fnac.om, Numilog ou Epagine. Les verrous numériques sont des protections bien fragiles, devant la masse des échanges pairs à pairs. Pour mesurer l’ampleur de ce mouvement, il suffit de s’en réferrer aux études liés aux échanges peer-to-peer. La dernière en date, celle du cabinet allemand Ipoque, indique qu’en fonction des régions du globe, les réseaux pairs à pairs représentent entre 40 et 70% du trafic global de l’Internet.

Légiférer sur les réseaux Peer-to-Peer ?

La majorité des gouvernements, à l’échelle mondiale, a renoncé à légiférer sur le peer-to-peer, devant l’ampleur du phénomène. La loi Hadopi, discutée en France en cette période, est une exception curieuse à la règle, dont beaucoup remettent en cause la légitimité, mais qui semble surtout impossible à appliquer.

À moins de priver de connexion Internet la grande majorité des foyers français...

D’autant qu’il semble très difficile de mesurer l’impact du piratage des oeuvres sur les ventes. D’un côté, les syndicats professionnels affirment que la crise de l’industrie musicale est dûe au piratage des oeuvres. De l’autre, certaines études, telles que celle commanditée récemment par le gouvernement hollandais, remise début janvier au Ministre de l’Économie, indiquent à l’inverse que le piratage serait bénéfique à l’industrie musicale (http://www.ez.nl/dsresource?objectid=161961&type=PDF).

N’est-il pas prétentieux de croire que l’industrie du livre va réussir à « vérouiller » ses contenus, là où les majors du disque, qui disposaient de moyens économiques autrement plus importants, ont échoué, et explorent désormais ce qu’ils considèrent comme la seule issue, c’est-à-dire la vente de fichiers MP3 libérés de DRM ? Est-il raisonnable de penser que les verrous numériques fournis par Adobe pour les livres numériques sont plus « puissants » que ceux fournis par Microsoft, au niveau de l’industrie musicale ?

Les pirates qui mettent à disposition des internautes un certain nombre de « collections » ou de textes sur des sites privés ou semi-privés sont apparemment conscients de la fragilité du numérique, et cherchent à tout prix l’emploi des formats ouverts, qu’ils estiment « pérennes » dans le temps. Voilà une raison de plus de les comparer à des « conservateurs de bibliothèque », puisque ces derniers doivent veiller, s’assurer que « toute mesure de surveillance, de protection, de reproduction et de communication propre à préserver l’intégrité du document » soit prise (Extrait de La charte des bibliothèques adoptée par le Conseil supérieur des bibliothèques le 7 novembre 1991).

Or, assurer la conservation et la pérennité des documents, lorsqu’ils sont numériques, est une tâche difficile, voire impossible en l’état actuel des techniques. Je me souviens encore avoir posé la question, lors du colloque Livre 2010, en 2007, à Jean-Pierre Cendron, alors délégué à la stratégie pour le projet Gallica, à ce propos. Sa réponse, telle que consignée dans le compte-rendu de la table ronde, fut la suivante : Se plaçant sur le terrain de la conservation, Jean-Pierre Cendron a rappelé que contrairement au papier et au microfilm, nous ne connaissions pas, encore aujourd’hui, quelle pouvait être la pérennité du support numérique. (voir ici pour la source)

Une réponse honnête, qui sous-tend une réalité peu amène. Nous sommes en train de procéder à une numérisation massive de notre savoir, sans avoir la moindre idée des délais pendant lesquels notre patrimoine restera disponible, en raison même de la nature du numérique. Avec donc, un risque accru de perdre l’ensemble des savoirs, qui sont de plus en plus « numériques dès le départ » (photographies, films, audio, manuscrits d’auteurs et copies d’éditeurs, etc.). Ce risque immense de la page blanche, des savoirs perdus de manière irrémédiable en raison de la fragilité intrinsèque du support numérique, nous en voyons déjà parfois, timidement, les conséquences. Tel ou tel chercheur du CNRS ou d’un autre centre se plaint que la copie numérique qui a été confiée à l’INA (dont la mission principale est pourtant la conservation ! ) soit perdue. Cela arrive de plus en plus souvent…

En réalité, la fragilité du numérique est extrême, pour deux raisons principales :

1°) L’extrême hétérogénéité des formats employés, souvent propriétaires, avec lesquels le savoir numérique est construit. Du côté du livre, par exemple, beaucoup d’éditeurs sont obligés de refaire les maquettes de leurs livres déjà composés il y a parfois cinq ans, mais sous des logiciels qui n’existent plus, ou dont la compatibilité avec les versions actuelles n’est qu’apparente. Il faut remercier ici des firmes telles que Quark ou Adobe, qui n’organisent aucune compatibilité ascendante entre leurs familles de produits, qu’il s’agisse respectivement de Quark ou Indesign. Et quelle différence, de ce point de vue, avec les méthodes employées par bien des éditeurs scientifiques ou techniques, notamment anglo-saxons, qui s’appuient, au moment de composer leurs livres, sur des standards ouverts et cohérents tels que LaTex, ce qui leur permet de reprendre leurs épreuves plus de vingt ans après, sans aucun souci…

2°) Le numérique est également fragile en raison de la nature des supports. Que cela soit l’optique (CD-ROM, etc), ou les supports magnétiques tels que les disques durs, il s’agit d’éléments extrêmement fragiles, prompts à s’effacer rapidement, et pas seulement de manière intentionnelle. Pour parer à cela, il n’existe qu’un moyen : la duplication, que l’on voudrait (presque) à l’infini, en permanence, pour s’assurer que sur dix baies remplies de disques durs contenant les mêmes données, dans quinze ans, il existe au moins un disque dur qui fonctionne encore. Un marché s’est donc fortement développé ces dernières années, celui du stockage. Avec un coût extraordinaire pour les bibliothèques. Mais cela, les équipes de Gallica ou de la British Library le savent bien, puisqu’elle doivent sans cesse organiser des « stratégies » de réplication des données, lancer des appels d’offre pour obtenir, chaque jour, toujours plus de pétaoctets de stockage répliqués à l’identique dans différents lieux.

Mais ce qu’une Bibliothèque patrimoniale peut envisager, en matière d’efforts financiers pour pérenniser le savoir numérique, et sans pour autant obtenir des certitudes, aucune autre structure ne peut le faire. Le risque de la page blanche, d’un effacement partiel ou total du savoir conservé sous forme numérique, est donc bien réel.

Numériser N’EST PAS conserver

En réalité, la seule issue, compte tenu de la fragilité du support numérique, reste de disséminer le savoir numérique. Et c’est là où les « groupes de pirates », qui échangent sans cesse leurs fichiers (textes, vidéos...) en essayant de conserver l’accès à leurs fichiers le plus longtemps possible, jouent un rôle majeur. Étant donné qu’ils ont tendance (du moins, pour certains groupes privés ou semi-privés, via le protocole Bitorrent), à archiver, organiser des collections sous des formats ouverts, à les diffuser sur des milliers de machines qui restent éloignées les unes des autres, physiquement, ils accentuent les chances d’éviter le risque d’une « page blanche », au niveau du savoir numérique.

Personne n’est à l’abri de ce risque, dans un monde informatisé marqué par l’ « effet papillon » (en tant que métaphore), où une erreur mineure peut entraîner des conséquences en cascade dont la portée est globale. Google nous a donné un merveilleux exemple d’ « effet papillon » le 30 janvier 2009. Suite à une erreur humaine dans la manipulation d’un fichier, qui aurait due être totalement anecdotique (inscription d’un caractère dit « joker » dans un fichier texte), l’ensemble des résultats des moteurs de recherche, pendant une heure, partout dans le monde, interdisaient l’accès à tous les sites Internet, marqués comme « potentiellement dangereux », et « pouvant endommager votre ordinateur ». Exemple parfait d’ « effet papillon » : une modification mineure déclenche un ensemble de variations majeures dont l’effet n’était pas prévu. Internet et les réseaux informatiques sont des ensembles très fragiles, dont nous ne pouvons pas connaître l’état à moyen terme. Nous ne devrions jamais l’oublier.

Il existe donc là un vrai paradoxe : les pirates qui bafouent, violent chaque jour les législations sur le droit d’auteur et le Copyright sont peut-être, en même temps, la seule chance de survie du savoir numérique. Et il est plausible d’imaginer qu’un jour, pas si lointain, certains auteurs, éditeurs ou producteurs, aillent chercher la seule copie encore existante de leur travail auprès des pirates. Voilà encore le pourquoi du titre, qui semble provocateur : « portrait du pirate en conservateur de bibliothèque ». Le but n’est pas de donner une image idyllique du « pirate » sur Internet, mais de mettre en relief certaines réalités qu’il semble absurde d’ignorer plus longtemps…


Les ressources offertes librement et gratuitement sur Lekti ne pourraient exister
sans le soutien de notre communauté de lecteurs qui achètent leurs livres
sur Les espaces de l'édition indépendante et aux bibliothèques qui s'abonnent, pour leurs lecteurs, à la bibliothèque numérique Lekti.
Qu'ils en soient remerciés.

Suivre la vie du site RSS 2.0 | Nous contacter | Les lettres d'information | Soumettre un texte
Les autres composantes de Lekti-ecriture.com : Les espaces de l'édition indépendante | La bibliothèque numérique Lekti | Le bloc-notes Lekti-ecriture.com