11 septembre 2025

L’action coordonnée des éditeurs de presse contre les bases de données : une mise en lumière de l’inévitable mort de l’opt-out.

Contexte et faits :

En cette rentrée 2025, la presse française reprend avec vigueur sa lutte contre l’appropriation illégitime d’œuvres de l’esprit par des systèmes d’intelligence artificielle exploitant des contenus protégés pour l’entraînement de leurs modèles.

En effet, l’Alliance de la presse d’information générale (Apig) et le Syndicat des éditeurs de la presse magazine (SEPM) ont lancé une action concertée en ce lundi 1er septembre.

Ces journaux et magazines français dénoncent les pratiques abusives des bases de données du type « Common Crawl » permettant d’alimenter en données les systèmes d’intelligence artificielle générative comme ChatGPT.

Pour autant une difficulté subsiste : celle du caractère public et en libre accès de telles bases de données.

Ces structures dénommées « Common Crawl » « C4 » ou encore « OSCAR, représentent des corpus textuels agrégeant des milliards de pages web grâce au Crawling.

Les représentants des éditeurs, qui regroupent plus de 57 % des journalistes français, ont décidé d’engager une action judiciaire destinée à obtenir la suppression des contenus obtenus illicitement et de cesser la pratique de crawling sur les sites concernés

Les fondements :

Les éditeurs s’appuient sur les droits voisins de la presse (Directive UE 2019/790) et sur le droit d’auteur pour exiger une rémunération de l’utilisation de leurs contenus.

La loi française de juillet 2019 (n°2019-775) a transposé cette directive en créant un droit voisin spécifique.

L’article L.218-2 du Code de la propriété intellectuelle stipule que « l’autorisation de l’éditeur de presse ou de l’agence de presse est requise avant toute reproduction ou communication au public » d’une publication de presse en ligne.

Ainsi, toute reproduction, même numérique d’un article de presse est soumise à l’accord du producteur.

Le contentieux est déjà ancien puisqu’un précédent litige avait déjà opposé les éditeurs de presse et Google quant à la rémunération relative à l’utilisation de bribes d’articles dans les résultats de recherches.

Au début de l’année2020, les syndicats SEPM, APIG (presse quotidienne) et l’AFP avaient saisi l’Autorité de la concurrence, et sollicité le paiement par Google de droits voisins au titre de l’exploitation de leur contenu.

En 2021, l’Autorité a condamné Google à 500 millions d’euros pour absence de bonne foi dans ces négociations. Google a finalement pris des engagements en 2022 : il doit négocier « de bonne foi » et proposer une rémunération dans un délai défini.

À ce jour, environ 140 titres ont signé des accords avec Google en vertu de ces cadres négociés. Parallèlement, Facebook (Meta) a conclu dès octobre 2021 un accord de licence avec l’APIG pour la reprise de contenus de presse (mise en place du fil « Facebook News »), conformément à la directive transposée.

Il est important de préciser que les membres de l’Alliance avaient mis en œuvre leur droit opt-out dès septembre 2023.

Par cette opposition ces derniers contestent notamment l’application de l’exception de fouille de textes et de données issue de la directive 2019.

En France, l’article L.122-5-3 CPI autorise la création de copies numériques en vue de fouilles de textes et de données sur des œuvres accessibles licitement.

Cette exception comporte deux volets distincts :

· Un volet recherche limite la fouille à des organismes publics non commerciaux, dans un but strictement scientifique.

· Un volet général ouvre la fouille à toute personne, « quelle que soit la finalité », sauf si l’auteur s’y est opposé de manière appropriée. La loi française précise cet « opt-out » : l’auteur doit exprimer son refus par un procédé lisible.

Il convient d’observer que les géants de l’IA ne se limitent pas à du simple data mining non commercial mais exploitent les données pour générer directement des réponses ou des résumés.

Par ailleurs, le statut même de bases de données « publiques » ou en libre accès ne supprime pas l’exigence du consentement du titulaire des droits pour être exploité droits : le libre accès d’un article ne vaut pas autorisation de distribution ou de réutilisation commerciale, d’autant plus que ces bases de données sont réputées contourner les paywalls mis en place par les éditeurs.

En pratique :

Face à cette menace constante, il convient désormais de constater, à l’instar de ce qu’a également relevé une partie de la doctrine, l’obsolescence de l’opt out.

Ce mécanisme, qui traduit une rare anticipation de l’Union européenne face aux enjeux liés à l’intelligence artificielle, n’a toutefois pas été conçu pour répondre à un développement d’une telle ampleur.

L’opt-out peut apparaître pertinent à posteriori, dans la mesure où il permet d’identifier les acteurs qui s’opposent à l’exploitation de leurs œuvres à des fins d’entraînement après la constatation d’une atteinte aux droits.

En pratique cependant, son efficacité demeure limitée et sa portée contraignante s’avère réduite.

En effet, si les modalités de l’opt-out demeurent très générales, se bornant à indiquer que la réserve de droits doit être formulée « de manière appropriée » au moyen de procédés lisibles par machine, il faut souligner que les dispositifs techniques susceptibles de garantir une efficacité optimale de ce droit, restent limités et, pour l’essentiel, encore méconnus.

En ce sens, l’absence de clarté quant aux modalités d’exercice de l’opt-out constitue une difficulté réelle pour les gestionnaires de bases de données. La diversité des moyens techniques et pratiques permettant de signaler une clause de retrait auprès des plateformes d’IA génératives rend en effet complexe l’identification des titulaires qui consentent ou non à l’utilisation de leurs œuvres à des fins d’entraînement de systèmes d’intelligence artificielle.

Afin de répondre à ces limites la Commission européenne a été amenée à envisager la possibilité d’registre centralisé des opt-outs : une sorte de base de données recensant toutes les réserves de droits au même endroit, facilitant non seulement l’identification des œuvres exclues de l’exploration de textes et de données, mais aussi le respect effectif de ces oppositions par les opérateurs d’IA.

Cette proposition fait l’objet, depuis début 2025, d’une étude de faisabilité visant à imaginer un outil numérique commun à l’échelle de l’Union européenne, avec la volonté d’harmoniser les pratiques et de rendre le mécanisme d’opt-out réellement effectif et contrôlable.

Mais pendant que cette étude de faisabilité est menée, les titulaires de droit restent encore et toujours démunis face à l’exploitation non consentie de leurs œuvres.

Il convient donc de trouver d’autres moyens destinés à permettre aux ayants droits de conserver un contrôle sur l’accès à leurs œuvres, lesquels constitueraient des solutions plus efficaces que la seule approche réglementaire d’un opt-out centralisé.

Le « watermarking » (ou tatouage numérique) pourrait être une solution envisageable puisqu’il permet d’assurer une traçabilité et l’identification de l’auteur. Le « watermarking » est comme une empreinte digitale visible ou invisible incrustée dans l’œuvre, qui résiste aux modifications et permet de toujours remonter à son propriétaire original.

Le « fingerprinting » constitue une autre possibilité, puisqu’il permet la la création d’une empreinte digitale unique pour chaque contenu ou utilisateur à partir de caractéristiques

techniques comme la résolution, le format ou les métadonnées. Ilcrée une empreinte digitale unique (un hash) à partir du contenu du fichier pour identifier l’œuvre elle-même.

Déjà largement utilisé dans le domaine publicitaire pour le suivi des utilisateurs, ce procédé pourrait être adapté afin de renforcer la protection des contenus contre une utilisation non autorisée par les systèmes d’intelligence artificielle.

Ces solutions techniques, associées à des protocoles tels que TDMRep, permettant d’exprimer les réserves de droits de manière lisible par les machines, ou encore à une utilisation optimisée des fichiers robots.txt pour restreindre l’accès des robots d’IA, offrent ainsi un ensemble d’outils susceptibles de dépasser les limites actuelles du mécanisme d’opt-out et de garantir une protection accrue des droits d’auteur face aux défis posés par l’intelligence artificielle générative.

Conclusion :

Mais à la réflexion et face à cette obsolescence évidente, l’opt in ne serait-il pas tout simplement la clé pour redéfinir les contours d’un développement de l’IA responsable et respectueux des droits de propriété intellectuelle comme l’Union Européenne l’appelle de ses vœux ?

L’opt-in se définit comme l’exact inverse de l’opt-out, puisqu’il suppose d’obtenir le consentement préalable et explicite des titulaires de droits avant toute utilisation de leurs contenus ou données aux fins d’entraînement des modèles d’intelligence artificielle.

Certains défenseurs des droits, notamment l’Institut des Droits Fondamentaux Numériques, demandent l’introduction de l’opt-in obligatoire pour garantir un contrôle effectif de l’exploitation des œuvres de l’esprit.

Finalement, nous notons que plus d’un an après l’adoption Règlement sur l’Intelligence Artificielle (RIA), les auteurs et artistes interprètes restent tout aussi démunis. Les dispositions les plus significatives ne seront applicables qu’à partir du 2 aout 2026 telles que :

– L’obligation imposée aux fournisseurs de systèmes d’IA d’élaborer et de publier une politique générale de respect des droits de propriété intellectuelle prévue à l’article 53, §1, c) du RIA

– L’obligation un résumé suffisamment détaillé des données d’entraînement ayant servi à la conception des modèles prévue à l’article 53, §1, d) dudit règlement

Cette absence de cadre juridique effectif provoque la situation de vulnérabilité dans laquelle les auteurs et interprètes demeurent, exposés à l’appropriation de leurs œuvres sans possibilité réelle de recours. Il est nécessaire préserver, au sein de l’écosystème numérique, les conditions d’une création libre et pérenne

Envie d’en savoir plus ? Suivez-nous sur LinkedIn pour ne rien manquer de l’actualité du droit des nouvelles technologies !

https://www.linkedin.com/posts/jonathan-elkaim-5212ba6_apig-activity-7369390547746172928-ARuc?utm_source=share&utm_medium=member_desktop&rcm=ACoAAEJgPdEB7cZNQFfJzvJmr082TdBkzyTOQB0

Maître Jonathan Elkaim – Avocat

Alessandro Tummillo – Juriste

ActualitésDroit des nouvelles technologiesIA GénérativePropriété Intellectuelle

L’action coordonnée des éditeurs de presse contre les bases de données : une mise en lumière de l’inévitable mort de l’opt-out.

Laisser un commentaire Annuler la réponse

Navigation

Expertises

L’action coordonnée des éditeurs de presse contre les bases de données : une mise en lumière de l’inévitable mort de l’opt-out.

Vous aimerez aussi

Compte-rendu Table Ronde « Quand l’IA nous laisse sans voix »

Décision du Tribunal de Munich : GEMA contre OpenAI

Affaire LOVO partie 2 : La voix protégée mais hors du droit de la propriété intellectuelle

Laisser un commentaire Annuler la réponse