Décision du Tribunal de Munich : GEMA contre OpenAI
La société GEMA avait déposé une plainte en novembre 2024 faisant état d’une reproduction de plusieurs textes de chansons allemandes
notoires par GPT-4 et GPT-4o, restitués par le chatbot ChatGPT sans autorisation. OpenAI conteste en soutenant que :
- Ses modèles s’entraînent sur des données sans les stocker ;
- Les sorties du chatbot dépendaient uniquement des requêtes (prompts) des utilisateurs, lesquels devaient être considérés comme les véritables responsable des textes générés ;
- L’exception de Text and Data Mining (TDM) prévues par le droit allemand (44b UrhG) et européen (article 4 de la directive DSM), autorise les opérations de fouille de données sans l’accord des titulaires de droits.
Qu’en a décidé le tribunal de Munich ?
I. La mémorisation des textes par le modèle d’IA en tant que preuve d’une reproduction non autorisée
En premier lieu, les juges reconnaissent la reproduction des textes protégés dès lors que “la recherche en informatique a montré … qu’il y a
mémorisation lorsque les modèles linguistiques ne se contentent pas de prélever des informations dans l’ensemble de données d’entraînement lors de l’entraînement, mais que les paramètres spécifiés après l’entraînement reflètent une reprise complète des données
d’entraînement.”
Un test in concreto a permis de constater que telle était le cas en l’espèce, rapportant la preuve d’une mémorisation qui a engendré une
reproduction sans autorisation et non d’un simple entraînement.
Le Tribunal estime que “la perception indirecte est suffisante pour la reproduction, qui est donnée si l’œuvre peut être perçue à l’aide
d’aides techniques.” En définitive, la décision dégage un cadre d’analyse prétorien pour distinguer un entraînement anodin de celui qui ne l’est pas. Le processus de mémorisation des données dans les paramètres du modèle d’IA pouvant être restitués de manière identifiable via ses outputs, est assimilé à une fixation matérielle qui constitue une reproduction au sens du droit d’auteur.
II. La distinction entre « prélèvement d’information » et « mémorisation d’information » : une distinction fondamentale dans le cadre de l’appréciation du TDM
En second lieu, la juridiction a écarté l’application de l’exception de TDM aux motifs que celle-ci ne saurait s’appliquer à la mémorisation d’œuvres dans les paramètres d’un modèle mais uniquement à l’extraction temporaire des données nécessaires à l’apprentissage.
En d’autres termes, si le Text and Data Mining vise à extraire de l’information sans affecter les intérêts économiques des auteurs, la
reproduction par mémorisation d’un texte porte directement atteinte au droit d’auteur de ses titulaires.
Le Tribunal évite ainsi la généralisation d’une exception aussi importante que le TDM et précise les contours de son application.
III. Sur la responsabilité des utilisateurs : vers un modèle de responsabilité des fournisseurs d’IA ?
En outre, les juges ont considéré que les textes reproduits dans les outputs n’étaient pas le fruit de l’utilisateur, mais bien le résultat de
l’architecture interne du modèle d’IA. Un modèle conçu, entraîné et exploité par OpenAI. Ainsi, cette décision écarte la responsabilité qui peut incomber à l’utilisateur en raison des requêtes (prompts) qu’il formule.
En somme, cette décision, encore non définitive, affirme une interprétation protectrice de l’exception de Text and Data Mining. Ce jugement, renforce d’autant plus, la responsabilité et la vigilance attendues des concepteurs d’IA. Une décision qui pourrait servir de référence dans le futur contentieux européen relatif au droit d’auteur et l’IA génératives.

Laisser un commentaire