OpenAI contrainte de remettre 20 millions de journaux ChatGPT dans l'affaire de droits d'auteur du NYT

Decrypt

En bref

  • La décision oblige OpenAI à fournir 20 millions de journaux de conversations après des mois de litiges concernant la vie privée, la conservation et le périmètre.
  • La juge Ona T. Wang a estimé que la taille de l’échantillon est « proportionnelle » aux besoins du dossier pour déterminer si les réponses de ChatGPT ont reproduit des contenus du Times.
  • L’affaire s’inscrit dans une vague croissante de contestations liées au droit d’auteur, visant la manière dont les laboratoires d’IA collectent et utilisent les données d’entraînement.

Le hub Art, Mode et Divertissement de Decrypt.


Découvrez SCENE

Une juge fédérale a ordonné à OpenAI de transmettre environ 20 millions de journaux de conversations ChatGPT anonymisés au New York Times et à d’autres plaignants, augmentant l’exposition de la société d’IA à une série de litiges sur le droit d’auteur et la gouvernance des données.

Rendue mercredi à New York, la décision rejette la demande d’OpenAI visant à bloquer la production des historiques de discussions utilisateurs et ordonne à l’entreprise de remettre les journaux sous un cadre de protection.

Le résultat pourrait influencer la façon dont des entreprises technologiques comme OpenAI, Anthropic et Perplexity collectent les données d’entraînement, obtiennent des licences de contenu et établissent des garde-fous sur ce que leurs systèmes peuvent produire.

Bien que le tribunal « reconnaisse que les préoccupations relatives à la vie privée des utilisateurs d’OpenAI sont sincères », de telles considérations « ne sont qu’un des facteurs de l’analyse de proportionnalité, et ne peuvent l’emporter lorsqu’il existe une pertinence manifeste et une charge minimale », a écrit la juge Ona T. Wang.

Decrypt a contacté les deux parties pour obtenir un commentaire.

La décision découle de la plainte en cours du Times, qui affirme que les modèles d’OpenAI ont été entraînés sur des contenus d’actualité protégés par le droit d’auteur sans autorisation. La procédure a été engagée en décembre 2023.

En janvier dernier, OpenAI a contesté les allégations du NYT et déposé une contre-plainte, affirmant que la publication ne « disait pas toute la vérité ».

Le tribunal a ensuite estimé que les 20 millions de journaux de conversations concernés étaient « proportionnels aux besoins du dossier » pour évaluer si les réponses de ChatGPT copiaient le contenu du NYT.

Au cours de l’année écoulée, le litige s’est intensifié, les plaignants réclamant un large accès aux données de sortie, tandis qu’OpenAI avertissait qu’une telle production massive soulèverait des problèmes de confidentialité et de fonctionnement.

En juin, OpenAI a subi un autre revers lorsque le tribunal a ordonné à l’entreprise de conserver une large gamme de données utilisateurs ChatGPT pour la procédure, y compris des conversations que les utilisateurs auraient déjà supprimées.

Quelques mois plus tard, en octobre, le litige a refait surface lorsque le tribunal a signalé le dépôt d’OpenAI du 20 octobre (ECF 679) qui contestait la production de l’échantillon de 20 millions de journaux, et a ordonné aux deux parties de fournir des clarifications sur les raisons de leur désaccord.

À l’époque, la juge a pressé les parties d’expliquer en quoi ce litige était lié aux préoccupations antérieures concernant les journaux supprimés et si OpenAI était revenu sur des accords précédents concernant ce qu’elle avait déclaré vouloir transmettre.

Fin du mois dernier, OpenAI a déposé une objection formelle demandant au juge de district d’annuler la décision du magistrat sur la découverte.

La société a fait valoir que la décision était « manifestement erronée » et « disproportionnée », car elle l’obligerait à divulguer des millions de conversations privées d’utilisateurs, selon un document judiciaire partagé avec Decrypt par un représentant d’OpenAI.

Ce litige s’inscrit dans une offensive plus large contre les laboratoires d’IA, des auteurs, médias, éditeurs de musique et dépôts de code cherchant à tester les limites du droit d’auteur existant lorsque les modèles ingèrent et reproduisent du contenu protégé.

Des tribunaux à travers les États-Unis et l’Europe sont désormais saisis de réclamations similaires.

Voir l'original
Avertissement : Les informations contenues dans cette page peuvent provenir de tiers et ne représentent pas les points de vue ou les opinions de Gate. Le contenu de cette page est fourni à titre de référence uniquement et ne constitue pas un conseil financier, d'investissement ou juridique. Gate ne garantit pas l'exactitude ou l'exhaustivité des informations et n'est pas responsable des pertes résultant de l'utilisation de ces informations. Les investissements en actifs virtuels comportent des risques élevés et sont soumis à une forte volatilité des prix. Vous pouvez perdre la totalité du capital investi. Veuillez comprendre pleinement les risques pertinents et prendre des décisions prudentes en fonction de votre propre situation financière et de votre tolérance au risque. Pour plus de détails, veuillez consulter l'avertissement.
Commentaire
0/400
Aucun commentaire