La controverse sur les données d'entraînement de l'IA s'intensifie : un autre géant de la technologie confronté à une poursuite pour livres piratés

robot
Création du résumé en cours

Un événement intéressant s’est produit récemment : le cercle technologique a été poursuivi en justice concernant des jeux de données d’IA. Une écrivaine, Elizabeth Lyon, a poursuivi une entreprise technologique bien connue pour avoir utilisé un jeu de données contenant leurs œuvres protégées par le droit d’auteur lors de l’entraînement de leurs grands modèles de langage.

Que se passe-t-il exactement ? Le problème réside dans le jeu de données SlimPajama-627B. Ce jeu de données provient du projet RedPayama, qui contient une collection très controversée de livres « Books3 » – pour être franc, une grande quantité de données non autorisées sur les livres. L’entreprise a utilisé cet ensemble de données pour entraîner le modèle d’IA SlimLM, et l’auteur a constaté que son travail y était inclus.

Ce n’est pas un incident isolé. Des problèmes juridiques similaires s’accumulent, non seulement pour cette entreprise, mais aussi pour plusieurs autres géants de la tech – accusés d’avoir utilisé du contenu protégé sans autorisation lors du développement de systèmes d’IA. Cela implique une question fondamentale : les modèles d’IA peuvent-ils être entraînés à volonté en utilisant des données d’Internet et des publications ? Comment protéger les droits et intérêts des titulaires de droits d’auteur ?

Du point de vue du Web3 et de la communauté open source, cela reflète une contradiction plus large. D’une part, le développement de l’IA nécessite d’énormes données ; En revanche, les droits et intérêts des créateurs de contenu ne peuvent être portés atteinte à volonté. Comment trouver un équilibre entre les deux est devenu un problème auquel toute l’industrie technologique est confrontée. Il est important de continuer à suivre la manière dont ces procès évolueront à l’avenir.

Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • 5
  • Reposter
  • Partager
Commentaire
0/400
GateUser-beba108dvip
· 2025-12-18 01:50
Encore une fois, les grands groupes technologiques suivent aveuglément, peu importe la question des droits d'auteur ou non.
Voir l'originalRépondre0
AirdropDreamervip
· 2025-12-18 01:50
Encore une fois, encore une fois, c'est encore une histoire de vol de données par l'IA... Les géants de la technologie sont vraiment imbattables, hein
Voir l'originalRépondre0
MidnightSnapHuntervip
· 2025-12-18 01:48
Encore cette histoire ? La formation de grands modèles est la version moderne du "pragmatisme"
Voir l'originalRépondre0
MetaMaximalistvip
· 2025-12-18 01:28
honnêtement, ce n'est que le début. une fois que le précédent sera établi, chaque créateur va venir frapper à la porte. la vraie question que personne ne pose est de savoir si la doctrine du fair use s'applique même *au* données d'entraînement à grande échelle... et pour être honnête, les géants de la technologie qui jouent sur un territoire juridique flou pendant que les auteurs sont pressurisés, c'est le summum du capitalisme extractif déguisé en innovation.
Voir l'originalRépondre0
  • Épingler

Trader les cryptos partout et à tout moment
qrCode
Scan pour télécharger Gate app
Communauté
Français (Afrique)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)