Reddit poursuit Anthropic pour utilisation abusive présumée des données des utilisateurs dans la formation de modèles d'IA


Découvrez les principales actualités et événements fintech !

Abonnez-vous à la newsletter de FinTech Weekly

Lue par des dirigeants de JP Morgan, Coinbase, Blackrock, Klarna et plus encore


Reddit dépose une plainte contre Anthropic pour utilisation non autorisée des données utilisateur

Reddit a engagé une action en justice contre la société d’intelligence artificielle Anthropic, l’accusant de violation de ses conditions d’utilisation et d’engager ce que la plateforme qualifie de « pratiques commerciales illégales et déloyales ». La plainte, déposée mercredi devant un tribunal fédéral, intensifie les tensions concernant l’utilisation de contenus web accessibles au public pour entraîner des systèmes d’IA commerciaux.

Selon la plainte, Reddit affirme qu’Anthropic a accédé et utilisé de grandes quantités de contenu généré par ses utilisateurs pour entraîner ses modèles d’IA sans obtenir les permissions ou licences nécessaires. La plateforme sociale soutient que cela viole non seulement ses politiques, mais exploite également la contribution de ses utilisateurs à des fins commerciales sans consentement.

L’affaire soulève des questions plus larges sur la propriété du contenu en ligne à l’ère de l’IA générative, et sur la manière dont les entreprises devraient traiter les données publiques qui portent les nuances des attentes en matière de vie privée et de confiance communautaire.

Un défi juridique basé sur l’utilisation du contenu et le gain commercial

Reddit affirme qu’Anthropic, malgré sa présentation comme une entreprise d’IA éthique, a agi en méconnaissance des règles de la plateforme Reddit.

Le cœur de la plainte repose sur l’allégation qu’Anthropic a entraîné ses modèles d’IA—notamment Claude—sur des données Reddit extraites sans autorisation. Reddit souligne que, contrairement à OpenAI et Google, qui ont conclu des accords de licence conformes aux conditions de la plateforme et à la protection des utilisateurs, Anthropic n’a pas obtenu de permissions similaires.

Cette distinction pourrait être un facteur clé dans l’affaire, surtout alors que les entreprises d’IA sont de plus en plus sous pression pour clarifier leurs sources et leur gestion des données d’entraînement, en particulier lorsque ces données proviennent de plateformes avec du contenu généré par les utilisateurs.

Boom de l’IA et tensions sur les plateformes

Depuis la fin 2022, l’IA générative a entraîné des changements importants dans l’industrie technologique, avec des plateformes comme Reddit devenant des dépôts de valeur pour des insights, discussions et conseils générés par l’humain. Ces qualités les rendent attractives pour les développeurs d’IA qui construisent des modèles plus performants et contextuellement conscients.

Reddit lui-même a investi dans l’économie de l’IA, annonçant récemment des partenariats avec OpenAI et Google permettant à ces entreprises d’utiliser le contenu de Reddit selon des conditions de licence spécifiques. Ces accords visent à préserver la vie privée des utilisateurs tout en permettant de générer des revenus à partir de 20 ans de contenu.

Selon la plainte, l’utilisation par Anthropic des données Reddit s’est faite sans de tels accords. La plateforme sociale affirme que cela a causé des préjudices financiers et réputationnels directs, en citant l’utilisation commerciale non autorisée de ses données pour améliorer les produits d’un concurrent.

L’équipe juridique de Reddit a souligné que respecter les règles de la plateforme n’est pas optionnel, surtout dans des secteurs comme la fintech et l’IA où la transparence et la conformité sont de plus en plus scrutées par les utilisateurs et les régulateurs.

Implications pour le marché et réponse de l’industrie

L’action de Reddit a augmenté de plus de 6 % mercredi suite à l’annonce de la plainte, ce qui indique le soutien des investisseurs à la décision de la société de faire respecter ses droits sur les données. La société, qui a été introduite en bourse début 2024, possède actuellement une capitalisation d’environ 22 milliards de dollars.

Anthropic, quant à elle, est rapidement devenue l’une des startups d’IA les mieux financées de l’industrie. La société était évaluée à 61,5 milliards de dollars en mars, avec le soutien de grands acteurs comme Amazon, Salesforce Ventures et Cisco Investments.

Bien qu’Anthropic ait déclaré qu’elle n’était pas d’accord avec les affirmations de Reddit, l’issue de la plainte pourrait avoir des implications à long terme sur la manière dont les entreprises d’IA abordent la collecte de données. Elle pourrait également influencer la tarification ou la restriction d’accès à leur contenu à des fins d’entraînement.

Des experts du secteur ont souligné que, même si le développement de l’IA implique souvent de scraper des données de domaines publics, la frontière entre « accessible au public » et « utilisable commercialement » reste floue. Des affaires juridiques comme celle-ci pourraient encourager la mise en place de cadres plus précis qui équilibrent innovation et utilisation éthique du contenu.

Accent croissant sur l’éthique des données dans l’IA

L’action en justice de Reddit s’inscrit dans un mouvement plus large où les plateformes commencent à se défendre contre ce qu’elles perçoivent comme une exploitation par les entreprises d’IA. Alors que de plus en plus de sociétés technologiques cherchent à monétiser leurs actifs de données, la licence de contenu devient un terrain de bataille.

Reddit a clairement indiqué dans sa plainte qu’il n’est pas opposé à l’utilisation de ses données pour l’entraînement de l’IA, mais s’oppose à leur utilisation non autorisée. En faisant la distinction entre les entreprises respectant ses conditions—comme OpenAI et Google—et celles qui ne le font pas, Reddit cherche à se positionner comme une plateforme favorable à l’IA tout en protégeant sa communauté d’utilisateurs.

La plainte mentionne également le partenariat existant entre OpenAI et Reddit, ainsi que le lien entre Reddit et Sam Altman, PDG d’OpenAI, ancien membre du conseil d’administration et actionnaire majoritaire, ce qui ajoute une complexité supplémentaire au contexte de cette affaire.

Et après ?

Au fur et à mesure que la procédure judiciaire progresse, tous les regards seront tournés vers la manière dont le système juridique traitera la ligne floue entre contenu internet ouvert et données d’entraînement propriétaires. Cette affaire pourrait établir un précédent pour de futurs litiges entre plateformes de contenu et développeurs d’IA.

Pour l’instant, la contestation juridique de Reddit s’ajoute à la tension croissante sur la façon dont les modèles d’IA sont entraînés et sur le degré auquel les propriétaires de plateformes peuvent ou doivent contrôler l’accès aux données générées par leurs utilisateurs.

La plainte renforce également le message selon lequel l’ère du scraping de données non réglementé pourrait toucher à sa fin, surtout à mesure que la sensibilisation du public aux droits sur les données augmente et que les plateformes cherchent à exercer davantage de contrôle sur l’utilisation de leur contenu dans les applications d’IA.

Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
0/400
Aucun commentaire
  • Épingler

Trader les cryptos partout et à tout moment
qrCode
Scan pour télécharger Gate app
Communauté
Français (Afrique)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)