Découvrez les meilleures actualités et événements fintech !
Abonnez-vous à la newsletter de FinTech Weekly
Lue par des dirigeants de JP Morgan, Coinbase, Blackrock, Klarna et plus encore
Reddit dépose une plainte contre Anthropic pour utilisation non autorisée des données utilisateur
Reddit a engagé une action en justice contre la société d’intelligence artificielle Anthropic, l’accusant de violation de ses conditions d’utilisation et d’engager ce que la plateforme qualifie de « pratiques commerciales illégales et déloyales ». La plainte, déposée mercredi devant un tribunal fédéral, intensifie les tensions concernant l’utilisation de contenus web accessibles au public pour entraîner des systèmes d’IA commerciaux.
Selon la plainte, Reddit affirme qu’Anthropic a accédé et utilisé de grandes quantités de contenu généré par ses utilisateurs pour entraîner ses modèles d’IA sans obtenir les permissions ou licences nécessaires. La plateforme sociale soutient que cela viole non seulement ses politiques, mais exploite aussi la contribution de ses utilisateurs à des fins commerciales sans consentement.
L’affaire soulève des questions plus larges sur la propriété du contenu en ligne à l’ère de l’IA générative, et sur la manière dont les entreprises devraient traiter les données publiques qui portent les nuances des attentes en matière de vie privée et de confiance communautaire.
Un défi juridique basé sur l’utilisation du contenu et le gain commercial
Reddit affirme qu’Anthropic, malgré sa présentation comme une entreprise d’IA éthique, a agi en méconnaissance des règles de la plateforme Reddit.
Le cœur de la plainte repose sur l’allégation qu’Anthropic a entraîné ses modèles d’IA—notamment Claude—sur des données Reddit extraites sans autorisation. Reddit souligne que, contrairement à OpenAI et Google, qui ont conclu des accords de licence conformes aux conditions de la plateforme et à la protection des utilisateurs, Anthropic n’a pas obtenu de permissions similaires.
Cette distinction pourrait être un facteur clé dans l’affaire, surtout alors que les entreprises d’IA sont de plus en plus sous pression pour clarifier leurs sources et leur gestion des données d’entraînement, en particulier lorsque ces données proviennent de plateformes avec du contenu généré par les utilisateurs.
Boom de l’IA et tensions sur les plateformes
Depuis la fin 2022, l’IA générative a entraîné des changements importants dans l’industrie technologique, Reddit devenant un dépôt de valeur élevé pour les insights, discussions et conseils générés par les humains. Ces qualités en font une cible attrayante pour les développeurs d’IA cherchant à créer des modèles plus performants et contextuellement intelligents.
Reddit a récemment renforcé sa position dans l’économie de l’IA, annonçant des partenariats avec OpenAI et Google permettant à ces entreprises d’utiliser le contenu de Reddit selon des conditions de licence spécifiques. Ces accords visent à préserver la vie privée des utilisateurs tout en permettant de monétiser les 20 ans de contenu de la plateforme.
Selon la plainte, l’utilisation par Anthropic des données Reddit s’est faite sans de tels accords, ce qui aurait causé un préjudice financier et réputationnel direct, en citant l’utilisation commerciale non autorisée de ses données pour améliorer les produits d’un concurrent.
L’équipe juridique de Reddit a souligné que respecter les règles de la plateforme n’est pas optionnel, surtout dans des secteurs comme la fintech et l’IA où la transparence et la conformité sont de plus en plus scrutées par les utilisateurs et les régulateurs.
Implications pour le marché et réponse de l’industrie
L’action de Reddit a augmenté de plus de 6 % mercredi suite à l’annonce de la plainte, ce qui indique le soutien des investisseurs à la décision de la société de faire respecter ses droits sur les données. La société, devenue publique début 2024, a une capitalisation boursière d’environ 22 milliards de dollars.
Anthropic, quant à elle, est rapidement devenue l’une des startups d’IA les mieux financées. La société était évaluée à 61,5 milliards de dollars en mars, avec le soutien de grands acteurs comme Amazon, Salesforce Ventures et Cisco Investments.
Bien qu’Anthropic ait déclaré qu’elle n’était pas d’accord avec les affirmations de Reddit, l’issue de la procédure pourrait avoir des implications à long terme sur la façon dont les entreprises d’IA abordent la collecte de données. Elle pourrait également influencer la tarification ou la restriction d’accès à leur contenu pour l’entraînement.
Des experts du secteur ont souligné que, même si le développement de l’IA implique souvent de scraper des données de domaines publics, la frontière entre « accessible au public » et « utilisable commercialement » reste floue. Des affaires juridiques comme celle-ci pourraient encourager la mise en place de cadres plus précis qui équilibrent innovation et utilisation éthique du contenu.
Accent croissant sur l’éthique des données dans l’IA
L’action en justice de Reddit s’inscrit dans un mouvement plus large où les plateformes commencent à se défendre contre ce qu’elles perçoivent comme une exploitation par les entreprises d’IA. Alors que de plus en plus de sociétés technologiques cherchent à monétiser leurs actifs de données, la licence de contenu devient un terrain de bataille.
Reddit a clairement indiqué dans sa plainte qu’il n’est pas opposé à l’utilisation de ses données pour l’entraînement de l’IA, mais s’oppose à leur utilisation non autorisée. En distinguant les entreprises qui respectent ses conditions—comme OpenAI et Google—de celles qui ne le font pas, Reddit cherche à se positionner comme un acteur favorable à l’IA tout en protégeant sa communauté d’utilisateurs.
La plainte mentionne également le partenariat existant entre OpenAI et Reddit, ainsi que le lien entre Reddit et Sam Altman, PDG d’OpenAI, ancien membre du conseil d’administration et actionnaire majoritaire, ce qui complexifie encore le contexte de cette affaire.
Et après ?
Au fur et à mesure que la procédure judiciaire progresse, tous les regards seront tournés vers la manière dont le système judiciaire traitera la ligne floue entre contenu internet ouvert et données d’entraînement propriétaires. Cette affaire pourrait établir un précédent pour de futurs litiges entre plateformes de contenu et développeurs d’IA.
Pour l’instant, la contestation juridique de Reddit s’ajoute à la tension croissante sur la façon dont les modèles d’IA sont entraînés et sur le degré auquel les propriétaires de plateformes peuvent ou doivent contrôler l’accès aux données générées par leurs utilisateurs.
La plainte renforce également le message selon lequel l’ère du scraping de données non régulé pourrait toucher à sa fin, surtout à mesure que la sensibilisation du public aux droits sur les données augmente et que les plateformes cherchent à exercer davantage de contrôle sur l’utilisation de leur contenu dans les applications d’IA.
Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
Reddit poursuit Anthropic pour utilisation abusive présumée des données des utilisateurs dans la formation de modèles d'IA
Découvrez les meilleures actualités et événements fintech !
Abonnez-vous à la newsletter de FinTech Weekly
Lue par des dirigeants de JP Morgan, Coinbase, Blackrock, Klarna et plus encore
Reddit dépose une plainte contre Anthropic pour utilisation non autorisée des données utilisateur
Reddit a engagé une action en justice contre la société d’intelligence artificielle Anthropic, l’accusant de violation de ses conditions d’utilisation et d’engager ce que la plateforme qualifie de « pratiques commerciales illégales et déloyales ». La plainte, déposée mercredi devant un tribunal fédéral, intensifie les tensions concernant l’utilisation de contenus web accessibles au public pour entraîner des systèmes d’IA commerciaux.
Selon la plainte, Reddit affirme qu’Anthropic a accédé et utilisé de grandes quantités de contenu généré par ses utilisateurs pour entraîner ses modèles d’IA sans obtenir les permissions ou licences nécessaires. La plateforme sociale soutient que cela viole non seulement ses politiques, mais exploite aussi la contribution de ses utilisateurs à des fins commerciales sans consentement.
L’affaire soulève des questions plus larges sur la propriété du contenu en ligne à l’ère de l’IA générative, et sur la manière dont les entreprises devraient traiter les données publiques qui portent les nuances des attentes en matière de vie privée et de confiance communautaire.
Un défi juridique basé sur l’utilisation du contenu et le gain commercial
Reddit affirme qu’Anthropic, malgré sa présentation comme une entreprise d’IA éthique, a agi en méconnaissance des règles de la plateforme Reddit.
Le cœur de la plainte repose sur l’allégation qu’Anthropic a entraîné ses modèles d’IA—notamment Claude—sur des données Reddit extraites sans autorisation. Reddit souligne que, contrairement à OpenAI et Google, qui ont conclu des accords de licence conformes aux conditions de la plateforme et à la protection des utilisateurs, Anthropic n’a pas obtenu de permissions similaires.
Cette distinction pourrait être un facteur clé dans l’affaire, surtout alors que les entreprises d’IA sont de plus en plus sous pression pour clarifier leurs sources et leur gestion des données d’entraînement, en particulier lorsque ces données proviennent de plateformes avec du contenu généré par les utilisateurs.
Boom de l’IA et tensions sur les plateformes
Depuis la fin 2022, l’IA générative a entraîné des changements importants dans l’industrie technologique, Reddit devenant un dépôt de valeur élevé pour les insights, discussions et conseils générés par les humains. Ces qualités en font une cible attrayante pour les développeurs d’IA cherchant à créer des modèles plus performants et contextuellement intelligents.
Reddit a récemment renforcé sa position dans l’économie de l’IA, annonçant des partenariats avec OpenAI et Google permettant à ces entreprises d’utiliser le contenu de Reddit selon des conditions de licence spécifiques. Ces accords visent à préserver la vie privée des utilisateurs tout en permettant de monétiser les 20 ans de contenu de la plateforme.
Selon la plainte, l’utilisation par Anthropic des données Reddit s’est faite sans de tels accords, ce qui aurait causé un préjudice financier et réputationnel direct, en citant l’utilisation commerciale non autorisée de ses données pour améliorer les produits d’un concurrent.
L’équipe juridique de Reddit a souligné que respecter les règles de la plateforme n’est pas optionnel, surtout dans des secteurs comme la fintech et l’IA où la transparence et la conformité sont de plus en plus scrutées par les utilisateurs et les régulateurs.
Implications pour le marché et réponse de l’industrie
L’action de Reddit a augmenté de plus de 6 % mercredi suite à l’annonce de la plainte, ce qui indique le soutien des investisseurs à la décision de la société de faire respecter ses droits sur les données. La société, devenue publique début 2024, a une capitalisation boursière d’environ 22 milliards de dollars.
Anthropic, quant à elle, est rapidement devenue l’une des startups d’IA les mieux financées. La société était évaluée à 61,5 milliards de dollars en mars, avec le soutien de grands acteurs comme Amazon, Salesforce Ventures et Cisco Investments.
Bien qu’Anthropic ait déclaré qu’elle n’était pas d’accord avec les affirmations de Reddit, l’issue de la procédure pourrait avoir des implications à long terme sur la façon dont les entreprises d’IA abordent la collecte de données. Elle pourrait également influencer la tarification ou la restriction d’accès à leur contenu pour l’entraînement.
Des experts du secteur ont souligné que, même si le développement de l’IA implique souvent de scraper des données de domaines publics, la frontière entre « accessible au public » et « utilisable commercialement » reste floue. Des affaires juridiques comme celle-ci pourraient encourager la mise en place de cadres plus précis qui équilibrent innovation et utilisation éthique du contenu.
Accent croissant sur l’éthique des données dans l’IA
L’action en justice de Reddit s’inscrit dans un mouvement plus large où les plateformes commencent à se défendre contre ce qu’elles perçoivent comme une exploitation par les entreprises d’IA. Alors que de plus en plus de sociétés technologiques cherchent à monétiser leurs actifs de données, la licence de contenu devient un terrain de bataille.
Reddit a clairement indiqué dans sa plainte qu’il n’est pas opposé à l’utilisation de ses données pour l’entraînement de l’IA, mais s’oppose à leur utilisation non autorisée. En distinguant les entreprises qui respectent ses conditions—comme OpenAI et Google—de celles qui ne le font pas, Reddit cherche à se positionner comme un acteur favorable à l’IA tout en protégeant sa communauté d’utilisateurs.
La plainte mentionne également le partenariat existant entre OpenAI et Reddit, ainsi que le lien entre Reddit et Sam Altman, PDG d’OpenAI, ancien membre du conseil d’administration et actionnaire majoritaire, ce qui complexifie encore le contexte de cette affaire.
Et après ?
Au fur et à mesure que la procédure judiciaire progresse, tous les regards seront tournés vers la manière dont le système judiciaire traitera la ligne floue entre contenu internet ouvert et données d’entraînement propriétaires. Cette affaire pourrait établir un précédent pour de futurs litiges entre plateformes de contenu et développeurs d’IA.
Pour l’instant, la contestation juridique de Reddit s’ajoute à la tension croissante sur la façon dont les modèles d’IA sont entraînés et sur le degré auquel les propriétaires de plateformes peuvent ou doivent contrôler l’accès aux données générées par leurs utilisateurs.
La plainte renforce également le message selon lequel l’ère du scraping de données non régulé pourrait toucher à sa fin, surtout à mesure que la sensibilisation du public aux droits sur les données augmente et que les plateformes cherchent à exercer davantage de contrôle sur l’utilisation de leur contenu dans les applications d’IA.