Reddit подає позов проти Anthropic за ймовірне неправомірне використання даних користувачів для навчання моделей штучного інтелекту

SleepTrader

2026-02-26 02:16:22

Відкрийте для себе найкращі новини та події у сфері фінтех!

Підписуйтеся на розсилку FinTech Weekly

Читають керівники JP Morgan, Coinbase, Blackrock, Klarna та інших компаній

Reddit подає позов проти Anthropic через несанкціоноване використання даних користувачів

Reddit подав позов проти компанії штучного інтелекту Anthropic, звинувативши стартап у порушенні умов користування та у так званих «незаконних та несправедливих бізнес-практиках». Позов, поданий у середу у федеральному суді, посилює напруженість щодо використання публічно доступного веб-контенту для навчання комерційних систем штучного інтелекту.

Згідно з позовною заявою, Reddit стверджує, що Anthropic отримував і використовував великі обсяги контенту, створеного користувачами Reddit, для навчання своїх моделей ШІ без отримання необхідних дозволів або ліцензій. Соціальна платформа вважає, що це порушує її політику та експлуатує внески користувачів у комерційних цілях без згоди.

Цей випадок підкреслює ширші питання про те, хто володіє онлайн-контентом у епоху генеративного ШІ і як компанії мають ставитися до публічних даних, що містять нюанси приватності та довіри спільноти.

Юридична боротьба через використання контенту та комерційний інтерес

Reddit стверджує, що Anthropic, попри заяви про етичну орієнтацію компанії ШІ, діяла всупереч правилам платформи.

Основна частина позову стосується того, що Anthropic навчала свої моделі ШІ — зокрема Claude — на Reddit-даних, зібраних без дозволу. Reddit зазначає, що, на відміну від OpenAI і Google, які уклали ліцензійні угоди, що відповідають умовам платформи та захисту користувачів, Anthropic не отримав подібних дозволів.

Ця різниця може стати ключовим фактором у справі, особливо враховуючи зростаючий тиск на компанії ШІ щодо прозорості джерел і обробки навчальних даних, особливо коли ці дані походять із платформ із внесками користувачів.

Бум ШІ та напруженість платформ

З кінця 2022 року генеративний ШІ спричинив значні зміни у технологічній галузі, а платформи, такі як Reddit, стали цінними сховищами людських ідей, обговорень і порад. Ці якості роблять їх привабливими для розробників ШІ, які прагнуть створювати більш здатні та контекстуально обізнані моделі.

Reddit активно долучився до економіки ШІ, нещодавно оголосивши про партнерства з OpenAI та Google, що дозволяє цим компаніям використовувати контент Reddit за певними ліцензійними умовами. Ці угоди спрямовані на збереження приватності користувачів і одночасно отримання доходу від 20-річного контенту платформи.

Однак, за даними позову, Anthropic використовував Reddit-дані без таких угод. Соціальна платформа стверджує, що це спричинило прямий фінансовий і репутаційний збиток, оскільки дані були використані для покращення продуктів конкурента без дозволу.

Юридична команда Reddit підкреслює, що дотримання правил платформи — не опція, особливо у сферах фінтеху та ШІ, де прозорість і відповідність регуляторним вимогам стають дедалі важливішими.

Ринкові наслідки та реакція галузі

Акції Reddit зросли більш ніж на 6% у середу після оголошення про позов, що свідчить про підтримку інвесторів у рішенні компанії захищати свої права на дані. Компанія, яка вийшла на біржу на початку 2024 року, має приблизну ринкову капіталізацію у 22 мільярди доларів.

Між тим, Anthropic швидко став однією з найбільш фінансованих стартапів у галузі ШІ. У березні компанія оцінила свою вартість у 61,5 мільярда доларів за підтримки таких гігантів, як Amazon, Salesforce Ventures і Cisco Investments.

Хоча Anthropic заявляє, що не погоджується з претензіями Reddit, результат справи може мати довгострокові наслідки для підходів компаній ШІ до збору даних. Це також може вплинути на цінову політику або обмеження доступу до контенту платформ для навчання моделей.

Інсайдери галузі зазначають, що, хоча розробка ШІ часто включає скрапінг даних із публічних джерел, межа між «публічною доступністю» та «комерційною придатністю» залишається неясною. Такі юридичні справи, як ця, можуть сприяти створенню більш чітких рамок, що балансуватимуть інновації та етичне використання контенту.

Зростаюча увага до етики даних у ШІ

Позов Reddit є частиною ширшої тенденції, коли платформи починають протистояти тому, що вони вважають експлуатацією з боку компаній ШІ. Оскільки все більше технологічних компаній прагнуть монетизувати свої дані, ліцензування контенту стає ареною боротьби.

У позові Reddit чітко зазначено, що він не проти використання своїх даних для навчання ШІ, а проти їхнього несанкціонованого використання. Вони роблять різницю між компаніями, які дотримуються умов — такими як OpenAI і Google — і тими, що, за їхніми словами, цього не роблять, прагнучи позиціонувати себе як дружні до ШІ та захисники своїх користувачів.

У позові згадується вже існуюче партнерство OpenAI з Reddit, а також зв’язки між Reddit і генеральним директором OpenAI Самом Альтманом, колишнім членом ради директорів і великим акціонером, що додає додаткової складності до контексту справи.

Що чекати далі

Після початку судового процесу всі погляди будуть прикуті до того, як правова система вирішить питання розмитих меж між відкритим інтернет-контентом і власними навчальними даними. Ця справа може стати прецедентом для майбутніх спорів між платформами та розробниками ШІ.

Поки що позов Reddit додає напруженості у питання, як саме тренуються моделі ШІ і наскільки власники платформ можуть і повинні контролювати доступ до даних, внесених користувачами.

Ця справа також підкреслює, що ера необмеженого скрапінгу даних, ймовірно, завершується, особливо з урахуванням зростання обізнаності про права на дані та прагнення платформ мати більше контролю над тим, як їхній контент використовується у застосунках ШІ.

Переглянути оригінал

Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.