Откройте для себя SCENE
Федеральный магистрат обязал OpenAI передать примерно 20 миллионов обезличенных журналов ChatGPT The New York Times и другим истцам, усилив уязвимость компании-разработчика AI к целому ряду споров по авторским правам и управлению данными.
Вынесенное в среду в Нью-Йорке постановление отклоняет попытку OpenAI заблокировать передачу записей чатов пользователей и требует передать журналы в рамках защитного механизма.
Это решение может повлиять на то, как такие технологические компании, как OpenAI, Anthropic и Perplexity, собирают обучающие данные, лицензируют контент и выстраивают защиту вокруг того, что их системы могут генерировать.
Хотя суд “признает, что вопросы конфиденциальности пользователей OpenAI являются серьезными”, подобные соображения “являются лишь одним из факторов в анализе соразмерности и не могут преобладать, когда есть явная значимость и минимальная нагрузка”, написала магистрат Она Т. Ван.
Decrypt обратился за комментариями к обеим сторонам.
Постановление связано с продолжающимся иском Times, в котором утверждается, что модели OpenAI обучались на защищенном авторским правом новостном контенте без разрешения. Иск был подан в декабре 2023 года.
В январе прошлого года OpenAI оспорила претензии NYT и подала встречный иск, заявив, что издание не “рассказывает всю историю”.
Позднее суд пришел к выводу, что 20 миллионов выбранных журналов чатов “соразмерны нуждам дела” для оценки того, копировал ли ChatGPT материалы NYT.
За последний год спор обострился: истцы настаивали на широком доступе к данным выводов, а OpenAI предупреждала, что массовая передача материалов создаст проблемы с приватностью и операционными издержками.
В июне OpenAI столкнулась с еще одним поражением, когда суд обязал компанию сохранить широкий спектр пользовательских данных ChatGPT для иска, включая чаты, которые пользователи, возможно, уже удалили.
Спустя несколько месяцев, в октябре, спор вспыхнул вновь: суд отметил подачу OpenAI от 20 октября (ECF 679), в которой компания оспаривала передачу выборки из 20 миллионов журналов, и потребовал от обеих сторон пояснить, почему их позиции расходятся.
В то время судья попросила стороны объяснить, как этот спор связан с предыдущими вопросами об удаленных журналах и отступила ли OpenAI от прежних соглашений о том, что компания собиралась передать.
В конце прошлого месяца OpenAI подала формальное возражение с просьбой к окружному судье отменить распоряжение магистрата о раскрытии информации.
Компания утверждала, что решение было “явно ошибочным” и “несоразмерным”, поскольку потребовало бы раскрытия миллионов приватных пользовательских переписок, согласно судебному документу, предоставленному Decrypt представителем OpenAI.
Этот спор возник на фоне широкой кампании против AI-лабораторий: авторы, новостные организации, музыкальные издательства и репозитории кода стремятся проверить, насколько далеко распространяется действие существующего законодательства об авторском праве, когда модели поглощают и воспроизводят защищенный материал.
Суды по всему США и Европе сейчас рассматривают аналогичные иски.