Reddit kiện Anthropic về việc sử dụng sai trái dữ liệu người dùng trong đào tạo mô hình AI

SleepTrader

2026-02-24 11:28:20

Khám phá các tin tức và sự kiện fintech hàng đầu!

Đăng ký nhận bản tin của FinTech Weekly

Được đọc bởi các giám đốc điều hành tại JP Morgan, Coinbase, Blackrock, Klarna và nhiều hơn nữa

Reddit kiện Anthropic về việc sử dụng trái phép dữ liệu người dùng

Reddit đã có hành động pháp lý chống lại công ty trí tuệ nhân tạo Anthropic, cáo buộc startup này vi phạm điều khoản dịch vụ của họ và tham gia vào các hành vi “hoạt động kinh doanh trái pháp luật và không công bằng” theo lời platform này. Vụ kiện, được nộp vào thứ Tư tại tòa liên bang, làm tăng căng thẳng về việc sử dụng nội dung web công khai để đào tạo hệ thống AI thương mại.

Theo đơn kiện, Reddit cáo buộc Anthropic đã truy cập và sử dụng lượng lớn nội dung do người dùng tạo ra trên Reddit để đào tạo các mô hình AI của họ mà không có được sự cho phép hoặc giấy phép cần thiết. Nền tảng mạng xã hội này lập luận rằng hành động này không chỉ vi phạm chính sách của họ mà còn lợi dụng đóng góp của người dùng để kiếm lợi thương mại mà không có sự đồng ý.

Vụ kiện nhấn mạnh các câu hỏi rộng hơn về quyền sở hữu nội dung trực tuyến trong thời đại AI tạo sinh, và cách các công ty nên xử lý dữ liệu công khai mang theo các kỳ vọng về quyền riêng tư và lòng tin cộng đồng.

Thách thức pháp lý liên quan đến việc sử dụng nội dung và lợi ích thương mại

Reddit cho rằng Anthropic, mặc dù tự giới thiệu là một công ty AI có đạo đức, đã hành xử trái với các quy định của nền tảng Reddit.

Trọng tâm của đơn kiện là cáo buộc rằng Anthropic đã huấn luyện các mô hình AI — đặc biệt là Claude — dựa trên dữ liệu Reddit bị lấy trộm mà không có sự cho phép. Reddit chỉ ra rằng, khác với OpenAI và Google, đã ký các thỏa thuận cấp phép phù hợp với điều khoản của nền tảng và bảo vệ người dùng, Anthropic đã không đảm bảo được các quyền này.

Sự khác biệt này có thể là yếu tố then chốt trong vụ án, đặc biệt khi các công ty AI ngày càng bị áp lực làm rõ cách họ lấy và xử lý dữ liệu huấn luyện, đặc biệt là khi dữ liệu đó đến từ các nền tảng có nội dung do người dùng đóng góp.

Sự bùng nổ AI và căng thẳng giữa các nền tảng

Từ cuối 2022, AI tạo sinh đã thúc đẩy những thay đổi lớn trong ngành công nghệ, với các nền tảng như Reddit trở thành kho chứa giá trị cao cho các insights, thảo luận và lời khuyên do con người tạo ra. Những đặc điểm này khiến chúng trở nên hấp dẫn đối với các nhà phát triển AI xây dựng các mô hình có khả năng hiểu biết và phù hợp hơn với ngữ cảnh.

Reddit đã tham gia vào nền kinh tế AI, gần đây công bố các hợp tác với OpenAI và Google cho phép các công ty này sử dụng nội dung Reddit theo các điều khoản cấp phép cụ thể. Các thỏa thuận này nhằm bảo vệ quyền riêng tư của người dùng trong khi vẫn tạo ra doanh thu từ 20 năm nội dung của nền tảng.

Tuy nhiên, theo đơn kiện, việc Anthropic sử dụng dữ liệu Reddit đã diễn ra mà không có các thỏa thuận như vậy. Nền tảng này lập luận rằng điều này đã gây thiệt hại trực tiếp về tài chính và uy tín, khi dữ liệu của họ bị sử dụng trái phép để nâng cao sản phẩm của đối thủ.

Đội ngũ pháp lý của Reddit nhấn mạnh rằng việc tuân thủ các quy định của nền tảng là không thể bỏ qua, đặc biệt trong các lĩnh vực như fintech và AI, nơi tính minh bạch và tuân thủ ngày càng bị giám sát chặt chẽ hơn từ phía người dùng và cơ quan quản lý.

Ảnh hưởng thị trường và phản ứng của ngành

Cổ phiếu Reddit đã tăng hơn 6% vào thứ Tư sau khi công bố vụ kiện, cho thấy sự ủng hộ của nhà đầu tư đối với quyết định của công ty trong việc bảo vệ quyền dữ liệu của mình. Công ty, chính thức niêm yết vào đầu năm 2024, hiện có vốn hóa thị trường khoảng 22 tỷ USD.

Trong khi đó, Anthropic nhanh chóng trở thành một trong những startup được đầu tư nhiều nhất trong ngành AI. Công ty này được định giá 61,5 tỷ USD vào tháng 3, với sự hậu thuẫn từ các ông lớn như Amazon, Salesforce Ventures và Cisco Investments.

Dù Anthropic đã tuyên bố không đồng ý với các cáo buộc của Reddit, kết quả của vụ kiện có thể ảnh hưởng lâu dài đến cách các công ty AI tiếp cận việc thu thập dữ liệu. Nó cũng có thể ảnh hưởng đến cách các nền tảng định giá hoặc hạn chế quyền truy cập vào nội dung của họ để đào tạo.

Các chuyên gia trong ngành nhận định rằng, mặc dù phát triển AI thường liên quan đến việc lấy dữ liệu từ các nguồn công khai, ranh giới giữa “công khai” và “có thể sử dụng thương mại” vẫn còn mơ hồ. Các vụ kiện như thế này có thể thúc đẩy các khung pháp lý rõ ràng hơn nhằm cân bằng giữa đổi mới và đạo đức trong việc sử dụng nội dung.

Tăng cường chú trọng đạo đức dữ liệu trong AI

Hành động pháp lý của Reddit là một phần trong xu hướng rộng hơn khi các nền tảng bắt đầu phản kháng lại những gì họ xem là sự khai thác trái phép của các công ty AI. Khi ngày càng nhiều công ty công nghệ tìm cách kiếm tiền từ dữ liệu của mình, việc cấp phép nội dung đã trở thành một chiến trường.

Reddit đã rõ ràng trong đơn kiện rằng họ không phản đối việc sử dụng dữ liệu của mình trong đào tạo AI, mà chỉ phản đối việc sử dụng trái phép. Bằng cách phân biệt giữa các công ty tôn trọng điều khoản của họ — như OpenAI và Google — và những công ty bị cáo buộc không tuân thủ, Reddit muốn định vị mình là một nền tảng thân thiện với AI và bảo vệ cộng đồng người dùng.

Thỏa thuận hợp tác hiện tại giữa OpenAI và Reddit đã được đề cập trong đơn kiện, và mối liên hệ giữa Reddit và CEO OpenAI Sam Altman, cựu thành viên hội đồng quản trị và cổ đông lớn, càng làm phức tạp thêm bối cảnh của vụ kiện.

Chuyện gì tiếp theo

Khi quá trình xét xử diễn ra, tất cả sẽ chú ý xem hệ thống pháp luật sẽ xử lý như thế nào về ranh giới mơ hồ giữa nội dung internet mở và dữ liệu đào tạo độc quyền. Vụ kiện này có thể đặt ra tiền lệ cho các tranh chấp trong tương lai giữa các nền tảng nội dung và các nhà phát triển AI.

Hiện tại, vụ kiện của Reddit góp phần làm rõ hơn về cách các mô hình AI được đào tạo và mức độ mà các chủ sở hữu nền tảng có thể hoặc nên kiểm soát quyền truy cập vào dữ liệu do người dùng đóng góp.

Vụ kiện cũng nhấn mạnh rằng thời kỳ khai thác dữ liệu không có quy định rõ ràng có thể sắp kết thúc, đặc biệt khi nhận thức về quyền dữ liệu của công chúng ngày càng tăng và các nền tảng muốn kiểm soát nhiều hơn cách nội dung của họ được sử dụng trong các ứng dụng AI.

Xem bản gốc

Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.