Salesforce đang đối mặt với vụ kiện tập thể tại tòa án liên bang San Francisco, bị cáo buộc xây dựng các mô hình AI XGen dựa trên thư viện sách vi phạm bản quyền. Hai tác giả E. Molly Tanzer và Jennifer Gilmore cho rằng Salesforce đã dùng hàng trăm nghìn cuốn sách từ bộ dữ liệu RedPajama và The Pile, bao gồm Books3 — tập hợp hơn 196.000 cuốn sách sao chép từ Bibliotik.
Ban đầu, Salesforce công khai liệt kê “RedPajama-Books” làm nguồn huấn luyện, nhưng sau đó đã xóa và thay bằng mô tả “nguồn dữ liệu ngôn ngữ công khai.” Đơn kiện còn cáo buộc công ty tiếp tục vi phạm khi thương mại hóa công nghệ qua nền tảng Agentforce AI và mẫu XGen-Sales.
Các chuyên gia pháp lý cho rằng nguyên đơn phải chứng minh thiệt hại tài chính thực tế, song nếu Salesforce cố tình bỏ qua vi phạm, tòa vẫn có thể kết luận hành vi xâm phạm có chủ ý.