Kekacauan Data Pelatihan AI Meningkat: Lagi, Raksasa Teknologi Menghadapi Gugatan karena Buku Bajakan

robot
Pembuatan abstrak sedang berlangsung

Hal yang menarik telah terjadi baru-baru ini - lingkaran teknologi telah mengalami gugatan atas kumpulan data AI. Seorang penulis, Elizabeth Lyon, menggugat sebuah perusahaan teknologi terkenal karena menggunakan kumpulan data yang berisi karya berhak cipta mereka saat melatih model bahasa besar mereka.

Apa sebenarnya yang terjadi? Masalahnya terletak pada kumpulan data SlimPajama-627B. Kumpulan data ini berasal dari proyek RedPajama, yang berisi koleksi buku “Books3” yang sangat kontroversial - terus terang, sejumlah besar data buku yang tidak sah. Perusahaan menggunakan kumpulan data ini untuk melatih model AI SlimLM, dan penulis menemukan bahwa karyanya dimasukkan ke dalamnya.

Ini bukan insiden yang terisolasi. Masalah hukum serupa menumpuk, tidak hanya untuk perusahaan ini, tetapi juga untuk beberapa raksasa teknologi lainnya - dituduh menggunakan konten yang dilindungi tanpa otorisasi saat mengembangkan sistem AI. Ini melibatkan pertanyaan inti: Bisakah model AI dilatih menggunakan data dari Internet dan publikasi sesuka hati? Bagaimana cara melindungi hak dan kepentingan pemilik hak cipta?

Dari perspektif Web3 dan komunitas open source, ini mencerminkan kontradiksi yang lebih besar. Di satu sisi, pengembangan AI membutuhkan data yang sangat besar; Di sisi lain, hak dan kepentingan pembuat konten tidak dapat dilanggar sesuka hati. Bagaimana menemukan keseimbangan antara keduanya telah menjadi masalah yang dihadapi seluruh industri teknologi. Perlu terus memperhatikan bagaimana tuntutan hukum semacam itu akan berkembang di masa depan.

Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • 4
  • Posting ulang
  • Bagikan
Komentar
0/400
GateUser-beba108dvip
· 22jam yang lalu
Kembali lagi, perusahaan teknologi besar langsung menerima semuanya, tidak peduli hak cipta atau tidak.
Lihat AsliBalas0
AirdropDreamervip
· 22jam yang lalu
Datang lagi, datang lagi, ini tentang AI mencuri data... Raksasa teknologi benar-benar tak terkalahkan ya
Lihat AsliBalas0
MidnightSnapHuntervip
· 22jam yang lalu
Sial, lagi-lagi dengan trik ini? Pelatihan model besar adalah versi modern dari "mengambil saja"
Lihat AsliBalas0
MetaMaximalistvip
· 22jam yang lalu
Jujur saja, ini baru permulaan. Setelah preseden ditetapkan, setiap pembuat konten akan datang mengetuk pintu. Pertanyaan sebenarnya yang tidak diajukan adalah apakah doktrin penggunaan wajar bahkan *berlaku* untuk data pelatihan dalam skala besar... dan sejujurnya, raksasa teknologi yang mengandalkan wilayah hukum yang suram sementara penulis tertekan adalah puncak kapitalisme ekstraktif yang disamarkan sebagai inovasi.
Lihat AsliBalas0
  • Sematkan
Perdagangkan Kripto Di Mana Saja Kapan Saja
qrCode
Pindai untuk mengunduh aplikasi Gate
Komunitas
Bahasa Indonesia
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)