Cursor Mengungkap Metode Pelatihan Autoinstal, Meningkatkan Kinerja Composer 2 Sebesar 14 Poin Persentase

Berdasarkan pengungkapan terbaru Cursor, perusahaan ini meluncurkan teknik pelatihan bernama autoinstall untuk rangkaian model Composer: menggunakan model generasi sebelumnya untuk secara otomatis menyiapkan lingkungan eksekusi bagi reinforcement learning generasi berikutnya. Saat melatih Composer 2, Cursor menggunakan Composer 1,5 untuk menyelesaikan tugas ini. Metode ini bekerja dalam dua langkah: pertama, sebuah agen membaca dokumentasi repositori kode dan konfigurasi untuk menghasilkan 10 perintah verifikasi beserta output yang diharapkan; kedua, agen lain menggunakan 3 dari perintah tersebut untuk menyiapkan lingkungan dari nol hingga perintah berhasil dijalankan, dengan maksimal 5 percobaan ulang. Composer 2 meraih skor 61,7% di Terminal-Bench, tolok ukur yang mengukur kemampuan penyiapan lingkungan, dibandingkan dengan Composer 1,5 yang 47,9%, menandai peningkatan 14 poin persentase.

Penafian: Informasi di halaman ini dapat berasal dari pihak ketiga dan tidak mewakili pandangan atau opini Gate. Konten yang ditampilkan hanya untuk tujuan referensi dan bukan merupakan nasihat keuangan, investasi, atau hukum. Gate tidak menjamin keakuratan maupun kelengkapan informasi dan tidak bertanggung jawab atas kerugian apa pun yang timbul akibat penggunaan informasi ini. Investasi aset virtual memiliki risiko tinggi dan rentan terhadap volatilitas harga yang signifikan. Anda dapat kehilangan seluruh modal yang diinvestasikan. Harap pahami sepenuhnya risiko yang terkait dan buat keputusan secara bijak berdasarkan kondisi keuangan serta toleransi risiko Anda sendiri. Untuk detail lebih lanjut, silakan merujuk ke Penafian.

Artikel Terkait

Uni Eropa Melarang Pornografi Deepfake yang Dihasilkan AI pada 7 Mei

Menurut Xinhua News Agency, pada 7 Mei anggota Parlemen Eropa dan negara anggota mencapai kesepakatan untuk melarang sistem kecerdasan buatan menghasilkan konten pornografi deepfake. Larangan ini akan dimasukkan ke dalam amandemen Undang-Undang Kecerdasan Buatan 2024. Parlemen Eropa

GateNews9menit yang lalu

Tether Rilis Model AI MedPsy Medis QVAC, Raih Skor 62,62 pada Versi 17B Parameter

Menurut Odaily, Tether AI Research Group merilis QVAC MedPsy, model AI medis yang dirancang untuk berjalan secara lokal di smartphone dan perangkat wearable tanpa ketergantungan pada cloud. Versi berjumlah 1,7 miliar parameter itu memperoleh skor 62,62 pada tujuh tolok ukur medis, melampaui MedGemma-1.5-4B milik Google dengan selisih 11,42 poin

GateNews29menit yang lalu

B.AI Meluncurkan Empat Model Baru Termasuk GPT-5.5 Instant dalam 48 Jam Setelah Rilis OpenAI

API B.AI telah meluncurkan empat model baru: GPT-5.5 Instant, DeepSeek-v3.2, MiniMax-M2.7, dan GLM-5.1. GPT-5.5 Instant menyelesaikan adaptasi dasar dan integrasi antarmuka dalam waktu 48 jam setelah perilisan OpenAI, sehingga memungkinkan akses tanpa penundaan ke

GateNews34menit yang lalu

Model AI Medis 1,7 miliar milik Tether Melampaui Pesaing yang 16x Lebih Besar Hari Ini

Menurut tim riset AI Tether, perusahaan hari ini meluncurkan model bahasa medis seri QVAC MedPsy yang dirancang untuk dijalankan secara lokal di smartphone dan perangkat wearable tanpa ketergantungan pada cloud. Versi dengan 1,7 miliar parameter mencetak 62,62 pada tujuh benchmark medis, melampaui Google MedGemma-4B

GateNews45menit yang lalu

Penilaian Pra-IPO Anthropic Mencapai 1,2 Triliun Dolar AS, Melampaui OpenAI sebesar 20%

Menurut Odaily, valuasi tersirat Anthropic di pasar pra-IPO berbasis blockchain mencapai 1,2 triliun dolar AS, melampaui OpenAI sekitar 20%. Jika perusahaan go public dengan valuasi ini, perusahaan itu akan menjadi perusahaan tercatat publik terbesar ke-11 secara global berdasarkan kapitalisasi pasar, di belakang Apple,

GateNews50menit yang lalu

Kenaikan Saham Korea Selatan Mengungguli Pasar Global di Tengah Booming AI

Pasar saham Korea Selatan mengalami kenaikan yang belum pernah terjadi sebelumnya, didorong oleh saham semikonduktor terkait kecerdasan buatan, dengan indeks KOSPI naik 78% tahun ini, melampaui semua pasar besar lainnya secara global, menurut data Financial Modeling Prep yang dikutip dalam analisis Axios.

CryptoFrontier58menit yang lalu
Komentar
0/400
Tidak ada komentar