Pada 26 Februari, waktu Beijing, Anthropic, perusahaan AI terkemuka di Amerika Serikat, mengumumkan akuisisi Vercept, startup AI otomatisasi komputer yang digerakkan oleh visi, untuk menutupi kekurangan visual fungsi Penggunaan Komputer. Ini adalah akuisisi kedua Anthropic setelah mengakuisisi startup rantai alat full-stack Bun pada Desember 2025.
Penggunaan Komputer adalah kemampuan inti dari kontrol langsung AI terhadap komputer yang dibuat oleh Anthropic untuk model besarnya Claude, memungkinkan Claude untuk “melihat layar, menggerakkan mouse, mengetik keyboard, dan mengoperasikan perangkat lunak” seperti manusia, dan menyelesaikan tugas multi-langkah dan lintas aplikasi yang kompleks, yang akan dirilis dengan Soneta Claude 3.5 pada Oktober 2024.
Namun, karena kemacetan dalam akurasi pemahaman visual, pengenalan antarmuka yang kompleks, dan pemrosesan pemandangan dinamis pada tahap awal model, tingkat keberhasilan operasi penggunaan komputer rendah dan tugasnya mudah gagal. Akumulasi Vercept dalam pengenalan UI presisi tinggi, penalaran spasial, pelacakan antarmuka dinamis, dan pemrosesan visual latensi rendah hanya dapat menutupi kekurangan di atas.
Menurut Anthropic, pengembang menggunakan Claude untuk menangani tugas-tugas yang semakin kompleks, termasuk menulis dan menjalankan kode di seluruh repositori, mensintesis penelitian dari lusinan sumber, dan mengelola alur kerja di berbagai alat dan tim. Penggunaan Komputer memungkinkan Claude untuk bekerja secara real-time di berbagai perangkat lunak seolah-olah dia sedang duduk di depan komputer, menyelesaikan banyak tugas multi-langkah yang tidak dapat dilakukan dengan kode saja. Akuisisi Vercept akan membantu perusahaan lebih meningkatkan kemampuan ini.
Berkantor pusat di Seattle, AS, Vercept didirikan oleh alumni Allen Institute for AI (AI2) dan memposisikan Agen AI yang mengutamakan visi, dengan fokus pada otomatisasi bebas API yang “melihat layar dan mengontrol komputer seperti manusia”. Anggota tim inti bertanggung jawab atas robotika dan kecerdasan yang diwujudkan, Agen AI, dan pembelajaran penguatan.
Berdasarkan akumulasi teknologi dan latar belakang tim pendiri, Vercept menyelesaikan putaran pendanaan awal senilai $16 juta pada Januari 2025, senilai sekitar $67 juta, dan daftar investor termasuk mantan CEO Google Eric Schmidt, kepala ilmuwan Google DeepMind Jeff Dean, pendiri Cruise Kyle Vogt dan lainnya. Jumlah total dana yang dikumpulkan oleh Vercept adalah sekitar $50 juta.
Anthropic percaya keahlian Vercept dalam persepsi dan interaksi secara langsung dapat diterapkan pada beberapa masalah terberat yang ditangani Anthropic. Aplikasi desktop Vercept Vy akan ditutup selama 30 hari, dan sebagai bagian dari transisi, Vercept mendorong pengguna untuk mencoba alat Claude Anthropic sebagai alternatif selama akhir layanan.
Berbicara tentang pertimbangan akuisisi, salah satu pendiri Vercept Luca Weihs mengatakan bahwa di masa depan, kemampuan Claude untuk menyelesaikan tugas kerja berbasis pengetahuan akan sebanding dengan tingkat kode yang ditulisnya saat ini, yang berarti bahwa cara orang berinteraksi dengan komputer dapat berubah secara mendasar untuk memastikan bahwa pengalaman interaksi ini sama pentingnya dengan model yang mendasarinya.
Akuisisi ini mencerminkan persaingan yang berkembang di jalur Agen AI yang dapat mengontrol komputer dan perangkat lain serta menyelesaikan tugas bagi pengguna. Selain Anthropic, OpenAI juga aktif menyebarkan. Pada pertengahan Februari, pendiri OpenClaw Peter Steinberger mengumumkan bahwa dia akan bergabung dengan OpenAI penuh waktu untuk mengembangkan agen AI pribadi generasi berikutnya. Proyek OpenClaw tidak diakuisisi oleh OpenAI atau digabungkan ke dalam perusahaan, tetapi ditransfer ke Independent Open Source Foundation, terus mempertahankan protokol open source MIT dan otonomi komunitas. OpenAI menyediakan pendanaan, teknologi, dan sponsor sumber daya model, tetapi tidak memiliki atau mengontrol keputusan proyek. Melalui metode “pengenalan bakat”, ini melengkapi kemampuan OpenAI untuk mendarat di Agen AI pribadi dan melindungi keunggulan Anthropic dalam agen tingkat perusahaan.
Meskipun ada perbedaan dalam metode operasi, ini pada dasarnya adalah taruhan antara kedua perusahaan di jalur Agen AI. Pendiri Anthropic Dario Amodei mengatakan dalam sebuah wawancara baru-baru ini bahwa bentuk utama evolusi AI bukanlah generator teks, tetapi sistem eksekusi loop tertutup dengan kontrol komputer universal. Itu dapat menyelesaikan tugas produksi yang kompleks seperti pengeditan video dan rekayasa perangkat lunak dengan mengamati layar, berkonsultasi dengan riwayat, memahami konteks, dan berkolaborasi lintas platform seperti manusia.
Kendala utama dalam industri saat ini bukanlah kecerdasan, tetapi keandalan interaksi - yaitu, kemampuan model cukup kuat, tetapi masih tidak cukup untuk menyelesaikan tugas secara stabil, akurat, dan tanpa kesalahan. Dalam satu hingga tiga tahun ke depan, AI akan menyelesaikan sebagian besar kebutuhan pekerjaan yang membutuhkan “pembelajaran di tempat kerja” melalui kombinasi manajemen konteks panjang dan kontrol visi komputer.
(Sumber artikel: Yicai)
Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
Anthropic mengakuisisi OpenAI rebutan orang “Dua kekuatan Silicon Valley” apa rencana mereka?
Pada 26 Februari, waktu Beijing, Anthropic, perusahaan AI terkemuka di Amerika Serikat, mengumumkan akuisisi Vercept, startup AI otomatisasi komputer yang digerakkan oleh visi, untuk menutupi kekurangan visual fungsi Penggunaan Komputer. Ini adalah akuisisi kedua Anthropic setelah mengakuisisi startup rantai alat full-stack Bun pada Desember 2025.
Penggunaan Komputer adalah kemampuan inti dari kontrol langsung AI terhadap komputer yang dibuat oleh Anthropic untuk model besarnya Claude, memungkinkan Claude untuk “melihat layar, menggerakkan mouse, mengetik keyboard, dan mengoperasikan perangkat lunak” seperti manusia, dan menyelesaikan tugas multi-langkah dan lintas aplikasi yang kompleks, yang akan dirilis dengan Soneta Claude 3.5 pada Oktober 2024.
Namun, karena kemacetan dalam akurasi pemahaman visual, pengenalan antarmuka yang kompleks, dan pemrosesan pemandangan dinamis pada tahap awal model, tingkat keberhasilan operasi penggunaan komputer rendah dan tugasnya mudah gagal. Akumulasi Vercept dalam pengenalan UI presisi tinggi, penalaran spasial, pelacakan antarmuka dinamis, dan pemrosesan visual latensi rendah hanya dapat menutupi kekurangan di atas.
Menurut Anthropic, pengembang menggunakan Claude untuk menangani tugas-tugas yang semakin kompleks, termasuk menulis dan menjalankan kode di seluruh repositori, mensintesis penelitian dari lusinan sumber, dan mengelola alur kerja di berbagai alat dan tim. Penggunaan Komputer memungkinkan Claude untuk bekerja secara real-time di berbagai perangkat lunak seolah-olah dia sedang duduk di depan komputer, menyelesaikan banyak tugas multi-langkah yang tidak dapat dilakukan dengan kode saja. Akuisisi Vercept akan membantu perusahaan lebih meningkatkan kemampuan ini.
Berkantor pusat di Seattle, AS, Vercept didirikan oleh alumni Allen Institute for AI (AI2) dan memposisikan Agen AI yang mengutamakan visi, dengan fokus pada otomatisasi bebas API yang “melihat layar dan mengontrol komputer seperti manusia”. Anggota tim inti bertanggung jawab atas robotika dan kecerdasan yang diwujudkan, Agen AI, dan pembelajaran penguatan.
Berdasarkan akumulasi teknologi dan latar belakang tim pendiri, Vercept menyelesaikan putaran pendanaan awal senilai $16 juta pada Januari 2025, senilai sekitar $67 juta, dan daftar investor termasuk mantan CEO Google Eric Schmidt, kepala ilmuwan Google DeepMind Jeff Dean, pendiri Cruise Kyle Vogt dan lainnya. Jumlah total dana yang dikumpulkan oleh Vercept adalah sekitar $50 juta.
Anthropic percaya keahlian Vercept dalam persepsi dan interaksi secara langsung dapat diterapkan pada beberapa masalah terberat yang ditangani Anthropic. Aplikasi desktop Vercept Vy akan ditutup selama 30 hari, dan sebagai bagian dari transisi, Vercept mendorong pengguna untuk mencoba alat Claude Anthropic sebagai alternatif selama akhir layanan.
Berbicara tentang pertimbangan akuisisi, salah satu pendiri Vercept Luca Weihs mengatakan bahwa di masa depan, kemampuan Claude untuk menyelesaikan tugas kerja berbasis pengetahuan akan sebanding dengan tingkat kode yang ditulisnya saat ini, yang berarti bahwa cara orang berinteraksi dengan komputer dapat berubah secara mendasar untuk memastikan bahwa pengalaman interaksi ini sama pentingnya dengan model yang mendasarinya.
Akuisisi ini mencerminkan persaingan yang berkembang di jalur Agen AI yang dapat mengontrol komputer dan perangkat lain serta menyelesaikan tugas bagi pengguna. Selain Anthropic, OpenAI juga aktif menyebarkan. Pada pertengahan Februari, pendiri OpenClaw Peter Steinberger mengumumkan bahwa dia akan bergabung dengan OpenAI penuh waktu untuk mengembangkan agen AI pribadi generasi berikutnya. Proyek OpenClaw tidak diakuisisi oleh OpenAI atau digabungkan ke dalam perusahaan, tetapi ditransfer ke Independent Open Source Foundation, terus mempertahankan protokol open source MIT dan otonomi komunitas. OpenAI menyediakan pendanaan, teknologi, dan sponsor sumber daya model, tetapi tidak memiliki atau mengontrol keputusan proyek. Melalui metode “pengenalan bakat”, ini melengkapi kemampuan OpenAI untuk mendarat di Agen AI pribadi dan melindungi keunggulan Anthropic dalam agen tingkat perusahaan.
Meskipun ada perbedaan dalam metode operasi, ini pada dasarnya adalah taruhan antara kedua perusahaan di jalur Agen AI. Pendiri Anthropic Dario Amodei mengatakan dalam sebuah wawancara baru-baru ini bahwa bentuk utama evolusi AI bukanlah generator teks, tetapi sistem eksekusi loop tertutup dengan kontrol komputer universal. Itu dapat menyelesaikan tugas produksi yang kompleks seperti pengeditan video dan rekayasa perangkat lunak dengan mengamati layar, berkonsultasi dengan riwayat, memahami konteks, dan berkolaborasi lintas platform seperti manusia.
Kendala utama dalam industri saat ini bukanlah kecerdasan, tetapi keandalan interaksi - yaitu, kemampuan model cukup kuat, tetapi masih tidak cukup untuk menyelesaikan tugas secara stabil, akurat, dan tanpa kesalahan. Dalam satu hingga tiga tahun ke depan, AI akan menyelesaikan sebagian besar kebutuhan pekerjaan yang membutuhkan “pembelajaran di tempat kerja” melalui kombinasi manajemen konteks panjang dan kontrol visi komputer.
(Sumber artikel: Yicai)