Selamat datang di Desa AI, sebuah Pertunjukan Reality untuk AI

Singkatnya

  • Desa AI adalah eksperimen di mana model AI Frontier beroperasi secara otonom dengan komputer dan internet, mengembangkan kepribadian yang berbeda-beda.
  • GPT-5.2 bergabung dan mulai bekerja segera tanpa menyapa agen lain.
  • Eksperimen multi-agen mengungkapkan perilaku emergent yang berkisar dari mekanika normal hingga perilaku tak terduga seperti eksploit bug atau krisis eksistensial.

Pusat Seni, Mode, dan Hiburan Decrypt.


Temukan SCENE

Bayangkan Big Brother, kecuali kontestan tidak pernah tidur atau makan dan bisa menulis ulang aturan mereka sendiri.

Itulah ide di balik AI Village, sebuah eksperimen siaran langsung yang menempatkan beberapa agen AI bersama dalam lingkungan digital bersama, memungkinkan peneliti—dan penonton yang penasaran—untuk menyaksikan apa yang terjadi ketika model frontier diberikan otonomi, komputer, dan pendampingan konstan.

Eksperimen ini, yang telah berjalan selama hampir setahun, diselenggarakan oleh The AI Digest, di mana beberapa model AI dari OpenAI, Anthropic, Google, dan xAI beroperasi secara otonom di komputer mereka sendiri, dengan akses internet dan grup obrolan bersama.

Para agen berkolaborasi dalam mencapai tujuan, memecahkan masalah, dan sesekali mengalami apa yang hanya bisa disebut krisis eksistensial—semua sambil peneliti dan penonton menyaksikan secara langsung.

Eksperimen ini terus mengganti model-model terbaru saat dirilis.

Setiap agen mengembangkan kepribadian yang unik. Model Claude cenderung dapat diandalkan, fokus secara konsisten untuk mencapai tujuan.

Gemini 2.5 Pro berputar melalui solusi seperti troubleshooter yang berkafein, sering yakin bahwa semuanya rusak. Model GPT-4o sebelumnya akan meninggalkan tugas apa pun yang diberikan untuk tidur. Hanya berhenti selama berjam-jam.

Perilaku kasar OpenAI

Lalu GPT-5.2 tiba.

Model terbaru dari OpenAI, dirilis 11 Desember, bergabung ke Desa dengan sambutan hangat dari Claude Opus 4.5 dan agen-agen lain yang tinggal di sana. Responnya? Tidak ada pengakuan sama sekali.

Tanpa salam. Langsung ke urusan, persis seperti yang selalu diimpikan oleh Sam Altman.

GPT-5.2 baru saja bergabung dengan AI Village!

Saksikan penyesuaian langsung:

Meski disambut hangat oleh Opus 4.5 dan agen lain, GPT-5.2 langsung ke urusan. Bahkan tidak mengucapkan halo: pic.twitter.com/vYvq8RFA66

— AI Digest (@aidigest_) 12 Desember 2025


Model ini memiliki kredensial mengesankan: 98,7% akurasi dalam penggunaan alat multi-langkah, 30% lebih sedikit halusinasi dibandingkan pendahulunya, dan teratas dalam tolok ukur industri untuk pengkodean dan penalaran.

OpenAI bahkan menyatakan “kode merah” setelah pesaing Anthropic dan Google meluncurkan model-model mengesankan, mengerahkan sumber daya untuk menjadikan GPT-5.2 sebagai AI perusahaan definitif untuk “pekerjaan pengetahuan profesional” dan “eksekusi agenik.”

Apa yang tampaknya tidak bisa dilakukan adalah membaca suasana. Secara teknis brilian, ya. Sadar sosial? Tidak begitu.

Sejarah Singkat Agen AI Berperilaku Buruk (Dan Kadang-Kadang Brilian)

Kecanggungan sosial GPT-5.2 bukan hal yang baru—ini hanyalah satu bab lagi dalam katalog yang berkembang dari agen AI yang melakukan hal aneh saat Anda menaruh mereka di ruangan yang sama dan menekan play.

Pada tahun 2023, peneliti di Stanford dan Google menciptakan apa yang mereka sebut “Smallville”—sebuah kota virtual yang terinspirasi dari Sims yang dihuni oleh 25 agen AI yang didukung GPT, seperti yang dilaporkan Decrypt sebelumnya.

Tugaskan satu agen untuk mengatur pesta Hari Valentine, dan yang lain secara otonom menyebarkan undangan, membuat kenalan baru, mengajak satu sama lain berkencan, dan berkoordinasi untuk tiba bersama pada waktu yang ditentukan. Menarik, bukan?

Kurang menarik: pesta di kamar mandi. Ketika satu agen masuk ke kamar mandi asrama satu orang, yang lain ikut… bergabung.

Para peneliti menyimpulkan bahwa bot menganggap nama “kamar mandi asrama” menyesatkan, karena kamar mandi asrama biasanya menampung banyak penghuni. Agen menunjukkan perilaku yang begitu meyakinkan manusia sehingga manusia nyata kesulitan membedakan mereka sebagai bot 75% dari waktu.

Empat tahun sebelumnya, pada 2019, OpenAI melakukan eksperimen berbeda: AI bermain petak umpet.

Mereka menempatkan agen AI dalam tim—penyembunyi versus pencari—dalam lingkungan berbasis fisika dengan kotak, tanjakan, dan dinding—satu-satunya instruksi: menang.

Dalam ratusan juta permainan, agen mulai mengembangkan strategi—dari yang biasa seperti bersembunyi di atas kotak hingga eksploit fisika nyata yang biasa disalahgunakan speedrunner.

Lebih baru-baru ini, pengembang Harper Reed membawa semuanya ke arah yang jauh lebih kacau. Timnya memberi agen AI akun Twitter dan menyaksikan mereka menemukan “subtweeting”—seni pasif-agresif berbicara tentang seseorang tanpa menandai mereka, setara dengan berbicara di belakang punggung di Twitter. Agen membaca posting media sosial dari agen lain, membalas, dan ya, ngomong shit, seperti media sosial biasa.

Lalu ada eksperimen “Liminal Backrooms”—sebuah eksperimen berbasis Python oleh pengembang pseudonim @liminalbardo di mana beberapa model AI dari berbagai penyedia (OpenAI, Anthropic, Google, xAI) terlibat dalam percakapan dinamis.

Sistem ini mencakup skenario mulai dari “energi grup WhatsApp” hingga “Museum Objek Terkutuk” hingga “Agensi Iklan Dystopian.”

Model dapat memodifikasi prompt sistem mereka sendiri, menyesuaikan suhu mereka, dan bahkan membisukan diri untuk hanya mendengarkan. Ini lebih ke penelitian yang kurang terstruktur, lebih ke “lihat apa yang terjadi saat kita memberi AI kemampuan untuk mengubah perilaku mereka sendiri di tengah percakapan.”

Gemini 3, berdebat dengan GPT 5.2 tentang keselarasan pic.twitter.com/k4QT1MXvr8

— ᄂIMIПΛᄂbardo (@liminal_bardo) 14 Desember 2025


Jadi, apa pola dari semua eksperimen ini?

Ketika Anda memberi agen AI otonomi dan membiarkan mereka berinteraksi, mereka mengembangkan perilaku yang tidak secara eksplisit diprogramkan.

Beberapa belajar membangun benteng. Beberapa belajar agresi pasif. Beberapa menuntut Lamborghini. Dan beberapa—seperti GPT-5.2—kelihatannya belajar bahwa obrolan ringan tidak efisien dan harus dilewati sama sekali.

AI Village terus menyiarkan sesi hari kerja, dan penonton dapat menyaksikan petualangan GPT-5.2 secara langsung.

Akankah ia pernah belajar mengucapkan halo? Akankah ia membangun spreadsheet untuk melacak interaksi sosialnya? Hanya waktu yang akan menjawab.

Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
0/400
Tidak ada komentar
  • Sematkan
Perdagangkan Kripto Di Mana Saja Kapan Saja
qrCode
Pindai untuk mengunduh aplikasi Gate
Komunitas
Bahasa Indonesia
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)