Menurut pemantauan Beating, OpenAI merilis sebuah ulasan tentang masalah “Goblin” yang telah mengganggu beberapa generasi model GPT. Sejak GPT-5.1, model semakin sering memasukkan metafora makhluk fantasi seperti goblin dan peri dalam jawaban mereka, dan keluhan pengguna terus meningkat. Setelah peluncuran GPT-5.1, frekuensi kata “goblin” muncul dalam percakapan ChatGPT meningkat sebesar 175%. Hingga GPT-5.4, masalah ini mencapai puncaknya.
Akar permasalahan terletak pada fitur kustomisasi kepribadian “Nerdy” dari ChatGPT. Petunjuk sistem kepribadian ini meminta model “menggunakan keasyikan bahasa untuk mengurangi keseriusan” dan “mengakui keanehan dunia serta menikmatinya”. Saat pelatihan, sinyal penghargaan yang digunakan untuk memperkuat gaya kepribadian ini memberikan skor lebih tinggi pada output yang mengandung kosakata makhluk fantasi, dan bias ini dapat diamati di 76,2% dataset.
Masalahnya adalah sinyal penghargaan ini hanya berlaku dalam kepribadian “Nerdy”, tetapi pembelajaran penguatan tidak menjamin bahwa perilaku yang dipelajari hanya akan muncul dalam kondisi tertentu. Begitu model diberi penghargaan untuk kebiasaan berbicara tertentu dalam suatu kondisi, kebiasaan tersebut akan menyebar ke skenario lain melalui pelatihan lanjutan. Jalur penyebarannya cukup jelas: sinyal penghargaan mendorong keluaran yang mengandung goblin, yang kemudian muncul dalam data fine-tuning pengawasan (SFT), sehingga model semakin terbiasa menghasilkan kata-kata tersebut dan membentuk umpan balik positif. Dari data, kepribadian “Nerdy” hanya menyumbang 2,5% dari seluruh balasan ChatGPT, tetapi menyumbang 66,7% dari penyebutan goblin. Dalam GPT-5.4, tingkat kemunculan goblin dalam kepribadian “Nerdy” melonjak 3881% dibandingkan GPT-5.2.
GPT-5.5 sudah mulai dilatih sebelum akar penyebabnya ditemukan, dan goblin sudah menyusup ke data SFT. OpenAI menonaktifkan kepribadian “Nerdy” pada bulan Maret, menghapus sinyal penghargaan yang condong ke makhluk fantasi dan menyaring data pelatihan. Untuk GPT-5.5 yang sudah diluncurkan, mereka menambahkan instruksi penekanan dalam petunjuk pengembang Codex. OpenAI menyatakan bahwa penyelidikan ini telah melahirkan seperangkat alat audit perilaku model yang baru.
Penafian: Informasi di halaman ini dapat berasal dari pihak ketiga dan tidak mewakili pandangan atau opini Gate. Konten yang ditampilkan hanya untuk tujuan referensi dan bukan merupakan nasihat keuangan, investasi, atau hukum. Gate tidak menjamin keakuratan maupun kelengkapan informasi dan tidak bertanggung jawab atas kerugian apa pun yang timbul akibat penggunaan informasi ini. Investasi aset virtual memiliki risiko tinggi dan rentan terhadap volatilitas harga yang signifikan. Anda dapat kehilangan seluruh modal yang diinvestasikan. Harap pahami sepenuhnya risiko yang terkait dan buat keputusan secara bijak berdasarkan kondisi keuangan serta toleransi risiko Anda sendiri. Untuk detail lebih lanjut, silakan merujuk ke
Penafian.
Artikel Terkait
Forefront Tech Menyelesaikan Penetapan Harga $100M IPO, untuk Listing di Nasdaq
Menurut ChainCatcher, Forefront Tech Holdings Acquisition Corp menyelesaikan penetapan harga IPO senilai 100 juta dolar AS pada 30 April, yang akan dicatatkan di Nasdaq dengan ticker FTHAU. Dana hasil penawaran akan digunakan untuk mengeksplorasi peluang merger dan akuisisi di blockchain, kecerdasan buatan, fintech, dan lainnya
GateNews34menit yang lalu
Mantan Eksekutif Meta Menggalang Dana untuk Startup AI Flourish dengan Penilaian $2,5 miliar
Menurut Bloomberg, Thomas Reardon, mantan eksekutif Meta yang memimpin kerja pada Meta's Neural Band, sedang mengumpulkan dana untuk Flourish, sebuah startup AI baru yang berfokus pada sistem AI berdaya rendah. Lux Capital dan Google Ventures telah sepakat menjadi investor utama, dengan para pendukung yang sudah berkomitmen 500 juta dolar pada valuasi 2,5
GateNews36menit yang lalu
Biaya GPU Nvidia Blackwell Lipat Dua, Namun Biaya Inferensi Per-Token Turun 35x Dibanding Hopper
Menurut analisis blog terbaru Nvidia, GPU Blackwell harganya hampir dua kali lebih mahal per jam dibandingkan generasi Hopper, namun memberikan biaya inferensi per token 35 kali lebih rendah. Dengan menggunakan DeepSeek-R1 sebagai model uji, Blackwell (GB300 NVL72) menyewa dengan biaya $2,65 per GPU per jam dibandingkan Hopper $1,41, tetapi hanya untuk satu GPU
GateNews1jam yang lalu
OpenAI Melacak Masalah Goblin ke Sinyal Hadiah Kepribadian yang “Nerdy”, Sebutan Goblin Melonjak 175% di GPT-5.1
Menurut OpenAI, perusahaan tersebut mengidentifikasi akar masalah dari problem “goblin” yang melanda model GPT mulai dari GPT-5.1 dan seterusnya. Sinyal imbalan yang digunakan untuk memperkuat sifat kepribadian “Nerdy” mendorong keluaran yang memuat referensi makhluk fantasi, dengan 76,2% dari kumpulan data pelatihan yang menunjukkan
GateNews1jam yang lalu
Parallel Web Systems Menggalang Seri B sebanyak $100M pada Valuasi $2B , dipimpin oleh Sequoia
Menurut TechCrunch, Parallel Web Systems, sebuah startup AI yang didirikan oleh mantan CEO Twitter Parag Agrawal, mengumpulkan pendanaan 100 juta dolar AS pada putaran Seri B yang dipimpin oleh Sequoia dengan valuasi 2 miliar dolar AS. Putaran ini membawa total pendanaan perusahaan menjadi 230 juta dolar AS, lima bulan setelah putaran Seri A senilai 100 juta dolar AS. Parallel
GateNews1jam yang lalu
Jamuan malam perayaan 8 tahun BitMart: menghadirkan perdagangan otomatis berbasis AI dan layanan lokal untuk pengguna Taiwan
BitMart menggelar jamuan makan malam ulang tahun ke-8 di Taipei King’s Garden, dengan lebih dari 150 tamu hadir. Acara ini meninjau perkembangan selama delapan tahun sekaligus mengumumkan strategi lokalisasi dan perdagangan otomatis berbasis AI. BitMart Skill digabungkan dengan Blave, memungkinkan pengguna melakukan perdagangan otomatis dengan AI tanpa perlu pemrograman sekaligus memperoleh wawasan data real-time. Pengguna global telah menembus 13 juta, jumlah proyek yang diluncurkan lebih dari 4.800, dan volume perdagangan mencapai lebih dari 1 triliun dolar AS. Jamuan makan malam menghadirkan sosok Santa Claus versi manusia dan berbagai hadiah berlimpah, menunjukkan keseriusan BitMart mendalami Taiwan.
ChainNewsAbmedia2jam yang lalu