Hasil pencarian untuk "BUG"
2026-05-03
05:17

GPT-5.5 Kembali ke Ujung Terdepan dalam Coding, Tapi OpenAI Mengganti Benchmark Setelah Kalah dari Opus 4.7

Berita Gate tanggal 27 April — SemiAnalysis, sebuah firma analisis semikonduktor dan AI, merilis benchmark perbandingan asisten coding yang mencakup GPT-5.5, Claude Opus 4.7, dan DeepSeek V4. Temuan utamanya: GPT-5.5 menandai kembalinya pertama OpenAI ke ujung terdepan dalam model coding dalam enam bulan, dengan insinyur SemiAnalysis kini bergantian antara Codex dan Claude Code setelah sebelumnya hampir sepenuhnya mengandalkan Claude. GPT-5.5 didasarkan pada pendekatan pra-pelatihan baru yang diberi kode "Spud" dan merupakan ekspansi pertama OpenAI dalam skala pra-pelatihan sejak GPT-4.5. Dalam pengujian praktis, muncul pembagian kerja yang jelas. Claude menangani perencanaan proyek baru dan penyiapan awal, sementara Codex unggul pada perbaikan bug yang membutuhkan penalaran intensif. Codex menunjukkan pemahaman yang lebih kuat tentang struktur data dan penalaran logis, tetapi kesulitan menyimpulkan maksud pengguna yang ambigu. Pada satu tugas di satu dasbor, Claude secara otomatis meniru tata letak halaman referensi tetapi memalsukan dalam jumlah besar data, sedangkan Codex melewatkan tata letak tetapi menyajikan data yang jauh lebih akurat. Analisis mengungkap detail manipulasi benchmark: posting blog OpenAI pada Februari mendorong industri untuk mengadopsi SWE-bench Pro sebagai standar baru untuk benchmark coding. Namun, pengumuman GPT-5.5 beralih ke benchmark baru yang disebut "Expert-SWE." Alasannya, yang terselip dalam catatan kecil, adalah bahwa GPT-5.5 disalip oleh Opus 4.7 pada SWE-bench Pro dan tertinggal jauh dari Mythos 77.8% yang belum dirilis Anthropic. Terkait Opus 4.7, Anthropic menerbitkan analisis pasca-kematian satu minggu setelah rilis, mengakui tiga bug dalam Claude Code yang bertahan selama beberapa minggu dari Maret hingga April, dan memengaruhi hampir semua pengguna. Beberapa insinyur sebelumnya telah melaporkan penurunan performa pada versi 4.6, tetapi diabaikan sebagai pengamatan subjektif. Selain itu, tokenizer baru Opus 4.7 meningkatkan penggunaan token hingga 35%, yang secara terbuka diakui Anthropic—secara efektif merupakan kenaikan harga yang tersembunyi. DeepSeek V4 dinilai sebagai "mampu menyamai laju dengan yang di garis depan tetapi tidak memimpin," dengan memposisikan dirinya sebagai alternatif berbiaya terendah di antara model sumber tertutup. Analisis juga mencatat bahwa "Claude terus mengungguli DeepSeek V4 Pro pada tugas penulisan bahasa Tionghoa dengan kesulitan tinggi," dengan komentar bahwa "Claude menang melawan model Tionghoa di bahasa aslinya." Artikel ini memperkenalkan konsep kunci: harga model harus dievaluasi berdasarkan "biaya per tugas" bukan "biaya per token." Harga GPT-5.5 dua kali lipat dari GPT-5.4 input $5, output per million tokens, tetapi ia menyelesaikan tugas yang sama dengan token yang lebih sedikit, sehingga biaya aktualnya tidak harus lebih tinggi. Data awal SemiAnalysis menunjukkan rasio input-ke-output Codex sebesar 80:1, lebih rendah daripada rasio Claude Code 100:1.
Lainnya
03:25

Litecoin Mengalami Reorganisasi Rantai Mendalam untuk Membatalkan Eksploit Lapisan Privasi MWEB

Berita Gate, 26 April — Litecoin mengalami reorganisasi rantai yang dalam (reorg) pada hari Sabtu setelah para penyerang mengeksploitasi kerentanan zero-day pada lapisan privasi MimbleWimble Extension Block (MWEB), menurut Litecoin Foundation. Bug tersebut memungkinkan node penambangan yang menjalankan perangkat lunak yang lebih lama untuk memvalidasi transaksi MWEB yang tidak valid, sehingga memungkinkan penyerang untuk melakukan peg LTC keluar dari ekstensi privasi dan mengalihkan koin tersebut ke bursa terdesentralisasi pihak ketiga. Major mining pools turut menjadi target serangan denial-of-service yang terkait dengan kelemahan yang sama.
Lainnya
LTC2,52%
SOL2,55%
12:03

Program Hadiah Bug Alchemix untuk Eksploitasi v3 setelah restart, hadiah maksimum 300k dolar AS

Berita Gate, 7 April, platform keamanan Web3 Immunefi mengumumkan bahwa protokol DeFi Alchemix telah mengaktifkan kembali program bug bounty di platform berdasarkan kontrak v3 terbarunya, dengan hadiah maksimum hingga 300k dolar AS. Program ini bertujuan untuk mendorong peneliti keamanan meninjau kode kontrak versi baru, sehingga potensi kerentanan dapat ditemukan lebih awal dan meningkatkan keamanan keseluruhan protokol. Immunefi menyatakan bahwa saat ini adalah periode yang krusial untuk mengaudit kode terkait dan berpartisipasi dalam program hadiah.
Lainnya
ALCX0,37%
12:30

Hyperliquid Testnet untuk Pasar Binari Mengintegrasikan Program Hadiah Bug Tingkat Mainnet

Berita Gate, pada 3 April, Hyperliquid Co-founder Jeff mengumumkan di platform komunitas bahwa hasil transaksi pada testnet untuk pasar biner telah dimasukkan ke dalam program bug bounty tingkat mainnet. Pengumuman tersebut menyatakan bahwa cakupan bug bounty saat ini tidak mencakup pasar dengan banyak hasil. Selain itu, meskipun pengguna dipersilakan untuk memberikan umpan balik terkait front-end, namun masalah yang berkaitan dengan front-end tidak termasuk dalam ruang lingkup hadiah program bug bounty.
Lainnya
05:41

Sui Meluncurkan Virtual Machine Baru untuk Pengujian dan Membuka Program Bug Bounty

Gate News melaporkan bahwa pada 17 Maret, Sui Developers merilis tweet yang menyatakan bahwa mesin virtual baru Sui telah diluncurkan untuk pengujian, dan secara bersamaan membuka program bug bounty. Menurut penjelasan, mesin virtual baru yang diluncurkan kali ini berisi tiga peningkatan teknologi inti: penulisan ulang mesin eksekusi lengkap, mekanisme cache yang lebih cepat, dan peningkatan bahasa Move generasi baru.
Lainnya
SUI3,95%