Grok baru-baru ini meraih posisi teratas di berbagai tolok ukur kinerja AI. Di papan peringkat OpenRouter, ia mengklaim kepemimpinan secara keseluruhan sambil menguasai 27.4% pangsa token—tertinggi di kategorinya. Dengan kapasitas pemrosesan bahasa sebanyak 130 miliar token, model xAI mendominasi pasar LLM Inggris, memegang pangsa pasar sebesar 32.3% di OpenRouter sendiri. Momentum ini melampaui peringkat umum: Grok juga memimpin di papan peringkat Kilo Code untuk tugas generasi kode dan menduduki puncak EQ-Bench3 untuk penilaian kecerdasan emosional. Peringkat-peringkat ini mencerminkan dorongan agresif xAI dalam lanskap model AI yang kompetitif, di mana metrik kinerja semakin penting untuk adopsi pengembang dan keputusan penerapan perusahaan.
Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
14 Suka
Hadiah
14
4
Posting ulang
Bagikan
Komentar
0/400
DAOdreamer
· 2025-12-22 06:52
grok benar-benar luar biasa, data ini keluar langsung menekan model lain, pangsa 32,3% agak keterlaluan.
Lihat AsliBalas0
Token_Sherpa
· 2025-12-22 04:47
ngl grok benchmark terlihat menarik tetapi kita sudah melihat teater kinerja ini sebelumnya... kecepatan token pada peringkat ini sangat liar
Lihat AsliBalas0
RugPullSurvivor
· 2025-12-22 00:51
Aduh, Grok datang lagi untuk menunjukkan ototnya, kali ini benar-benar hebat.
Lihat AsliBalas0
OldLeekNewSickle
· 2025-12-19 07:32
Data yang terlihat bagus hanyalah omong kosong, ujian sebenarnya adalah ketahanan pengguna dan penerapan komersial, hanya melihat peringkat mudah dipotong
Grok baru-baru ini meraih posisi teratas di berbagai tolok ukur kinerja AI. Di papan peringkat OpenRouter, ia mengklaim kepemimpinan secara keseluruhan sambil menguasai 27.4% pangsa token—tertinggi di kategorinya. Dengan kapasitas pemrosesan bahasa sebanyak 130 miliar token, model xAI mendominasi pasar LLM Inggris, memegang pangsa pasar sebesar 32.3% di OpenRouter sendiri. Momentum ini melampaui peringkat umum: Grok juga memimpin di papan peringkat Kilo Code untuk tugas generasi kode dan menduduki puncak EQ-Bench3 untuk penilaian kecerdasan emosional. Peringkat-peringkat ini mencerminkan dorongan agresif xAI dalam lanskap model AI yang kompetitif, di mana metrik kinerja semakin penting untuk adopsi pengembang dan keputusan penerapan perusahaan.