Model sumber terbuka sedang mengejar, tetapi apa sebenarnya yang sedang dikejar?

robot
Pembuatan abstrak sedang berlangsung

Open source sedang mengejar, tapi perlu dijelaskan: mengejar sampai mana

Z.ai merilis GLM-5.1, dan Modal hampir bersamaan ikut tersedia untuk di-host. Dua hal yang saling bertumpuk ini, dibandingkan dilihat satu per satu, menjadi lebih menarik.

Modelnya adalah 754B MoE (parameter aktif 40B). Skor SWE-Bench Pro 58,4%; pada tugas pengkodean posisinya tidak jauh berbeda dengan GPT-5.4 dan Opus 4.6; bisa menjalankan mode otonom penuh selama 8 jam, iterasi hingga beberapa ribu kali tanpa jatuh. BenchLM saat ini berada di peringkat ke-10, dan KernelBench menunjukkan bahwa ia 3,6 kali lebih cepat dibanding solusi open source sebelumnya.

Respons di media sosial terpecah: Bindu Reddy mengatakan ini adalah bukti open source mengejar hingga menyalip closed source; Victor Taelin justru meragukan bahwa “500+ tokens/s” tidak realistis pada presisi FP8, sehingga deploy sebenarnya kemungkinan hanya sekitar 200 tps. Keduanya punya dasar—modelnya memang bisa, tetapi angka pemasaran cenderung terlalu optimistis.

Kali ini ada beberapa perbedaan dibanding rilis open source sebelumnya:

  • Endpoint gratis Modal mengubah algoritma keterpakain dan biaya. Z.ai (sebelumnya Zhipu, sekarang telah IPO di Hong Kong) menjangkau pengembang di Barat lewat Modal; pengembang tidak perlu memikirkan gesekan geopolitik; penetapan harga $1 per jutaan token masukan juga menekan jangkar harga layanan proprietari.
  • Kampanye tentang efisiensi inferensi perlu konteks. GLM-5.1 menggunakan sparse mixture of attention dan reinforcement learning asinkron untuk mengendalikan biaya ekspansi. Namun “500+ tps” bergantung pada infrastruktur yang sebagian besar orang tidak memilikinya. Bottleneck yang sesungguhnya ada pada servitisasi dan penjadwalan, bukan pada spesifikasi di atas kertas model.
  • Bisa langsung diintegrasikan ke toolchain yang sudah ada. Kompatibel dengan Claude Code dan OpenClaw, artinya bisa langsung menggantikan alur kerja kerja proprietari yang sudah ada. Tekanan pada Anthropic dan OpenAI terutama di harga, bukan karena kapabilitas disamakan.

MarkTechPost dan Constellation sama-sama menafsirkan ini sebagai upaya open source dan closed source “ketinggalan 6 bulan” yang sedang menyempit. Dalam arah agen pengkodean, penilaian ini kemungkinan besar benar. Z.ai memakai lisensi MIT; fine-tuning putaran kedua sudah dalam perjalanan.

Tapi jangan mengira open source telah membalikkan keadaan secara menyeluruh. Model proprietari masih jauh lebih unggul dalam alignment keamanan dan inferensi multimodal. Yang sedang terkikis adalah benteng pada skenario agen pengkodean ini: perusahaan lebih menilai biaya deployment pada tugas seperti ini, sehingga mereka tidak terlalu sensitif terhadap perbedaan kemampuan marjinal di sana.

Lebih penting daripada model: infrastruktur

Modal berbasis klaster B200; GLM-5.1 di-deploy memakai SGLang, dan di skenario interaktif bisa berjalan pada 30–75 tokens/s. Detail teknik yang terdengar membosankan inilah yang sebenarnya paling penting.

Z.ai menunjukkan throughput 21,5k QPS di VectorDBBench (setelah 600 iterasi optimisasi). Performa seperti ini membutuhkan elastisitas serverless Modal agar dapat diserahkan secara stabil; mengandalkan model saja tidak akan mencapai skala sebesar itu.

Ini juga mengubah cara kita melihat “rilis model”: rilis tersebut tidak lagi sekadar kejadian terpisah, melainkan bagian dari strategi ekosistem. Kombinasi “model open source + infrastruktur Barat” menjadi lindung nilai terhadap penguncian API laboratorium tunggal.

Soal batas GLM-5.1: performa benchmark coding mencapai 94,6% seperti Opus, tapi gap inferensinya masih ada. Profil kapabilitas yang lebih “seimbang” ini lebih berarti untuk kasus penggunaan tertentu.

Ke depan: pendapatan Z.ai tahun lalu tumbuh 131% secara year-on-year. Jika biaya inferensi turun sampai di bawah $0,50 per jutaan tokens, open source berpeluang mengambil 30–50% pangsa deployment agen pengkodean dalam setahun. Perubahan kebijakan di AS mungkin membawa gangguan, tetapi risiko saat ini terlihat tidak tinggi.

Perspektif Bukti Dampak industri Penilaianku
Kaum optimis open source SWE-Bench Pro 58,4%, otonom 8 jam Perusahaan mulai uji coba pengganti open source Agak berlebihan. Keunggulannya ada pada integrasi dan keterpakain, bukan pada nilai skor. Uji coba gratis Modal lebih penting daripada peringkat di daftar.
Penjaga closed source BenchLM peringkat 10, kemampuan inferensi masih di bawah Opus Closed source terus memimpin dalam keamanan dan multimodal Mismatch harga. Efisiensi GLM memampatkan kekuatan penetapan harga lawan, sehingga Anthropic harus merespons.
Kaum pragmatis urusan infrastruktur Endpoint Modal, kompatibel dengan OpenClaw Modal terkonsentrasi pada platform serverless Ini yang paling kunci. Apa pun model mana yang menang, perusahaan infrastruktur diuntungkan.
Pihak yang meragukan dari sisi geopolitik IPO Z.ai di Hong Kong, lisensi MIT, ketegangan AS-Tiongkok Sumber model akan mendapat pengawasan lebih Sementara terbilang terlalu tinggi. Yang lebih realistis adalah fokus pada ruang komersialisasi dengan mitra hosting di Barat.

Kesimpulan: Serangan kombinasi ini menegaskan satu hal: pada bidang vertikal agen pengkodean, kemampuan open source sudah pada dasarnya menyusul dan menyamai. Yang diuntungkan adalah Builder yang lebih dulu membangun arsitektur “tidak tergantung infrastruktur”, serta investor yang menata platform hosting. Anthropic menghadapi tekanan harga. Perusahaan yang masih sangat terikat pada API closed source sedang membayar premi karena kapabilitas yang terus mengecil kesenjangannya.

Pentingnya: Tinggi
Kategori: Rilis model, kerja sama, open source

Penilaian: Untuk jalur agen pengkodean, saat ini masih merupakan jendela yang relatif awal. Yang paling diuntungkan adalah dua jenis pihak: (1) Builder dan integrator yang membangun workflow “tidak tergantung infrastruktur”; (2) pihak yang menaruh dana pada hosting serverless dan platform inferensi. Untuk trader jangka pendek, kecuali bisa menangkap ritme penurunan harga dan perpindahan trafik, keunggulannya terbatas; untuk investor jangka panjang, perlu memperhatikan apakah kurva biaya benar-benar turun sampai di bawah $0,50 per jutaan tokens, untuk memverifikasi apakah pangsa bisa melonjak.

Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
Tidak ada komentar
  • Sematkan