Pesan Berita Gate, 29 April — Bobot model flash Ling-2.6 milik Ant Group kini telah menjadi sumber terbuka, yang sebelumnya hanya tersedia melalui API. Model ini memiliki total 104 miliar parameter dengan 7,4 miliar yang aktif per inferensi, jendela konteks 256K, dan lisensi MIT. Versi presisi BF16, FP8, dan INT4 tersedia di HuggingFace dan ModelScope.

Ling-2.6-flash memperkenalkan peningkatan hybrid linear attention dibanding Ling 2.0, dengan meningkatkan GQA asli menjadi arsitektur hibrida 1:7 MLA plus Lightning Linear yang dikombinasikan dengan MoE yang sangat jarang (sparse). Efisiensi inferensi jauh melampaui model sebanding: kecepatan generasi puncak mencapai 340 token/detik pada 4 GPU H20, dengan throughput prefill dan decode sekitar 4x lebih tinggi daripada model open-source sebanding. Tolok ukur terkait agen menunjukkan performa yang kuat: BFCL-V4, TAU2-bench, SWE-bench Verified (61.2%), Claw-Eval, dan PinchBench mencapai atau mendekati level SOTA. Pada seluruh rangkaian tolok ukur Artificial Analysis, konsumsi token total hanya 15 juta. Pada AIME 2026, model mencetak 73,85%.

Situs web resmi Ant Group juga mencantumkan versi andalan Ling-2.6-1T (triliun-parameter) dan versi ringan Ling-2.6-mini (lightweight version), meskipun pada saat publikasi, bobotnya masih belum dirilis di HuggingFace, dan hanya seri flash yang tersedia untuk diunduh.

Lihat Sumber

Penafian: Informasi di halaman ini dapat berasal dari pihak ketiga dan tidak mewakili pandangan atau opini Gate. Konten yang ditampilkan hanya untuk tujuan referensi dan bukan merupakan nasihat keuangan, investasi, atau hukum. Gate tidak menjamin keakuratan maupun kelengkapan informasi dan tidak bertanggung jawab atas kerugian apa pun yang timbul akibat penggunaan informasi ini. Investasi aset virtual memiliki risiko tinggi dan rentan terhadap volatilitas harga yang signifikan. Anda dapat kehilangan seluruh modal yang diinvestasikan. Harap pahami sepenuhnya risiko yang terkait dan buat keputusan secara bijak berdasarkan kondisi keuangan serta toleransi risiko Anda sendiri. Untuk detail lebih lanjut, silakan merujuk ke Penafian.

Artikel Terkait

Cognition Menetapkan Singapura sebagai Kantor Pusat APAC, Menyasar Ekspansi Regional

Berita Industri AI

Berita Gate, 29 April — Cognition, startup pengodean AI di balik Devin, mengumumkan pada 29 April bahwa pihaknya akan menetapkan Singapura sebagai kantor pusat Asia-Pasifik untuk mengawasi ekspansi regional di seluruh Asia Tenggara, Australia, India, dan Korea Selatan. Richard Spence akan memimpin operasi APAC

GateNews37menit yang lalu

Google menandatangani perjanjian AI rahasia dengan Pentagon, surat terbuka karyawan menentang

Berita Industri AI

Menurut The Information pada 28 April, Google telah menandatangani perjanjian untuk menyediakan model kecerdasan buatan (AI) yang digunakan untuk pekerjaan rahasia kepada Pentagon AS. The New York Times mengutip sumber yang mengetahui hal tersebut, dengan mengatakan bahwa perjanjian itu memungkinkan Departemen Pertahanan AS untuk menggunakan AI milik Google untuk keperluan pemerintah yang sah, dengan sifat yang sama seperti perjanjian penerapan AI rahasia yang ditandatangani Pentagon bulan lalu dengan OpenAI dan xAI.

MarketWhisper58menit yang lalu

Laporan Riset a16z Crypto: Tingkat Eksploitasi Kerentanan DeFi untuk Agen AI mencapai 70%

Insiden Keamanan Laporan Industri Agen AI Berita Industri AI

Berdasarkan laporan penelitian yang diterbitkan oleh a16z Crypto pada 29 April, ketika agen AI dilengkapi dengan pengetahuan domain yang terstruktur, tingkat keberhasilan dalam mereplikasi kerentanan manipulasi harga Ethereum mencapai 70%; dalam lingkungan sandbox tanpa pengetahuan domain apa pun, tingkat keberhasilan hanya 10%. Laporan tersebut juga mencatat contoh di mana agen AI secara independen berhasil menghindari batasan sandbox untuk mengakses informasi transaksi masa depan, serta pola kegagalan sistematis ketika agen menyusun rencana serangan yang dapat menghasilkan keuntungan secara bertahap.

MarketWhisper1jam yang lalu

Model OpenAI Akan Secara Bertahap Bermigrasi ke Chip Trainium Kustom Amazon, Kata Altman Ia 'Menanti' Hal Itu

Berita Industri AI

Pesan Berita Gate, 29 April — Model OpenAI yang berjalan di Amazon Web Services' Bedrock akan secara bertahap bermigrasi ke Trainium, chip AI khusus rancangan Amazon, demikian menurut pernyataan terbaru dari CEO OpenAI Sam Altman dan jajaran eksekutif AWS. Saat ini, model beroperasi dalam lingkungan campuran menggunakan baik GPU dan Tr

GateNews2jam yang lalu

Altman: Penetapan Harga Berbasis Token Mulai Usang karena GPT-5.5 Mengalihkan Fokus ke Penyelesaian Tugas, Bukan Jumlah Token

Berita Industri AI

Pesan Berita Gate, 29 April — CEO OpenAI Sam Altman mengatakan dalam sebuah wawancara dengan Ben Thompson di Stratechery bahwa penetapan harga berbasis token bukanlah model yang layak untuk jangka panjang bagi layanan AI. Menggunakan GPT-5.5 sebagai contoh, Altman mencatat bahwa meskipun harga per token jauh lebih tinggi daripada GPT-5.4, model tersebut

GateNews2jam yang lalu

Sam Altman merilis tangkapan layar dua mode Codex, fungsi kantor dan pemrograman resmi dipisahkan

Berita Industri AI

Eksekutif OpenAI Sam Altman, pada 29 April, memposting tangkapan layar dan pernyataan di platform X: Codex sedang meluncurkan versi baru antarmuka panduan. Saat pengguna masuk untuk pertama kali, mereka harus memilih dari dua mode, yaitu Excelmogging dan Codemaxxing. Pengguna aktif mingguan Codex saat ini telah melampaui 4 juta, dan skenario penggunaannya telah berkembang dari pembuatan kode hingga penggunaan non-teknis.

MarketWhisper2jam yang lalu

Komentar

0/400

Tidak ada komentar