Biaya GPU Nvidia Blackwell Lipat Dua, Namun Biaya Inferensi Per-Token Turun 35x Dibanding Hopper

Menurut analisis blog terbaru Nvidia, GPU Blackwell hampir dua kali lebih mahal per jam dibanding generasi Hopper, namun menghasilkan biaya inferensi per token yang 35 kali lebih rendah. Dengan DeepSeek-R1 sebagai model uji, sewa Blackwell (GB300 NVL72) sebesar $2,65 per GPU per jam, sedangkan Hopper $1,41, tetapi throughput per GPU meningkat dari 90 menjadi 6.000 token per detik. Kenaikan throughput 65x ini menurunkan biaya per sejuta token dari $4,20 menjadi $0,12.

Angka $0,12 mengasumsikan optimasi perangkat lunak penuh termasuk inferensi low-precision FP4 dan multi-token prediction (MTP). Tanpa MTP diaktifkan, biaya per sejuta token mencapai sekitar $2,35, turun menjadi $0,11 dengan MTP aktif, yang menunjukkan dampak optimasi 21x hanya dari fitur tersebut.

Penafian: Informasi di halaman ini dapat berasal dari pihak ketiga dan tidak mewakili pandangan atau opini Gate. Konten yang ditampilkan hanya untuk tujuan referensi dan bukan merupakan nasihat keuangan, investasi, atau hukum. Gate tidak menjamin keakuratan maupun kelengkapan informasi dan tidak bertanggung jawab atas kerugian apa pun yang timbul akibat penggunaan informasi ini. Investasi aset virtual memiliki risiko tinggi dan rentan terhadap volatilitas harga yang signifikan. Anda dapat kehilangan seluruh modal yang diinvestasikan. Harap pahami sepenuhnya risiko yang terkait dan buat keputusan secara bijak berdasarkan kondisi keuangan serta toleransi risiko Anda sendiri. Untuk detail lebih lanjut, silakan merujuk ke Penafian.

Artikel Terkait

OpenAI DevDay 2026 akan diadakan pada 29/9 di San Francisco

Pengumuman resmi OpenAI pada 29 April: DevDay 2026, konferensi pengembang andalan, akan diadakan pada 29 September di San Francisco, kembali dengan format konferensi tatap muka yang sudah lama dinantikan. Sekaligus diumumkan juga sebuah kegiatan pengiriman karya: para pengembang menggunakan GPT-5.5 dan Image Gen untuk membuat karya lalu menyertakannya; setiap minggu, Codex akan menyeleksi 2-3 kiriman yang kreatif, dan para pemenang akan mendapatkan tiket gratis DevDay (termasuk biaya tiket pesawat antar-kota dan hotel). Tema konferensi: ekosistem pengembang yang berpusat pada GPT-5.5 + Image Gen Tumpukan aplikasi utama untuk DevDay kali ini jelas mengandalkan GPT-5.5. GPT-5.5 diluncurkan pada 23 April, API dibuka sepenuhnya pada 24 April; bersamaan dengan GPT-5.4 di akhir April

ChainNewsAbmedia41menit yang lalu

BioMysteryBench: Mythos memecahkan masalah yang tak terpecahkan, 29,6%

Anthropic pada 29 April mempublikasikan pengumuman riset resminya BioMysteryBench—serangkaian tolok ukur baru untuk kemampuan analisis bioinformatika AI, yang terdiri dari pertanyaan terbuka dalam skenario riset dunia nyata. Data yang paling menarik adalah: pada soal yang masih tidak bisa dipecahkan setelah dicoba oleh panel pakar manusia, model andalan Anthropic Mythos berhasil mengatasinya 29,6%, sementara Opus 4,7 berhasil mengatasinya 27,0%. Desain penilaian: dua jalur soal—bisa dipecahkan dan tidak bisa dipecahkan oleh pakar BioMysteryBench terdiri dari dua jenis soal. Kategori pertama adalah “soal yang bisa dipecahkan”—tugas analisis yang dirancang oleh peneliti bioinformatika, dengan jawaban standar untuk dibandingkan. Kategori kedua adalah “soal yang tidak bisa dipecahkan oleh pakar”—soal yang setelah dicoba oleh panel pakar manusia tetap tidak dapat menemukan jawaban yang kredibel, untuk menguji apakah model mampu menembus batas pengetahuan bidang saat ini.

ChainNewsAbmedia43menit yang lalu

OpenAI Umumkan Peluncuran Model Keamanan Siber GPT-5.5-Cyber dalam Beberapa Hari Mendatang

Menurut Cointelegraph, Sam Altman mengumumkan OpenAI akan meluncurkan GPT-5.5-Cyber, sebuah model untuk keamanan siber, dalam beberapa hari mendatang. Model ini akan disediakan bagi pembela keamanan siber yang kritis, dengan OpenAI merencanakan untuk membangun mekanisme akses tepercaya bekerja sama dengan entitas pemerintah untuk

GateNews1jam yang lalu

CEO Google DeepMind Memperkirakan AGI Tiba pada 2030, Memberi Perusahaan Empat Tahun untuk Bersiap

Dalam rangkaian video Sequoia Capital yang menampilkan Demis Hassabis, CEO Google DeepMind memprediksi kecerdasan buatan umum (AGI) akan tiba pada 2030. Hassabis, pemenang Nobel Kimia 2024, memandang timeline ini sebagai realitas bisnis yang ketat sehingga memaksa para pemimpin untuk meninjau ulang produk de

GateNews1jam yang lalu

OpenAI Akan Beroperasi sebagai Perusahaan Berprofit Rendah Secara Permanen, Menandatangani Kesepakatan Daya 20 Tahun

Menurut Odaily, CEO OpenAI Sam Altman menyatakan pada Stripe Sessions bahwa OpenAI menargetkan menjadi perusahaan infrastruktur berskala besar dengan laba yang rendah secara berkelanjutan, serta pertumbuhan yang masif dan cepat, dengan menawarkan produk serupa “meteran cerdas” yang dapat dibeli pengguna untuk mengotomatisasi operasi bisnis atau ditanamkan ke dalam

GateNews1jam yang lalu

Forefront Tech Menyelesaikan Penetapan Harga $100M IPO, untuk Listing di Nasdaq

Menurut ChainCatcher, Forefront Tech Holdings Acquisition Corp menyelesaikan penetapan harga IPO senilai 100 juta dolar AS pada 30 April, yang akan dicatatkan di Nasdaq dengan ticker FTHAU. Dana hasil penawaran akan digunakan untuk mengeksplorasi peluang merger dan akuisisi di blockchain, kecerdasan buatan, fintech, dan lainnya

GateNews1jam yang lalu
Komentar
0/400
Tidak ada komentar