Sumber gambar: Financial Times
Dalam dua tahun terakhir, fokus utama persaingan industri AI berpusat pada “training”—perlombaan membangun model skala besar paling kuat. Evolusi berkelanjutan dari GPT-4 ke arsitektur multimodal menitikberatkan pada upaya mendorong batas kemampuan model.
Namun, pada ajang NVIDIA GTC 2026, Jensen Huang menegaskan: arena inti AI kini bergeser dari Training ke Inference.
Transformasi ini menandai dinamika bisnis baru: training adalah investasi satu kali, sedangkan inference menciptakan permintaan berkelanjutan.
Secara spesifik:
Akibatnya, AI berevolusi dari industri berbasis teknologi menjadi industri berbasis permintaan, bergeser dari belanja modal (CapEx) ke pendapatan berulang.
Pernyataan “data center adalah Token factory” bukan sekadar jargon pemasaran—ini menandai paradigma industri baru. Pada era internet tradisional:
Di era AI, logika ini berubah secara fundamental:
Perubahan ini memberikan karakteristik unit produksi pada data center untuk pertama kalinya.
Siklus tertutup yang utuh terbentuk: Investasi komputasi → Komputasi inference → Generasi Token → Realisasi pendapatan
Dalam kerangka ini, konsep “AI Factory” dari NVIDIA mendefinisikan ulang infrastruktur AI dengan prinsip industri:
Dengan kata lain, data center telah berevolusi dari klaster server menjadi “pembangkit listrik” atau “fasilitas manufaktur.”
Fungsi produksi di era AI dapat dinyatakan sebagai:

Pendapatan = Token × Harga, Biaya = Biaya Komputasi
Dengan demikian, laba disederhanakan menjadi Laba = Token × (Harga - Biaya per Token)
Model ini mendorong tiga pergeseran utama:
Lonjakan permintaan inference yang diproyeksikan berasal dari tiga perubahan struktural:
Dari generasi sederhana ke penalaran kompleks:
Setiap pemanggilan kini menimbulkan biaya komputasi yang jauh lebih tinggi.
AI bergeser dari pemrosesan teks pendek ke:
Hal ini secara signifikan meningkatkan kebutuhan komputasi.
AI Agent dapat:
Akibatnya, permintaan compute AI beralih dari pertumbuhan linear ke eksponensial.
Pada NVIDIA GTC 2026, NVIDIA juga secara implisit memperkenalkan model layanan AI berlapis—yakni sistem harga bertingkat untuk sumber daya komputasi.
Sistem ini mirip dengan pendekatan bertingkat pada komputasi awan:
Berbagai skenario membutuhkan harga Token berbeda:
Pada akhirnya, faktor penentu adalah: Siapa yang mampu memproduksi Token dengan biaya terendah dan menjualnya dengan harga tertinggi.
Jensen Huang memperkirakan bahwa pada 2027, pasar chip dan infrastruktur AI dapat mencapai $1 triliun.
Inti utamanya adalah AI menjadi infrastruktur—setara dengan:
Tren ini akan mendorong tiga perubahan besar:
Modal akan mengalir dari lapisan aplikasi kembali ke infrastruktur inti:
Pemain sentral baru akan meliputi:
AI kini bukan sekadar isu perangkat lunak—tetapi juga melibatkan:
Jika Token adalah produk, Agent adalah “generator permintaan.” Pada internet tradisional, pengguna menciptakan permintaan; di era AI:
Agent sendiri yang menciptakan permintaan. Contohnya:
Inilah pertama kalinya entitas permintaan non-manusia muncul dalam ekonomi AI. Dengan demikian, skala Agent menentukan batas atas permintaan inference.
Itulah sebabnya persaingan AI kini bergeser dengan cepat ke arah:
Walaupun narasi “Token Factory” sangat menarik, masih ada kekhawatiran signifikan di pasar.
Jika harga Token turun, margin laba akan tertekan.
Banyak aplikasi AI masih bersifat eksperimental.
Faktor-faktor ini dapat mengancam stabilitas ekonomi Token dalam jangka panjang.
Jika tren saat ini dirangkum, muncul analogi utama:
Struktur ini sangat mirip dengan sistem produksi industri pada Revolusi Industri. Ini menandai transisi AI dari industri perangkat lunak menuju sistem industri berbasis compute.
Pada NVIDIA GTC 2026, konsep “Token Factory” dari Jensen Huang bukan sekadar metafora—tetapi mendefinisikan ulang logika fundamental industri AI:
Dengan munculnya ekonomi Agent dan lonjakan permintaan inference, pasar infrastruktur AI berada di jalur menuju skala triliun dolar.
Jika tren ini berlanjut, persaingan bisnis di masa depan tidak lagi soal produk atau jumlah pengguna—melainkan siapa yang paling efisien dalam memproduksi Token.





