Perang Chip Memanas! Dominasi GPU NVIDIA Diserang oleh Google dan Amazon

輝達 GPU Tahun lalu mengirimkan sebanyak 6 juta unit, satu server Blackwell berharga hingga 3 juta dolar AS dan mengirimkan 1000 unit per minggu, mendominasi pasar chip AI. Tetapi perang chip ini sedang beralih, dengan kemunculan chip kustom seperti Google TPU, AWS Tranium, Broadcom ASIC, dan lain-lain, analis memperkirakan Broadcom dapat menguasai 70-80% pangsa pasar chip ASIC kustom.

GPU dari kartu permainan melompat ke inti AI selama sepuluh tahun emas

晶片戰爭白熱化

GPU Nvidia dari kartu permainan melompat menjadi chip inti AI, dapat ditelusuri kembali ke AlexNet tahun 2012. Tim riset pertama kali menggunakan kemampuan komputasi paralel GPU Nvidia untuk pelatihan jaringan saraf, memimpin secara signifikan dalam kompetisi pengenalan citra, membuka era pembelajaran mendalam. Keunggulan utama chip GPU berasal dari ribuan inti proses paralel, mampu menjalankan operasi tensor seperti perkalian matriks secara efisien, sangat cocok untuk pelatihan dan inferensi AI.

Dalam rak server besar, 72 chip GPU dapat digabungkan melalui teknologi NVLink menjadi satu unit komputasi besar seperti GPU tunggal. Nvidia tidak hanya memasok chip GPU ke OpenAI, pemerintah dan perusahaan di seluruh dunia, tetapi juga membangun seluruh sistem server secara langsung. Pesaing seperti AMD bergantung pada chip Instinct GPU dan ekosistem perangkat lunak sumber terbuka untuk mempercepat kemajuan, baru-baru ini didukung oleh OpenAI dan Oracle. Chip GPU AMD terutama menggunakan perangkat lunak sumber terbuka, sementara Nvidia mengoptimalkan secara ketat di sekitar CUDA.

Chip ASIC kustom menjadi kunci keberhasilan raksasa cloud

Dari Google, Amazon, Meta, Microsoft hingga OpenAI, semua raksasa cloud berinvestasi dalam pengembangan chip ASIC (Application Specific Integrated Circuit) kustom. Chip yang dirancang khusus untuk satu tujuan ini diperkirakan akan menjadi kategori chip AI dengan pertumbuhan tercepat dalam beberapa tahun ke depan. Seiring model bahasa besar memasuki tahap matang, kebutuhan inferensi dengan cepat melampaui pelatihan, biaya inferensi, konsumsi energi, dan kestabilan menjadi titik sakit platform cloud, dan ini adalah medan perang utama chip ASIC.

Berbeda dengan GPU serba guna, ASIC seperti “alat super presisi khusus,” di-hardcode untuk mengoptimalkan beban kerja AI tertentu, sehingga lebih cepat dan konsumsi daya lebih rendah. Kekurangannya, fleksibilitasnya terbatas dan biaya pengembangannya sangat tinggi, satu chip kustom bisa mencapai ratusan juta dolar AS, sehingga hanya raksasa cloud yang mampu membayar. Chip ASIC kustom untuk AI sangat mahal, minimal membutuhkan ratusan juta dolar, tetapi untuk penyedia layanan cloud besar, efisiensi energi lebih tinggi dan ketergantungan pada Nvidia berkurang.

Google adalah pemain besar pertama di bidang chip ASIC, yang pertama kali menciptakan chip khusus untuk percepatan kecerdasan buatan, dan pada 2015 memperkenalkan istilah Tensor Processing Unit (TPU). Chip TPU menjadi pendorong Google menemukan arsitektur Transformer pada 2017, yang menjadi dasar bersama untuk AI seperti ChatGPT, Claude, dan lainnya. Kini Google telah mengembangkan TPU Ironwood generasi ke-7, dan membantu Anthropic melatih model Claude menggunakan jutaan TPU.

AWS setelah mengakuisisi Annapurna Labs, menginvestasikan penuh dalam pengembangan chip AI sendiri. Tranium dan Inferentia telah menjadi tulang punggung platform pelatihan dan inferensi AWS. Pada 2024, Anthropic melatih model di pusat data AWS di Indiana Utara dengan 500.000 chip Tranium 2, bahkan sama sekali tanpa chip GPU Nvidia, menunjukkan posisi ASIC semakin meningkat.

Trend diversifikasi chip dan pertimbangan cost-effectiveness

Broadcom dan Marvell adalah perusahaan kontraktor chip utama yang menjadi mitra strategis inti perusahaan cloud super besar. Chip TPU Google, akselerator internal Meta, dan chip ASIC yang akan datang dari OpenAI semuanya melibatkan Broadcom secara mendalam. Broadcom membantu membangun TPU Google dan chip inferensi AI Meta, analis memperkirakan Broadcom menguasai 70% hingga 80% pasar chip ASIC kustom.

Chip AI edge juga berkembang ke perangkat pribadi. NPU (Neural Processing Unit) adalah chip yang dirancang khusus untuk menjalankan kecerdasan buatan di perangkat, sekarang sudah terintegrasi di Snapdragon Qualcomm, AMD, Intel, dan seri SoC Apple M, digunakan di ponsel, laptop, rumah pintar, mobil, bahkan robot. AI di perangkat akan membawa privasi yang lebih tinggi, latensi lebih rendah, dan kontrol yang lebih kuat.

Perbandingan tiga kategori chip

GPU: Fleksibilitas tinggi cocok untuk berbagai beban kerja, tetapi konsumsi daya tinggi dan biaya mahal, satu rak mencapai 3 juta dolar AS

ASIC: Khusus, kecepatan tinggi, konsumsi daya rendah, biaya pengembangan ratusan juta dolar tetapi cost-performance jangka panjang 30-40%

FPGA/NPU: Dapat dikonfigurasi ulang, berada di antara keduanya, cocok untuk perangkat edge dan tahap pengujian

TSMC menguasai saluran pasokan chip

Baik itu chip Blackwell Nvidia, chip TPU Google, maupun chip Tranium AWS, sebagian besar chip AI akhirnya diproduksi oleh TSMC. Hal ini mengikat pasokan kekuatan komputasi AI dengan dinamika geopolitik global. AS berusaha melalui pabrik TSMC di Arizona dan proses 18A Intel, mengembalikan sebagian kapasitas produksi chip ke domestik. Namun, perusahaan China seperti Huawei dan Alibaba juga aktif membangun chip ASIC mereka sendiri, mencari alternatif domestik di tengah pembatasan ekspor.

Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
0/400
Tidak ada komentar
  • Sematkan
Perdagangkan Kripto Di Mana Saja Kapan Saja
qrCode
Pindai untuk mengunduh aplikasi Gate
Komunitas
Bahasa Indonesia
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)