Hasil pencarian untuk "FT TOKEN"
Hari Ini
09:16

KAT Melonjak Lebih dari 70% dalam 24 Jam, Sempat Tembus $0.019

Pesan Gate News, 24 April — KAT (Katana), token asli dari blockchain Ethereum Layer 2 yang berfokus pada DeFi, sempat melonjak melewati $0.019 pada 24 April, dengan kenaikan 24 jam yang berkembang hingga lebih dari 70%. Token tersebut diperdagangkan pada $0.01845, dengan kapitalisasi pasar $47 juta. Katana dirancang sebagai solusi Layer 2 khusus untuk aplikasi keuangan terdesentralisasi di Ethereum.
Lainnya
KAT67,67%
ETH0,34%
05:21

Cambricon Menyelesaikan Adaptasi Day 0 DeepSeek-V4, Menandai Tonggak Penting untuk Ekosistem Chip AI Tiongkok

Pesan Gate News, 24 April — Perdebatan telah meletus di Amerika Serikat mengenai kemampuan teknologi dan kepatuhan DeepSeek V4. Chris McGuire, seorang rekan senior di Dewan Hubungan Luar Negeri (CFR) dan mantan pejabat Dewan Keamanan Nasional Gedung Putih serta Departemen Pertahanan, mempublikasikan analisis yang berargumen bahwa V4 belum mengubah lanskap persaingan AI AS-Tiongkok. Menurut McGuire, laporan V4 milik DeepSeek sendiri mengakui bahwa kemampuan penalarannya tertinggal dari model-model frontier sekitar 3 hingga 6 bulan, dengan tolok ukur terhadap GPT-5.2 dan Gemini 3.0 Pro yang dirilis enam bulan sebelumnya. McGuire mengangkat kekhawatiran bahwa meskipun laporan V4 mengungkap adaptasi pada tahap inferensi ke GPU NVIDIA dan NPU Huawei Ascend, laporan itu tidak secara terbuka merinci model GPU atau biaya pelatihan yang digunakan selama pengembangan. Ia mempertanyakan apakah ketiadaan informasi ini menunjukkan penggunaan chip NVIDIA Blackwell yang dikendalikan ekspor, dengan mencatat bahwa V3 sebelumnya mengklaim menggunakan 2.000 GPU H800 dengan biaya $5,57 juta. DeepSeek telah membantah menggunakan Blackwell, dengan menyatakan bahwa model tersebut dilatih menggunakan prosesor NVIDIA H800 dan Huawei Ascend 910C. CEO Replit Amjad Masad menanggapi analisis McGuire, dengan berargumen bahwa para ilmuwan Tiongkok secara publik membagikan terobosan AI yang benar-benar nyata sementara para pembuat kebijakan dan pelobi Amerika memperbesar kekhawatiran "China distillation". Masad menyoroti inovasi arsitektural yang diungkap dalam pernyataan resmi DeepSeek, termasuk kompresi perhatian tingkat token DeepSeek Sparse Attention dan peningkatan efisiensi yang signifikan untuk komputasi long-context. Ia mencatat bahwa V4-Pro menunjukkan kebutuhan komputasi inferensi per-token dan KV cache yang jauh lebih rendah pada panjang konteks 1M dibandingkan V3.2, dengan menekankan bahwa kemajuan arsitektural ini tidak terkait dengan distilasi data pelatihan dan bahwa semua peneliti, termasuk lab-lab Amerika, dapat memperoleh manfaat dari pengembangan open-source.
Lainnya
03:21

Data Pelatihan DeepSeek V4 Berlipat Ganda Jadi 33T, Memicu Ketidakstabilan yang Menunda Rilis

Berita Gate, 24 April — Laporan teknis DeepSeek V4 mengungkap bahwa V4-Flash dan V4-Pro masing-masing telah dipra-latih pada 32T dan 33T token, dua kali lipat dari sekitar 15T token yang digunakan untuk V3. Laporan tersebut mengakui menemui "tantangan ketidakstabilan yang signifikan" selama pelatihan, dengan lonjakan loss yang berulang kali terjadi akibat anomali pada lapisan Mixture-of-Experts MoE; mekanisme routing itu sendiri memperparah anomali ini, dan rollback sederhana tidak dapat menyelesaikan masalah tersebut. DeepSeek menerapkan dua solusi yang kini digunakan pada pelatihan aktual: Anticipatory Routing, yang memisahkan perhitungan indeks routing dari pembaruan jaringan tulang punggung dan secara otomatis hanya memicu saat lonjakan loss terdeteksi menambahkan overhead sekitar 20%, serta SwiGLU Clamping, yang secara langsung menekan anomali dengan mengapit nilai aktivasi pada rentang tetap. Laporan tersebut menyatakan kedua pendekatan efektif, tetapi mengakui "prinsip-prinsip yang mendasarinya masih belum dipahami secara memadai." Susan Zhang, peneliti Google DeepMind yang sebelumnya bekerja di Meta AI dan OpenAI, berkomentar bahwa ketidakstabilan yang dipicu oleh penggandaan data pelatihan "menjelaskan keterlambatannya." Ia menggambarkan dua solusi tersebut sebagai "perban sementara" sambil mengakui transparansi teknis DeepSeek.
Lainnya