Message d’actualité de Gate, 24 avril — DeepSeek a publié la série V4 de modèles open-source sous la licence MIT, avec des poids désormais disponibles sur Hugging Face et ModelScope. La série comprend deux modèles (MoE) de type mixture-of-experts : V4-Pro avec 1,6 billion de paramètres au total et 49 milliards activés par jeton, et V4-Flash avec 284 milliards de paramètres au total et 13 milliards activés par jeton. Les deux prennent en charge une fenêtre de contexte d’1 million de jetons.

L’architecture présente trois mises à niveau clés : un mécanisme d’attention hybride combinant l’attention clairsemée compressée (CSA) et l’attention fortement compressée (HCA) qui réduit considérablement la surcharge pour les longs contextes — pour V4-Pro, les FLOPs d’inférence pour un contexte de 1M ne sont que 27 % de ceux de V3.2, et le cache KV (VRAM destiné au stockage d’informations historiques pendant l’inférence) n’est que 10 % de celui de V3.2 ; des hyperconnexions à contraintes de manifold (mHC) remplaçant les connexions résiduelles traditionnelles afin d’améliorer la stabilité de la propagation du signal entre les couches ; et l’optimiseur Muon pour une convergence d’entraînement plus rapide. Le préentraînement a utilisé plus de 32 trillions de jetons de données.

Le post-entraînement emploie une approche en deux étapes : d’abord entraîner des experts spécifiques au domaine via un fine-tuning supervisé (SFT) et l’apprentissage par renforcement GRPO, puis les fusionner en un seul modèle grâce à une distillation en ligne. V4-Pro-Max (plus haut mode d’inférence) affirme être le modèle open-source le plus puissant, avec des benchmarks de codage de premier plan et des écarts nettement réduits par rapport aux modèles de pointe propriétaires sur les tâches de raisonnement et d’agents. V4-Flash-Max atteint des performances de raisonnement de niveau Pro avec un budget de calcul suffisant, mais est limité par l’échelle des paramètres sur les tâches de connaissance pure et les tâches d’agents complexes. Les poids sont stockés dans une précision mixte FP4+FP8.

Afficher la source

Avertissement : Les informations contenues dans cette page peuvent provenir de tiers et ne représentent pas les points de vue ou les opinions de Gate. Le contenu de cette page est fourni à titre de référence uniquement et ne constitue pas un conseil financier, d'investissement ou juridique. Gate ne garantit pas l'exactitude ou l'exhaustivité des informations et n'est pas responsable des pertes résultant de l'utilisation de ces informations. Les investissements en actifs virtuels comportent des risques élevés et sont soumis à une forte volatilité des prix. Vous pouvez perdre la totalité du capital investi. Veuillez comprendre pleinement les risques pertinents et prendre des décisions prudentes en fonction de votre propre situation financière et de votre tolérance au risque. Pour plus de détails, veuillez consulter l'avertissement.

Articles similaires

V4‑Pro atteint un taux de réussite de 67 % en codage lors d’un test d’auto-utilisation interne, se rapprochant des performances d’Opus 4.5

Actualités de l’industrie de l’IA

Message d’actualités Gate, 24 avril — V4 a divulgué publiquement des données internes de tests d’auto-utilisation (dogfooding) pour son modèle V4‑Pro. La société a collecté environ 200 tâches d’ingénierie issues du monde réel auprès de plus de 50 ingénieurs, couvrant le développement de fonctionnalités, la correction de bogues, la refactorisation et le diagnostic sur des piles technologiques incluant

GateNewsIl y a 10m

Le Royaume-Uni examine Anthropic AI pour renforcer la cybersécurité bancaire

Actualités de l’industrie de l’IA

Le Royaume-Uni explore une étape majeure en matière de cybersécurité financière en travaillant avec la société d’IA Anthropic. Des discussions préliminaires laissent entendre que le gouvernement pourrait déployer le modèle avancé Claude Mythos d’Anthropic dans les banques et les institutions financières. Cette démarche vise à renforcer les défenses face aux menaces cybernétiques

CryptometerIoIl y a 15m

Le bureau chinois de la PI ajoute l’IA, les semi-conducteurs et les interfaces cerveau-ordinateur à son programme de protection accélérée

Actualités de l’industrie de l’IA

Message de Gate News, 24 avril — L’Administration nationale chinoise de la propriété intellectuelle a annoncé le 24 avril qu’elle mettra en place une protection complète de la propriété intellectuelle pour les technologies émergentes grâce à des réformes institutionnelles, des services renforcés et des applications étendues. L’administration wi

GateNewsIl y a 21m

Le gouvernement américain exploite un nœud Bitcoin sans minage, indique l’amiral

bitcoin news Géopolitique Réglementation et politiques Actualités de l’industrie de l’IA

Un amiral senior a indiqué que le gouvernement américain exploite activement un nœud sur le réseau Bitcoin tout en évitant délibérément de participer aux activités de minage. La divulgation suggère que les autorités prennent un rôle plus impliqué dans l’infrastructure blockchain pour la supervision et

CryptoFrontierIl y a 38m

Le chiffre d’affaires du T1 de Tesla progresse de 16% à 22,4 Md$ ; lancement du robot humanoïde prévu à la mi-2026

Actions Actualités de l’industrie de l’IA

Message de Gate News, 24 avril — Tesla a publié un chiffre d’affaires du premier trimestre de 22,4 milliards $ US le 23 avril, soit une hausse de 16% d’une année sur l’autre. Les livraisons mondiales de véhicules de l’entreprise ont dépassé 358 000 unités, tandis que la production a dépassé 408 000 unités. La gigafactory de Shanghai de Tesla a livré 213 000 véhi

GateNewsIl y a 38m

Le bénéfice de SK Hynix au T1 explose par cinq et atteint un record grâce au boom de l’IA, avec des primes aux employés portées à 878 000 $

Actions Actualités de l’industrie de l’IA

Message de Gate News, 24 avril — SK Hynix a annoncé une hausse par cinq de son bénéfice opérationnel trimestriel, à un niveau record de 37,61 billions de wons ($32,4 milliards) le 23 avril, portée par une demande en forte hausse liée à l’intelligence artificielle et aux centres de données. La manne alimente des primes aux employés sans précédent, que les analystes estiment susceptibles d’atteindre jusqu’à 878 000 $ par employé en 2027 si les prévisions actuelles de bénéfices se maintiennent. Les primes

GateNewsIl y a 1h

Commentaire

0/400

Aucun commentaire