Beating : NVIDIA a publié les poids de Cosmos-Reason2-32B, la version phare de sa vision-langage d’IA physique (VLM) axée sur le raisonnement, conçue pour aider les robots et les systèmes de conduite autonome à comprendre des principes spatiaux, temporels et physiques. Le modèle de 32 milliards de paramètres, basé sur Qwen3-VL-32B-Instruct, est disponible sous la NVIDIA Open Model License pour un usage commercial.
Le modèle peut analyser des flux vidéo pour évaluer la sécurité routière, détecter des objets sur des images avec des coordonnées 2D/3D, et servir de moteur de planification pour les robots humanoïdes et les véhicules autonomes. Par rapport à la génération précédente, Cosmos-Reason2 ajoute la détection d’objets avec une localisation temporelle précise et étend la fenêtre de contexte à 256K tokens.
Avertissement : Les informations contenues dans cette page peuvent provenir de tiers et ne représentent pas les points de vue ou les opinions de Gate. Le contenu de cette page est fourni à titre de référence uniquement et ne constitue pas un conseil financier, d'investissement ou juridique. Gate ne garantit pas l'exactitude ou l'exhaustivité des informations et n'est pas responsable des pertes résultant de l'utilisation de ces informations. Les investissements en actifs virtuels comportent des risques élevés et sont soumis à une forte volatilité des prix. Vous pouvez perdre la totalité du capital investi. Veuillez comprendre pleinement les risques pertinents et prendre des décisions prudentes en fonction de votre propre situation financière et de votre tolérance au risque. Pour plus de détails, veuillez consulter l'
avertissement.
Articles similaires
Forefront Tech finalise la tarification de l’$100M IPO, une cotation au Nasdaq sous le code FTHAU
D’après ChainCatcher, la société d’acquisition à vocation spécifique Forefront Tech a finalisé la tarification de son introduction en bourse (IPO) de 100 millions de dollars le 30 avril et sera cotée au Nasdaq sous le symbole boursier FTHAU. La société prévoit d’utiliser le produit de l’opération pour saisir des opportunités de fusions-acquisitions dans le secteur de la blockchain, de la fintech, de l’intelligence artificielle et
GateNewsIl y a 21m
Anthropic Claude facture à un utilisateur 200,98 dollars en trop en raison d’un bug de facturation, et le remboursement a d’abord été refusé avant une compensation intégrale
D’après la surveillance de Beating, un bug de facturation dans le service Anthropic Claude Code a entraîné une surfacturation de Max 20x à hauteur de 200,98 dollars de frais d’utilisation supplémentaires, alors que le client n’utilisait que 13% de son quota mensuel. Le bug a été déclenché lorsque l’historique des commits du dépôt git d’un utilisateur contenait le caractère en majuscule
GateNewsIl y a 49m
DeepSeek Introduit une méthode de primitives visuelles pour améliorer le raisonnement multimodal le 30 avril
D’après le rapport technique de DeepSeek, le 30 avril, l’entreprise a introduit Visual Primitives, une méthode qui intègre des unités visuelles de base telles que des points et des boîtes englobantes dans des chaînes de raisonnement afin de résoudre le problème de l’écart de référence dans les tâches multimodales. La méthode réduit la consommation de jetons d’images
GateNewsIl y a 1h
OpenAI révèle pourquoi Codex interdit de parler de « gobelins » : la récompense de personnalité « nerd » a dérapé
OpenAI explique dans son blog officiel que Codex interdit de parler de gobelins et autres créatures, à cause d’un signal de récompense favorisant des métaphores de créatures lors de l’entraînement des traits « nerd », ce qui a entraîné une contamination entre personnalités et une dérive du RLHF. L’incident a été révélé par Barron Roth après la fuite des instructions système, et OpenAI a alors adopté deux stratégies : un codage dur à court terme et une suppression à long terme des signaux de récompense. Cela met en garde contre la fragilité de la conception des récompenses, et souligne que les audits post-entraînement doivent être plus précis.
ChainNewsAbmediaIl y a 2h
Alibaba ouvre en open-source le module d’interprétabilité Qwen-Scope, couvrant 7 modèles, le 30 avril
Selon PANews, le 30 avril, Alibaba a annoncé via Qwen l’ouverture du code de Qwen-Scope, un module d’interprétabilité entraîné sur les modèles des séries Qwen3 et Qwen3.5. La publication couvre 7 grands modèles de langage dans des variantes denses et de type mixture-of-experts, avec 14 ensembles d’autoencodeurs clairsemés
GateNewsIl y a 2h
Les serveurs d’IA Nvidia B300 atteignent 1 million de dollars en Chine dans un contexte de pénurie d’approvisionnement
D’après Reuters, les serveurs d’IA B300 de Nvidia se vendent désormais pour environ 7 millions de yuans (1 million de dollars US) en Chine, sous l’effet d’une répression des réseaux de contrebande et de la demande persistante des entreprises technologiques locales. Le prix a fortement augmenté par rapport à environ 4 millions de yuans (585 000 dollars US) à la fin de 2025, de manière significative
GateNewsIl y a 2h