2025 robot research explosion L'architecture et l'entraînement, vieux défis relevés Collecte de données, qualité des données, pipelines opérationnels Avec RL, taux de succès en direct de Figure/Dyna/PI >99% Cadre d'auto-amélioration et d'auto-récupération mature VLA fine-tuning insuffisant, conserver la polyvalence → fusion de compétences spécialisées Découpage des actions, marquage FAST Les actions des robots ne plus laguer, vitesse proche de celle humaine
Fusion multimodale : vision/parole/toucher Compensation sensorielle, grande amélioration des tâches tactiles Renforcement System1/2, mise en œuvre de la planification à longue portée Gemini Robotics-ER 1.5 introduit CoT et sécurité sémantique pour le corps physique Percée dans la mémoire « mur » NVIDIA ReMEmber navigation mémoire Titans+MIRAS stabilité de la mémoire lors des tests
VLM plus puissant → compréhension spatiale et pipeline de marquage plus précis Le Modèle Mondial commence à être utilisé pour l'augmentation et l'évaluation stratégique En termes simples : la scalabilité apporte « émergence physique » Disponibilité zéro échantillon, puissance visuelle et sensorielle, raisonnement physique universel
2026 : échelle de données ×100 L'intelligence concrète vraiment sur le devant de la scène
@openmind_agi
Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
<说点大家不想说的行业真相>
2025 robot research explosion
L'architecture et l'entraînement, vieux défis relevés
Collecte de données, qualité des données, pipelines opérationnels
Avec RL, taux de succès en direct de Figure/Dyna/PI >99%
Cadre d'auto-amélioration et d'auto-récupération mature
VLA fine-tuning insuffisant, conserver la polyvalence → fusion de compétences spécialisées
Découpage des actions, marquage FAST
Les actions des robots ne plus laguer, vitesse proche de celle humaine
Fusion multimodale : vision/parole/toucher
Compensation sensorielle, grande amélioration des tâches tactiles
Renforcement System1/2, mise en œuvre de la planification à longue portée
Gemini Robotics-ER 1.5 introduit CoT et sécurité sémantique pour le corps physique
Percée dans la mémoire « mur »
NVIDIA ReMEmber navigation mémoire
Titans+MIRAS stabilité de la mémoire lors des tests
VLM plus puissant → compréhension spatiale et pipeline de marquage plus précis
Le Modèle Mondial commence à être utilisé pour l'augmentation et l'évaluation stratégique
En termes simples : la scalabilité apporte « émergence physique »
Disponibilité zéro échantillon, puissance visuelle et sensorielle, raisonnement physique universel
2026 : échelle de données ×100
L'intelligence concrète vraiment sur le devant de la scène
@openmind_agi