2026-01-04 00:02:33

<说点大家不想说的行业真相>

2025 robot research explosion
L'architecture et l'entraînement, vieux défis relevés
Collecte de données, qualité des données, pipelines opérationnels
Avec RL, taux de succès en direct de Figure/Dyna/PI >99%
Cadre d'auto-amélioration et d'auto-récupération mature
VLA fine-tuning insuffisant, conserver la polyvalence → fusion de compétences spécialisées
Découpage des actions, marquage FAST
Les actions des robots ne plus laguer, vitesse proche de celle humaine

Fusion multimodale : vision/parole/toucher
Compensation sensorielle, grande amélioration des tâches tactiles
Renforcement System1/2, mise en œuvre de la planification à longue portée
Gemini Robotics-ER 1.5 introduit CoT et sécurité sémantique pour le corps physique
Percée dans la mémoire « mur »
NVIDIA ReMEmber navigation mémoire
Titans+MIRAS stabilité de la mémoire lors des tests

VLM plus puissant → compréhension spatiale et pipeline de marquage plus précis
Le Modèle Mondial commence à être utilisé pour l'augmentation et l'évaluation stratégique
En termes simples : la scalabilité apporte « émergence physique »
Disponibilité zéro échantillon, puissance visuelle et sensorielle, raisonnement physique universel

2026 : échelle de données ×100
L'intelligence concrète vraiment sur le devant de la scène

@openmind_agi

Voir l'original

Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.