Los viejos problemas de arquitectura y entrenamiento serán superados Recolección de datos, calidad de datos, puesta a punto de recetas Con apoyo de RL, éxito en campo de Figure/Dyna/PI >99% Marco de auto-mejora y auto-recuperación maduro La afinación de VLA no supera la generalidad, se mantiene la versatilidad → fusión de especialización y versatilidad Segmentación de acciones, marcado FAST Los movimientos de los robots ya no se traban, velocidad cercana a la humana
Fusión multimodal: visión/voz/tacto Mejora en la percepción táctil, gran avance en tareas de contacto Refuerzo de System1/2, implementación de planificación de largo plazo Gemini Robotics-ER 1.5 introduce CoT y seguridad semántica en cuerpos físicos Superación de la “pared” de memoria NVIDIA ReMEmber para navegación y memoria Titans+MIRAS prueba de estabilidad de memoria en rendimiento
VLM más potente → comprensión espacial y línea de etiquetado más precisa El Modelo Mundial comienza a usarse para ampliación y evaluación de estrategias En palabras simples: la escala trae “emergencia física” Disponibilidad de cero muestras, percepción visual y táctil, razonamiento físico general
2026: escala de datos ×100 La inteligencia de entidad realmente en marcha
@openmind_agi
Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
La investigación en robots en 2025 explotará
Los viejos problemas de arquitectura y entrenamiento serán superados
Recolección de datos, calidad de datos, puesta a punto de recetas
Con apoyo de RL, éxito en campo de Figure/Dyna/PI >99%
Marco de auto-mejora y auto-recuperación maduro
La afinación de VLA no supera la generalidad, se mantiene la versatilidad → fusión de especialización y versatilidad
Segmentación de acciones, marcado FAST
Los movimientos de los robots ya no se traban, velocidad cercana a la humana
Fusión multimodal: visión/voz/tacto
Mejora en la percepción táctil, gran avance en tareas de contacto
Refuerzo de System1/2, implementación de planificación de largo plazo
Gemini Robotics-ER 1.5 introduce CoT y seguridad semántica en cuerpos físicos
Superación de la “pared” de memoria
NVIDIA ReMEmber para navegación y memoria
Titans+MIRAS prueba de estabilidad de memoria en rendimiento
VLM más potente → comprensión espacial y línea de etiquetado más precisa
El Modelo Mundial comienza a usarse para ampliación y evaluación de estrategias
En palabras simples: la escala trae “emergencia física”
Disponibilidad de cero muestras, percepción visual y táctil, razonamiento físico general
2026: escala de datos ×100
La inteligencia de entidad realmente en marcha
@openmind_agi