2025 robô pesquisa explode Arquitetura e treinamento desafios antigos superados Coleta de dados, qualidade de dados, execução de fórmulas Com suporte de RL, sucesso de现场Figure/Dyna/PI >99% Estrutura de autoaperfeiçoamento e autorrecuperação amadurecida VLA ajuste fino insuficiente, mantém generalistas → fusão de especializações em generalistas Divisão de ações, marcação FAST Os movimentos do robô não mais travam, velocidade próxima à humana
Fusão multimodal: visão/linguagem/tato Complemento sensorial para visão, grande melhoria em tarefas de contato Reforço de System1/2, planejamento de longo prazo implementado Gemini Robotics-ER 1.5 introduz CoT e segurança semântica em corpos físicos Superação de barreiras na memória NVIDIA ReMEmber navegação por memória Titans+MIRAS estabilidade de memória durante testes
VLM mais potente → compreensão espacial mais precisa e linha de rotulagem World Model começa a ser usado para ampliação e avaliação de estratégias Resumindo: escala traz “emergência física” Disponibilidade zero de amostras, força visual, raciocínio físico geral
2026: escala de dados ×100 Inteligência de entidade realmente na mesa
@openmind_agi
Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
<说点大家不想说的行业真相>
2025 robô pesquisa explode
Arquitetura e treinamento desafios antigos superados
Coleta de dados, qualidade de dados, execução de fórmulas
Com suporte de RL, sucesso de现场Figure/Dyna/PI >99%
Estrutura de autoaperfeiçoamento e autorrecuperação amadurecida
VLA ajuste fino insuficiente, mantém generalistas → fusão de especializações em generalistas
Divisão de ações, marcação FAST
Os movimentos do robô não mais travam, velocidade próxima à humana
Fusão multimodal: visão/linguagem/tato
Complemento sensorial para visão, grande melhoria em tarefas de contato
Reforço de System1/2, planejamento de longo prazo implementado
Gemini Robotics-ER 1.5 introduz CoT e segurança semântica em corpos físicos
Superação de barreiras na memória
NVIDIA ReMEmber navegação por memória
Titans+MIRAS estabilidade de memória durante testes
VLM mais potente → compreensão espacial mais precisa e linha de rotulagem
World Model começa a ser usado para ampliação e avaliação de estratégias
Resumindo: escala traz “emergência física”
Disponibilidade zero de amostras, força visual, raciocínio físico geral
2026: escala de dados ×100
Inteligência de entidade realmente na mesa
@openmind_agi