2026-01-04 00:02:33

<说点大家不想说的行业真相>

2025 robô pesquisa explode
Arquitetura e treinamento desafios antigos superados
Coleta de dados, qualidade de dados, execução de fórmulas
Com suporte de RL, sucesso de现场Figure/Dyna/PI >99%
Estrutura de autoaperfeiçoamento e autorrecuperação amadurecida
VLA ajuste fino insuficiente, mantém generalistas → fusão de especializações em generalistas
Divisão de ações, marcação FAST
Os movimentos do robô não mais travam, velocidade próxima à humana

Fusão multimodal: visão/linguagem/tato
Complemento sensorial para visão, grande melhoria em tarefas de contato
Reforço de System1/2, planejamento de longo prazo implementado
Gemini Robotics-ER 1.5 introduz CoT e segurança semântica em corpos físicos
Superação de barreiras na memória
NVIDIA ReMEmber navegação por memória
Titans+MIRAS estabilidade de memória durante testes

VLM mais potente → compreensão espacial mais precisa e linha de rotulagem
World Model começa a ser usado para ampliação e avaliação de estratégias
Resumindo: escala traz “emergência física”
Disponibilidade zero de amostras, força visual, raciocínio físico geral

2026: escala de dados ×100
Inteligência de entidade realmente na mesa

@openmind_agi

Ver original

Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.