O verdadeiro campo de batalha na competição de IA Agentic: infraestrutura, não pontuações de modelos

robot
Geração de resumo em curso

Auto-Reporting e questões reais na camada de execução

Together AI anunciou em 8 de abril que, através de re-treinamento com RL, a capacidade de codificação do GLM-5 aumentou 28%. Isso mudou a narrativa de competição de “empilhar parâmetros” para “otimização contínua”, mas a questão é: sem validação de benchmark independente, com o poder computacional em alta, quão confiável é esse número? A sua nuvem nativa de IA talvez consiga fazer a diferença na linha de produção sem servidor, mas, honestamente, o verdadeiro gargalo atual é a estabilidade na execução de longas cadeias, não esses poucos pontos percentuais de capacidade de codificação.

As discussões em torno do GLM-5 apresentaram divergências claras:

  • Os otimistas dizem que “pensamento cruzado + chamadas de ferramenta” já consegue rodar fluxos de trabalho complexos, usando como prova o caso de mais de 600 rodadas de iteração no arXiv;
  • Mas subestimam a taxa de estagnação inicial nos benchmarks: a análise do LongCLI-Bench mostra que a taxa de sucesso do agente na SWE-Bench é inferior a 30%; a raiz do problema está na fragilidade do planejamento inicial, várias tentativas de ajuste de ferramenta não resolvem.
  • Por outro lado, a Anthropic assinou contratos de vários GW com TPU (consumo de energia comparável à mineração de Bitcoin), indicando que os recursos computacionais estão se concentrando em players com capacidade de integração vertical. Para competir com o efeito de lock-in de empresas como AWS e Azure, a Together precisa demonstrar, na implantação real, que consegue garantir um SLA de 99,9%.

Desalinhamento entre fluxo de capital e narrativa

  • Em Q1 de 2026, o total de investimentos de risco atingiu 300 bilhões de dólares, sendo cerca de 80% destinados à IA, dos quais uma única OpenAI recebeu 122 bilhões de dólares em financiamento em escala;
  • Discussões no Twitter sobre infraestrutura descentralizada (como DGrid AI) mostram que o mercado ainda reage lentamente à mudança de narrativa de “do modelo para a infraestrutura”;
  • Em tarefas complexas, fluxos de trabalho híbridos que combinam “injeção de planejamento” com intervenção humana podem melhorar a estabilidade em cerca de 20% em relação à automação pura, mas esse tipo de fluxo de trabalho é altamente subestimado, e as empresas ainda não percebem o valor da supervisão dos desenvolvedores.

Cenário competitivo, mudanças na oferta e soluções superestimadas

  • No aspecto competitivo: o GLM-5 usa arquitetura MoE (744 bilhões de parâmetros, cerca de 40 bilhões ativos), o que representa um desafio para o setor de código fechado; mas a Zhiyuan não respondeu de forma direta, parecendo mais uma evolução incremental do que uma inovação disruptiva.
  • Mudanças na oferta: empresas de mineração como a Core Scientific estão migrando para hospedagem de IA, indicando que a escassez de GPUs pode não ser tão severa quanto se previa; infraestrutura reutilizável pode impactar o mercado de serverless, reduzindo o espaço de valor agregado de empresas como a Together.
  • Ajuste na narrativa: o entusiasmo excessivo com “modelos de pensamento” não resolve problemas fundamentais como a contaminação de dados de benchmark, como já apontado nas críticas ao LongCLI-Bench.
Campo da narrativa Evidências Impacto Julgamento
Otimistas Agentic GLM-5 atingiu 77,8% na SWE-Bench Verified, mais de 600 rodadas no arXiv Foca na otimização contínua com RL, incentivando pilotos empresariais Superestimado. A verdadeira vantagem está na combinação de supervisão humana e máquina, beneficiando consultorias como a Accenture
Céticos de poder computacional Contratos de GW com TPU da Anthropic, 300 bilhões de dólares em financiamento de IA no Q1 Transformar escassez em “disputa de alocação”, pressionando o mercado de nuvem open source Preço distorcido. A transição de mineradoras para IA pode gerar capacidade ociosa que prejudica o valor de empresas de alto nível como a Together
Apoio à descentralização Discussões no Twitter sobre DGrid/0G, PermawebDAO Construir narrativa verificável de IA Web3, dispersando o interesse por nuvens centralizadas Sinal inicial. A reação do público é lenta, e regulações também atrasam a adoção de soluções nativas de criptografia
Pragmáticos empresariais Taxa de estagnação precoce do LongCLI-Bench abaixo de 30%, aumento de 28% sem validação independente Revela lacunas na camada de execução, desacelera a especulação com agentes Essa é a principal percepção: equipes capazes de estabelecer ciclos de feedback fechados se beneficiarão, como na pré-visualização do OpenAI o3

Perspectivas e lógica de precificação

  • Se a melhoria reportada for confiável (sem auditoria, probabilidade subjetiva de cerca de 60%), a pipeline de agentes sem servidor da Together pode conquistar entre 15% e 20% da carga de trabalho de agentes até 2027;
  • Mas regulações estão impulsionando a “nuvem de alinhamento de segurança”, elevando os requisitos de conformidade e confiabilidade, o que favorece os gigantes atuais;
  • Para ativos e precificação de serviços: confiabilidade e SLA serão os principais âncoras de valor agregado, e a valorização de melhorias pontuais em modelos deve ser reduzida.

Conclusão: o entusiasmo dos investidores com a narrativa de “agente” do GLM-5 está adiantado, mas a dependência de infraestrutura subjacente ainda é pouco compreendida. Em tarefas complexas, equipes que priorizarem “execução híbrida humano-máquina + ciclo de feedback” terão retorno superior, enquanto a relação custo-benefício de ajustes finos em modelos está em declínio.

Importância: Alta
Classificação: Lançamento de modelos, tendências do setor, insights tecnológicos

Julgamento: Ainda não é tarde para apostar na narrativa de “infraestrutura prioritária”. Traders de curto prazo já perderam o pico emocional, os verdadeiros beneficiários serão equipes capazes de entregar SLA alto e fluxos híbridos, além de fundos de médio a longo prazo. Aumentar posições em confiabilidade e conformidade é recomendável.

GLM1,24%
BTC1,11%
0G-1,78%
Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Nenhum comentário
  • Fixar