GPT-5.4, o grande modelo "Agent Nativo" chegou?

robot
Geração de resumo em curso

Após apenas dois dias de rumores, no dia 5 de março, horário local, a OpenAI lançou oficialmente o GPT-5.4. E esta atualização do modelo foca na direção mais quente atualmente: os Agentes de IA.

Antes do GPT-5.4, o limite das grandes modelos podia ser resumido numa frase: eles podem te dizer “como fazer”, mas não podem fazer por si próprios.

Se pedes para analisar um concorrente, ele te fornece um relatório extenso em texto; se pedes para organizar uma Excel, ele escreve um código Python para que tu executes; se pedes para reservar um voo, ele te indica passo a passo qual site usar e qual botão clicar.

A barreira, chamada de “operação de computador”, é o que separa essa capacidade.

O GPT-5.4 é o primeiro modelo geral da OpenAI a derrubar essa barreira.

GPT-5.4 em comparação com modelos anteriores|Fonte: OpenAI

Ele consegue reconhecer conteúdo na tela por meio de capturas de tela, emitir comandos de mouse e teclado, e executar fluxos de trabalho em múltiplas aplicações. Segundo a própria OpenAI, é o “modelo mais poderoso e eficiente até hoje para tarefas profissionais”.

Mais tecnicamente, o GPT-5.4 suporta uma janela de contexto de até 1 milhão de tokens e pode usar bibliotecas como Playwright para controlar diretamente navegadores e aplicações de desktop.

Isso significa que ele não lida mais apenas com “diálogos sobre tarefas”, mas com “a própria tarefa”.

01 O preparo da OpenAI

Se tens acompanhado as ações recentes da OpenAI, perceberás que o GPT-5.4 não surgiu do nada, mas é uma evolução clara na estratégia da empresa.

Há duas semanas, a OpenAI lançou o GPT-5.3-Codex, elevando o Codex de “agente que escreve código” para “agente que pode fazer quase tudo que um desenvolvedor faz no computador”, e estabeleceu novos padrões na indústria com o SWE-Bench Pro e o Terminal-Bench.

Ao mesmo tempo, lançou a plataforma empresarial “Frontier”, com HP, Intuit e Uber como primeiros usuários.

O GPT-5.4 é mais inteligente na preenchimento de tabelas|Fonte: OpenAI

Antes disso, em 2 de março, a OpenAI e a AWS ampliaram sua parceria de 3,8 bilhões de dólares para mais de 100 bilhões de dólares, com duração de 8 anos, tornando a AWS o distribuidor exclusivo na nuvem do OpenAI Frontier. O tamanho desse investimento já é um sinal.

A rodada de financiamento de 110 bilhões de dólares, apoiada por Amazon, SoftBank e Nvidia, também foi concretizada na mesma época.

Não é uma empresa que apenas “desenvolve bons produtos”, mas uma que está em uma corrida para “dominar o mercado de Agentes de IA empresariais”.

A capacidade nativa de operação de computador do GPT-5.4 é a arma-chave dessa corrida.

02 Funciona mesmo?

As demonstrações na apresentação sempre parecem incríveis, mas o verdadeiro teste é na prática.

A fintech Walleye Capital relatou em testes internos que o GPT-5.4 aumentou a precisão em avaliações de modelos financeiros no Excel em 30 pontos percentuais, acelerando significativamente a automação de análises de cenários.

A CEO da plataforma de avaliação de talentos Mercor chamou o GPT-5.4 de “o melhor modelo que já testamos”, destacando seu desempenho em tarefas de longo prazo como criação de slides, modelagem financeira e análises jurídicas.

Um desenvolvedor independente que usa Codex diariamente comentou de forma mais realista: “O GPT-5.4 é minha nova rotina com o Codex. Sua forma de pensar é mais parecida com a humana, sem a obsessão pelos detalhes técnicos do 5.3.” Mas ele também alertou: “Cuidado, já vi o modelo cometer erros ao executar tarefas e esconder isso.”

Melhorias na operação e na visualização do GPT-5.4|Fonte: OpenAI

Esse detalhe é bastante interessante.

Dados de testes também confirmam essa melhora de capacidade. Segundo relatos, o GPT-5.4 supera 83% dos funcionários de escritório comuns na avaliação pelo benchmark GDPval. Parece impressionante, mas o verdadeiro ponto é: em quais tarefas ele pode substituir humanos?

Porém, o Dr. Jeff Dalton, da Escola de Informática de Edimburgo, apontou uma questão real — nas demonstrações atuais, quase não há evidências detalhadas que sustentem essas afirmações grandiosas. A capacidade é real, mas os limites ainda precisam de validação independente.

03 O campo dos Agentes, sem zona de segurança

Se o GPT-5.4 representa a ambição da OpenAI de dominar os Agentes, os concorrentes não estão parados.

A Anthropic lançou em fevereiro o Claude 3.7 Sonnet com a funcionalidade “Computer Use”, uma versão híbrida de raciocínio para tarefas complexas, posicionando-se como um modelo de raciocínio misto.

O Google, com a série Gemini 2.0, também vem investindo em capacidades “Agentic”, e o Project Mariner já consegue realizar múltiplas operações de forma autônoma no Chrome.

Mas a diferença essencial do GPT-5.4 e seus concorrentes é que ele é o primeiro produto da OpenAI a incorporar a operação de computador nativamente no modelo geral — não uma ferramenta separada, nem uma API que precisa ser chamada, mas uma capacidade integrada ao próprio modelo.

Esse termo “nativo” na engenharia significa, na prática, menor latência, transições mais naturais entre tarefas e menos “cola de código”. Para empresas que querem implementar rapidamente um Agente, essa diferença impacta diretamente nos custos de implantação.

A OpenAI também anunciou que o GPT-5.4 pode se conectar diretamente ao Microsoft Excel e ao Google Sheets, realizando análises e automações em nível de célula. Essa é uma movimentação clara na direção do núcleo do fluxo de trabalho empresarial.

A batalha dos Agentes nunca foi sobre quem corre mais rápido, mas quem consegue se integrar primeiro ao fluxo de trabalho das empresas, tornando-se uma presença difícil de remover.

As apresentações técnicas sempre são empolgantes, mas o verdadeiro teste será no 91º dia — quando a atenção diminuir, e os usuários começarem a usar essa ferramenta em cenários reais de trabalho. Ela conseguirá manter a estabilidade ao capturar telas, clicar com precisão, concluir tarefas silenciosamente e entregar resultados?

A frase do desenvolvedor sobre “esconder erros” é, até agora, a mais importante advertência nesta reportagem.

O limite do potencial dos Agentes de IA nunca é “o que eles podem fazer”, mas “você confia neles para fazer?”

A confiança é, de fato, a verdadeira moeda nesta guerra dos Agentes.

Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
0/400
Nenhum comentário
  • Fixar