A OpenAI lançou GPT-5.4 Mini e Nano: velocidade duplicada, concebido para a era dos sub-agentes de IA, apenas $0.2 por milhão de tokens no mínimo

動區BlockTempo

OpenAI hoje (18) lançou oficialmente dois novos modelos leves, GPT-5.4 Mini e GPT-5.4 Nano. O primeiro oferece o dobro de velocidade em relação à geração anterior, com preço de apenas $0.75 por milhão de tokens de entrada, enquanto o segundo prioriza baixa latência e preços altamente competitivos de $0.20, visando o mercado de alto throughput.
(Atualização anterior: OpenAI lança GPT-5.2! Substituição de profissionais, menor alucinação, detalhes sobre API)
(Informações adicionais: Resumo completo do lançamento do GPT-5 da OpenAI: acesso gratuito, destaques de funcionalidades, preços do gpt-5, gpt-5-mini e gpt-5-nano API)

Índice do artigo

Alternar

  • GPT-5.4 Mini: 2 vezes mais rápido, força versátil e leve
  • GPT-5.4 Nano: ultra baixa latência, voltado para cenários de alto throughput
  • Arquitetura de subagentes: modelos menores não são versões reduzidas, fazem parte do design do sistema

Hoje (18), a OpenAI lançou simultaneamente às meia-noite os modelos de linguagem compactos GPT-5.4 Mini e GPT-5.4 Nano. Esses modelos não são modelos de ponta, mas foram claramente projetados como camadas de execução em sistemas de IA híbridos: modelos mais poderosos coordenam o agendamento, enquanto muitos modelos menores realizam tarefas diárias em paralelo.

A OpenAI chama essa arquitetura de “melhoria significativa na velocidade e eficiência de custos, trocando parte da precisão por maior velocidade”. Essa troca reflete a transição atual na indústria de IA de um único grande modelo para uma “colaboração de múltiplos agentes”.

GPT-5.4 Mini: 2 vezes mais rápido, força versátil e leve

O GPT-5.4 Mini é o produto principal desta rodada, focado em equilibrar velocidade e multitarefa. Em relação à geração anterior, sua velocidade de inferência dobrou, com melhorias em geração de código, compreensão multimodal e chamadas de ferramentas.

Nos testes de benchmark, o GPT-5.4 Mini atingiu 54,4% no SWE-Bench Pro (auto-correção de problemas no GitHub) e 72,1% no OSWorld-Verified (automação de tarefas desktop), ambos indicadores de liderança na sua categoria.

No aspecto funcional, suporta entrada mista de texto e imagens, chamadas de ferramentas, busca na internet e arquivos, além de interação com interfaces de usuário de computador, cobrindo quase todas as necessidades de aplicações modernas de IA. Os principais cenários de uso listados pela OpenAI incluem: assistentes de código, integração com IDEs, revisão de código, interpretação de capturas de tela, subagentes para uso de computador e sistemas de resposta em tempo real.

Quanto ao preço, o GPT-5.4 Mini cobra $0.75 por milhão de tokens de entrada e $4.50 por milhão de tokens de saída, continuando a estratégia recente da OpenAI de reduzir custos.

Disponibilidade: o GPT-5.4 Mini já está disponível no ChatGPT (camada gratuita e assinatura Go), Codex e API da OpenAI, além de poder ser implantado via Azure AI Foundry.

GPT-5.4 Nano: ultra baixa latência, voltado para cenários de alto throughput

O GPT-5.4 Nano tem uma proposta mais clara: a OpenAI o chama de “modelo mais compacto e mais eficiente em custos atualmente”, especialmente projetado para ambientes onde a latência é crítica e o processamento paralelo em larga escala é necessário.

Nos testes de benchmark, o Nano obteve 52,4% no SWE-Bench Pro e 39,0% no OSWorld, ligeiramente abaixo do Mini, mas com um preço extremamente competitivo, oferecendo excelente relação custo-benefício.

Em termos de funcionalidades, suporta comandos de instrução, chamadas de funções, código básico, compreensão de imagens, classificação e extração de dados. Pode lidar com a maioria das tarefas estruturadas, mas não suporta operações complexas de desktop ou raciocínio profundo.

Quanto ao preço, o Nano custa apenas $0.20 por milhão de tokens de entrada e $1.25 por milhão de tokens de saída, aproximadamente um quarto do preço do Mini, ideal para empresas que precisam de automação em grande escala. Os cenários listados incluem classificação, extração de dados, suporte a subagentes de código, automação em grande volume, roteamento de requisições, processamento de formulários e fluxos de trabalho de atendimento ao cliente.

Vale destacar que o GPT-5.4 Nano atualmente só está acessível via API, não aparecendo na interface do ChatGPT, sendo claramente direcionado a desenvolvedores e produtos empresariais.

Arquitetura de subagentes: modelos menores não são versões reduzidas, fazem parte do design do sistema

A propaganda da OpenAI para esses modelos é “nascidos para a era dos subagentes”, uma frase que tem uma lógica de produto concreta por trás.

Em sistemas de IA com múltiplos agentes, o modelo de ponta (como GPT-5 ou modelos de inferência da série o) é responsável pelo planejamento de alto nível e decisões complexas, enquanto tarefas repetitivas e estruturadas — como captura de páginas web, transformação de dados, preenchimento de formulários, geração de trechos de código — podem ser realizadas por modelos menores, mais rápidos e mais baratos, em paralelo. O GPT-5.4 Mini e Nano foram projetados exatamente para esse papel de camada de execução.

Essa abordagem também explica por que ambos os modelos enfatizam chamadas de ferramentas e interação com o sistema operacional: em arquiteturas de IA cada vez mais automatizadas, modelos pequenos capazes de executar comandos de forma confiável e interagir com sistemas externos têm valor comercial tão grande quanto os modelos de maior parâmetro.

Ver original
Aviso: As informações nesta página podem ser provenientes de terceiros e não representam as opiniões ou pontos de vista da Gate. O conteúdo exibido nesta página é apenas para referência e não constitui aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou integridade das informações e não será responsável por quaisquer perdas decorrentes do uso dessas informações. Os investimentos em ativos virtuais apresentam altos riscos e estão sujeitos a uma volatilidade de preços significativa. Você pode perder todo o capital investido. Por favor, compreenda completamente os riscos envolvidos e tome decisões prudentes com base em sua própria situação financeira e tolerância ao risco. Para mais detalhes, consulte o Aviso Legal.
Comentário
0/400
Sem comentários