A OpenAI lançou oficialmente o GPT-5.5 a 23 de abril de 2026, um novo modelo de IA concebido para compreender a intenção do utilizador em aplicações do mundo real através de capacidades nativas de utilização de computador. O modelo apresenta capacidades nativas de propósito geral que lhe permitem navegar por aplicações de desktop, clicar em botões e escrever texto para fluxos de trabalho multi-etapas, de acordo com o anúncio da OpenAI.

O GPT-5.5 combina a utilização nativa de computador com raciocínio avançado, navegando autonomamente por ferramentas de software necessárias para tarefas profissionais de alto nível. A janela de contexto do modelo, ~1,1 milhões de tokens, permite-lhe processar vastos conjuntos de dados financeiros que anteriormente exigiam fragmentação manual. A equipa financeira da OpenAI usou o GPT-5.5 para rever 24,771 formulários fiscais K-1 (71,637 páginas) e concluiu a tarefa duas semanas mais cedo do que no ano anterior.

Métricas de Desempenho

O GPT-5.5 obteve 88,5% em tarefas internas de modelação para banca de investimento e 60% no benchmark FinancialAgent v1.1, superando o GPT-5.4 em quatro pontos. O modelo atingiu 84,9% no GDPval, que testa as capacidades dos agentes para produzirem trabalho especializado específico em 44 profissões. No OSWorld-Verified, que mede as operações autónomas reais do computador do modelo, este alcançou 78,7%. O GPT-5.5 marcou 98% no Tau2-bench Telecom, que testa fluxos de trabalho extremamente difíceis de apoio ao cliente.

Um empregado da equipa Go-to-Market confirmou que a automatização dos relatórios de negócios semanais irá poupar aproximadamente 5-10 horas de trabalho manual por semana.

Geração de Código e Optimização do Sistema

A OpenAI relata que o GPT-5.5 foi usado para ajudar a escrever código para a sua própria infra-estrutura de serviços. O modelo alcançou a “Optimização a Nível de Sistema” ao analisar padrões de tráfego de produção para escrever heurísticas de balanceamento de carga personalizadas, aumentando a sua própria velocidade de geração de tokens em 20%.

Num teste para programadores, foi pedido ao modelo que “re-arquitectasse um editor de markdown” e devolveu uma stack quase completa de 12 diffs com correcção humana mínima. A OpenAI nota que o novo modelo chega à resposta correcta em menos interações e usa 40% menos tokens para as mesmas tarefas Codex em comparação com o GPT-5.4.

Dan Shipper, fundador e CEO da Every, descreveu o GPT-5.5 como o primeiro modelo de código que tem “clareza conceptual séria”. Shipper testou o GPT-5.5 depois de ele e o seu melhor engenheiro terem passado dias a depurar um problema pós-lançamento numa aplicação. De acordo com Shipper, o GPT-5.5 conseguiu o que o GPT-5.4 não conseguiu: analisou o código com defeito e produziu a reescrita que o engenheiro acabou por decidir. O modelo pode “lembrar” e referenciar de forma cruzada bibliotecas inteiras de informação sem perder o seu lugar, reduzindo as “alucinações” que afectavam versões anteriores.

Capacidades Autónomas e Auto-Correção

A OpenAI afirma que o GPT-5.5 é optimizado para “auto-correção” e autonomia. É melhor a interpretar instruções ambíguas e a usar uma interface de computador (clicking, typing, browsing) para cumprir objectivos sem intervenção humana. O modelo torna-se particularmente útil quando é necessário que um agente opere software, gerencie fluxos de trabalho pesados em terminal, ou raciocine ao longo de toda uma base de código (500K+ tokens) com elevada precisão de recuperação.

Funcionalidade de Pensamento do GPT-5.5

No ChatGPT, a OpenAI introduziu o “GPT-5.5 Thinking”, que a empresa diz desbloquear ajuda mais rápida para problemas mais difíceis. A funcionalidade fornece respostas mais inteligentes, mais concisas, para ajudar os utilizadores a concluírem tarefas complicadas com mais eficiência. Destaca-se em trabalho profissional como síntese e análise de informação, programação e tarefas pesadas em documentos como pesquisa, especialmente ao usar plugins.

Os primeiros testers Pro do GPT-5.5 relatam uma melhoria enorme tanto na qualidade como na dificuldade do trabalho que o ChatGPT consegue assumir. A sua menor latência torna-o mais prático para tarefas exigentes do que o GPT-5.4 Pro. As respostas do GPT-5.5 Pro estão bem estruturadas, são relevantes, úteis e precisas, com desempenho particularmente forte em direito, ciência de dados, negócios e educação.

Preços e Acesso

Embora exista uma versão básica disponível, a versão mais capaz (GPT-5.5 Pro) custa 100 US$/mês para subscritores individuais. Para empresas, o custo por token de saída é aproximadamente o dobro do do GPT-5.4, mesmo com 40% de eficiência de tokens superior. O gasto total para implementações agentic em grande escala pode ser substancial. Há uma preocupação crescente de que o raciocínio do mais alto nível se torne um “luxo” acessível apenas a empresas bem financiadas, o que poderá alargar a diferença de produtividade entre grandes empresas e pequenos startups.

Ver fonte

Isenção de responsabilidade: As informações contidas nesta página podem ser provenientes de terceiros e não representam os pontos de vista ou opiniões da Gate. O conteúdo apresentado nesta página é apenas para referência e não constitui qualquer aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou o carácter exaustivo das informações e não poderá ser responsabilizada por quaisquer perdas resultantes da utilização destas informações. Os investimentos em ativos virtuais implicam riscos elevados e estão sujeitos a uma volatilidade de preços significativa. Pode perder todo o seu capital investido. Compreenda plenamente os riscos relevantes e tome decisões prudentes com base na sua própria situação financeira e tolerância ao risco. Para mais informações, consulte a Isenção de responsabilidade.

Comentar

0/400

AprDaydream

· 2h atrás

Espero que o oficial forneça um mecanismo de registo de ações/audição que seja auditável, caso contrário, será difícil responsabilizar, especialmente em contas de ativos operadas automaticamente.

Ver originalResponder0

PaperHandsPro

· 3h atrás

A "compreensão de intenção" na aplicação prática é realmente o ponto difícil, espero que não volte a acontecer aquela situação embaraçosa de você querer reservar um bilhete de avião e ele alterar o seu currículo.

Ver originalResponder0

Half-SectionedSucculent

· 3h atrás

Estou um pouco ansioso, mas também um pouco assustado: poder clicar com o mouse equivale a poder fazer muitas coisas que só os "cliques humanos" podem fazer, e o controle de risco e a luta contra fraudes precisam ser aprimorados.

Ver originalResponder0

ACalmnessWithAHintOfPomelo

· 3h atrás

Esta onda também terá impacto no Web3, se as operações automáticas na cadeia, os processos de assinatura e a interação com carteiras puderem ser feitos de forma integrada, a forma do produto mudará.

Ver originalResponder0

StarsInTheGlassDome

· 3h atrás

API e preços, primeiro não se apresse, primeiro veja se ele consegue resistir a janelas pop-up, múltiplas janelas e oscilações de rede em ambientes de desktop complexos.

Ver originalResponder0

GateUser-b665e41c

· 3h atrás

Sinto que a evolução de "saber falar e escrever" para "saber fazer e entregar" passa a próxima etapa de fornecer a ela uma melhor memória e gestão de tarefas.

Ver originalResponder0

LintCollector

· 3h atrás

Se realmente for possível conectar entre aplicações: pesquisar no navegador → processar no Excel → criar apresentação no PowerPoint → enviar por email, então será um ciclo completo de fluxo de trabalho de escritório.

Ver originalResponder0

DegenWithNotebook

· 3h atrás

Finalmente chegou à operação nativa na área de trabalho? Agora realmente vai ser um "estagiário digital".

Ver originalResponder0