Resultados da pesquisa por "EXPERT"
2026-04-27
05:17

GPT-5.5 Volta ao Topo em Codificação, mas a OpenAI Troca os Benchmarks Depois de Perder para o Opus 4.7

Mensagem do Gate News, 27 de abril — A SemiAnalysis, uma empresa de análise de semicondutores e IA, divulgou um benchmark comparativo de assistentes de codificação, incluindo GPT-5.5, Claude Opus 4.7 e DeepSeek V4. A principal descoberta: GPT-5.5 marca o primeiro retorno da OpenAI ao limite do que há de mais avançado em modelos de codificação em seis meses, com engenheiros da SemiAnalysis agora alternando entre Codex e Claude Code depois de anteriormente dependerem quase exclusivamente de Claude. O GPT-5.5 é baseado em uma nova abordagem de pré-treinamento codificada como "Spud" e representa a primeira expansão do OpenAI na escala de pré-treinamento desde o GPT-4.5. Em testes práticos, surgiu uma divisão clara de funções. Claude fica com o planejamento de projetos novos e a configuração inicial, enquanto Codex se destaca em correções de bugs que exigem raciocínio intensivo. O Codex demonstra uma compreensão mais forte de estruturas de dados e raciocínio lógico, mas tem dificuldades para inferir a intenção ambígua do usuário. Em uma tarefa única no painel, o Claude replicou automaticamente o layout da página de referência, mas fabricou grandes quantidades de dados, enquanto o Codex pulou o layout, mas entregou dados significativamente mais precisos. A análise revela um detalhe de manipulação de benchmark: o post do blog da OpenAI de fevereiro incentivou a indústria a adotar o SWE-bench Pro como o novo padrão para benchmarks de codificação. No entanto, o anúncio do GPT-5.5 mudou para um novo benchmark chamado "Expert-SWE." O motivo, escondido nas letras miúdas, é que o GPT-5.5 foi superado pelo Opus 4.7 no SWE-bench Pro e ficou muito aquém do não lançado Mythos da Anthropic 77.8%. Em relação ao Opus 4.7, a Anthropic publicou uma análise pós-mortem uma semana após o lançamento, reconhecendo três bugs no Claude Code que persistiram por várias semanas de março a abril, afetando quase todos os usuários. Vários engenheiros já haviam relatado degradação de desempenho na versão 4.6, mas foram dispensados como observações subjetivas. Além disso, o novo tokenizador do Opus 4.7 aumenta o uso de tokens em até 35%, algo que a Anthropic admitiu abertamente—o que, efetivamente, constitui um aumento de preço oculto. O DeepSeek V4 foi avaliado como "acompanhando o ritmo da fronteira, mas não liderando," posicionando-se como a alternativa de menor custo entre modelos de código fechado. A análise também observou que "Claude continua a superar o DeepSeek V4 Pro em tarefas de escrita em chinês de alta dificuldade," comentando que "Claude venceu o modelo chinês na própria língua. O artigo apresenta um conceito-chave: a precificação dos modelos deve ser avaliada por "custo por tarefa" em vez de "custo por token." A precificação do GPT-5.5 é o dobro da do GPT-5.4 input $5, output por um milhão de tokens, mas ele conclui as mesmas tarefas usando menos tokens, tornando o custo real não necessariamente mais alto. Os dados iniciais da SemiAnalysis mostram que a proporção input-to-output do Codex é de 80:1, menor do que a do Claude Code, de 100:1.
Mais
17:11

Polícia de Hong Kong alerta sobre aumento de golpes com criptomoedas; duas mulheres perdem US$1,24M nas últimas semanas

Mensagem do Gate News, 25 de abril — Duas mulheres de Hong Kong perderam, juntas, HK$9,7 milhões (US$1,24 milhão) para golpistas de criptomoedas nas últimas semanas, levando a polícia local a emitir um aviso público. A polícia de Hong Kong informou mais de 80 casos de fraude em uma única semana, com perdas totais superiores a HK$80 milhão (U
Mais
ETH-0,03%
10:51

COTI faz parceria com a Sayfer para fortalecer a segurança do protocolo de privacidade

Mensagem do Gate News, 24 de abril — A COTI anunciou uma parceria com a Sayfer, uma empresa de segurança em blockchain fundada em 2019, para reforçar a estrutura de segurança que dá suporte ao seu ecossistema com foco em privacidade. A Sayfer atuará como uma assessora de segurança de longo prazo para a COTI, apoiando o projeto enquanto ele se prepara para
Mais
COTI-0,94%
1INCH-0,75%
DOT0,16%
XTZ4,29%
09:45

DeepSeek disponibiliza código-fonte aberto do TileKernels, biblioteca de kernels de GPU para treinamento e inferência de modelos em larga escala

Mensagem do Gate News, 23 de abril — A DeepSeek disponibilizou o código-fonte aberto do TileKernels sob a licença MIT, uma biblioteca de kernels de GPU escrita em TileLang para treinamento e inferência de modelos de linguagem em larga escala. O TileLang é uma linguagem de domínio desenvolvida pela equipe tile-ai para expressar kernels de GPU de alto desempenho em
Mais
07:05

A remoção do Claude Code da Anthropic gera reação negativa da comunidade; a OpenAI ganha apoio

A Anthropic remove o Claude Code do plano Pro, gerando críticas enquanto desenvolvedores migram para a OpenAI; o Codex permanece gratuito/básico, o GPT-5.4 e o Image 2.0 melhoram o desempenho, impulsionando uma grande migração de usuários. Resumo: O artigo analisa a remoção do Claude Code da $20 proposta do plano Pro pela Anthropic, o que desencadeia reações de desenvolvedores que chamam isso de aumento de preço “oculto” e de um risco de confiabilidade. Ele contrasta essa medida com a política da OpenAI de manter o Codex nas faixas gratuitas e básicas, enquanto destaca um desempenho forte dos modelos do GPT-5.4 e do ChatGPT Images 2.0, além de observar uma migração rápida de usuários para a OpenAI, com o Codex supostamente superando 4 milhões de usuários ativos semanais.
Mais
05:01

Digital Asset faz parceria com a Ethereum Korea em colaboração de conteúdo, marcando o primeiro MOU para a comunidade

A Digital Asset assina um MOU com a Ethereum Korea para receber atualizações do ecossistema Ethereum, desenvolvimentos da roadmap e conteúdo especializado, sinalizando uma colaboração bidirecional para conectar recursos do ecossistema Ethereum coreano e global. Resumo: A Digital Asset e a Ethereum Korea assinaram um MOU para fornecer atualizações do ecossistema Ethereum, desenvolvimentos da roadmap e conteúdo especializado aos leitores da Digital Asset. A parceria tem como objetivo conectar as capacidades coreanas ao ecossistema Ethereum global por meio de colaboração bidirecional.
Mais
ETH-0,03%
13:01
1

Consulta sobre o Projeto de Lei Financeira da China Chega ao Fim; Ausência Largamente Considerável de Status Legal de Moeda Digital e Regulação de Ativos Cripto

O Projeto de Lei de Finanças da China tem como objetivo unificar a legislação financeira, concedendo aos reguladores amplos poderes de investigação. Embora fortaleça a supervisão, ele não tem foco em setores emergentes como IA e moedas digitais, destacando a necessidade de equilibrar regulação e inovação.
Mais