De acordo com a OpenAI, a empresa identificou a causa raiz do problema “goblin” que afetou modelos GPT a partir do GPT-5.1. Um sinal de recompensa usado para reforçar o traço de personalidade “Nerdy” incentivou respostas com referências a criaturas de fantasia, com 76,2% do conjunto de dados de treinamento exibindo esse viés. A personalidade Nerdy respondeu por apenas 2,5% das respostas do ChatGPT, mas contribuiu com 66,7% das menções a goblins, com as ocorrências disparando 3.881% de GPT-5.2 para GPT-5.4.
A OpenAI removeu a personalidade Nerdy em março, eliminou o sinal de recompensa tendencioso e filtrou os dados de treinamento. A empresa também adicionou instruções de supressão aos prompts de desenvolvedor do GPT-5.5 no Codex. A investigação levou ao desenvolvimento de novas ferramentas de auditoria do comportamento do modelo.
Aviso: As informações nesta página podem ser provenientes de terceiros e não representam as opiniões ou pontos de vista da Gate. O conteúdo exibido nesta página é apenas para referência e não constitui aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou integridade das informações e não será responsável por quaisquer perdas decorrentes do uso dessas informações. Os investimentos em ativos virtuais apresentam altos riscos e estão sujeitos a uma volatilidade de preços significativa. Você pode perder todo o capital investido. Por favor, compreenda completamente os riscos envolvidos e tome decisões prudentes com base em sua própria situação financeira e tolerância ao risco. Para mais detalhes, consulte o
Aviso Legal.
Related Articles
OpenAI lança o GPT-5.5-Cyber: confronto com o Anthropic Mythos
A OpenAI anunciou o lançamento do GPT-5.5-Cyber, projetado especificamente para cibersegurança, que será implantado em “nos próximos dias” com um mecanismo confiável de acesso em cooperação com o governo para unidades-chave de defesa, não disponível para venda aberta. Em contraste com a via aberta do Anthropic Mythos, a Casa Branca se opõe a expandir para 70 unidades. O Preparedness Framework avaliou como High (ainda não chegou a critical), enquanto também reforça a proteção de segurança cibernética. Em seguida, vale acompanhar a lista de implantação, se a CISA pode entrar na relação e as diferenças entre os padrões de segurança dos dois lados.
ChainNewsAbmedia17m atrás
Receita do 1T da Schneider Electric atinge € 9,8 bilhões, impulsionada em 11,2% pela demanda de data centers por IA
De acordo com a Reuters, a Schneider Electric reportou receita no primeiro trimestre de 9,8 bilhões de euros (US$ 11,4 bilhões) em 30 de abril, com o crescimento orgânico subindo para 11,2% impulsionado pela demanda por data centers de IA. O fornecedor francês de equipamentos de energia e resfriamento disse que o resultado ficou ligeiramente acima das estimativas de consenso e
GateNews24m atrás
Protum levanta rodada Seed de US$ 2 milhões para plataforma de governança com IA, mirando fechamento em junho de 2026
De acordo com o TechCrunch Startup Spotlight, a Protum, uma startup de governança com IA, está levantando uma rodada seed de US$ 2 milhões com o objetivo de fechar até junho de 2026. Fundada por Sandeep J., que traz 25 anos de experiência em transformação de empresas, a Protum fornece uma plataforma projetada para dar às empresas uma gestão contínua
GateNews54m atrás
A onda de demissões nas empresas pode levar a um impasse em que empregadores e trabalhadores saem perdendo; estudo recomenda: criar um imposto sobre automação com IA
Pesquisas apontam uma externalidade na necessidade de demissões impulsionadas por IA: o custo das demissões é arcado apenas pelas empresas, mas a perda de poder de compra é suportada por todo o mercado. Quanto mais demissões, mais a demanda encolhe, e ambos os lados saem perdendo. Propõe-se criar uma taxa sobre a automação com IA para internalizar os custos externos, usando a arrecadação para financiar a requalificação, a fim de restaurar a demanda e estabilizar a economia.
ChainNewsAbmedia58m atrás
Claude vai cobrar imposto de idioma? Pesquisa revela que traduções de conteúdo em chinês, japonês e coreano consomem mais tokens, quase 3 vezes
Pesquisador Komatsuzaki aponta no X que os tokenizers dos LLMs de uso mais amplo têm uma “taxa” para idiomas não ingleses. Ao traduzir e testar com o benchmark de 《The Bitter Lesson》, o Claude apresentou aumentos de tokens de aproximadamente 3,24× no hindi, 2,86× no árabe, 2,04× no russo e 1,71× no chinês, bem acima do OpenAI. Modelos locais da China são mais amigáveis para o chinês, indicando que viés de dados de treinamento para o inglês gera uma desigualdade de custos, tornando-se um obstáculo à popularização.
ChainNewsAbmedia1h atrás
O negócio de IA da Microsoft dobra para $370B ARR; planos de $190B Capex para 2026
Em 29 de abril, a Microsoft divulgou os resultados do terceiro trimestre fiscal de 2026 referentes ao período encerrado em 31 de março, superando as expectativas do mercado. A receita do 3º trimestre atingiu US$ 82,886 bilhões, alta de 18% na comparação anual e acima do esperado US$ 81,4 bilhões; o lucro líquido GAAP cresceu 23% para US$ 31,778 bilhões; os lucros diluídos não-GAAP por
GateNews1h atrás