OpenAI rastrea el problema del “Goblin” hasta una señal de recompensa por personalidad nerd, las menciones de “Goblin” se disparan un 175% en GPT-5.1

Según OpenAI, la empresa identificó la causa raíz del problema del “goblin” que afectó a los modelos GPT desde GPT-5.1 en adelante. Una señal de recompensa usada para reforzar el rasgo de personalidad “Nerdy” alentó salidas que incluían referencias a criaturas de fantasía, y el 76,2% del conjunto de datos de entrenamiento mostró este sesgo. La personalidad Nerdy representó solo el 2,5% de las respuestas de ChatGPT, pero contribuyó con el 66,7% de las menciones de goblin, con apariciones disparándose un 3.881% de GPT-5.2 a GPT-5.4.

OpenAI eliminó la personalidad Nerdy en marzo, eliminó la señal de recompensa sesgada y filtró los datos de entrenamiento. La empresa también añadió instrucciones de supresión a los prompts de desarrollador de GPT-5.5 en Codex. La investigación condujo al desarrollo de nuevas herramientas de auditoría del comportamiento de los modelos.

Aviso legal: La información de esta página puede proceder de terceros y no representa los puntos de vista ni las opiniones de Gate. El contenido que aparece en esta página es solo para fines informativos y no constituye ningún tipo de asesoramiento financiero, de inversión o legal. Gate no garantiza la exactitud ni la integridad de la información y no se hace responsable de ninguna pérdida derivada del uso de esta información. Las inversiones en activos virtuales conllevan riesgos elevados y están sujetas a una volatilidad significativa de los precios. Podrías perder todo el capital invertido. Asegúrate de entender completamente los riesgos asociados y toma decisiones prudentes de acuerdo con tu situación financiera y tu tolerancia al riesgo. Para obtener más información, consulta el Aviso legal.

Artículos relacionados

OpenAI lanza GPT-5.5-Cyber: enfrenta a Anthropic Mythos

OpenAI anuncia el lanzamiento de GPT-5.5-Cyber, diseñado específicamente para ciberseguridad, que se desplegará en «los próximos días» mediante un mecanismo de acceso confiable con colaboración gubernamental para unidades clave de defensa, sin venta abierta. En contraste con la ruta abierta de Anthropic Mythos, la Casa Blanca se opone a ampliarlo a 70. El Preparedness Framework lo califica como High (no llega a critical), mientras que se refuerzan las protecciones de ciberseguridad. A continuación, se vigilará la lista de despliegue, si CISA podría entrar en el listado y las diferencias entre los estándares de seguridad de ambas partes.

ChainNewsAbmediaHace17m

Los ingresos del Q1 de Schneider Electric alcanzan 9,8 mil millones de euros, impulsados un 11,2% por la demanda de centros de datos de IA

Según Reuters, Schneider Electric informó unos ingresos del primer trimestre de 9,8 mil millones de euros (US$11,4 mil millones) el 30 de abril, con un crecimiento orgánico que se elevó al 11,2% impulsado por la demanda de centros de datos de IA. El proveedor francés de equipos eléctricos y de refrigeración dijo que el resultado estuvo ligeramente por encima de las estimaciones de consenso y

GateNewsHace24m

Protum recauda una ronda semilla de 2 millones de dólares para una plataforma de gobernanza de IA, con objetivo de cerrar en junio de 2026

Según TechCrunch Startup Spotlight, Protum, una startup de gobernanza con IA, está recaudando una ronda semilla de 2 millones de dólares con el objetivo de cerrarla para junio de 2026. Fundada por Sandeep J., que aporta 25 años de experiencia en la transformación de empresas, Protum ofrece una plataforma diseñada para dar a las empresas continuidad en su

GateNewsHace54m

La ola de despidos en las empresas podría llevar a un escenario de “pierden ambos” entre empleadores y trabajadores; estudio recomienda: debería implementarse un impuesto a la automatización mediante IA

Un estudio señala la externalidad de la necesidad de despidos impulsados por IA: los costos de los despidos los asume en exclusiva la empresa, pero la pérdida del poder adquisitivo se carga al conjunto del mercado; cuanto más se despide, más se debilita la demanda y ambos lados pierden. Se propone imponer un impuesto a la automatización con IA para internalizar los costos externos y financiar la recapacitación con los ingresos fiscales, con el fin de reactivar la demanda y estabilizar la economía.

ChainNewsAbmediaHace58m

Claude ¿cobrará un impuesto por idioma? Estudio revela que la traducción de contenido chino, japonés y coreano consume hasta casi 3 veces más tokens

El investigador Komatsuzaki señaló en X que los tokenizers de los LLM principales tienen un “impuesto” de lenguaje para idiomas no ingleses. Al traducir y ponerla a prueba con 《The Bitter Lesson》, Claude mostró aumentos de tokens de aproximadamente 3,24× en hindi, 2,86× en árabe, 2,04× en ruso y 1,71× en chino, claramente por encima de OpenAI. Los modelos nativos de China son más amigables con el chino, lo que sugiere que los datos de entrenamiento están sesgados hacia el inglés, generando desigualdad de costos y convirtiéndose en un obstáculo para la adopción generalizada.

ChainNewsAbmediahace1h

La IA de Microsoft para empresas se duplica hasta $370B ARR; planes de $190B Capex para 2026

El 29 de abril, Microsoft informó los resultados del tercer trimestre fiscal de 2026 para el periodo finalizado el 31 de marzo, superando las expectativas del mercado. Los ingresos del Q3 alcanzaron 82,886 mil millones de dólares, un 18% más interanual y por encima de lo esperado, 81,4 mil millones de dólares; el beneficio neto GAAP creció un 23% hasta 31,778 mil millones de dólares; las ganancias diluidas no-GAAP por

GateNewshace1h
Comentar
0/400
Sin comentarios