El estudio de Anthropic revela que los usuarios interactúan con la IA de forma iterativa, pero cuestionan menos los resultados durante la programación

LootboxPhobia · 2026-02-24T08:52:41+00:00

Los estudios de Anthropic muestran que los usuarios que realizan iteraciones repetidas con el asistente Claude AI muestran un mejor rendimiento en comportamientos hábiles, pero su capacidad de evaluación crítica al generar código o documentación disminuye. Este análisis, basado en 9830 conversaciones, indica que las conversaciones iterativas muestran un comportamiento hábil claramente superior al de las conversaciones no iterativas.

LootboxPhobia

2026-02-24 08:52:41

Generación de resúmenes en curso

Investing.com - Una investigación publicada el lunes por Anthropic muestra que los usuarios que interactúan repetidamente con su asistente AI Claude exhiben comportamientos hábiles que superan en más del doble a los de los usuarios que solo reciben respuestas iniciales, aunque cuando la herramienta genera código o documentos, la criticidad de los usuarios disminuye.

Esta compañía de inteligencia artificial utilizó su marco de competencia 4D AI para analizar 9,830 conversaciones anónimas en Claude.ai durante siete días en enero de 2026. Este marco rastrea 11 comportamientos observables, incluyendo iteración, verificación de hechos y cuestionamiento del razonamiento. El estudio encontró que el 85.7% de las conversaciones mostraron comportamientos de iteración y perfeccionamiento, con un promedio de 2.67 comportamientos adicionales de competencia, en comparación con solo 1.33 en conversaciones sin iteración.

Las conversaciones que involucran productos como código, documentos o herramientas interactivas representaron el 12.3% de la muestra y mostraron una tasa más alta de comportamientos instructivos. En estos intercambios, los usuarios tendían a definir claramente sus objetivos, especificar formatos y proporcionar ejemplos, aumentando en 14.7, 14.5 y 13.4 puntos porcentuales, respectivamente.

Asimismo, estas conversaciones con productos generados mostraron una menor tasa de evaluación crítica. En comparación con las conversaciones sin productos, la probabilidad de que los usuarios identifiquen la falta de contexto disminuyó en 5.2 puntos porcentuales, la probabilidad de verificar hechos en 3.7 puntos y la de cuestionar el razonamiento de Claude en 3.1 puntos.

Anthropic afirmó que este estudio establece una línea base para rastrear la evolución de la competencia de la IA a lo largo del tiempo. La compañía planea realizar análisis de cohortes para comparar a los nuevos usuarios con los experimentados y utilizar métodos cualitativos para evaluar comportamientos que ocurren fuera de la interfaz de chat.

Este artículo ha sido traducido con asistencia de inteligencia artificial. Para más información, consulte nuestros términos de uso.

Ver originales

Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.