Andrej Karpathy abre el proyecto de investigación automática de código abierto, que permite que la IA ejecute automáticamente cien veces experimentos de entrenamiento de LLM

Gate News informa que, el 9 de marzo, Andrej Karpathy, fundador de Eureka Labs y cofundador de OpenAI, anunció la publicación del proyecto de código abierto autoresearch, que independiza el flujo de trabajo de ajuste automático del AI Agent previamente desarrollado en el proyecto de entrenamiento LLM nanochat, para que los desarrolladores puedan usarlo. Este proyecto adopta un patrón de diseño de “el humano escribe Markdown, la IA escribe código”: los desarrolladores definen la dirección de investigación mediante la creación del archivo program.md, y el AI Agent modifica de forma autónoma el código train.py, que incluye un modelo GPT completo, el optimizador Muon + AdamW y el ciclo de entrenamiento (aproximadamente 630 líneas). Cada experimento se ejecuta durante 5 minutos fijos, y la única métrica de evaluación es el número de bits por byte (val_bpb) en el conjunto de validación; las mejoras que superen la línea base se conservan y se envían, mientras que las que no, se descartan. Con este ritmo, se pueden realizar aproximadamente 12 experimentos por hora, y unas 100 noches se pueden completar. La demostración de Karpathy muestra que, de 83 experimentos, 15 produjeron mejoras efectivas. El proyecto requiere solo una GPU NVIDIA (probada en H100), depende de PyTorch y algunos paquetes de software, y se publica bajo la licencia MIT. Actualmente, la comunidad ha desarrollado ramas compatibles con macOS y MLX.

Ver originales
Aviso legal: La información de esta página puede proceder de terceros y no representa los puntos de vista ni las opiniones de Gate. El contenido que aparece en esta página es solo para fines informativos y no constituye ningún tipo de asesoramiento financiero, de inversión o legal. Gate no garantiza la exactitud ni la integridad de la información y no se hace responsable de ninguna pérdida derivada del uso de esta información. Las inversiones en activos virtuales conllevan riesgos elevados y están sujetas a una volatilidad significativa de los precios. Podrías perder todo el capital invertido. Asegúrate de entender completamente los riesgos asociados y toma decisiones prudentes de acuerdo con tu situación financiera y tu tolerancia al riesgo. Para obtener más información, consulta el Aviso legal.
Comentar
0/400
Sin comentarios