Beating, OpenAI post-training investigador Paul Garnier demostró que Codex 5.5 puede generar código de control interpretable que supera los baselines de aprendizaje por refuerzo profundo en aplicaciones de mecánica de fluidos. En lugar de entrenar redes neuronales, Garnier utilizó el modelo para refinar iterativamente scripts de Python analizando simulaciones de física, logrando un rendimiento superior en más de la mitad de los escenarios probados.
Las reglas de control generadas por IA eran interpretables desde el punto de vista físico, como “retrasar la inyección de chorro cuando la curvatura local supera el umbral”. A diferencia de las cajas negras de redes neuronales, el enfoque basado en código demostró ser robusto ante cambios de distribución; cuando se extendió la duración de las pruebas cuatro veces, los modelos tradicionales de DRL colapsaron, mientras que el código informado por física se mantuvo estable. Implementar la estrategia de control completa consumió 21,25 millones de tokens, totalizando menos de 14 USD.