De acordo com Beating, o investigador de pós-treino da OpenAI Paul Garnier demonstrou que o Codex 5.5 consegue gerar código de controlo interpretável, superando baselines de aprendizagem por reforço profundo em aplicações de mecânica dos fluidos. Em vez de treinar redes neuronais, Garnier usou o modelo para refinar iterativamente scripts em Python, analisando simulações de física, alcançando um desempenho superior em mais de metade dos cenários testados.
As regras de controlo geradas por IA eram fisicamente interpretáveis, como “adiar a injecção de jacto quando a curvatura local excede o limiar”. Ao contrário das black boxes de redes neuronais, a abordagem baseada em código revelou-se robusta face a mudanças de distribuição; quando a duração do teste foi estendida em quatro vezes, os modelos DRL tradicionais colapsaram enquanto o código, informado pela física, se manteve estável. Implementar a estratégia de controlo completa consumiu 21,25 milhões de tokens, num total inferior a 14$.