O Codex supera o DRL no controlo de fluidez com código escrito à mão, com um custo total de 14 dólares

De acordo com Beating, o investigador de pós-treino da OpenAI Paul Garnier demonstrou que o Codex 5.5 consegue gerar código de controlo interpretável, superando baselines de aprendizagem por reforço profundo em aplicações de mecânica dos fluidos. Em vez de treinar redes neuronais, Garnier usou o modelo para refinar iterativamente scripts em Python, analisando simulações de física, alcançando um desempenho superior em mais de metade dos cenários testados.

As regras de controlo geradas por IA eram fisicamente interpretáveis, como “adiar a injecção de jacto quando a curvatura local excede o limiar”. Ao contrário das black boxes de redes neuronais, a abordagem baseada em código revelou-se robusta face a mudanças de distribuição; quando a duração do teste foi estendida em quatro vezes, os modelos DRL tradicionais colapsaram enquanto o código, informado pela física, se manteve estável. Implementar a estratégia de controlo completa consumiu 21,25 milhões de tokens, num total inferior a 14$.

Aviso legal: As informações contidas nesta página podem provir de fontes externas e têm caráter meramente informativo. Não refletem os pontos de vista nem as opiniões da Gate e não constituem qualquer tipo de aconselhamento financeiro, de investimento ou jurídico. A negociação de ativos virtuais envolve um risco elevado. Não se baseie exclusivamente nas informações contidas nesta página ao tomar decisões. Para mais detalhes, consulte o Aviso legal.
Comentar
0/400
Nenhum comentário