Codex supera a DRL en control fluido con código manuscrito, costo total de 14 USD

Beating, OpenAI post-training investigador Paul Garnier demostró que Codex 5.5 puede generar código de control interpretable que supera los baselines de aprendizaje por refuerzo profundo en aplicaciones de mecánica de fluidos. En lugar de entrenar redes neuronales, Garnier utilizó el modelo para refinar iterativamente scripts de Python analizando simulaciones de física, logrando un rendimiento superior en más de la mitad de los escenarios probados.

Las reglas de control generadas por IA eran interpretables desde el punto de vista físico, como “retrasar la inyección de chorro cuando la curvatura local supera el umbral”. A diferencia de las cajas negras de redes neuronales, el enfoque basado en código demostró ser robusto ante cambios de distribución; cuando se extendió la duración de las pruebas cuatro veces, los modelos tradicionales de DRL colapsaron, mientras que el código informado por física se mantuvo estable. Implementar la estrategia de control completa consumió 21,25 millones de tokens, totalizando menos de 14 USD.

Aviso legal: La información en esta página puede provenir de fuentes de terceros y es solo para referencia. No representa las opiniones ni puntos de vista de Gate y no constituye asesoramiento financiero, de inversión ni legal. El comercio de activos virtuales implica un alto riesgo. No te bases únicamente en la información presentada en esta página para tomar decisiones. Para más detalles, consulta el Aviso legal.
Comentar
0/400
Sin comentarios