По данным Beating, исследователь по пост-тренингу в OpenAI Пол Гарнье продемонстрировал, что Codex 5.5 способен генерировать интерпретируемый код управления, превосходя базовые подходы deep reinforcement learning в задачах гидродинамики. Вместо обучения нейросетей Гарнье использовал модель, чтобы итеративно дорабатывать Python-скрипты, анализируя физические симуляции, и добился более высокой эффективности чем в половине протестированных сценариев.
Сгенерированные ИИ правила управления были физически интерпретируемыми, например: «задерживать впрыск струи, когда локальная кривизна превышает порог». В отличие от «черных ящиков» нейросетей кодовый подход оказался устойчивым при сдвигах распределений; когда длительность тестов была увеличена в четыре раза, традиционные модели DRL разрушились, тогда как физически-информированный код сохранил стабильность. Внедрение полной стратегии управления потребовало 21,25 миллиона токенов, что в сумме составило менее $14.