Згідно з Beating, дослідник посттренінгу OpenAI Пол Гарньє (Paul Garnier) продемонстрував, що Codex 5.5 може генерувати інтерпретований контрольний код, який перевершує базові рівні глибокого підкріплювального навчання в задачах гідромеханіки. Замість тренування нейромереж Гарньє використав модель, щоб ітеративно вдосконалювати Python-скрипти, аналізуючи фізичні симуляції, і досяг кращої продуктивності більш ніж у половині протестованих сценаріїв.
Згенеровані ШІ правила керування були фізично інтерпретованими, наприклад: «затримувати впорскування струменя, коли локальна кривизна перевищує поріг». На відміну від чорних скриньок нейромереж, кодовий підхід виявився стійким до зсувів розподілу; коли тривалість тестів збільшили вчетверо, традиційні моделі DRL дали збій, тоді як фізично інформований код залишився стабільним. Впровадження повної стратегії керування використало 21,25 мільйона токенів, що загалом склало менше $14.