Codex перевершує DRL у керуванні рідинами з рукописним кодом, загальна вартість $14

Згідно з Beating, дослідник посттренінгу OpenAI Пол Гарньє (Paul Garnier) продемонстрував, що Codex 5.5 може генерувати інтерпретований контрольний код, який перевершує базові рівні глибокого підкріплювального навчання в задачах гідромеханіки. Замість тренування нейромереж Гарньє використав модель, щоб ітеративно вдосконалювати Python-скрипти, аналізуючи фізичні симуляції, і досяг кращої продуктивності більш ніж у половині протестованих сценаріїв.

Згенеровані ШІ правила керування були фізично інтерпретованими, наприклад: «затримувати впорскування струменя, коли локальна кривизна перевищує поріг». На відміну від чорних скриньок нейромереж, кодовий підхід виявився стійким до зсувів розподілу; коли тривалість тестів збільшили вчетверо, традиційні моделі DRL дали збій, тоді як фізично інформований код залишився стабільним. Впровадження повної стратегії керування використало 21,25 мільйона токенів, що загалом склало менше $14.

Застереження: інформація на цій сторінці може походити зі сторонніх джерел і надається виключно для ознайомлення. Вона не відображає позицію чи думку Gate і не є фінансовою, інвестиційною чи юридичною консультацією. Торгівля віртуальними активами пов’язана з високим ризиком. Будь ласка, не покладайтеся лише на інформацію з цієї сторінки під час прийняття рішень. Детальніше дивіться у Застереженні.
Прокоментувати
0/400
Немає коментарів