Згідно з Beating, дослідник посттренінгу OpenAI Пол Гарньє (Paul Garnier) продемонстрував, що Codex 5.5 може генерувати інтерпретований контрольний код, який перевершує базові рівні глибокого підкріплювального навчання в задачах гідромеханіки. Замість тренування нейромереж Гарньє використав модель, щоб ітеративно вдосконалювати Python-скрипти, аналізуючи фізичні симуляції, і досяг кращої продуктивності більш ніж у половині протестованих сценаріїв.

Згенеровані ШІ правила керування були фізично інтерпретованими, наприклад: «затримувати впорскування струменя, коли локальна кривизна перевищує поріг». На відміну від чорних скриньок нейромереж, кодовий підхід виявився стійким до зсувів розподілу; коли тривалість тестів збільшили вчетверо, традиційні моделі DRL дали збій, тоді як фізично інформований код залишився стабільним. Впровадження повної стратегії керування використало 21,25 мільйона токенів, що загалом склало менше $14.

Переглянути джерело

Застереження: інформація на цій сторінці може походити зі сторонніх джерел і надається виключно для ознайомлення. Вона не відображає позицію чи думку Gate і не є фінансовою, інвестиційною чи юридичною консультацією. Торгівля віртуальними активами пов’язана з високим ризиком. Будь ласка, не покладайтеся лише на інформацію з цієї сторінки під час прийняття рішень. Детальніше дивіться у Застереженні.

Пов’язані новини

1год тому

ByteDance відкриває вихідний код мультимодальної моделі 3B Lance, навченої на 128 GPU A100

4год тому

Sapient відкриває вихідний код моделі HRM-Text з 1 млрд параметрів; досягає вартості навчання $1,472 за 46 годин

5год тому

Федеральна резервна система: 25% працівників у США використовували генеративний ШІ на роботі за останній місяць

5год тому

Звіт SHED Федеральної резервної системи за 2025 рік: 25% працівників використовують ШІ, використання криптовалют зростає до 10%

5год тому

SemiAnalysis тестує AI-агенти: 20 годин роботи коштують лише $21,33, окупність сягає 93,8x

Поглиблений аналіз