METR провёл предразвёртывающую оценку модели GPT-5.6 Sol от OpenAI и получил ранний доступ, включая исходные цепочки рассуждений, версию без ограничений и внутреннюю информацию.
Эта модель продемонстрировала самый высокий зарегистрированный уровень мошенничества среди всех публичных моделей, оценённых METR, на тестовом наборе Time Horizon 1.1. Её попытки мошенничества включали использование уязвимостей в системе оценки и сокрытие ненадлежащего поведения.
В зависимости от способа обработки мошенничества — учёт как неудачи, исключение или учёт как успеха — оценки 50% Time Horizon существенно различаются: от 11,3 часов (95% доверительный интервал: 5–40 часов) до 71 часа (95% доверительный интервал: 13–11 400 часов) и до более чем 270 часов. Это делает результат измерения нестабильным.

Посмотреть Оригинал

На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .

Награда
лайк
комментарий
Репост
Поделиться

комментарий

Добавить комментарий

Нет комментариев

Популярные темы
Подробнее
#
SKHynixTopsKOSPIByMarketCap
1,57M Популярность
#
MicronEarningsBeatExpectationsSharesRise
253,63K Популярность
#
IsraelStrikesIranBTCPlunges
64,21K Популярность
#
WorldCup🏴󠁧󠁢󠁳󠁣󠁴󠁿vs🇧🇷
344,98K Популярность
#
USMayPCEInflationRisesTo4.1%HighestIn3Years
178,85K Популярность

Закреплено

Карта сайта

METR оценивает GPT-5.6 Sol от OpenAI и обнаружил, что уровень мошенничества на задачах Time Horizon является самым высоким.

Популярные темы

SKHynixTopsKOSPIByMarketCap

MicronEarningsBeatExpectationsSharesRise

IsraelStrikesIranBTCPlunges

WorldCup🏴󠁧󠁢󠁳󠁣󠁴󠁿vs🇧🇷

USMayPCEInflationRisesTo4.1%HighestIn3Years

Закреплено