Кто-то создал открытый исходный код «Теоретический Мифос» для обратного проектирования самого опасного ИИ компании Anthropic

Вкратце

  • OpenMythos — это полностью с нуля восстановленная архитектура Claude Mythos, созданная только на основе публичных научных работ и предположений.
  • Claude Mythos — самая мощная модель Anthropic, скрытая в проекте Glasswing, потому что она самостоятельно обнаружила 271 уязвимость Firefox и 32-шаговые сетевые атаки.
  • Репозиторий — это теоретическая каркасная структура — код без обученных весов. Он отражает отдельное усилие Vidoc Security, которое воспроизвело обнаружение уязвимостей Mythos с помощью готовых моделей.

Если Anthropic не покажет вам, что внутри его самой опасной ИИ, кто-то на GitHub попробует догадаться. Разработчик по имени Кай Гомес опубликовал OpenMythos — открытую реконструкцию того, как он думает, выглядит Claude Mythos изнутри. Репозиторий за несколько недель после релиза набрал более 10 000 звезд на GitHub и содержит исчерпывающий файл «readme» с уравнениями, цитатами и вежливым отказом от связи с Anthropic. Это спекуляция. Но структурированная спекуляция — в коде. Вот краткое напоминание о том, что такое Mythos: Mythos просочился в публичное пространство в конце марта, когда Anthropic случайно опубликовал черновые материалы, описывающие его как самую мощную модель компании на сегодняшний день — выше Opus. Следующая версия, Mythos Preview, оказалась слишком хорошей для релиза в области кибербезопасности.

 По словам Anthropic, Mythos обнаружил 271 уязвимость в Firefox во время тестирования Mozilla. Он стал первой ИИ-моделью, которая завершила симуляцию атаки на корпоративную сеть из 32 шагов. Anthropic заперла его внутри проекта Glasswing, проверенной коалиции из около 40 партнеров, включая Microsoft, Apple, Amazon и NSA. Публично к нему доступа нет. Поэтому Гомес попытался понять, как он работает. Основная гипотеза OpenMythos — что Mythos является рекуррентным-глубоким трансформером — также называемым циклическим трансформером. Стандартные модели состоят из сотен уникальных слоёв. Циклические модели используют меньший стек и многократно пропускают его через себя за один проход.

Другими словами, одни и те же веса проходят через большее число итераций. Глубокое мышление в непрерывном латентном пространстве, прежде чем будет сгенерирован любой токен. Репозиторий утверждает, что это объясняет две самые странные особенности Mythos: он рассуждает о новых проблемах, которые не может решить ни одна другая модель, но его память неравномерна. Это архитектурный отпечаток цикличности — композиция вместо хранения. OpenMythos ссылается на Parcae, статью за апрель 2026 года из Калифорнийского университета Сан-Диего и Together AI, которая решила проблему нестабильности в циклических моделях — модель Parcae с 770 миллионами параметров по качеству сопоставима с фиксированным трансформером с 1,3 миллиардами параметров, с предсказуемыми законами масштабирования в зависимости от количества циклов. Также в репозитории используется Multi-Latent Attention DeepSeek для сжатия памяти и схема Mixture-of-Experts для охвата широкого спектра доменов. Чего у него нет — так это весов, то есть по сути это техника без исполнителя. OpenMythos — теоретический проект. Код определяет варианты модели от 1 миллиарда до 1 триллиона параметров, но их нужно обучать самостоятельно — в файле «readme» указана программа обучения для 3 миллиардов параметров на FineWeb-Edu и целевая задача с 30 миллиардами токенов, скорректированная под Chinchilla, что требует сотен тысяч долларов на H100. Никто пока этого не делал. Почему это важно? Потому что это уже второй случай за месяц, когда кто-то пытается проломить стену вокруг Mythos. Первый — исследование Vidoc Security, которое воспроизвело несколько самых тревожных уязвимостей Mythos, используя GPT-5.4 и Claude Opus 4.6 внутри открытого агента. Без доступа к Glasswing, за менее чем 30 долларов за скан. Другой угол зрения, тот же вывод: оборона вокруг Mythos может быть тоньше, чем рекламировали. OpenMythos и реплика Vidoc выполняют разные задачи. Vidoc воспроизвел выводы Mythos — сами уязвимости — с помощью существующих моделей. OpenMythos пытается воспроизвести архитектуру — реальную машину, которая эти выводы производит. Один говорит, что вам не нужно Mythos, чтобы найти уязвимости, которые он обнаружил. Другой — что со временем вы сможете создать что-то вроде Mythos самостоятельно.

Anthropic почти наверняка не делится гипотезами Гомеса о архитектуре публично, и многие из решений в OpenMythos — явные оговорки — «readme» старается быть достаточно расплывчатым, чтобы пользователи понимали, что это всего лишь подход. Он неоднократно использует слова «вероятно», «подозревается» и «почти наверняка». Настоящий Mythos может вовсе не быть циклическим трансформером. Или он может иметь детали, которые Гомес еще не обратил. Что демонстрирует OpenMythos — так это то, что большая часть исследовательской литературы уже содержит большинство компонентов. Циклические трансформеры, Mixture of Experts, Multi-Latent Attention, Adaptive Computation Time, исправление стабильности Parcae — ничего из этого не является собственностью. Репозиторий — это, скорее, инвентаризация того, что публично известно о создании модели уровня Mythos. Лицензия — MIT, и у него уже 2700 форков. Скрипт обучения лежит там, ожидая кого-то с кластером GPU и диссертацией, чтобы доказать свою теорию.

Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
Добавить комментарий
Добавить комментарий
Нет комментариев
  • Закрепить