7 травня (за часом США) Google DeepMind опублікувала звіт про міждисциплінарні досягнення AlphaEvolve. Офіційний блог DeepMind підсумував конкретний прогрес AlphaEvolve з моменту його запуску: знайдено спосіб для множення 4×4 комплексних матриць, який кращий за алгоритм Страссена 1969 року (48 разів чистих скалярних множень), виконано спільну роботу з математиком Теренсом Тао та іншими дослідниками для розв’язання кількох математичних складних задач Ердіша (Ердős), оптимізовано роботу дата-центрів Google, що дало змогу заощадити 0,7% глобальних обчислювальних ресурсів, прискорено ключові kernel’и, задіяні в тренуванні Gemini, на 23%, а загальний час тренування Gemini зменшено на 1%.
Архітектура: еволюційний Agent із широтою пошуку Gemini Flash + глибиною оцінювання Gemini Pro
AlphaEvolve — це еволюційний агент для кодування, призначений для пошуку універсальних алгоритмів і оптимізації:
Gemini Flash — максимізація ширини ідей для дослідження
Gemini Pro — надання глибоких критичних рекомендацій
Автоматичний оцінювач — верифікація кожної кандидатної відповіді та надання зворотного зв’язку
Еволюційна рамка — постійна ітерація на основі відгуків оцінювання з збереженням найперспективніших рішень
Ця структура дозволяє AlphaEvolve без попередніх підказок від людей безперервно генерувати й тестувати розв’язання для відкритих задач, особливо для доменів, де «відповідь можна автоматично верифікувати» (алгоритми, математика, задачі оптимізації).
Математичні результати: оновлення рекорду для множення 4×4 матриць і перехід за межі 1969 року, а також розв’язання задач Ердіша разом із Теренсом Тао
AlphaEvolve досягла конкретного прогресу в математиці та комп’ютерних науках:
Множення 4×4 комплексних матриць: знайдено алгоритм, що потребує лише 48 разів чистих скалярних множень, і який перевершує найкращий результат, запропонований Страссеном у 1969 році
Співпраця з Теренсом Тао та іншими відомими математиками — спільне розв’язання кількох відкритих задач Ердіша (Ердős)
Алгоритм Страссена є одним із ключових довгострокових найкращих рішень для складності обчислень множення матриць; у цій задачі AlphaEvolve зламала рекорд, що тримався десятиліттями, — це конкретний приклад того, як «AI Agent знаходить нові розв’язання на математичній межі».
Досягнення в інфраструктурі: енергозбереження в дата-центрах Google та зниження похибки в квантових схемах у 10×
AlphaEvolve застосовували у власних системах Google:
Дата-центри: знайдено кращі методи планування задач, у середньому відновлення 0,7% глобальних обчислювальних ресурсів
Тренування Gemini: швидкість ключових kernel’ів зросла на 23%, а загальний час тренування зменшився на 1%
Квантова фізика: на квантовому процесорі Google Willow AlphaEvolve розробила квантову схему з похибкою, що в 10 разів нижча за традиційну найкращу оптимізаційну базову лінію, — завдяки цьому складне моделювання молекул можна виконувати на Willow
Оптимізація електромереж: частка здійсненних розв’язків задачі AC Optimal Power Flow із використанням моделей графових нейромереж (GNN) зросла з 14% до понад 88%
Геонауки: автоматизація моделі оптимізації Earth AI, а точність прогнозування ризиків природних катастроф підвищилася на 5%
Події, які можна буде відстежити надалі: чи AlphaEvolve згодом буде відкрито для зовнішніх дослідників як внутрішній інструмент Google, подальші прориви в серії задач Ердіша та прогрес комерціалізації AlphaEvolve в Google Cloud (DeepMind уже анонсувала відповідні інтеграції в дописі в блозі Google Cloud).
Ця стаття DeepMind про міждисциплінарні успіхи AlphaEvolve: множення 4×4 матриць оновлює рекорд Strassen 1969, а тренування Gemini пришвидшено на 1% вперше з’явилася в Cтілi новин ABMedia.
Пов'язані статті
SNS запускає MCP-протокол, який дає змогу AI-агентам керувати доменами .sol, 7 травня
Південна Корея запускає $8M фонд кібербезпеки для 50 компаній з використанням ШІ
OpenAI розширює пілот із рекламою ChatGPT на Південну Корею, Велике Британію, Японію, Бразилію та Мексику 7 травня
США і Китай готуються до запуску офіційного діалогу з безпеки ШІ, який очолять посадовці Мінфіну
RLWRLD випускає AI-модель RLDX-1 для промислових роботизованих рук
OpenAI Codex запускає розширення для Chrome: можна тестувати Web App у браузері, отримувати контекст між сторінками, працювати паралельно