DeepMind AlphaEvolve 跨领域战绩:4×4 矩阵乘法刷新 Strassen 1969 纪录、Gemini 训练快 1%

鏈新聞abmedia

Google DeepMind 5 月 7 日(美国时间)发布 AlphaEvolve 跨领域成果报告。DeepMind 官方部落格整理 AlphaEvolve 自推出以来的具體进展:找到比 Strassen 1969 演算法更好的 4×4 複數矩陣乘法方法(48 次純量乘法)、与陶哲軒(Terence Tao)等數学家合作解決多个 Erdős(艾狄胥)數学难題、为 Google 资料中心節省 0.7% 全球运算资源、把 Gemini 訓練的关鍵 kernel 速度提升 23%、整體 Gemini 訓練时间減少 1%。

架構:Gemini Flash 廣度探索 + Gemini Pro 深度評估的演化式 Agent

AlphaEvolve 是一个演化式編碼 Agent、设计用於通用演算法发现与最佳化:

Gemini Flash—最大化探索想法的廣度

Gemini Pro—提供深度的批判性建议

自动評估器—验证每个候选答案、並提供回饋

演化框架—基於評估回饋持续迭代、保留最有前景的解

这个結構让 AlphaEvolve 能在沒有人類预先指引的情況下、針对开放问題持续产生与測試解、适合「答案可被自动验证」的领域(演算法、數学、最佳化问題)。

數学成果:4×4 矩陣乘法刷新 1969 年紀錄、与陶哲軒合作解 Erdős 问題

AlphaEvolve 在數学与电腦科学的具體进展:

4×4 複數值矩陣乘法:找到只需 48 次純量乘法的演算法、勝过 Strassen 1969 年提出的最佳結果

与陶哲軒等知名數学家合作、共同解決多个 Erdős(艾狄胥)开放问題

Strassen 演算法是矩陣乘法计算複雜度的长期最佳解之一、AlphaEvolve 在此案打破數十年紀錄、是「AI Agent 在數学边界上找到新解」的具體案例。

基礎设施成果:Google 资料中心節能、量子电路誤差降 10×

AlphaEvolve 在 Google 自家系统中的应用:

资料中心:找到更好的任務排程方法、平均回收 0.7% 全球运算资源

Gemini 訓練:关鍵 kernel 速度提升 23%、整體訓練时间減少 1%

量子物理:在 Google Willow 量子處理器上、AlphaEvolve 设计的量子电路誤差较傳统最佳化基線低 10 倍、让複雜分子模擬可在 Willow 上執行

电力網最佳化:將圖神经網路(GNN)模型解 AC Optimal Power Flow 问題的可行解比例从 14% 提升到 88% 以上

地球科学:自动化最佳化 Earth AI 模型、自然災害风险预測準確度提升 5%

后续可追蹤的具體事件:AlphaEvolve 是否从 Google 內部工具开放給外部研究者使用、Erdős 系列问題的后续突破、以及 AlphaEvolve 在 Google Cloud 的商业化进度(DeepMind 已在 Google Cloud 部落格预告相关整合)。

这篇文章 DeepMind AlphaEvolve 跨领域戰績:4×4 矩陣乘法刷新 Strassen 1969 紀錄、Gemini 訓練快 1% 最早出现於 链新聞 ABMedia。

免责声明:本页面信息可能来自第三方,不代表 Gate 的观点或意见。页面显示的内容仅供参考,不构成任何财务、投资或法律建议。Gate 对信息的准确性、完整性不作保证,对因使用本信息而产生的任何损失不承担责任。虚拟资产投资属高风险行为,价格波动剧烈,您可能损失全部投资本金。请充分了解相关风险,并根据自身财务状况和风险承受能力谨慎决策。具体内容详见声明

相关文章

SNS 于 5 月 7 日推出 MCP 协议,使 AI 代理能够管理 .sol 域名

根据 SNS 于 2026 年 5 月 7 日的官方公告,SNS MCP(模型上下文协议)已上线,使 AI 代理能够通过对话交互发现、注册和管理 Solana 上的 .sol 域名。用户现在可以将兼容的 AI 平台(如 Claude AI 和 OpenClaw)连接到

GateNews14 分钟前

韩国为 50 家公司推出 $8M AI 网络安全基金

据朝鲜日报称,韩国科学与信息通信部以及韩国互联网与安全机构将向 2026 年信息安全新技术支持项目投资 120 亿韩元(830 万美元)。该项目旨在支持 50 家公司开展 18 项 AI 安全任务

Crypto Frontier15 分钟前

OpenAI 于 5 月 7 日将 ChatGPT 广告试点扩展至韩国、英国、日本、巴西和墨西哥

据《韩国时报》报道,OpenAI 于 5 月 7 日宣布,将把其 ChatGPT 广告试点扩展至韩国、英国、日本、巴西和墨西哥,以便在其最初市场(美国、加拿大、澳大利亚和新西兰)之外实现对免费用户的变现。 该测试将面向 Free 和 Go 计划中的成年用户,

GateNews15 分钟前

美国和中国将启动官方 AI 安全对话,由财政部官员牵头

据报道称,美国和中国正准备启动一场官方 AI 安全对话,旨在为其技术竞争建立危机管理机制。美国代表团将由财政部长 Scott Bessent 率领,而中国将由副

GateNews45 分钟前

RLWRLD 发布用于工业机械手的 RLDX-1 AI 模型

RLWRLD,LG Electronics 支持的机器人 AI 初创公司,依据 RLWRLD 的说法发布了 RLDX-1,这是一种面向工业应用中五指机械手的基础模型。该公司已在 GitHub 和 Hugging Face 上发布了该模型的权重、代码和技术文档。 模型

Crypto Frontier1小时前

OpenAI Codex 推出 Chrome 擴充:可在瀏覽器中測試 Web 应用程序、跨页面获取上下文、并行运行

OpenAI 于 5 月 7 日(美国时间)公布 Codex 的 Chrome 扩充功能,让 Codex 编码 Agent 可直接在 macOS 与 Windows 的 Chrome 浏览器内运行。OpenAI Codex 官方文件说明,该扩充功能使 Codex 在不接管用户浏览器的情况下,测试 web app、跨多个分頁获取 context、使用 Chrome DevTools,并与其他工作并行进行。OpenAI 同时公布 Codex 周活跃用户超过 400 万,较年初增长 8 倍。 浏览器内可做的事:测试 web app、跨页取 context、用 DevTools Chrome 扩充功能

鏈新聞abmedia1小时前
评论
0/400
暂无评论