Gate 新闻简报,4月29日——蚂蚁集团的 Ling-2.6-flash 模型权重现已开源;此前这些权重仅通过 API 提供。该模型总参数量为 1040 亿,单次推理激活为 74 亿,拥有 256K 上下文窗口,并采用 MIT 许可。提供 BF16、FP8 和 INT4 精度版本,现已在 HuggingFace 与 ModelScope 上提供。
Ling-2.6-flash 相较 Ling 2.0 引入了混合线性注意力改进:将原始的 GQA 升级为 1:7 MLA,并结合 Lightning Linear 的混合架构,同时配合高度稀疏的 MoE。推理效率显著超过同类模型:在 4x H20 GPU 上,峰值生成速度达到 340 tokens/s;在可比的开源模型上,prefill 与 decode 的吞吐量约高出 4 倍。与智能体相关的基准测试显示出强劲表现:BFCL-V4、TAU2-bench、SWE-bench Verified (61.2%)、Claw-Eval 以及 PinchBench 达到或接近 SOTA 水平。在完整的 Artificial Analysis 基准测试套件中,总 token 消耗仅为 1500 万。在 AIME 2026 上,该模型得分为 73.85%。
蚂蚁集团的官方网站同样列出了 Ling-2.6-1T ( 万亿参数旗舰版本 ) 以及 Ling-2.6-mini ( 轻量版本 );不过截至发布,权重仍未在 HuggingFace 上发布,当前仅提供 flash 系列下载。
免责声明:本页面信息可能来自第三方,不代表 Gate 的观点或意见。页面显示的内容仅供参考,不构成任何财务、投资或法律建议。Gate 对信息的准确性、完整性不作保证,对因使用本信息而产生的任何损失不承担责任。虚拟资产投资属高风险行为,价格波动剧烈,您可能损失全部投资本金。请充分了解相关风险,并根据自身财务状况和风险承受能力谨慎决策。具体内容详见
声明。
相关文章
xAI 推出 Grok 定制语音,让用户在一分钟内克隆自己的 AI 语音
据 Beating,xAI 发布了 Grok Custom Voices 和 Voice Library,允许用户在 xAI 控制台录制一分钟音频,以生成一个自定义的 voice_id,用于 Grok TTS 和 Voice Agent API。该功能支持包括客服代理、内容创作在内的应用,
GateNews55 分钟前
HBM 后 AI 存储器瓶颈是 HBF?图灵奖得主 David Patterson:推理将重新定义存储架构
图灵奖得主 David Patterson 指出,随着 AI 从训练走向大规模推理,下一波内存瓶颈可能不是 HBM,而是 HBF(高带宽快闪存储器)。HBF 将 NAND Flash 堆叠提供大容量、低功耗,负责推理中的上下文与中间数据存取,与以速度为核心的 HBM 分工不同。SK 海力士与 SanDisk 正推动标准化,预计 2038 年 HBF 的需求可能超越 HBM。
鏈新聞abmedia1小时前
Anthropic 使用 Claude 的开发者大会 5/6 旧金山开幕:直播免费注册
Anthropic 5 月 1 日宣布首屆「Code with Claude」开发者大会將於 5 月 6 日舊金山开幕,並首次擴大至倫敦(5/19)与东京(6/10)三城巡迴。三场主场会议的现地名額採抽籤制、皆已抽选完畢,但直播註冊仍对所有人开放。为回应现地需求超載,舊金山场另加开 5/7「Extended」场次,專为獨立开发者与早期階段創辦人设计。
三场巡迴:5/6 舊金山、5/19 倫敦、6/10 东京
Code with Claude 是 Anthropic 主辦的开发者大会,舊金山主场已是第二次舉辦。3 场活动內容相同:一整天的现场工作坊、最新功能 demo、与 Claude 各條
鏈新聞abmedia1小时前
OpenAI 公布 GPT-5.5 上线一周数据:API 营收增速创新高、Codex 翻倍
OpenAI 5 月 1 日于官方账号公布 GPT-5.5 上线一周后的 3 项数据:自评为「历代最强发表」、API 营收成长速度为过去任何一次模型发表的 2 倍以上、Codex 在不到 7 天内营收翻倍。OpenAI 将原因归为企业端对 agentic coding(代理式編码)工具需求持续攀升,与 4 月 30 日 GPT-5.5-Cyber 同期应战 Anthropic Mythos 形成同一波产品节奏。
3 项自公布数据:API 营收倍速、Codex 7 天翻倍、最强发表
OpenAI 此次公布的 3 个关键数字来自官方推文,未附详细财报:第一,GPT-5.5 是「历代营收成长最強」的模
鏈新聞abmedia1小时前
美国众议院外交事务委员会在《MATCH 法案》通过后 36-8 就 AI 出口管制与科技巨头会面
根据 Beating,美国众议院外交事务委员会成员下周将前往硅谷,向来自 Google、Anthropic、Meta、Tesla、Intel、Applied Materials 和 Nvidia 的代表进行会面,以讨论人工智能与出口管制。一个产业圆桌会议是
GateNews2小时前
OpenAI 推出 Codex Pets,具备定制生成的 AI 驱动虚拟伴侣
据 Beating 称,OpenAI 已为 Codex 桌面应用添加了一项名为“Codex Pets”的新功能,允许用户生成并与一只动画虚拟伴侣互动。用户可以在编辑器中输入 /pet 来激活宠物。该功能作为代理状态指示器运行,用于显示一项
GateNews2小时前