腾讯 AI 首席姚顺宇在 6 月 5 日的会议上为开发进度辩护

腾讯首席 AI 科学家姚舜禹于 6 月 5 日在腾讯云 AI 产业应用大会上首次公开亮相。在会上,他介绍了公司的混元 3 大语言模型,并回应了“腾讯在 AI 发展方面落后了”的批评。姚舜禹从 OpenAI 加入腾讯,领导混元 模型团队,他与腾讯高级执行副总裁唐道生展开对话,内容涵盖 AI 模型战略、产品开发,以及智能体的未来。这位 28 岁科学家通过将 AI 竞争描述为“马拉松而非冲刺”来回应外部质疑,他表示,世界不能仅仅依赖 ChatGPT 作为单一占主导地位的应用。

姚舜禹详述混元 3 开发路径

姚在会谈对话中介绍了混元 3 的三项核心改进。“其实没有什么秘密。今天做大模型在某种程度上是一项比较繁琐的工作。我们应该把基础设施做对,把数据做对——算法部分相对简单,”姚表示。改进包括为预训练和强化学习重建整套基础设施,更加全面升级数据与评测体系,强调界定真实问题并提升数据质量,以及在招聘、模型开发节奏和权衡取舍等方面做“品味驱动”的决策。

姚在博士研究期间提出了 ReAct 架构,他强调模型开发中许多决策是“品味驱动”的,而不是基于公式的。“很多决策其实是非常品味驱动的,”他在对话中多次重复。2019 年他从博士论文中提出的题为“From Next Token Prediction to Digital Automation(从下一个 Token 预测到数字自动化)”的研究,探讨了 GPT-2 时代的语言智能体。“当时还是 GPT-2 时代,甚至连连续段落都生成不了——还有很多粗糙的地方,”姚回忆道。“但我当时觉得 GPT 是一件非常优雅的事情,输出下一个 token 是一项极其简单、但又非常通用的任务。我相信有一天它不仅能输出下一个 token,还能把这个世界的一切自动化。”

姚指出,编码智能体是最关键的一类智能体形式,因为它们是图灵完备的。他概述了腾讯在智能体开发方面的三段式策略:强调系统的整体性设计、充分利用从产品线回流的数据,以及保持足够的想象力用于探索。在模型开发策略方面,姚分享了三个方向:尽管编码变成了最重要的主线,但仍要保持完整的数据体系;通过协同设计经验利用产品线反馈数据;并探索技术与产品演进中的下一代范式。

谈及成本效能的权衡,姚表示“性能是成本效益的前提”。“很多人会发现,使用一个强模型比使用一个差模型更便宜,因为它能更快把事情做对,”他解释道。他还认为,用相对更小的模型实现强性能,并在大多数任务上保持稳健性能,“在今天的中国可能更有价值”。

腾讯定义 AGI 的组织要求

姚在去年一篇博客文章中提出“AI 的下半场”的概念,这个说法如今在业界被广泛使用。他解释该概念的核心在于一个根本性转变:过去几十年 AI 发展侧重“找方法”,而如今方法论已经成熟,“找好问题”变得更难。“以前我们发明了像 AlphaGo 这样的方式去下围棋,但它只能下棋。我们做了一个专门用于翻译的模型,但它只能做翻译。但是有了预训练和后训练,我们现在有了一个通用大锤,可以敲任何钉子,”姚解释道。“更难的其实是找到要解决的好问题。”

姚表示,腾讯庞大的产品矩阵和场景为 AI 技术提供了真实的问题来源,这是他加入腾讯的第二个原因。他认为文化是自己的首要动力。“我第一次和唐总以及其他高管领导交流时,我的第一印象是大家对于我们做得好的、以及没做得好的地方都非常诚实——非常直截了当,没有掩盖什么,”姚说。“腾讯整体是基于信任来运转的,而不是基于指标。这种坦诚、低自我、务实的文化,再加上对长期主义的承诺,对打造一个长期的 AI 组织至关重要。”

据姚所言,AI 下半场最重要的任务是在中国建立一个基于长期 AGI 的组织。这个组织需要构建一个“均衡三角形”:扎实的基础技术、创造价值的产品,以及面向前沿探索的精神。

姚与唐在大会上回应节奏质疑

姚在对话中表示,AI 是一场长期博弈,而下半场才刚开始。“我不认为 ChatGPT 和 Claude Code 会是唯一的超级应用——那将是一个非常黯淡的世界。今天就像 1970 年代 PC 刚出现的时候——还有很多很多事情要做,”姚说。他预测未来会更加多元而不是更单一,并指出“编码智能体才刚刚开始,多模态、具身智能——很多很多新的东西才刚刚开始发生。”

“过去,模型和产品经历了大量探索,也走了很多弯路。我认为这很正常,”姚表示。“更重要的是我们能否诚实地面对自己,能否做到真实,能否看到反馈并进行改变,同时保持耐心。这才是下半场最重要的事情。”

唐道生表示,腾讯欢迎外界的批评和建议。“我们是一家业务形态非常多元的公司。有时候我们可能会快,有时候慢,我们也会在某些方面失败。但这是一场马拉松,我们相信模型会持续迭代,用户需求会不断变化,新的产品形态也会不断涌现,”唐说。

FAQ

姚舜禹在 6 月 5 日的腾讯大会上宣布了什么?

6 月 5 日在腾讯云 AI 产业应用大会上,腾讯首席 AI 科学家姚舜禹讨论了混元 3 大语言模型的开发路径。他详细介绍了三项核心改进:为预训练和强化学习重建基础设施、升级数据与评测体系,以及在招聘与模型开发中落实“品味驱动”的决策。姚还通过将竞争描述为“马拉松而非冲刺”来回应外界对腾讯 AI 发展节奏的质疑。

姚舜禹为什么从 OpenAI 加入腾讯?

姚在对话中表示,文化是他加入腾讯的首要原因。他描述自己对腾讯领导层的第一印象是“非常诚实”,并且是“直截了当,没有掩盖什么”。姚解释,腾讯基于信任而非指标运转,拥有“坦诚、低自我、务实的文化”,并且坚持长期主义——他认为这对打造长期的 AI 组织至关重要。他的第二个原因是腾讯庞大的产品矩阵,为 AI 技术开发提供了真实的问题来源。

免责声明:本页面信息可能来自第三方,仅供参考,不代表 Gate 的观点或意见,亦不构成任何财务、投资或法律建议。数字资产交易风险较高,请勿仅依赖本页面信息作出决策。具体内容详见声明
评论
0/400
暂无评论