腾讯首席 AI 科学家姚舜禹于 6 月 5 日在腾讯云 AI 产业应用大会上首次公开亮相。在会上，他介绍了公司的混元 3 大语言模型，并回应了“腾讯在 AI 发展方面落后了”的批评。姚舜禹从 OpenAI 加入腾讯，领导混元模型团队，他与腾讯高级执行副总裁唐道生展开对话，内容涵盖 AI 模型战略、产品开发，以及智能体的未来。这位 28 岁科学家通过将 AI 竞争描述为“马拉松而非冲刺”来回应外部质疑，他表示，世界不能仅仅依赖 ChatGPT 作为单一占主导地位的应用。

姚舜禹详述混元 3 开发路径

姚在会谈对话中介绍了混元 3 的三项核心改进。“其实没有什么秘密。今天做大模型在某种程度上是一项比较繁琐的工作。我们应该把基础设施做对，把数据做对——算法部分相对简单，”姚表示。改进包括为预训练和强化学习重建整套基础设施，更加全面升级数据与评测体系，强调界定真实问题并提升数据质量，以及在招聘、模型开发节奏和权衡取舍等方面做“品味驱动”的决策。

姚在博士研究期间提出了 ReAct 架构，他强调模型开发中许多决策是“品味驱动”的，而不是基于公式的。“很多决策其实是非常品味驱动的，”他在对话中多次重复。2019 年他从博士论文中提出的题为“From Next Token Prediction to Digital Automation（从下一个 Token 预测到数字自动化）”的研究，探讨了 GPT-2 时代的语言智能体。“当时还是 GPT-2 时代，甚至连连续段落都生成不了——还有很多粗糙的地方，”姚回忆道。“但我当时觉得 GPT 是一件非常优雅的事情，输出下一个 token 是一项极其简单、但又非常通用的任务。我相信有一天它不仅能输出下一个 token，还能把这个世界的一切自动化。”

姚指出，编码智能体是最关键的一类智能体形式，因为它们是图灵完备的。他概述了腾讯在智能体开发方面的三段式策略：强调系统的整体性设计、充分利用从产品线回流的数据，以及保持足够的想象力用于探索。在模型开发策略方面，姚分享了三个方向：尽管编码变成了最重要的主线，但仍要保持完整的数据体系；通过协同设计经验利用产品线反馈数据；并探索技术与产品演进中的下一代范式。

谈及成本效能的权衡，姚表示“性能是成本效益的前提”。“很多人会发现，使用一个强模型比使用一个差模型更便宜，因为它能更快把事情做对，”他解释道。他还认为，用相对更小的模型实现强性能，并在大多数任务上保持稳健性能，“在今天的中国可能更有价值”。

腾讯定义 AGI 的组织要求

姚在去年一篇博客文章中提出“AI 的下半场”的概念，这个说法如今在业界被广泛使用。他解释该概念的核心在于一个根本性转变：过去几十年 AI 发展侧重“找方法”，而如今方法论已经成熟，“找好问题”变得更难。“以前我们发明了像 AlphaGo 这样的方式去下围棋，但它只能下棋。我们做了一个专门用于翻译的模型，但它只能做翻译。但是有了预训练和后训练，我们现在有了一个通用大锤，可以敲任何钉子，”姚解释道。“更难的其实是找到要解决的好问题。”

姚表示，腾讯庞大的产品矩阵和场景为 AI 技术提供了真实的问题来源，这是他加入腾讯的第二个原因。他认为文化是自己的首要动力。“我第一次和唐总以及其他高管领导交流时，我的第一印象是大家对于我们做得好的、以及没做得好的地方都非常诚实——非常直截了当，没有掩盖什么，”姚说。“腾讯整体是基于信任来运转的，而不是基于指标。这种坦诚、低自我、务实的文化，再加上对长期主义的承诺，对打造一个长期的 AI 组织至关重要。”

据姚所言，AI 下半场最重要的任务是在中国建立一个基于长期 AGI 的组织。这个组织需要构建一个“均衡三角形”：扎实的基础技术、创造价值的产品，以及面向前沿探索的精神。

姚与唐在大会上回应节奏质疑

姚在对话中表示，AI 是一场长期博弈，而下半场才刚开始。“我不认为 ChatGPT 和 Claude Code 会是唯一的超级应用——那将是一个非常黯淡的世界。今天就像 1970 年代 PC 刚出现的时候——还有很多很多事情要做，”姚说。他预测未来会更加多元而不是更单一，并指出“编码智能体才刚刚开始，多模态、具身智能——很多很多新的东西才刚刚开始发生。”

“过去，模型和产品经历了大量探索，也走了很多弯路。我认为这很正常，”姚表示。“更重要的是我们能否诚实地面对自己，能否做到真实，能否看到反馈并进行改变，同时保持耐心。这才是下半场最重要的事情。”

唐道生表示，腾讯欢迎外界的批评和建议。“我们是一家业务形态非常多元的公司。有时候我们可能会快，有时候慢，我们也会在某些方面失败。但这是一场马拉松，我们相信模型会持续迭代，用户需求会不断变化，新的产品形态也会不断涌现，”唐说。

FAQ

姚舜禹在 6 月 5 日的腾讯大会上宣布了什么？

6 月 5 日在腾讯云 AI 产业应用大会上，腾讯首席 AI 科学家姚舜禹讨论了混元 3 大语言模型的开发路径。他详细介绍了三项核心改进：为预训练和强化学习重建基础设施、升级数据与评测体系，以及在招聘与模型开发中落实“品味驱动”的决策。姚还通过将竞争描述为“马拉松而非冲刺”来回应外界对腾讯 AI 发展节奏的质疑。

姚舜禹为什么从 OpenAI 加入腾讯？

姚在对话中表示，文化是他加入腾讯的首要原因。他描述自己对腾讯领导层的第一印象是“非常诚实”，并且是“直截了当，没有掩盖什么”。姚解释，腾讯基于信任而非指标运转，拥有“坦诚、低自我、务实的文化”，并且坚持长期主义——他认为这对打造长期的 AI 组织至关重要。他的第二个原因是腾讯庞大的产品矩阵，为 AI 技术开发提供了真实的问题来源。

View Source

免责声明：本页面信息可能来自第三方，仅供参考，不代表 Gate 的观点或意见，亦不构成任何财务、投资或法律建议。数字资产交易风险较高，请勿仅依赖本页面信息作出决策。具体内容详见声明。