中国的Z.AI发布首个无需美国芯片训练的重大AI图像生成模型

Decrypt

2026-01-14 20:11:00

GLM-4.04%

ATLAS-2.5%

DEEPSEEK-6.43%

简要总结

中国的Z.AI发布了一款完全在华为芯片上训练的开源图像模型。
它采用混合自回归-扩散设计，提升文本准确性和空间控制能力。
这一发布标志着中国在AI自主研发方面的努力，减少对美国GPU的依赖。

中国人工智能公司Z.AI于周三发布了一款完全在华为处理器上训练的开源图像生成模型，标志着首次有大型AI模型在没有依赖美国硬件的情况下完成了完整的训练周期。此举凸显了对Nvidia在AI芯片领域长期主导地位的潜在挑战，因为它表明中国顶尖AI公司之一可以在不依赖美国制造GPU的情况下训练大型模型。该模型已在Hugging Face上提供下载，在美学和连贯性方面表现良好——虽然按当今标准尚不算令人印象深刻——并且在我们的初步测试中显示出优异的空间感知能力。

由Z.AI新模型生成的图像。

这家总部位于北京的公司在上周的香港IPO中筹集了$558 百万资金，使用MindSpore框架在华为Ascend Atlas 800T A2服务器上训练了名为GLM-Image的模型。 “我们希望这能为社区探索国产算力的潜力提供有价值的参考，”Z.AI在一份与《南华早报》分享的声明中表示。

介绍GLM-Image：开源图像生成的新里程碑。

GLM-Image采用混合自回归加扩散架构，结合了强大的全局语义理解和高保真视觉细节。其整体质量可与主流扩散模型媲美…… pic.twitter.com/cjtUYRkge5

— Z.ai (@Zai_org) 2026年1月14日

GLM-Image结合了自回归和扩散技术，采用总参数达160亿的混合架构。自回归部分基于Z.AI的GLM-4语言模型，负责指令理解和图像构图，而扩散解码器则细化细节。这种方法类似于OpenAI最新的图像生成模型gpt-image-1.5，表现出优于纯扩散模型（如Stable Diffusion）的文本渲染和提示遵循能力。扩散模型通过从随机视觉噪声开始，逐步细化成图像，而自回归模型则逐步构建图像，基于前面的内容预测每一部分。扩散在整体逼真度方面表现出色，但在文本或布局等细节方面可能较弱，而自回归模型在结构和指令执行方面表现优异。目前，扩散技术在开源AI图像生成器中占据主导地位。

新型混合系统结合了两者，利用自回归生成规划图像，再用扩散技术润色最终效果。

图片：Z.AI

此次发布对Z.AI意义重大，该公司在2025年因涉嫌与中国军方有关联被华盛顿列入黑名单。该禁令使公司无法使用Nvidia的H100和A100处理器。如今，Z.AI已证明被列入黑名单的企业仍能利用国产硬件开发具有竞争力的AI系统，这是北京长期希望展示的成果。就在Z.AI宣布之后，《路透社》报道中国海关已指示代理阻止Nvidia H200芯片进入中国。据消息人士透露，政府官员召集科技公司会议，告知除非必要，否则不要购买这些芯片。措辞之严，几乎等同于“目前基本禁止”。北京似乎在发出信号：中国AI实验室可以在没有美国芯片的情况下构建有能力的模型，减少中国企业囤积Nvidia硬件的紧迫感。H200芯片的性能大约是北京去年8月封锁的H20芯片的六倍多，已接到中国企业超过200万台的订单，每台售价2.7万美元。乔治城安全与新兴技术中心的分析师指出，中国的芯片战略依赖于用华为处理器的大规模集群来弥补每芯片性能的不足。这种方法有效，但需要更多硬件、更高的能耗和更多的工程投入。 “这一策略的关键限制之一是中国是否有能力在国内生产足够的芯片，以弥补和追赶能力差距，”高级研究分析师Hanna Dohmen在11月对CNBC表示。根据华为自己的路线图，2026年的下一代芯片在原始性能方面实际上会比目前的旗舰产品更差。但这种评估可能低估了中国实验室通过算法效率所能实现的突破，正如DeepSeek通过在组装级GPU优化中用更少的芯片训练出具有竞争力的模型所展示的那样。

来源：外交关系委员会

根据公司的技术报告，Z.AI的GLM-Image在文本渲染和汉字生成方面在开源模型中达到了行业领先的基准分数。没有合适硬件的用户也可以通过API在线试用，价格为每生成一张图像0.014美元，或通过Z.AI维护的免费Hugging Face空间使用。 Z.AI成为中国“AI猛虎”中的第一家上市公司，这一集团由一批旨在与OpenAI和Anthropic竞争的大型语言模型创业公司组成。自上市以来，其股价已上涨约80%，这得益于投资者对中国AI企业如DeepSeek或阿里巴巴的热情，以及中国国内芯片产业的雄心。与此同时，华为正准备在今年大幅增加其Ascend处理器的产量。随着其在中国各大AI会议上的展位逐渐增多，华为正试图将自己定位为一个不再依赖硅谷圣克拉拉的国家级AI基础设施的支柱。

查看原文

免责声明：本页面信息可能来自第三方，不代表 Gate 的观点或意见。页面显示的内容仅供参考，不构成任何财务、投资或法律建议。Gate 对信息的准确性、完整性不作保证，对因使用本信息而产生的任何损失不承担责任。虚拟资产投资属高风险行为，价格波动剧烈，您可能损失全部投资本金。请充分了解相关风险，并根据自身财务状况和风险承受能力谨慎决策。具体内容详见声明。

0/400

暂无评论