05:21
DeepSeek V4 引发美国争论:智库质疑芯片使用,Replit CEO 为开放创新辩护
Gate News 消息,4 月 24 日——围绕 DeepSeek V4 的技术能力与合规性,美国爆发了一场争论。Chris McGuire 是外交关系委员会 (CFR) 的资深研究员,曾任白宫国家安全委员会以及国防部官员,发表了分析文章,称 V4 并未改变美中 AI 的竞争格局。根据 McGuire 的说法,DeepSeek 自己的 V4 报告承认,其推理能力比前沿模型大约落后 3 到 6 个月,并以发布于六个月前的 GPT-5.2 与 Gemini 3.0 Pro 作为基准。
McGuire 提出担忧:尽管 V4 报告披露了在推理阶段对 NVIDIA GPU 以及华为 Ascend NPU 的适配,但并未公开说明开发过程中所使用的 GPU 型号或训练成本。他质疑这种沉默是否意味着使用了受出口管制的 NVIDIA Blackwell 芯片,并指出 V3 先前曾声称使用了 2,000 张 H800 GPU,成本为 5.57 million 美元。DeepSeek 已否认使用 Blackwell,表示该模型是在 NVIDIA H800 与华为 Ascend 910C 处理器上训练的。
Replit 首席执行官 Amjad Masad 反驳了 McGuire 的分析,认为中国科学家正在公开分享真正的 AI 突破,而美国政策制定者与游说者则放大“China distillation”(中国蒸馏)的担忧。Masad 强调了 DeepSeek 在官方声明中披露的架构创新,包括 DeepSeek 稀疏注意力 的按 token 级别注意力压缩,以及针对长上下文计算的显著效率提升。他指出,V4-Pro 在 1M 上下文长度下,展现出比 V3.2 更低得多的按 token 推理计算量与 KV 缓存需求,并强调这些架构进展与训练数据蒸馏无关,所有研究人员——包括美国的实验室——都可以从开源发展中获益。
展开