DeepSeek V4 以 1M 上下文窗口发布;华为 Ascend 与昆仑芯片实现完全兼容

Gate 新闻消息,4月24日——DeepSeek V4-Pro 和 DeepSeek V4-Flash 已于 4月24日正式发布并开源;上下文处理长度从 128K 显著扩展至 1M,容量提升接近 10 倍。华为计算宣布其 Ascend 超级节点产品通过芯片与模型技术的紧密协同,已全面支持 DeepSeek V4 系列模型。

华为 Ascend 950 通过融合算子核与多流并行技术,实现高吞吐、低延迟的 DeepSeek V4 模型推理部署,从而降低 Attention 计算与内存访问的开销。对于输入 8K 的 DeepSeek V4-Pro,Ascend 950 实现约 20ms TPOT,单卡 Decode 吞吐为 4,700 TPS;对于输入 <8K 的 DeepSeek V4-Flash,达到约 10ms TPOT,吞吐为 1,600 TPS。Ascend A3 超级节点系列同样实现完全兼容,并提供训练参考实现以便快速微调。基于具备大 EP 模式的 Ascend A3 64 卡超级节点,DeepSeek V4-Flash 在使用 vLLM 推理引擎的 8K/1K 输入输出场景中实现单卡 Decode 吞吐超过 2,000 TPS。华为全系 Ascend A2、A3 和 950 产品线均支持 DeepSeek V4-Flash 与 V4-Pro。

华为云宣布与 DeepSeek V4 率先实现兼容,通过其 MaaS 平台为开发者提供一键式 API 令牌服务。华为云针对系统层、算子层与集群层能力进行了优化,确保模型快速适配与高性能部署。包括金山 WPS 和 360 在内的企业已通过华为云集成了 DeepSeek 的新模型。

昆仑芯片同样宣布基于 vLLM 推理框架,与 DeepSeek V4-Flash 和 V4-Pro 实现 Day 0 兼容,并将适配代码开源给 GitHub 社区。昆仑芯片此前在去年 DeepSeek V3.2 发布时已率先完成适配:通过对 DeepSeek 系列模型开展深度的软件-硬件协同性能优化。

Aviso legal: La información de esta página puede proceder de terceros y no representa los puntos de vista ni las opiniones de Gate. El contenido que aparece en esta página es solo para fines informativos y no constituye ningún tipo de asesoramiento financiero, de inversión o legal. Gate no garantiza la exactitud ni la integridad de la información y no se hace responsable de ninguna pérdida derivada del uso de esta información. Las inversiones en activos virtuales conllevan riesgos elevados y están sujetas a una volatilidad significativa de los precios. Podrías perder todo el capital invertido. Asegúrate de entender completamente los riesgos asociados y toma decisiones prudentes de acuerdo con tu situación financiera y tu tolerancia al riesgo. Para obtener más información, consulta el Aviso legal.

Artículos relacionados

Arm advierte debilidad en los smartphones y observa el crecimiento de chips de IA para compensar

Arm Holdings advirtió que la debilidad del mercado de los smartphones está comprimiendo una fuente clave de ingresos para la empresa de diseño de chips, aunque se espera que el crecimiento del negocio de chips de IA compense el impacto, según el CEO Rene Haas en una conferencia de resultados. En el trimestre anterior, las entregas de teléfonos disminuyeron, con las pérdidas concentradas en

CryptoFrontierHace5m

DeepSeek recauda financiación con una valoración de $45B en medio de la competencia de la IA

El laboratorio de IA chino DeepSeek está en conversaciones para recaudar su primera ronda de financiación con una valoración reportada de 45 mil millones de dólares, según TechCrunch. Esta valoración supone un aumento significativo frente a una valoración estimada de 20 mil millones de dólares solo unas semanas antes, después de que se prestara atención a los modelos de IA de la empresa por

CryptoFrontierHace24m

Huawei y Cambricon integran DeepSeek V4 en chips nacionales; se planean 750.000 unidades Ascend 950PR para 2026

Según el South China Morning Post, Huawei y Cambricon han comenzado a integrar DeepSeek V4 con plataformas de chips nacionales en 2026. Huawei dijo que V4 ya se ejecuta en su Ascend 950PR y otros procesadores Ascend, con planes para producir aproximadamente 750.000 chips 950PR este año tras la producción en masa st

GateNewsHace45m

Microsoft podría retrasar el objetivo de energía con cero emisiones de carbono para 2030, ya que la expansión de centros de datos de IA impulsa las necesidades energéticas

Según Bloomberg, Microsoft podría retrasar o cancelar su objetivo de 2030 para hacer coincidir todo el consumo de electricidad de cada hora con energía de cero emisiones, ya que la expansión de centros de datos de IA incrementa las necesidades de energía y los costos. El objetivo 100/100/0, anunciado en 2021, es más estricto que el objetivo anual de la empresa de igualar la energía renovable correspondiente a la demanda

GateNewsHace45m

Google DeepMind para entrenar IA en Eve Online, adquiere una participación minoritaria en Fenris Creations

Según Bloomberg, el 6 de mayo, Google DeepMind anunció que entrenará sistemas de IA en Eve Online y tomará una participación minoritaria en Fenris Creations, la compañía detrás del juego espacial multijugador. La inversión es de varios millones de dólares. El ejecutivo de DeepMind, Adrian Bolton, dijo que Eve Online pone a prueba la IA

GateNewsHace45m

Apple eleva la I+D al máximo en 30 años con el impulso de inversión en IA

Apple gastó el 10,3% de sus ingresos en investigación y desarrollo en su trimestre de marzo, marcando su mayor participación de I+D en al menos 30 años mientras la empresa intensifica el desarrollo de IA, según CNBC. El gasto en I+D aumentó casi un 34% interanual mientras que los ingresos crecieron un 17%, según la empresa. La empresa

CryptoFrontierHace54m
Comentar
0/400
Sin comentarios