DeepSeek Reduce precios de la API en un 90%, ejecuta V4 en chips Huawei y lleva la inferencia de IA a una guerra de precios total


DeepSeek redujo los precios de la API en un 90% en las coincidencias de caché de entrada y ofrece un descuento del 75% en V4-Pro hasta el 5 de mayo
Eso lleva el precio de coincidencia de caché de V4-Pro a alrededor de $0.0036 por millón de tokens, mientras que el precio de salida se sitúa mucho por debajo de los modelos fronterizos occidentales que cobran $12–$25 por millón de tokens
V4-Pro tiene 1.6 billones de parámetros en total, con 49 mil millones activos por pasada de inferencia. V4-Flash es la versión más pequeña con 284 mil millones de parámetros
V4 funciona en chips Huawei Ascend, no en NVIDIA
También usa mucho menos computación. Con una ventana de contexto de 1 millón de tokens, se informa que V4-Pro necesita solo el 27% de la computación requerida por V3.2
El rendimiento todavía está ligeramente por detrás de GPT-5.4 y Gemini 3.1 Pro
Ver original
post-image
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
Sin comentarios
  • Anclado