DeepSeek implementó su marco de aceleración de muestreo especulativo DSpark para los servicios de producción de DeepSeek-V4, tras un informe técnico conjunto con la Universidad de Pekín. DSpark aumenta la velocidad de generación entre un 60% y un 85% para la versión Flash y entre un 57% y un 78% para la versión Pro sin comprometer la calidad de salida.
DeepSeek publicó como código abierto el código base completo de DeepSpec junto con el marco. DeepSpec es compatible con modelos populares de código abierto, incluidos Qwen3 y Gemma, y proporciona a los desarrolladores un conjunto completo de herramientas Python para entrenar módulos de aceleración personalizados localmente.