DeepSeek y la Universidad de Pekín publican el documento DSpark el 27 de junio, el fundador Liang Wenfeng figura como autor

Según Guru Club, el 27 de junio, el equipo de DeepSeek y la Universidad de Pekín publicaron un artículo de investigación titulado "DSpark: Confidence-Scheduled Speculative Decoding with Semi-Autoregressive Generation". El artículo presenta un módulo de decodificación especulativa para optimizar el rendimiento de inferencia en los modelos existentes DeepSeek-V4-Pro y DeepSeek-V4-Flash. Al mismo tiempo, el equipo publicó como código abierto DeepSpec, un código de pila completa para entrenar y evaluar modelos de decodificación especulativa bajo licencia MIT. DeepSpec actualmente admite tres implementaciones: DSpark, DFlash y Eagle3. Cabe destacar que el fundador de DeepSeek, Liang Wenfeng, figura como autor del artículo.
Aviso legal: La información en esta página puede provenir de fuentes de terceros y es solo para referencia. No representa las opiniones ni puntos de vista de Gate y no constituye asesoramiento financiero, de inversión ni legal. El comercio de activos virtuales implica un alto riesgo. No te bases únicamente en la información presentada en esta página para tomar decisiones. Para más detalles, consulta el Aviso legal.
Comentar
0/400
ManeyToFuturevip
· hace1h
¡Vamos! 🔥
Ver originalResponder0