El servicio de grandes modelos de IA enfrenta una prueba severa de capacidad de cálculo.
A partir de 2026, la competencia en la industria de grandes modelos de inteligencia artificial se intensifica. Antes del Año Nuevo, grandes empresas como Tencent Yuanbao, Alibaba Qianwen, ByteDance Doubao concentraron esfuerzos en el mercado de consumo final, generando una “batalla por la adquisición” a través de diversas actividades promocionales. Desde las vacaciones de Año Nuevo, las noticias de financiamiento en el sector de grandes modelos a nivel mundial han sido frecuentes, y el interés del capital continúa en aumento.
Sin embargo, con el aumento explosivo en la escala de usuarios y la frecuencia de uso, el consumo de tokens (unidad mínima de procesamiento de IA) ha crecido significativamente, poniendo a los servicios de grandes modelos ante una dura prueba de capacidad de cálculo.
Durante el Año Nuevo, Doubao experimentó presión en su capacidad de cálculo debido a la alta frecuencia de interacción en la Gala de Año Nuevo, lo que llevó a la suspensión temporal de la función de videollamadas; empresas como Zhipu AI también implementaron medidas como limitación de API debido a solicitudes concurrentes altas. La insuficiencia de capacidad de cálculo y la tensión en los recursos de inferencia se han convertido en los principales desafíos para la implementación a gran escala de grandes modelos en la actualidad.
Los grandes modelos nacionales dominan OpenRouter
Desde que DeepSeek emergió en 2025 y sorprendió a nivel mundial, la industria de grandes modelos en China ha crecido rápidamente, manteniendo su liderazgo global gracias a ventajas tecnológicas y de escenarios únicos.
Según datos de OpenRouter, la mayor plataforma de agregación de APIs de grandes modelos a nivel mundial, en febrero, el consumo total de tokens de los diez principales modelos en la plataforma superó los 27 billones, con modelos nacionales aportando más de 14 billones, representando más del 50% del mercado.
Entre ellos, MiniMax M2.5 lidera a nivel mundial con más de 5 billones de tokens consumidos; Kimi K2.5 le sigue con más de 4 billones en febrero; DeepSeek V3.2 y GLM 5 ocupan el cuarto y octavo lugar respectivamente. Estos principales modelos nacionales se centran en mejorar capacidades de código y tareas automatizadas de agentes (Agent).
En el período del Año Nuevo, del 16 al 22 de febrero (desde la víspera lunar hasta el sexto día del primer mes lunar), la participación de modelos chinos en el consumo de tokens en los diez principales en OpenRouter superó el 60%. MiniMax M2.5 y GLM-5 mostraron aumentos significativos en consumo, con incrementos del 197% y 158% respectivamente.
En el mercado global, el crecimiento en el consumo de tokens de modelos de empresas extranjeras como Google, xAI y OpenAI es claramente menor que el de los modelos nacionales, con una participación de mercado global que muestra un crecimiento débil o incluso negativo en algunos casos.
Consumo de tokens
Podría iniciar un ciclo de crecimiento prolongado
Token (unidad mínima de procesamiento de IA) es la menor unidad de información que procesa la IA. Cada vez que un gran modelo genera un token, los servidores en el backend deben operar a alta velocidad, lo que requiere no solo una gran capacidad de cálculo, sino también una gran cantidad de electricidad. Según estimaciones de la industria, en la estructura de costos de generación de tokens, los costos de electricidad y cálculo representan más del 70%.
Un informe de JP Morgan indica que, basado en predicciones de escenarios de usuarios y desde la perspectiva de adopción de aplicaciones, el consumo de tokens podría iniciar un ciclo de crecimiento de varios años. Se estima que el consumo de tokens en inferencia de IA en China aumentará de más de 10 cuatrillones en 2025 a aproximadamente 390 cuatrillones en 2030, un aumento cercano a 369 veces, impulsado principalmente por dos factores: primero, a medida que la IA se convierte en la interfaz predeterminada para búsquedas, generación de contenido, atención al cliente y productividad, su penetración en usuarios consumidores y cargas de trabajo empresariales aumenta; segundo, la expansión de casos de uso desde IA conversacional hacia agentes inteligentes y salidas multimodales (contextos más largos, más llamadas a herramientas, salidas más ricas), incluso si el número de usuarios crece lentamente, esto aumentará la cantidad de tokens por sesión.
En cuanto a segmentos específicos, con el tiempo, la proporción de demanda de inferencia cambiará notablemente. La IA conversacional representará casi la mitad del consumo total de tokens en 2025, y se espera que para 2030 disminuya a un porcentaje de dígitos altos; la participación de agentes inteligentes en escenarios de vida cotidiana se espera que pase de cifras de un solo dígito en 2025 a entre el 10% y el 20% en 2030.
Los grandes modelos nacionales tienen
Ventajas duales en electricidad y capacidad de cálculo
Para los desarrolladores, la relación calidad-precio es fundamental. Desde China, tanto la electricidad como la capacidad de cálculo tienen ventajas de costos evidentes, y se espera que puedan redefinir el poder de fijación de precios en IA.
En cuanto a electricidad, datos de la Administración Nacional de Energía muestran que, hasta finales de 2025, la capacidad instalada total de generación en China alcanzó los 389 millones de kilovatios, con un crecimiento del 16.1% respecto al año anterior, representando un tercio de la generación mundial. China también se convirtió en el primer país del mundo en superar los 100 billones de kWh en consumo eléctrico total, con una oferta eléctrica abundante y costos competitivos. Bajo la tendencia de auge de IA, los precios de electricidad en EE. UU. han aumentado notablemente, resaltando aún más la competitividad de los costos eléctricos en China.
En cuanto a capacidad de cálculo, en octubre de 2025, CCTV informó que desde la fase del “14º Plan Quinquenal”, China inició una nueva ronda de despliegue de infraestructura digital, conectando redes de cálculo integradas en todo el país, posicionándose como la segunda mayor del mundo en capacidad total, creando una base sólida para el crecimiento de la economía digital y nuevas oportunidades de expansión.
Actualmente, varias empresas líderes en capacidad de cálculo en China han establecido sistemas completos de adaptación, logrando romper el monopolio tecnológico extranjero en la etapa de inferencia, y en hardware clave como servidores, módulos ópticos y sistemas de disipación de calor, alcanzando un control autónomo. Gracias a despliegues a gran escala, suministro de electricidad de bajo costo y mejoras continuas en algoritmos, las soluciones nacionales tienen ventajas evidentes en el costo de producción de tokens en escenarios principales.
La industria en general considera que, gracias a diseños arquitectónicos más eficientes, los modelos nacionales están reduciendo gradualmente su dependencia de GPU de alta gama; además, la adopción generalizada por desarrolladores globales impulsa una demanda explosiva de capacidad de cálculo nacional.
14 acciones clave relacionadas con grandes modelos
Aunque en los últimos días el rendimiento del sector de capacidad de cálculo ha mostrado cierta dispersión, no se puede negar que la demanda de capacidad de cálculo seguirá creciendo. En los períodos de análisis semanal, el consumo de tokens de grandes modelos nacionales superó en varias ocasiones al de EE. UU. (del 9 al 15 de febrero de 2026), y esta ventaja continúa ampliándose. Con múltiples factores favorables, la exportación de tokens parece ser una tendencia.
Según datos de Securities Times y Dabao, recopilados de Wind, Tonghuashun y otras fuentes públicas, en el mercado A-share, hay más de 140 empresas relacionadas con conceptos de grandes modelos como Zhipu, Kimi, DeepSeek y MiniMax.
En cuanto a rendimiento de mercado, hasta el 27 de febrero, estas más de 140 acciones han tenido un aumento promedio superior al 13% en lo que va de año. Jiechuang Intelligent, BlueFocus y Zhongkong Technology han registrado incrementos acumulados superiores al 60%, siendo las dos primeras relacionadas con Zhipu y la tercera con DeepSeek. Capital Online, Jincheng Modern y UCloud han subido más del 40% en lo que va de año, todas relacionadas con conceptos de Zhipu.
En cuanto a cambios en participación accionarial, 14 acciones han visto disminuir su número de accionistas desde finales de 2025, y en 3 casos la reducción supera el 10%, específicamente Shiji Tianhong, Hengwei Technology y Yuanguang Software.
Shiji Tianhong ha visto una disminución del 24% en el número de accionistas en el último año, y ha lanzado productos como el asistente AI “Xiao Hong” basado en modelos de lenguaje grande, dirigido a docentes, además de invertir en productos de escritura asistida por IA enfocados en la educación primaria y secundaria, como “BiShen Composition”.
Hengwei Technology ha reducido su número de accionistas en más del 21%. En febrero de 2025, anunció que sus dispositivos integrados de entrenamiento y inferencia, como los modelos Ascend y DeepSeek, ofrecen ventajas de “listo para usar + alta concurrencia y baja latencia”, cubriendo sectores como finanzas, gobierno, investigación y salud, ayudando a la transformación inteligente del sector.
Yuanguang Software ha reducido en un 10.6% su número de accionistas desde finales de 2025. Actualmente, la compañía ha integrado o adaptado modelos como Zhipu, Alibaba Qianwen, DeepSeek y Pangu.
Estas 14 acciones relacionadas con conceptos de grandes modelos han tenido un aumento promedio superior al 9% en lo que va de año, destacando Hengwei Technology, Shiji Tianhong y ShiDeMai, con incrementos superiores al 15%. Taiji Shares, Inspur y Yuxin Technology han mostrado un rendimiento más débil, con caídas en sus precios, aunque Inspur lidera en cuota de mercado de servidores y está relacionada con conceptos de DeepSeek y MiniMax.
Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
¡La expansión de tokens podría estar en auge! Kimi+DeepSeek+智谱+MiniMax, acciones conceptuales con concentración de capitales, salen a la luz
El servicio de grandes modelos de IA enfrenta una prueba severa de capacidad de cálculo.
A partir de 2026, la competencia en la industria de grandes modelos de inteligencia artificial se intensifica. Antes del Año Nuevo, grandes empresas como Tencent Yuanbao, Alibaba Qianwen, ByteDance Doubao concentraron esfuerzos en el mercado de consumo final, generando una “batalla por la adquisición” a través de diversas actividades promocionales. Desde las vacaciones de Año Nuevo, las noticias de financiamiento en el sector de grandes modelos a nivel mundial han sido frecuentes, y el interés del capital continúa en aumento.
Sin embargo, con el aumento explosivo en la escala de usuarios y la frecuencia de uso, el consumo de tokens (unidad mínima de procesamiento de IA) ha crecido significativamente, poniendo a los servicios de grandes modelos ante una dura prueba de capacidad de cálculo.
Durante el Año Nuevo, Doubao experimentó presión en su capacidad de cálculo debido a la alta frecuencia de interacción en la Gala de Año Nuevo, lo que llevó a la suspensión temporal de la función de videollamadas; empresas como Zhipu AI también implementaron medidas como limitación de API debido a solicitudes concurrentes altas. La insuficiencia de capacidad de cálculo y la tensión en los recursos de inferencia se han convertido en los principales desafíos para la implementación a gran escala de grandes modelos en la actualidad.
Los grandes modelos nacionales dominan OpenRouter
Desde que DeepSeek emergió en 2025 y sorprendió a nivel mundial, la industria de grandes modelos en China ha crecido rápidamente, manteniendo su liderazgo global gracias a ventajas tecnológicas y de escenarios únicos.
Según datos de OpenRouter, la mayor plataforma de agregación de APIs de grandes modelos a nivel mundial, en febrero, el consumo total de tokens de los diez principales modelos en la plataforma superó los 27 billones, con modelos nacionales aportando más de 14 billones, representando más del 50% del mercado.
Entre ellos, MiniMax M2.5 lidera a nivel mundial con más de 5 billones de tokens consumidos; Kimi K2.5 le sigue con más de 4 billones en febrero; DeepSeek V3.2 y GLM 5 ocupan el cuarto y octavo lugar respectivamente. Estos principales modelos nacionales se centran en mejorar capacidades de código y tareas automatizadas de agentes (Agent).
En el período del Año Nuevo, del 16 al 22 de febrero (desde la víspera lunar hasta el sexto día del primer mes lunar), la participación de modelos chinos en el consumo de tokens en los diez principales en OpenRouter superó el 60%. MiniMax M2.5 y GLM-5 mostraron aumentos significativos en consumo, con incrementos del 197% y 158% respectivamente.
En el mercado global, el crecimiento en el consumo de tokens de modelos de empresas extranjeras como Google, xAI y OpenAI es claramente menor que el de los modelos nacionales, con una participación de mercado global que muestra un crecimiento débil o incluso negativo en algunos casos.
Consumo de tokens
Podría iniciar un ciclo de crecimiento prolongado
Token (unidad mínima de procesamiento de IA) es la menor unidad de información que procesa la IA. Cada vez que un gran modelo genera un token, los servidores en el backend deben operar a alta velocidad, lo que requiere no solo una gran capacidad de cálculo, sino también una gran cantidad de electricidad. Según estimaciones de la industria, en la estructura de costos de generación de tokens, los costos de electricidad y cálculo representan más del 70%.
Un informe de JP Morgan indica que, basado en predicciones de escenarios de usuarios y desde la perspectiva de adopción de aplicaciones, el consumo de tokens podría iniciar un ciclo de crecimiento de varios años. Se estima que el consumo de tokens en inferencia de IA en China aumentará de más de 10 cuatrillones en 2025 a aproximadamente 390 cuatrillones en 2030, un aumento cercano a 369 veces, impulsado principalmente por dos factores: primero, a medida que la IA se convierte en la interfaz predeterminada para búsquedas, generación de contenido, atención al cliente y productividad, su penetración en usuarios consumidores y cargas de trabajo empresariales aumenta; segundo, la expansión de casos de uso desde IA conversacional hacia agentes inteligentes y salidas multimodales (contextos más largos, más llamadas a herramientas, salidas más ricas), incluso si el número de usuarios crece lentamente, esto aumentará la cantidad de tokens por sesión.
En cuanto a segmentos específicos, con el tiempo, la proporción de demanda de inferencia cambiará notablemente. La IA conversacional representará casi la mitad del consumo total de tokens en 2025, y se espera que para 2030 disminuya a un porcentaje de dígitos altos; la participación de agentes inteligentes en escenarios de vida cotidiana se espera que pase de cifras de un solo dígito en 2025 a entre el 10% y el 20% en 2030.
Los grandes modelos nacionales tienen
Ventajas duales en electricidad y capacidad de cálculo
Para los desarrolladores, la relación calidad-precio es fundamental. Desde China, tanto la electricidad como la capacidad de cálculo tienen ventajas de costos evidentes, y se espera que puedan redefinir el poder de fijación de precios en IA.
En cuanto a electricidad, datos de la Administración Nacional de Energía muestran que, hasta finales de 2025, la capacidad instalada total de generación en China alcanzó los 389 millones de kilovatios, con un crecimiento del 16.1% respecto al año anterior, representando un tercio de la generación mundial. China también se convirtió en el primer país del mundo en superar los 100 billones de kWh en consumo eléctrico total, con una oferta eléctrica abundante y costos competitivos. Bajo la tendencia de auge de IA, los precios de electricidad en EE. UU. han aumentado notablemente, resaltando aún más la competitividad de los costos eléctricos en China.
En cuanto a capacidad de cálculo, en octubre de 2025, CCTV informó que desde la fase del “14º Plan Quinquenal”, China inició una nueva ronda de despliegue de infraestructura digital, conectando redes de cálculo integradas en todo el país, posicionándose como la segunda mayor del mundo en capacidad total, creando una base sólida para el crecimiento de la economía digital y nuevas oportunidades de expansión.
Actualmente, varias empresas líderes en capacidad de cálculo en China han establecido sistemas completos de adaptación, logrando romper el monopolio tecnológico extranjero en la etapa de inferencia, y en hardware clave como servidores, módulos ópticos y sistemas de disipación de calor, alcanzando un control autónomo. Gracias a despliegues a gran escala, suministro de electricidad de bajo costo y mejoras continuas en algoritmos, las soluciones nacionales tienen ventajas evidentes en el costo de producción de tokens en escenarios principales.
La industria en general considera que, gracias a diseños arquitectónicos más eficientes, los modelos nacionales están reduciendo gradualmente su dependencia de GPU de alta gama; además, la adopción generalizada por desarrolladores globales impulsa una demanda explosiva de capacidad de cálculo nacional.
14 acciones clave relacionadas con grandes modelos
Aunque en los últimos días el rendimiento del sector de capacidad de cálculo ha mostrado cierta dispersión, no se puede negar que la demanda de capacidad de cálculo seguirá creciendo. En los períodos de análisis semanal, el consumo de tokens de grandes modelos nacionales superó en varias ocasiones al de EE. UU. (del 9 al 15 de febrero de 2026), y esta ventaja continúa ampliándose. Con múltiples factores favorables, la exportación de tokens parece ser una tendencia.
Según datos de Securities Times y Dabao, recopilados de Wind, Tonghuashun y otras fuentes públicas, en el mercado A-share, hay más de 140 empresas relacionadas con conceptos de grandes modelos como Zhipu, Kimi, DeepSeek y MiniMax.
En cuanto a rendimiento de mercado, hasta el 27 de febrero, estas más de 140 acciones han tenido un aumento promedio superior al 13% en lo que va de año. Jiechuang Intelligent, BlueFocus y Zhongkong Technology han registrado incrementos acumulados superiores al 60%, siendo las dos primeras relacionadas con Zhipu y la tercera con DeepSeek. Capital Online, Jincheng Modern y UCloud han subido más del 40% en lo que va de año, todas relacionadas con conceptos de Zhipu.
En cuanto a cambios en participación accionarial, 14 acciones han visto disminuir su número de accionistas desde finales de 2025, y en 3 casos la reducción supera el 10%, específicamente Shiji Tianhong, Hengwei Technology y Yuanguang Software.
Shiji Tianhong ha visto una disminución del 24% en el número de accionistas en el último año, y ha lanzado productos como el asistente AI “Xiao Hong” basado en modelos de lenguaje grande, dirigido a docentes, además de invertir en productos de escritura asistida por IA enfocados en la educación primaria y secundaria, como “BiShen Composition”.
Hengwei Technology ha reducido su número de accionistas en más del 21%. En febrero de 2025, anunció que sus dispositivos integrados de entrenamiento y inferencia, como los modelos Ascend y DeepSeek, ofrecen ventajas de “listo para usar + alta concurrencia y baja latencia”, cubriendo sectores como finanzas, gobierno, investigación y salud, ayudando a la transformación inteligente del sector.
Yuanguang Software ha reducido en un 10.6% su número de accionistas desde finales de 2025. Actualmente, la compañía ha integrado o adaptado modelos como Zhipu, Alibaba Qianwen, DeepSeek y Pangu.
Estas 14 acciones relacionadas con conceptos de grandes modelos han tenido un aumento promedio superior al 9% en lo que va de año, destacando Hengwei Technology, Shiji Tianhong y ShiDeMai, con incrementos superiores al 15%. Taiji Shares, Inspur y Yuxin Technology han mostrado un rendimiento más débil, con caídas en sus precios, aunque Inspur lidera en cuota de mercado de servidores y está relacionada con conceptos de DeepSeek y MiniMax.