Cambricon Completa la Adaptación del Día 0 de DeepSeek-V4, Marcando un Hito para el Ecosistema de Chips de IA de China

Mensaje de Gate News, 24 de abril — Cambricon anunció hoy que ha completado la adaptación del Día 0 de DeepSeek-V4, el último modelo de lenguaje grande de DeepSeek, utilizando su ecosistema propietario de software NeuWare y el framework vLLM. El código de adaptación se ha publicado simultáneamente como código abierto, marcando la segunda vez consecutiva que Cambricon ha entregado soporte nativo de chips el mismo día del lanzamiento del nuevo modelo de DeepSeek.

Para optimizar la arquitectura novedosa de DeepSeek-V4, Cambricon aprovechó su biblioteca de operadores Torch-MLU-Ops de alto rendimiento para una aceleración especializada de módulos que incluyen Compressor y mHC. La empresa también utilizó el lenguaje de programación BangC para desarrollar kernels altamente optimizados para operadores críticos como Attention dispersa/compresa y GroupGemm, aprovechando plenamente las capacidades subyacentes del hardware. Los esfuerzos previos de co-optimización software-hardware entre las dos compañías han logrado índices de utilización de cómputo líderes en la industria.

DeepSeek-V4, que se lanzó hoy y es de código abierto, cuenta con una ventana de contexto extendida de un millón de tokens, capacidades sólidas de Agente y un rendimiento de inferencia sobresaliente. Cambricon afirmó que DeepSeek-V4 ejecutándose de forma nativa en los chips de Cambricon representa un hito significativo para la industria de IA de China.

Aviso legal: La información de esta página puede proceder de terceros y no representa los puntos de vista ni las opiniones de Gate. El contenido que aparece en esta página es solo para fines informativos y no constituye ningún tipo de asesoramiento financiero, de inversión o legal. Gate no garantiza la exactitud ni la integridad de la información y no se hace responsable de ninguna pérdida derivada del uso de esta información. Las inversiones en activos virtuales conllevan riesgos elevados y están sujetas a una volatilidad significativa de los precios. Podrías perder todo el capital invertido. Asegúrate de entender completamente los riesgos asociados y toma decisiones prudentes de acuerdo con tu situación financiera y tu tolerancia al riesgo. Para obtener más información, consulta el Aviso legal.

Artículos relacionados

Elon Musk's xAI se renombrará como SpaceXAI cuando termine su estatus como compañía independiente

Según Odaily, Elon Musk anunció que xAI será renombrada como SpaceXAI, ya que la empresa dejará de operar como una entidad independiente.

GateNewsHace28m

IBM amplía su suite de IA empresarial con nuevas herramientas basadas en agentes en Think 2026

Según IBM, la compañía anunció una expansión de sus capacidades de IA empresarial en la conferencia Think 2026 en Boston, implementando nuevas herramientas basadas en agentes para ayudar a las organizaciones a integrar la inteligencia artificial en las operaciones diarias. Context Studio, ahora disponible de forma general, permite a las empresas a

GateNewsHace36m

Las acciones de Hut 8 suben 30% con un contrato de arrendamiento de centros de datos de IA por valor de 9,8 mil millones de dólares

Las acciones de Hut 8 se dispararon más de un 30% tras la noticia de un acuerdo de arrendamiento de centros de datos de IA por 9,8 mil millones de dólares. El minero de Bitcoin se está expandiendo hacia la infraestructura de IA con un contrato de hiperescalabilidad a largo plazo ubicado en Texas. Expansión de la infraestructura de IA El contrato incluye opciones que podrían aumentar el total

CryptoFrontierHace49m

Los sueños de Claude de Anthropic: el agente se organiza la memoria entre tareas, eliminando duplicados y contradicciones

Anthropic en la conferencia Code with Claude dio a conocer Dreams, con el que Claude Managed Agents puede ordenar automáticamente la memoria entre múltiples conversaciones, eliminar duplicados y contradicciones, y actualizar entradas desactualizadas, generando un repositorio de memoria posterior verificable. El límite de entrada es de 100 sesiones y 4.096 caracteres; se ejecuta de forma asíncrona y se completa en minutos a decenas de minutos, con soporte para observación en streaming. La vista previa para investigación requiere solicitud; por ahora solo admite claude-opus-4-7 y claude-sonnet-4-6, y la fecha de lanzamiento oficial aún no está definida.

ChainNewsAbmediahace3h

Anthropic compite con el poder de cómputo de SpaceX: logra Colossus 1 con 22.000 GPU en toda la infraestructura, Claude elimina los límites de uso

Anthropic anunció que llegó a un acuerdo de colaboración de potencia informática con SpaceX para el centro de datos Colossus 1, utilizando más de 220.000 GPU Nvidia, con una capacidad de más de 300MW. Se espera que en el plazo de un mes se despliegue completamente para el uso de Anthropic, mejorando el rendimiento y la experiencia de Claude y Code. Al mismo tiempo, se amplían los límites de uso por cada 5 horas para Pro/Max/Team/Enterprise, se elimina el límite en horas pico y se incrementa la velocidad de la API de Opus. La infraestructura en Asia y Europa también se expande simultáneamente; a futuro hay otras intenciones como “cómputo de IA en órbita”, aunque aún no se ha cerrado ningún contrato.

ChainNewsAbmediahace4h
Comentar
0/400
Sin comentarios