OpenAI y Broadcom presentan Jalapeño, el primer chip de IA personalizado para inferencia de LLM

OpenAI y Broadcom presentaron hoy Jalapeño, el primer Procesador de Inteligencia de OpenAI diseñado para la inferencia de modelos de lenguaje de gran escala. El chip fue entregado al CEO de OpenAI, Sam Altman, y al presidente Greg Brockman por el presidente y CEO de Broadcom, Hock Tan, y el presidente Charlie Kawwas. El acelerador representa el primer chip de IA de una plataforma de cómputo multigeneracional que las empresas están construyendo en conjunto para hacer que la IA avanzada sea más rápida, más confiable y más accesible. OpenAI diseñó el chip desde cero basándose en su comprensión de los fundamentos de los LLM, con Broadcom y Celestica ayudando a industrializar la plataforma mediante la implementación del chip, la integración de sistemas de placas y racks, redes de alto rendimiento y sistemas de producción escalables.

OpenAI y Broadcom entregan el chip Jalapeño a la dirección de la empresa

La entrega del chip marca un paso importante en la estrategia de OpenAI de construir la pila completa detrás de sus modelos y productos. Jalapeño se desarrolló mediante la colaboración entre OpenAI, Broadcom y Celestica, con cada socio aportando experiencia especializada a la plataforma.

OpenAI diseñó la arquitectura del chip basándose en su hoja de ruta de modelos, kernels, sistemas de servicio y necesidades de producto. Broadcom contribuyó con la implementación del chip y las tecnologías de redes, incluido el silicio Tomahawk, para llevar la plataforma a producción a gran escala. Celestica proporcionó experiencia en integración de sistemas de placas y racks, y sistemas de producción escalables.

Arquitectura de Jalapeño optimizada para cargas de trabajo de inferencia de LLM

Jalapeño está diseñado con flexibilidad para funcionar con todos los LLM, guiado por el conocimiento de OpenAI sobre las necesidades de inferencia de los modelos de IA actuales y futuros en toda la industria. Las muestras de ingeniería ya están ejecutando cargas de trabajo de ML en el laboratorio a la frecuencia y potencia objetivo de producción, incluido GPT-5.3-Codex-Spark.

Las pruebas iniciales muestran que Jalapeño ofrecerá un rendimiento por vatio sustancialmente mejor que el estado del arte actual. La arquitectura reduce el movimiento de datos y equilibra los recursos de cómputo, memoria y redes para lograr una utilización real mucho más cercana al rendimiento máximo teórico. Se presentará un informe técnico detallado en los próximos meses.

"Jalapeño fue diseñado desde cero para la inferencia de LLM utilizando conocimientos detallados de nuestra estrecha colaboración con los investigadores de OpenAI", dijo Richard Ho, quien dirige el programa de hardware de OpenAI. "Optimizamos la arquitectura en torno a los kernels, el movimiento de memoria, las redes y los patrones de servicio que más importan para los modelos de IA de frontera. Según las pruebas iniciales, Jalapeño ejecutará eficientemente nuestras cargas de trabajo más importantes cerca de los límites teóricos del hardware".

El chip es un diseño en blanco para la inferencia moderna de LLM, no un acelerador de propósito general adaptado de cargas de trabajo de IA anteriores. Se basa en los sistemas que OpenAI ejecuta todos los días en ChatGPT, Codex, la API y los futuros productos agénticos. El objetivo es combinar la potencia y el rendimiento de los aceleradores de IA líderes actuales con una latencia más cercana a los sistemas de inferencia especializados más rápidos.

Desarrollo completado en un plazo de nueve meses utilizando diseño asistido por IA

Jalapeño se codesarrolló desde el diseño inicial hasta la fabricación (tape-out) en solo nueve meses. Las empresas creen que esto representa el ciclo de desarrollo de ASIC más rápido jamás logrado en semiconductores avanzados de alto rendimiento.

El cronograma acelerado refleja el codesarrollo profundo de software y hardware con los equipos de ingeniería de OpenAI, la experiencia en implementación de silicio de Broadcom y el uso de modelos de OpenAI para acelerar partes del proceso de diseño y optimización. Los mismos modelos que se sirven a los usuarios están ayudando a mejorar la infraestructura utilizada para ejecutar los modelos futuros.

Plataforma de cómputo multigeneracional planificada con Broadcom y Celestica

Jalapeño es el primer paso de una plataforma de cómputo multigeneracional que combina aceleradores diseñados por OpenAI con tecnologías de implementación de silicio, redes y conectividad de Broadcom, y la experiencia en placas, racks y sistemas de Celestica.

"El mundo se está moviendo hacia una economía impulsada por el cómputo", dijo Greg Brockman, presidente y cofundador de OpenAI. "Jalapeño es parte de nuestra estrategia de infraestructura de pila completa a largo plazo para hacer que el cómputo sea más abundante, lo que dará como resultado una IA más rápida, más confiable y más asequible para las personas y las empresas, y que pueda usarse para resolver problemas más importantes. Al diseñar más de la pila nosotros mismos, podemos ofrecer más inteligencia con mayor eficiencia y seguir impulsando la IA avanzada hacia un acceso más amplio".

Despliegue programado para finales de 2026

La plataforma de cómputo multigeneracional está diseñada para un despliegue inicial a finales de 2026 y su expansión en los años siguientes. OpenAI opera en toda la pila, incluida la arquitectura del chip, los kernels, los sistemas de memoria, las redes, la programación, los sistemas de despliegue y la experiencia del producto, con cada capa optimizada para hacer que sus modelos sean más rápidos, más confiables y más asequibles para los usuarios.

Preguntas frecuentes

¿Qué es Jalapeño y cuándo se presentó?

Jalapeño es el primer Procesador de Inteligencia de OpenAI, un acelerador de IA diseñado específicamente para la inferencia de modelos de lenguaje de gran escala. OpenAI y Broadcom presentaron el chip hoy.

¿Cuánto tiempo llevó desarrollar Jalapeño?

Jalapeño se codesarrolló desde el diseño inicial hasta la fabricación (tape-out) en nueve meses. Las empresas creen que esto representa el ciclo de desarrollo de ASIC más rápido jamás logrado en semiconductores avanzados de alto rendimiento.

¿Cuándo se implementará Jalapeño?

La plataforma de cómputo multigeneracional que incluye Jalapeño está diseñada para un despliegue inicial a finales de 2026, con expansión planificada en los años siguientes.

Aviso legal: La información en esta página puede provenir de fuentes de terceros y es solo para referencia. No representa las opiniones ni puntos de vista de Gate y no constituye asesoramiento financiero, de inversión ni legal. El comercio de activos virtuales implica un alto riesgo. No te bases únicamente en la información presentada en esta página para tomar decisiones. Para más detalles, consulta el Aviso legal.
Comentar
0/400
Sin comentarios