OpenAI y Broadcom presentan Jalapeño, su chip de inferencia para LLM

𝕏

Hace 7 minutos

Por Canuto

OpenAI y Broadcom presentaron Jalapeño, un chip de inferencia diseñado desde cero para modelos de lenguaje. La apuesta busca reducir costos, mejorar latencia y darle a OpenAI más control sobre la infraestructura que sostiene ChatGPT, Codex, su API y futuros productos agentes.
***

OpenAI y Broadcom revelaron Jalapeño, el primer Procesador de Inteligencia de OpenAI orientado a inferencia de LLM.
La empresa afirma que el chip fue llevado desde el diseño inicial hasta tape-out en nueve meses, con apoyo de modelos de OpenAI.
Jalapeño forma parte de una plataforma de múltiples generaciones que apunta a despliegues a escala de gigavatio desde finales de 2026.

OpenAI y Broadcom anunciaron Jalapeño, un acelerador de inferencia optimizado para grandes modelos de lenguaje o LLM. La presentación marca la entrada formal de OpenAI al terreno del diseño de chips, en un momento en que el acceso a cómputo se ha vuelto uno de los cuellos de botella centrales de la industria de inteligencia artificial.

La compañía describió a Jalapeño como su primer Procesador de Inteligencia. Según explicó, se trata del primer acelerador dentro de una plataforma de computación de múltiples generaciones que desarrolla junto a Broadcom para hacer la IA avanzada más rápida, más confiable y más accesible.

El chip fue entregado al CEO de OpenAI, Sam Altman, y al presidente Greg Brockman por el presidente y CEO de Broadcom, Hock Tan, junto al presidente Charlie Kawwas. Ese gesto buscó subrayar el carácter estratégico de una alianza que va más allá del suministro convencional de hardware.

Para lectores menos familiarizados con el sector, la inferencia es la etapa en la que un modelo ya entrenado responde preguntas, genera texto, programa o ejecuta tareas. Es decir, es la parte de la IA que llega directamente al usuario final en servicios como ChatGPT, Codex o productos de API.

En ese contexto, controlar más piezas de la infraestructura puede traducirse en menores costos operativos, menor latencia y mejor confiabilidad. También puede reducir la dependencia de plataformas generalistas, un factor cada vez más relevante en la competencia entre grandes laboratorios de IA.

Un chip diseñado desde cero para la inferencia de LLM

OpenAI indicó que Jalapeño fue diseñado desde cero con base en su comprensión de los fundamentos de los LLM. La empresa sostuvo que el desarrollo estuvo guiado por su hoja de ruta de modelos, núcleos, sistemas de servicio y necesidades de producto.

La arquitectura, según la compañía, no es una adaptación de aceleradores pensados para generaciones anteriores de cargas de trabajo de IA. En cambio, fue concebida específicamente para la inferencia moderna de LLM y para operar con flexibilidad frente a modelos actuales y futuros en toda la industria.

Ese punto es clave porque no todas las cargas de IA exigen el mismo equilibrio entre cómputo, memoria y redes. En el caso de los LLM, el movimiento de datos y la utilización real del hardware suelen determinar buena parte del costo y del rendimiento visible para el usuario.

OpenAI afirmó que Jalapeño busca combinar la potencia y el rendimiento de los aceleradores líderes con una latencia más cercana a la de los sistemas especializados más veloces. Si ese objetivo se cumple en producción, el chip podría resultar especialmente útil para productos interactivos a gran escala.

La empresa también enmarcó el proyecto dentro de una estrategia de pila completa. Con esa expresión, se refiere a que ya no solo desarrolla modelos y productos, sino que también avanza sobre arquitectura de chip, núcleos, memoria, redes, programación, despliegue y experiencia de uso.

De acuerdo con la explicación oficial, operar en toda la pila permite alinear cada capa hacia un mismo propósito. Ese propósito sería servir modelos más rápidos, más confiables y más asequibles para usuarios, desarrolladores y empresas.

Primeras pruebas, rendimiento por vatio y cargas como GPT-5.3-Codex-Spark

OpenAI señaló que las muestras de ingeniería de Jalapeño ya están ejecutando cargas de trabajo de aprendizaje automático en laboratorio. Según detalló, esas pruebas corren a la frecuencia y potencia objetivo de producción.

Entre las cargas mencionadas figura GPT-5.3-Codex-Spark. Aunque la empresa no publicó cifras de rendimiento concretas, sí aseguró que el chip está siendo probado con una de sus cargas más relevantes.

La compañía aclaró que todavía está midiendo el rendimiento final del procesador. Sin embargo, sostuvo que las pruebas iniciales muestran un rendimiento por vatio sustancialmente mejor que el actual estado del arte.

Ese dato es importante porque el rendimiento por vatio se ha convertido en una métrica crítica para la economía de la IA. Un mejor aprovechamiento energético puede reducir costos de operación y facilitar expansiones de capacidad en centros de datos bajo restricciones eléctricas.

OpenAI añadió que publicará un informe técnico detallado sobre el rendimiento en los próximos meses. Hasta entonces, buena parte de la evaluación externa dependerá de esa futura documentación y de la validación en despliegues reales.

La firma también explicó que la arquitectura reduce el movimiento de datos y equilibra recursos de cómputo, memoria y redes. En teoría, eso debería acercar la utilización real al rendimiento máximo teórico, una brecha que suele afectar a muchos sistemas de IA en producción.

Broadcom, Celestica y el objetivo de centros de datos a escala de gigavatio

En el anuncio, OpenAI atribuyó a Broadcom un papel central en la industrialización del proyecto. La empresa señaló que su socio aporta implementación de silicio y tecnologías de redes, incluido el silicio de redes Tomahawk, para llevar la plataforma a producción a gran escala.

Celestica también fue mencionada como socio clave. Su contribución estaría orientada a la integración de tableros, racks y sistemas, piezas necesarias para convertir un chip prometedor en infraestructura desplegable dentro de centros de datos.

La colaboración, según lo expuesto, no termina en una sola generación de hardware. Jalapeño es presentado como el primer paso de una plataforma multigeneración con expansión en los años siguientes.

OpenAI dijo que el despliegue inicial está diseñado para finales de 2026. Después de esa etapa, la capacidad se ampliaría con generaciones sucesivas del sistema construido junto a sus socios.

Hock Tan afirmó que esta cooperación representa un compromiso fundamental para escalar la infraestructura física requerida para la próxima década de IA. También sostuvo que el trabajo conjunto habilitará el despliegue de centros de datos a escala de gigavatio con Microsoft y otros socios a partir de 2026.

La referencia a una escala de gigavatio ilustra el tamaño de la ambición detrás del proyecto. En términos prácticos, apunta a instalaciones de cómputo masivo, con demandas eléctricas comparables a las de infraestructura industrial de gran tamaño.

Nueve meses hasta tape-out y uso de IA para diseñar chips

Uno de los aspectos más llamativos del anuncio fue el calendario de desarrollo. OpenAI aseguró que Jalapeño fue co-desarrollado desde el diseño inicial hasta el tape-out de fabricación en solo nueve meses.

La empresa describió ese plazo como lo que considera el ciclo de desarrollo de ASIC más rápido jamás logrado en semiconductores avanzados de alto rendimiento. Aunque esa afirmación requerirá contraste con antecedentes de la industria, deja ver el énfasis que OpenAI quiere poner en velocidad de ejecución.

El término tape-out alude al momento en que el diseño final del chip se envía a fabricación. En la industria de semiconductores, llegar a esa etapa en menos de un año suele considerarse un proceso muy agresivo, sobre todo cuando se trata de hardware de alto rendimiento.

OpenAI atribuyó esa velocidad a tres factores principales. Mencionó el co-desarrollo profundo entre software y hardware, la experiencia de Broadcom en implementación de silicio y el uso de modelos de OpenAI para acelerar partes del diseño y la optimización.

Ese último punto tiene implicaciones amplias para el sector. Si la IA puede ayudar a los ingenieros a diseñar mejores chips con mayor rapidez, podría reducir el costo del cómputo y acelerar nuevos ciclos de innovación en infraestructura.

La compañía lo expresó de forma directa al señalar que los mismos modelos que atienden a los usuarios están ayudando a mejorar la infraestructura que ejecutará modelos futuros. Esa retroalimentación refuerza la narrativa de un círculo de mejora continua entre software, hardware y productos.

La visión estratégica de OpenAI sobre la pila completa

Greg Brockman afirmó que el mundo se está moviendo hacia una economía impulsada por el cómputo. En esa línea, describió a Jalapeño como parte de una estrategia de infraestructura de pila completa orientada a volver el cómputo más abundante.

Según Brockman, un cómputo más abundante debería dar lugar a una IA más rápida, más confiable y más asequible para personas y empresas. También dijo que esa capacidad permitiría usar sistemas avanzados para resolver problemas más importantes.

Richard Ho, quien lidera el programa de hardware de OpenAI, explicó que Jalapeño fue diseñado desde cero para inferencia de LLM usando detalles de la estrecha colaboración con los investigadores de la empresa. Añadió que la arquitectura fue optimizada alrededor de núcleos, movimiento de memoria, redes y patrones de servicio clave para modelos de frontera.

Ho sostuvo que, con base en pruebas iniciales, Jalapeño ejecutará eficientemente las cargas de trabajo más importantes de OpenAI cerca de los límites teóricos del hardware. Esa afirmación resume la promesa técnica del proyecto, aunque todavía sin métricas públicas que permitan auditarla.

En el fondo, la estrategia revela una transición de OpenAI desde proveedor de modelos y aplicaciones hacia actor integral de infraestructura. Ese movimiento recuerda cómo, en otros ciclos tecnológicos, las compañías con mayor control sobre la capa física terminaron capturando ventajas en costos, disponibilidad y velocidad de innovación.

Para mercados tecnológicos y financieros, esta evolución también puede leerse como una señal de maduración. La carrera por IA ya no se libra solo en calidad de modelos, sino en quién puede sostener la demanda con chips, energía, redes y centros de datos suficientes.

Qué puede cambiar para usuarios, desarrolladores y empresas

OpenAI enmarcó el proyecto con una idea sencilla: la inferencia es donde la IA alcanza a las personas. Por eso, cada mejora en costo, velocidad y confiabilidad podría terminar reflejándose en respuestas más ágiles, tareas más extensas o servicios más accesibles.

La empresa puso como ejemplos una respuesta más rápida de ChatGPT, una tarea de Codex capaz de dar más pasos con menos espera, o un producto de API más barato de construir. También mencionó un acceso más confiable cuando la demanda es alta.

Para desarrolladores y pequeñas empresas, el costo de inferencia es una variable decisiva. Si baja lo suficiente, se vuelve más viable crear aplicaciones con modelos de frontera sin trasladar precios prohibitivos a los usuarios finales.

Para investigadores, estudiantes y organizaciones, la confiabilidad también importa. Una plataforma con mejor disponibilidad puede reducir interrupciones en momentos de alta demanda y ampliar el acceso a herramientas avanzadas de IA.

OpenAI cerró su planteamiento insistiendo en la idea de democratizar la IA. Según su visión, eso implica hacer que los modelos avanzados sean accesibles, fiables y suficientemente asequibles para que más personas los utilicen todos los días.

En ese marco, Jalapeño aparece menos como un producto aislado y más como una pieza de una tesis industrial. La apuesta es que controlar mejor el hardware de inferencia permitirá convertir más infraestructura en inteligencia útil para estudiantes, desarrolladores, pequeñas empresas, investigadores y grandes corporaciones.

Por ahora, el mercado deberá esperar datos técnicos más completos y el inicio de despliegues previsto para finales de 2026. Pero el anuncio deja claro que la próxima gran batalla de la IA no solo será algorítmica, sino también eléctrica, logística y de silicio.

Imagen original de DiarioBitcoin, creada con inteligencia artificial, de uso libre, licenciada bajo Dominio Público.

Este artículo fue escrito por un redactor de contenido de IA y revisado por un editor humano para garantizar calidad y precisión.

ADVERTENCIA: DiarioBitcoin ofrece contenido informativo y educativo sobre diversos temas, incluyendo criptomonedas, IA, tecnología y regulaciones. No brindamos asesoramiento financiero. Las inversiones en criptoactivos son de alto riesgo y pueden no ser adecuadas para todos. Investigue, consulte a un experto y verifique la legislación aplicable antes de invertir. Podría perder todo su capital.

Suscríbete a nuestro boletín

𝕏

USDT	Tether USDt	-0,02%	$54,08 mmd
BTC	Bitcoin	-1,32%	$24,92 mmd
ETH	Ethereum	-0,7%	$8,6 mmd
USDC	USDC	0,0%	$8,58 mmd
SOL	Solana	-0,18%	$1,93 mmd
XRP	XRP	-2,07%	$1,46 mmd
BNB	BNB	-0,42%	$0,930 798 mmd
USD1	World Liberty Financial USD	-0,01%	$0,824 136 mmd
HYPE	Hyperliquid	-4,34%	$0,612 217 mmd
TRX	TRON	-0,19%	$0,558 261 mmd

JUP	Jupiter	5,54%	$0,213 242
JTO	Jito	4,11%	$0,661 66
DEXE	DeXe	3,23%	$22,97
AAVE	Aave	2,83%	$74,61
BEAT	Audiera	1,51%	$1,8
AVAX	Avalanche	1,31%	$6,33
DASH	Dash	0,92%	$35,07
XMR	Monero	0,75%	$322,17
JST	JUST	0,69%	$0,083 181
SUN	Sun [New]	0,22%	$0,017 22

WLD	Worldcoin	-7,57%	$0,531 519
ATOM	Cosmos	-6,53%	$1,63
ALGO	Algorand	-6,27%	$0,089 34
INJ	Injective	-5,37%	$4,32
PEPE	Pepe	-4,81%	$0,000 002
LUNC	Terra Classic	-4,57%	$0,000 061
LIT	Lighter	-4,4%	$1,49
HYPE	Hyperliquid	-4,34%	$60,32
PENGU	Pudgy Penguins	-4,03%	$0,006 068
ONDO	Ondo	-3,91%	$0,300 866

OpenAI y Broadcom presentan Jalapeño, su chip de inferencia para LLM

Un chip diseñado desde cero para la inferencia de LLM

Primeras pruebas, rendimiento por vatio y cargas como GPT-5.3-Codex-Spark

Broadcom, Celestica y el objetivo de centros de datos a escala de gigavatio

Nueve meses hasta tape-out y uso de IA para diseñar chips

La visión estratégica de OpenAI sobre la pila completa

Qué puede cambiar para usuarios, desarrolladores y empresas

Suscríbete a nuestro boletín

Artículos Relacionados

Amazon acelera apuesta por entregas ultrarrápidas y expandirá Amazon Now a más de 300 localidades en India

Pese a caída del mercado, 21Shares aún proyecta a Bitcoin sobre USD $100.000 para fin de año

Ryan Cohen renuncia a premio de USD $35.000 millones para concentrarse en compra de eBay

HIVE impulsa sus acciones tras probar que sus GPU en Paraguay compiten con H100 en IA