NVIDIA presentó un diseño de infraestructura para fábricas de IA que lleva la refrigeración líquida a un nuevo extremo: operar con refrigerante de hasta 45 °C, eliminar ventiladores dentro del sistema y reducir casi a cero el uso de agua en ciertos entornos. La propuesta apunta a atacar uno de los cuellos de botella más costosos del boom de la inteligencia artificial: la energía necesaria para enfriar centros de datos cada vez más densos.
***
- La generación Rubin de NVIDIA es la primera en ofrecer enfriamiento 100% líquido en toda la infraestructura de IA, incluidos chips y red.
- Según la compañía, subir un grado la temperatura de la planta de enfriamiento puede recortar cerca de 4% los costos de energía asociados al cooling.
- Una instalación hiperescalar de 50 megavatios podría ahorrar más de USD $4.000.000 al año en energía y agua al migrar a esta arquitectura.
El rápido crecimiento de la inteligencia artificial está obligando a los operadores de centros de datos a replantear no solo cuánta potencia de cómputo instalan, sino también cómo la mantienen operativa sin disparar el consumo energético. En ese contexto, NVIDIA presentó una nueva referencia técnica para sus fábricas de IA basada en refrigeración líquida total.
La novedad central es que sus servidores más recientes pueden funcionar con líquido refrigerante a temperaturas de hasta 45 °C, equivalentes a 113 °F. Ese nivel, que supera la temperatura habitual de un jacuzzi, es precisamente el factor que la empresa asocia con una mayor eficiencia energética.
La generación Rubin de la infraestructura de IA de NVIDIA, según explicó la compañía, es la primera del mundo en alcanzar un esquema de enfriamiento 100% líquido. Eso incluye cada chip y cada componente de red en un circuito cerrado sin ventiladores en ninguna parte del sistema.
Este enfoque fue descrito en el diseño de referencia NVIDIA DSX para fábricas de IA, una guía que reúne mejores prácticas para diseñar, construir y operar toda la pila de infraestructura. La idea es ofrecer un marco replicable para nubes y operadores de centros de datos que busquen escalar cargas intensivas de IA.
Para los lectores menos familiarizados con este segmento, el enfriamiento es uno de los grandes costos ocultos de la infraestructura digital. Cuando la densidad de cómputo aumenta, también sube el calor generado por chips, redes y sistemas de alimentación, y disiparlo de forma eficiente se vuelve un problema estratégico.
Por qué 45 °C pueden mejorar la eficiencia
NVIDIA sostiene que una infraestructura completamente enfriada por líquido permite reducir de forma drástica la energía usada para cooling. Aunque cada generación de hardware mejora el rendimiento por vatio, la empresa plantea que el verdadero salto aparece cuando toda la plataforma térmica se rediseña alrededor del líquido.
Ali Heydari, director de enfriamiento e infraestructura de centros de datos en NVIDIA, afirmó que el diseño de referencia DSX para fábricas de IA tiene consumo de agua cero. También dijo que se han eliminado grandes cantidades de consumo energético y prácticamente todo el uso de agua.
Heydari añadió que, con diseños de enfriador seco, el sistema opera como un circuito cerrado sin refrigeración por agua evaporativa. Según su explicación, en algunos climas solo podría necesitarse un enfriador durante cerca de 1% del año.
Históricamente, el enfriamiento ha representado hasta 40% del consumo eléctrico de un centro de datos. Por eso, cualquier mejora en esta capa impacta tanto los gastos operativos como la presión sobre la red energética que alimenta estas instalaciones.
La compañía estima que elevar la temperatura de la planta de enfriamiento en apenas un grado puede reducir los costos de energía de cooling en cerca de 4%. A escala hiperescalar, ese margen aparentemente pequeño puede traducirse en millones de dólares al año.
Como ejemplo, NVIDIA calcula que una instalación de 50 megavatios puede ahorrar más de USD $4.000.000 anuales en costos de energía y agua relacionados con el enfriamiento. Ese cálculo se refiere a la transición desde infraestructura convencional hacia sistemas enfriados por líquido.
Menos agua, menos ruido y más densidad para centros de datos de IA
Uno de los puntos más llamativos de la propuesta es el potencial para reducir el consumo de agua casi a cero. En climas favorables, la arquitectura de refrigeración líquida a 45 °C permitiría operar sin enfriadores, con una caída de hasta 100% en el uso de agua frente a sistemas convencionales con torres de refrigeración.
La comparación ofrecida por la empresa es contundente. Un centro de datos tradicional puede consumir alrededor de 2,6 millones de galones de agua por megavatio al año para cooling, mientras que el nuevo esquema apunta a reducir esa cifra a casi cero.
La lógica detrás del ahorro es técnica, pero fácil de resumir. En vez de mover grandes volúmenes de aire frío para extraer calor del equipo de TI, el calor se captura directamente en el chip y se transporta mediante bucles de líquido que operan a temperaturas más altas.
Eso permite que enfriadores secos instalados en el exterior rechacen el calor durante buena parte del año. Como resultado, disminuyen de forma importante los requisitos de refrigeración mecánica y el consumo de agua de toda la instalación.
Otro cambio clave es que la temperatura ambiente del centro de datos se vuelve mucho más flexible. El aire caluroso del verano deja de ser un problema central, porque el servidor ya no depende del aire frío para mantener bajo control la temperatura de sus componentes.
La mezcla refrigerante utilizada por la arquitectura Rubin está compuesta por 75% de agua y 25% de propilenglicol. Ese líquido circula por placas frías situadas directamente sobre los procesadores, donde extrae el calor en la fuente antes de recircular en un circuito cerrado.
La desaparición de ventiladores internos también cambia la experiencia física del centro de datos. En las instalaciones tradicionales, el ruido puede superar 85 decibelios, un nivel suficientemente alto como para requerir protección auditiva.
Además del sonido, la arquitectura convencional obliga a organizar pasillos fríos y calientes para dirigir el aire con precisión. Rubin elimina ese patrón y reemplaza gran parte de esa complejidad con una arquitectura térmica sellada y mucho más compacta.
El salto técnico de Rubin y el rediseño total del servidor
La empresa subraya que los servidores líquidos del pasado eran híbridos. GPU y CPU podían usar placas frías, pero otros componentes seguían dependiendo del aire y de disipadores con aletas diseñados para liberar calor en corrientes de ventilación.
En un servidor completamente enfriado por líquido, esa solución parcial deja de ser suficiente. Por eso, el equipo de ingeniería térmica de NVIDIA rediseñó el manejo del calor en esos componentes secundarios para integrarlos también al circuito líquido.
Según la descripción técnica compartida por la fuente original, los ingenieros desarrollaron bucles que simplifican el enrutamiento del líquido hacia varios chips de alta potencia en una misma placa. El sistema usa una sola entrada y una sola salida, lo que limpia la arquitectura de enfriamiento a nivel de bandeja.
Ese trabajo tiene efectos visibles en el hardware. Los servidores Rubin muestran paneles frontales limpios y sellados, en contraste con los biseles perforados típicos de los diseños enfriados por aire.
También impacta la densidad del rack. NVIDIA asegura que un sistema que antes ocupaba seis unidades de rack ahora puede caber en dos, lo que implica más cómputo en menos espacio y con una reducción importante del ruido operativo.
La empresa argumenta que este rediseño no compromete rendimiento. El refrigerante entra al chip a 45 °C y sale cerca de 55 °C, luego de absorber una carga térmica considerable en toda la superficie del silicio, sin degradar el desempeño del procesador.
El punto aquí desafía una vieja idea de la industria. Durante años se asumió que un centro de datos frío era, por definición, un centro de datos eficiente, pero el comportamiento térmico del silicio moderno permite operar en ambientes bastante más cálidos de lo que sugiere esa intuición.
Implicaciones para la expansión de la IA y el ecosistema industrial
NVIDIA sostiene que, como Rubin integra una infraestructura enfriada por líquido al 100%, cada proveedor de nube y operador de centro de datos que la construya tendrá que hacer esa transición. En otras palabras, la compañía presenta este diseño no como una opción marginal, sino como un nuevo estándar práctico.
El ecosistema de proveedores ya se está alineando alrededor de esa hoja de ruta. Motivair, la división de refrigeración avanzada de Schneider Electric, ha trabajado con la hoja de ruta de productos de NVIDIA durante casi una década.
Richard Whitmore, presidente y CEO de Motivair, dijo que la relación se intensificó cuando las densidades de potencia cruzaron el umbral en el que el enfriamiento por aire dejó de ser una opción viable. En su lectura, una vez que los vatios por chip superaron cierto nivel, la refrigeración líquida se volvió obligatoria.
Whitmore también remarcó que la geografía importa. Un centro de datos en las Tierras Altas de Escocia enfrenta condiciones muy distintas a uno ubicado en Phoenix, Arizona, de modo que el ideal de operar sin enfriadores depende del clima exterior disponible.
Aun así, sostuvo que, en la ubicación adecuada y con el diseño correcto del sistema, no haría falta equipo de refrigeración tradicional. En ese escenario, bastaría con grandes bobinas de radiador ubicadas fuera del edificio y la temperatura del aire exterior para resolver todo el cooling.
Incluso en climas más cálidos, el movimiento hacia refrigerante a 45 °C acercaría a los operadores a ese modelo casi libre de enfriadores. La expectativa es que los chillers solo se activen unos pocos días al año, cuando la temperatura exterior realmente lo exija.
La expansión de la IA hace que esta discusión sea urgente. Las cargas de trabajo no se están volviendo más ligeras y la demanda de cómputo que impulsa la construcción de nuevos centros de datos crece más rápido que casi cualquier otra categoría de inversión en infraestructura.
Si la eficiencia térmica no mejora al mismo ritmo que el hardware, el costo energético de operar IA a escala crecerá en paralelo con la capacidad instalada. En ese sentido, el enfriamiento líquido a 45 °C aparece como una de las herramientas más importantes para contener esa brecha.
Otro beneficio mencionado por NVIDIA es la recuperación de calor residual. El calor sobrante de una fábrica de IA podría reutilizarse para calefaccionar edificios comerciales o residenciales cercanos, ampliando así el valor energético de estas instalaciones.
Para sectores como blockchain, minería avanzada, supercomputación e infraestructura financiera de alta frecuencia, el mensaje es claro. A medida que sube la densidad computacional, la ventaja competitiva ya no depende solo del chip más potente, sino de la capacidad de enfriarlo con menos agua, menos espacio y menos gasto eléctrico.
Imagen original de DiarioBitcoin, creada con inteligencia artificial, de uso libre, licenciada bajo Dominio Público.
Este artículo fue escrito por un redactor de contenido de IA y revisado por un editor humano para garantizar calidad y precisión.
ADVERTENCIA: DiarioBitcoin ofrece contenido informativo y educativo sobre diversos temas, incluyendo criptomonedas, IA, tecnología y regulaciones. No brindamos asesoramiento financiero. Las inversiones en criptoactivos son de alto riesgo y pueden no ser adecuadas para todos. Investigue, consulte a un experto y verifique la legislación aplicable antes de invertir. Podría perder todo su capital.
Suscríbete a nuestro boletín
Artículos Relacionados
Empresas
Qualcomm apuesta por chips de IA para centros de datos y desafía dependencia del smartphone
IA
Grok lanza /goal para automatizar tareas largas, pero ya enfrenta quejas por borrado de archivos
Empresas
SpaceX firma acuerdo de cómputo con Reflection por USD $6.300 millones hasta 2029
IA