NVIDIA Vera Rubin rompe el molde de las GPU con bastidores de 600 kilovatios y memorias de un millón de tokens

El Consejero Delegado de NVIDIA, Jensen Huang, soltó un bombazo en la GTC 2025 que hizo que los equipos de infraestructuras se lanzaran a por sus calculadoras: la plataforma Vera Rubin hará que los bastidores de los centros de datos alcancen los 600 kilovatios en 2027.¹ El anuncio supone un cambio fundamental en el funcionamiento de los centros de datos, ya que obliga a replantearse por completo el suministro eléctrico, los sistemas de refrigeración y la infraestructura física, que ha permanecido prácticamente inalterada durante décadas.

La plataforma Vera Rubin representa el salto más ambicioso de NVIDIA hasta la fecha. Este sistema multicomponente combina la CPU Vera personalizada, la GPU Rubin de última generación y el acelerador especializado Rubin CPX (Context Processing eXtension), diseñado específicamente para cargas de trabajo de IA de millones de tokens.² A diferencia de las mejoras incrementales típicas de las generaciones de GPU, la variante Vera Rubin NVL144 CPX ofrece 7,5 veces más rendimiento de IA que los actuales sistemas Blackwell GB300, al tiempo que cambia radicalmente la forma de empaquetar, refrigerar e implantar las GPU.³.

Somos la primera empresa tecnológica de la historia que anuncia cuatro generaciones de algo", explicó Huang a Data Center Dynamics, exponiendo la hoja de ruta de NVIDIA hasta 2028. "La transparencia tiene un propósito fundamental: dar a los proveedores de infraestructuras, operadores de centros de datos y empresas como Introl el tiempo de antelación necesario para prepararse para lo que equivale a una reimaginación completa de la infraestructura de IA".

Las especificaciones de la plataforma NVL144 de NVIDIA Vera Rubin muestran un rendimiento de inferencia FP4 de 3,6 exaflops y una mejora de 3,3 veces con respecto a la GB300 NVL72, que llegará en la segunda mitad de 2026.

La revolución de la arquitectura empieza con el silicio personalizado.

La hoja de ruta completa de NVIDIA desde Blackwell hasta Feynman, que muestra la evolución desde Oberon hasta las arquitecturas de bastidores Kyber con un consumo de energía de hasta 600 kW.

La CPU Vera marca el punto de partida de NVIDIA con respecto a los diseños ARM estándar, ya que incorpora 88 núcleos ARM personalizados con multithreading simultáneo, lo que permite 176 procesadores lógicos.NVIDIA denomina a estos núcleos "Olympus" y su diseño duplica el rendimiento de la CPU Grace utilizada en los actuales sistemas Blackwell. Cada CPU Vera se conecta a las GPU Rubin a través de una interfaz NVLink C2C a 1,8 TB/s, lo que proporciona un ancho de banda sin precedentes entre los elementos de cálculo.

La GPU Rubin estándar supera los límites con 288 GB de memoria HBM4 por paquete, manteniendo la misma capacidad que la Blackwell Ultra B300 pero aumentando de 8 TB/s a 13 TB/s el ancho de banda de la memoria.⁸ Cada paquete Rubin contiene dos troqueles de GPU limitados por retícula, aunque NVIDIA ha cambiado su metodología de recuento: lo que Blackwell denominaba una GPU (dos troqueles), Rubin lo denomina dos GPUs.⁹ El cambio refleja la creciente complejidad de las arquitecturas multitroquel y ayuda a los clientes a comprender mejor los recursos de cálculo reales de cada sistema.

El elemento más innovador llega en forma de Rubin CPX, un acelerador especialmente diseñado para el procesamiento masivo de contextos. El diseño monolítico ofrece 30 petaFLOPs de cálculo NVFP4 con 128 GB de memoria GDDR7 rentable, optimizada específicamente para mecanismos de atención en modelos de transformador.¹⁰ El CPX logra capacidades de atención 3 veces más rápidas en comparación con los sistemas GB300 NVL72, lo que permite a los modelos de IA procesar contextos de millones de tokens -equivalentes a una hora de vídeo o bases de código enteras- sin degradación del rendimiento.¹¹.

El despliegue exige una revisión completa de la infraestructura.

El sistema estándar Vera Rubin NVL144, cuya llegada está prevista para el segundo semestre de 2026, mantiene la compatibilidad con la infraestructura GB200/GB300 existente y utiliza la conocida arquitectura de bastidores Oberon.¹² El sistema incluye 144 GPU (72 paquetes), 36 CPU Vera y ofrece 3,6 exaFLOPS de rendimiento de inferencia FP4, lo que supone una mejora de 3,3 veces con respecto a Blackwell Ultra.¹³ El consumo de energía se mantiene manejable en aproximadamente 120-130 kW por bastidor, similar a las implantaciones actuales.

La variante Vera Rubin NVL144 CPX lleva el rendimiento aún más lejos, integrando 144 GPU Rubin CPX junto a 144 GPU Rubin estándar y 36 CPU Vera para proporcionar ocho exaFLOPs de cálculo NVFP4 -lo que supone una mejora de 7,5 veces con respecto al GB300 NVL72- con 100 TB de memoria de alta velocidad y 1,7 PB/s de ancho de banda de memoria en un solo rack.¹⁴

Todo cambia con Rubin Ultra y la arquitectura de bastidores Kyber en 2027. El sistema NVL576 concentra 576 GPUs en un solo bastidor y consume 600 kW de energía, cinco veces más que los sistemas actuales.¹⁵ El diseño Kyber gira las hojas de cálculo 90 grados en orientación vertical y coloca cuatro módulos de 18 hojas cada uno en el bastidor.¹⁶ Cada hoja aloja ocho GPUs Rubin Ultra junto con CPUs Vera, lo que permite alcanzar densidades que parecían imposibles hace tan solo unos años.

Sistema NVIDIA Blackwell actual con 72 GPU que proporcionan 1,1 exaflops

El futuro sistema Rubin de NVIDIA alcanzará las 576 GPU y los 15 exaflops en un único rack de 600 kW.

La refrigeración de estos sistemas requiere una inmersión total en líquido sin ventiladores, lo que supone un cambio con respecto a los sistemas actuales, que siguen utilizando cierta refrigeración por aire para los componentes auxiliares.¹⁷ CoolIT Systems y Accelsius ya han demostrado soluciones de refrigeración capaces de gestionar bastidores de 250 kW con temperaturas del agua de entrada de 40 °C, lo que valida la ruta tecnológica hacia implantaciones de 600 kW.¹⁸ El bastidor Kyber incluye un sidecar específico para la infraestructura de alimentación y refrigeración, por lo que se necesitan dos bastidores por cada sistema de 600 kW.¹⁹

La evolución de la arquitectura de potencia permite la computación a escala de megavatios.

La transición de NVIDIA a la distribución de alimentación de 800 VCC aborda las limitaciones físicas fundamentales de la infraestructura actual. La distribución tradicional de 54 V en el rack requeriría 64U de estantes de alimentación para los sistemas a escala Kyber, lo que no dejaría espacio para el cálculo real.²⁰ La arquitectura de 800 V elimina la conversión CA/CC a nivel de rack, mejora la eficiencia de extremo a extremo hasta en un 5% y reduce los costes de mantenimiento hasta en un 70%.²¹.

La nueva infraestructura de alimentación admite bastidores de 100 kW a más de 1 MW, utilizando la misma red troncal, y proporciona la escalabilidad necesaria para futuras generaciones.²² Las empresas que desplieguen Vera Rubin deben planificar actualizaciones eléctricas masivas: un solo bastidor NVL576 consume tanta energía como 400 hogares típicos. Los centros de datos que planifiquen despliegues para 2027 deben empezar ya a actualizar sus infraestructuras, incluidas las conexiones eléctricas a gran escala y, potencialmente, la generación in situ.

Para especialistas en infraestructuras como Introl, este cambio crea oportunidades sin precedentes. La experiencia de la compañía en el despliegue de infraestructuras de GPU a hiperescala, la gestión de más de 100.000 GPU en todo el mundo y su amplia presencia en la región de Asia-Pacífico la sitúan en una posición privilegiada. y su amplia presencia en la región APAC Las organizaciones necesitan socios que comprendan no sólo la implantación de la GPU, sino también el intrincado baile de energía, refrigeración y redes que requieren los sistemas de 600 kW.

El aumento del rendimiento justifica la inversión en infraestructuras.

La variante NVL144 CPX de Vera Rubin muestra el potencial de la plataforma con sus ocho exaFLOPS de cálculo NVFP4, junto con 100 TB de memoria de alta velocidad y 1,7 PB/s de ancho de banda de memoria, todo ello en un único bastidor.²⁴ NVIDIA afirma que las organizaciones pueden obtener entre 30 y 50 veces el retorno de la inversión, lo que se traduce en 5.000 millones de dólares de ingresos a partir de una inversión de capital de 100 millones de dólares.²⁵

Entre los primeros en adoptarlo se encuentra el Centro de Supercomputación Leibniz de Alemania, que está desplegando el superordenador Blue Lion con Vera Rubin para conseguir una potencia de cálculo 30 veces superior a la de su sistema actual.²⁶ El sistema Doudna del Laboratorio Nacional Lawrence Berkeley también funcionará con Vera Rubin, combinando simulación, datos e IA en una única plataforma para la computación científica.²⁷

La especialización de Rubin CPX para el procesamiento contextual aborda un cuello de botella crítico en los actuales sistemas de IA. Empresas como Cursor, Runway y Magic ya están explorando cómo CPX puede acelerar los asistentes de codificación y las aplicaciones de generación de vídeo que requieren procesar millones de fichas simultáneamente.²⁸ La capacidad de mantener bases de código enteras u horas de vídeo en la memoria activa cambia fundamentalmente lo que las aplicaciones de IA pueden lograr.

Los retos infraestructurales crean oportunidades de mercado.

El salto a los bastidores de 600 kW pone de manifiesto la cruda realidad de las capacidades actuales de los centros de datos. La mayoría de las instalaciones luchan con bastidores de 40 kW; incluso los centros de datos de IA de vanguardia rara vez superan los 120 kW. La transición requiere no sólo nuevos sistemas de refrigeración, sino el rediseño completo de las instalaciones, desde suelos de hormigón capaces de soportar grandes cargas de peso hasta subestaciones eléctricas dimensionadas para operaciones industriales.

"La pregunta sigue siendo cuántas instalaciones de centros de datos existentes serán capaces de soportar una configuración tan densa", señala The Register, destacando que la naturaleza de construcción a medida de los bastidores Kyber significa que las instalaciones necesitan una infraestructura construida específicamente.²⁹ Es probable que los desarrollos totalmente nuevos en regiones con excedentes de energía renovable o nuclear -Escandinavia, Quebec y los EAU- conduzcan a la adopción.²⁰.

El calendario da un respiro al sector, pero exige una actuación inmediata. Las organizaciones que planifican infraestructuras de IA para 2027 y más allá deben tomar decisiones ahora sobre la ubicación de las instalaciones, la adquisición de energía y la arquitectura de refrigeración. El plazo de tres años refleja la complejidad de desplegar una infraestructura que opera al límite de lo físicamente posible.

El camino más allá de Vera Rubin

La hoja de ruta de NVIDIA se extiende más allá de Vera Rubin hasta la arquitectura Feynman en 2028, probablemente hacia bastidores de 1 megavatio.³¹ El director ejecutivo de Vertiv, Giordano Albertazzi, sugiere que alcanzar la densidad a escala de MW requerirá "una nueva revolución en la refrigeración líquida y un cambio de paradigma en el lado de la energía"³² La trayectoria parece inevitable: las cargas de trabajo de la IA exigen aumentos exponenciales de la densidad de cálculo y la economía favorece la concentración frente a la distribución.

El paso de mejoras graduales a cambios revolucionarios en la infraestructura de las GPU es un reflejo de la transformación general de la IA. Del mismo modo que los grandes modelos lingüísticos pasaron de miles de millones a billones de parámetros, la infraestructura que los soporta debe dar saltos similares. Vera Rubin representa no sólo GPU más rápidas, sino un replanteamiento fundamental del funcionamiento de la infraestructura de cálculo.

Para empresas como Introl, especializadas en el despliegue de infraestructuras de GPU, Vera Rubin crea una oportunidad generacional. Las organizaciones necesitan socios que puedan navegar por la complejidad de los despliegues de 600 kW, desde la planificación inicial hasta la implementación y la optimización continua. Las empresas que implanten Vera Rubin con éxito obtendrán importantes ventajas competitivas en cuanto a capacidades de IA, mientras que las que duden corren el riesgo de salir perdiendo en la carrera de la industria hacia la IA a exaescala.

Conclusión

La plataforma Vera Rubin de NVIDIA obliga al sector de los centros de datos a enfrentarse a verdades incómodas sobre las limitaciones de la infraestructura al tiempo que ofrece una capacidad de cálculo sin precedentes. Los bastidores de 600 kW de 2027 representan algo más que un mayor consumo de energía: marcan una transformación completa en la forma en que se construye, refrigera y opera la infraestructura de IA. Las organizaciones que empiecen a planificar ahora, asociándose con especialistas en infraestructuras experimentados que comprendan las complejidades de los despliegues de próxima generación, estarán mejor posicionadas para aprovechar las capacidades revolucionarias que Vera Rubin permite.

La llegada de la plataforma en 2026-2027 da tiempo al sector para prepararse, pero el tiempo corre. Los centros de datos diseñados hoy deben anticiparse a los requisitos del mañana, y Vera Rubin deja claro que el mañana exige apartarse radicalmente del pensamiento convencional. Las empresas que adopten esta transformación impulsarán la próxima generación de avances en IA, desde modelos lingüísticos de millones de tokens hasta sistemas de generación de vídeo en tiempo real que hoy parecen ciencia ficción.

Referencias

¹ The Register. "Las CPU y GPU Vera Rubin de Nvidia trazan el camino hacia los bastidores de 600 kW". 19 de marzo de 2025. https://www.theregister.com/2025/03/19/nvidia_charts_course_for_600kw.

² Sala de prensa de NVIDIA. "NVIDIA presenta Rubin CPX: una nueva clase de GPU diseñada para la inferencia masiva de contextos". 2025. https://nvidianews.nvidia.com/news/nvidia-unveils-rubin-cpx-a-new-class-of-gpu-designed-for-massive-context-inference.

Ibid.

⁴ Dinámica de los centros de datos. "GTC: Jensen Huang, Ian Buck y Charlie Boyle, de Nvidia, sobre el futuro de la densidad de los bastidores de los centros de datos". 21 de marzo de 2025. https://www.datacenterdynamics.com/en/analysis/nvidia-gtc-jensen-huang-data-center-rack-density/.

⁵ TechPowerUp. "NVIDIA presenta la CPU Vera y la GPU Rubin Ultra AI, y anuncia la arquitectura Feynman". 2025. https://www.techpowerup.com/334334/nvidia-unveils-vera-cpu-and-rubin-ultra-ai-gpu-announces-feynman-architecture.

⁶ CNBC. "Nvidia anuncia los chips Blackwell Ultra y Vera Rubin AI". 18 de marzo de 2025. https://www.cnbc.com/2025/03/18/nvidia-announces-blackwell-ultra-and-vera-rubin-ai-chips-.html.

⁷ Yahoo Finanzas. "Nvidia estrena el superchip Vera Rubin de nueva generación en la GTC 2025". 18 de marzo de 2025. https://finance.yahoo.com/news/nvidia-debuts-next-generation-vera-rubin-superchip-at-gtc-2025-184305222.html.

⁸ Próxima plataforma. "Nvidia traza una hoja de ruta de sistemas GPU hasta 2028". 5 de junio de 2025. https://www.nextplatform.com/2025/03/19/nvidia-draws-gpu-system-roadmap-out-to-2028/.

⁹ Semianálisis. "NVIDIA GTC 2025 - Built For Reasoning, Vera Rubin, Kyber, CPO, Dynamo Inference, Jensen Math, Feynman". 4 de agosto de 2025. https://semianalysis.com/2025/03/19/nvidia-gtc-2025-built-for-reasoning-vera-rubin-kyber-cpo-dynamo-inference-jensen-math-feynman/.

¹⁰ Sala de prensa de NVIDIA. "NVIDIA presenta Rubin CPX: una nueva clase de GPU diseñada para la inferencia masiva de contextos".

¹¹ Ibid.

¹² Tom's Hardware. "Nvidia anuncia GPU Rubin en 2026, Rubin Ultra en 2027, Feynman también se añade a la hoja de ruta". 18 de marzo de 2025. https://www.tomshardware.com/pc-components/gpus/nvidia-announces-rubin-gpus-in-2026-rubin-ultra-in-2027-feynam-after.

¹³ La nueva pila. "NVIDIA presenta las arquitecturas Rubin y Feynman de nueva generación, que amplían los límites de potencia de la IA". 14 de abril de 2025. https://thenewstack.io/nvidia-unveils-next-gen-rubin-and-feynman-architectures-pushing-ai-power-limits/.

¹⁴ Sala de prensa de NVIDIA. "NVIDIA presenta Rubin CPX: una nueva clase de GPU diseñada para la inferencia masiva de contextos".

¹⁵ Data Center Dynamics. "Se espera que el rack Rubin Ultra NVL576 de Nvidia tenga 600 kW y llegue en la segunda mitad de 2027". 18 de marzo de 2025. https://www.datacenterdynamics.com/en/news/nvidias-rubin-ultra-nvl576-rack-expected-to-be-600kw-coming-second-half-of-2027/.

¹⁶ Tom's Hardware. "Nvidia muestra Rubin Ultra con bastidores e infraestructura Kyber de 600.000 vatios, llegará en 2027". 19 de marzo de 2025. https://www.tomshardware.com/pc-components/gpus/nvidia-shows-off-rubin-ultra-with-600-000-watt-kyber-racks-and-infrastructure-coming-in-2027.

¹⁷ Dinámica del centro de datos. "GTC: Jensen Huang, Ian Buck y Charlie Boyle, de Nvidia, sobre el futuro de la densidad de los bastidores de los centros de datos".

¹⁸ Frontera del centro de datos. "CoolIT y Accelsius empujan los límites de la refrigeración líquida de centros de datos en medio del aumento de la densidad de los racks". 2025. https://www.datacenterfrontier.com/cooling/article/55281394/coolit-and-accelsius-push-data-center-liquid-cooling-limits-amid-soaring-rack-densities.

¹⁹ Dinámica de los centros de datos. "GTC: Jensen Huang, Ian Buck y Charlie Boyle, de Nvidia, sobre el futuro de la densidad de los bastidores de los centros de datos".

²⁰ Blog técnico de NVIDIA. "La arquitectura NVIDIA 800 VDC impulsará la próxima generación de fábricas de IA". 20 de mayo de 2025. https://developer.nvidia.com/blog/nvidia-800-v-hvdc-architecture-will-power-the-next-generation-of-ai-factories/.

²¹ Ibid.

²² Ibid.

²³ Introl. "Área de cobertura". Consultado en 2025. https://introl.com/coverage-area.

²⁴ Sala de prensa de NVIDIA. "NVIDIA presenta Rubin CPX: una nueva clase de GPU diseñada para la inferencia masiva de contextos".

²⁵ Ibid.

²⁶ Blog de NVIDIA. "El superordenador Blue Lion funcionará con NVIDIA Vera Rubin". 10 de junio de 2025. https://blogs.nvidia.com/blog/blue-lion-vera-rubin/.

²⁷ Ibid.

²⁸ Sala de prensa de NVIDIA. "NVIDIA presenta Rubin CPX: una nueva clase de GPU diseñada para la inferencia masiva de contextos".

²⁹ The Register. "Las CPU y GPU Vera Rubin de Nvidia trazan el camino hacia los bastidores de 600 kW".

Global Data Center Hub. "Los bastidores de 600 kW de Nvidia ya están aquí (¿está preparada tu infraestructura?)". 23 de marzo de 2025. https://www.globaldatacenterhub.com/p/issue-8-nvidias-600kw-racks-are-hereis.

³¹ TechPowerUp. "NVIDIA presenta la CPU Vera y la GPU Rubin Ultra AI, y anuncia la arquitectura Feynman".

³² Dinámica de los centros de datos. "GTC: Jensen Huang, Ian Buck y Charlie Boyle, de Nvidia, sobre el futuro de la densidad de los bastidores de los centros de datos".

Anterior
Anterior

VVater e Introl anuncian una alianza para redefinir el futuro de los centros de datos de IA

Siguiente
Siguiente

CoreWeave: La revolución de la infraestructura de IA - Cómo una startup de minería de criptomonedas se convirtió en la columna vertebral de 23.000 millones de dólares de la inteligencia artificial