saltar al contenido
·NVIDIA

NVIDIA Rubin CPX: La inferencia de IA entra en la era del millón de tokens con 30 petaflops por tarjeta

NVIDIA ha presentado oficialmente su nuevo sistema de chip Rubin CPX , cuyo lanzamiento está previsto para finales de 2026. Este producto de vanguardia está diseñado específicamente para la generación de vídeo basada en IA, el desarrollo de software y el procesamiento de contexto a gran escala. El Rubin CPX estará disponible en formato de tarjeta, ya sea para su integración en la infraestructura de servidores existente o como dispositivo independiente en centros de datos.

Rubin CPX: Entrando en la «Era del Millón de Tokens» de la Inferencia de IA

Rubin CPX forma parte de la próxima línea de productos Rubin y ofrece una arquitectura única que divide la inferencia de IA en etapas distintas: "comprensión de entrada" y "generación de salida", gestionadas de forma independiente por chips GPU independientes. Esta separación aumenta significativamente la eficiencia.

Cada GPU Rubin CPX ofrece una impresionante potencia de procesamiento de 30 petaflops (con precisión NVFP4), equipada con 128 GB de memoria GDDR7 y hardware integrado de codificación y decodificación de vídeo. En comparación con los sistemas actuales, Rubin CPX triplica el rendimiento de la aceleración de la atención, lo que la convierte en una innovación para la computación de IA.

En plataformas a gran escala, un sistema completo Vera Rubin NVL144 CPX puede integrar hasta 144 GPU Rubin CPX , 144 GPU Rubin y 36 CPU Vera en un solo rack. Esta configuración alcanza un total de 8 exaflops de rendimiento de IA, 7,5 veces más potente que el sistema GB300 NVL72 actual. NVIDIA destaca que su ROI (retorno de la inversión) podría ser de 30 a 50 veces mayor, lo que significa que una inversión de 100 millones de dólares podría generar hasta 5000 millones de dólares en retornos.

Inferencia de IA y aplicaciones en el mundo real

Considerada como una GPU de inferencia de un millón de tokens , la Rubin CPX está diseñada para gestionar tareas de desarrollo de software y generación de vídeo a gran escala. En el desarrollo de software, ayuda a los desarrolladores a gestionar grandes bases de código al comprender bibliotecas de proyectos completas en múltiples archivos. Para la generación de vídeo, la Rubin CPX admite modelos de IA que pueden procesar hasta una hora de contenido de vídeo a la vez , lo que garantiza la continuidad y la consistencia de los resultados generados.

Varias empresas, incluidas Cursor (una plataforma de generación de código) , Runway (una plataforma de creación de videos) y Magic (una empresa de investigación de IA) , ya han expresado su interés en colaborar con NVIDIA en esta tecnología.

Fortalecimiento del liderazgo de infraestructura de IA de NVIDIA

Los analistas del sector predicen que Rubin CPX fortalecerá el dominio de NVIDIA en el sector de la infraestructura de IA. En 2025, se espera que los ingresos del negocio de centros de datos de NVIDIA superen los 184 000 millones de dólares , superando así los ingresos totales de algunos competidores en conjunto. El lanzamiento de Rubin CPX no solo representa un avance en hardware, sino que también marca una transición en la computación de IA: de arquitecturas de propósito general a soluciones dedicadas y altamente optimizadas.

¿Cree que los rápidos avances en hardware de IA, como el Rubin CPX, transformarán por completo los patrones de trabajo en el desarrollo de software y la generación de vídeo? ¿Cómo afectará la transformación del hardware de IA a su flujo de trabajo?

_{area}

_{region}
_{language}