Cover Image for Google pone en alerta a Nvidia al presentar su chip de inteligencia artificial Trillium y promete lanzar las GPU H200 Tensor Core en pocos días.

Google pone en alerta a Nvidia al presentar su chip de inteligencia artificial Trillium y promete lanzar las GPU H200 Tensor Core en pocos días.

Trillium presenta mejoras significativas en comparación con su predecesor TPU v5e.

Google Cloud ha presentado Trillium, su nuevo procesador TPU de sexta generación, diseñado para manejar cargas de trabajo de inteligencia artificial avanzada. Anunciado inicialmente en mayo de 2024, Trillium se centra en ofrecer un rendimiento mejorado y una mayor eficiencia de costos para tareas de entrenamiento, ajuste e inferencia a gran escala.

Esta novedad forma parte de la infraestructura AI Hypercomputer de Google Cloud, que combina TPUs, GPUs y CPUs con software abierto para satisfacer la creciente demanda de inteligencia artificial generativa. Trillium trae consigo importantes mejoras con respecto a su predecesor, el TPU v5e, logrando un incremento de más de 4 veces en rendimiento de entrenamiento y hasta 3 veces en capacidad de inferencia. Además, ofrece el doble de capacidad HBM y un aumento significativo en el ancho de banda del Interchip Interconnect (ICI), lo que lo hace ideal para modelos de lenguaje grandes, como Gemma 2 y Llama, así como para aplicaciones de inferencia que requieren muchos recursos computacionales, incluyendo modelos de difusión como Stable Diffusion XL.

Otro aspecto clave de Trillium es su eficiencia energética, con una mejora del 67% en comparación con versiones anteriores, un factor destacado también por Google. En pruebas de rendimiento, Trillium ha demostrado una velocidad de entrenamiento hasta 4 veces superior para modelos como Gemma 2-27b y Llama2-70B, mientras que en tareas de inferencia ha mostrado un rendimiento 3 veces mayor que el TPU v5e, especialmente en modelos que requieren un alto nivel de computación.

La escalabilidad es otra ventaja significativa de Trillium. Este TPU puede conectar hasta 256 chips en un único pod de alta capacidad, con la posibilidad de expandirse a miles de chips dentro de la red de centros de datos Jupiter de Google, proporcionando una escalabilidad casi lineal para tareas de entrenamiento extensas. Gracias al software Multislice, Trillium asegura un rendimiento consistente a través de cientos de pods.

Además de Trillium, Google ha presentado las A3 Ultra VMs que incorporan GPUs Nvidia H200 Tensor Core. Estas máquinas virtuales de alto rendimiento estarán disponibles en vista previa este mes, ofreciendo a los clientes de Google Cloud una opción robusta dentro de la infraestructura de inteligencia artificial de la compañía.