Cover Image for Una nueva startup desconocida pretende ofrecerte una SuperNIC de terabit para impulsar los centros de datos de IA del futuro, pero no esperes que mejore la velocidad de tu conexión a internet.

Una nueva startup desconocida pretende ofrecerte una SuperNIC de terabit para impulsar los centros de datos de IA del futuro, pero no esperes que mejore la velocidad de tu conexión a internet.

Enfabrica presenta su modelo ACF-S.

Enfabrica presentó recientemente su solución siliconada Accelerated Compute Fabric SuperNIC (ACF-S) durante el simposio Hot Chips 2024, que tuvo lugar en Stanford, California. Esta tecnología está diseñada para escalar redes de inteligencia artificial (IA) a millones de GPU, proporcionando un mayor ancho de banda, resiliencia, menor latencia y un control programático mejorado para los operadores de centros de datos.

En la conferencia titulada “ACF-S: Un SuperNIC de 8 Terabits/seg para el movimiento de datos de alto rendimiento en redes de IA y computación acelerada”, participaron Shrijeet Mukherjee, Director de Desarrollo y Co-Fundador de Enfabrica, junto con el ingeniero técnico Thomas Norrie. Se centraron en la arquitectura, diseño y características técnicas de su primer chip ACF SuperNIC, apodado “Millennium”.

Según la cobertura del evento, Enfabrica busca unificar la comunicación de sistemas que escalan vertical (añadiendo recursos a un único sistema) y horizontal (conectando múltiples sistemas). Aunque la estructura de red puede recordar a las redes basadas en interruptores PCIe tradicionales, en realidad no se trata de un interruptor PCIe. En su lugar, utiliza una arquitectura de red CLOS de dos niveles que conecta múltiples CPUs, GPUs y otros componentes mediante chips ACF-S y conmutadores de fabric de GPU. Esta arquitectura facilita una comunicación flexible y de alto rendimiento entre diferentes dominios computacionales, permitiendo el manejo eficiente de tareas intensivas en datos sin las limitaciones de los diseños convencionales basados en interruptores PCIe.

El chip ACF-S "Millennium" se considera un componente clave, diseñado para ofrecer una red resiliente para GPUs con un ancho de banda de 3.2 Tbps por acelerador. Este chip integra un enrutador completo, un tejido de conmutación interno multi-planar y un transporte programable por el usuario, respaldando una infraestructura escalable con la capacidad de manejar hasta 40,000 motores de copia y unidades de movimiento de datos.

Enfabrica también ha destacado que el chip Millennium se diferencia por su alta densidad de entrada/salida, integrando NICs dentro de crossbars, traducción de memoria escalable y procesamiento de paquetes y buffers de flujo compartidos, lo que mejora tanto el rendimiento como la eficiencia.

La estrategia de Enfabrica se centra en maximizar la eficiencia de cálculo mediante la optimización de la integración de hardware y software, mejorando la escalabilidad de entrada/salida y memoria, y poniendo en práctica una gestión inteligente del tráfico para optimizar el rendimiento de la red y la resiliencia del sistema. Esta propuesta permite que diversas funciones de NIC y interruptores PCIe se combinan en una única solución, ofreciendo casos de uso interesantes, como la posibilidad de añadir memoria CXL al fabric ACF-S y presentar grupos de memoria CXL sin necesidad de hosts.

  • Enfabrica
  • ACF-S
  • Redes de IA