Cover Image for Crean chip de inteligencia artificial especializado en un solo modelo

Crean chip de inteligencia artificial especializado en un solo modelo

Una empresa fundada por exalumnos de Harvard, llamada Etched, está desarrollando un chip de inteligencia artificial capaz de ejecutar únicamente un tipo de modelo: los modelos basados en transformers.

A medida que la inteligencia artificial generativa impacta a un número creciente de industrias, las empresas que producen chips para ejecutar los modelos están obteniendo enormes beneficios. Nvidia, en particular, tiene una influencia masiva, controlando entre un 70% y un 95% del mercado de chips de inteligencia artificial. Proveedores de servicios en la nube, desde Meta hasta Microsoft, están invirtiendo miles de millones de dólares en GPUs de Nvidia, conscientes de no quedarse rezagados en la carrera de la inteligencia artificial generativa. Por lo tanto, no sorprende que los proveedores de inteligencia artificial generativa no estén conformes con el statu quo. Gran parte de su éxito depende de los caprichos de los fabricantes de chips dominantes. Es por ello que, junto con inversores oportunista, están en la búsqueda de nuevas empresas prometedoras para desafiar a los actuales líderes en chips de inteligencia artificial.

Una de estas empresas es Etched, que se encuentra entre las numerosas compañías alternativas compitiendo por un lugar en la mesa, pero también es una de las más intrigantes. Con tan solo dos años de existencia, Etched fue fundada por un par de desertores de Harvard, Gavin Uberti (ex-OctoML y ex-Xnor.ai) y Chris Zhu, quienes junto con Robert Wachen y el ex director de tecnología de Cypress Semiconductor, Mark Ross, buscaron crear un chip capaz de hacer una sola cosa: ejecutar modelos de inteligencia artificial. Si bien no es inusual, ya que muchas startups y gigantes tecnológicos están desarrollando chips que corren exclusivamente modelos de inteligencia artificial, también conocidos como chips de inferencia, los chips de Etched son únicos en el sentido de que solo ejecutan un tipo de modelo: los Transformadores.

Los transformadores, propuestos por un equipo de investigadores de Google en 2017, se han convertido en la arquitectura de modelo de inteligencia artificial generativa dominante hasta ahora. Los transformadores son la base del modelo generador de video Sora de OpenAI. Son el corazón de modelos generadores de texto como Claude de Anthropic y Gemini de Google. Y alimentan generadores de arte como la versión más reciente de Stable Diffusion. "En 2022, hicimos una apuesta de que los transformadores tomarían el control del mundo", dijo Uberti, CEO de Etched, a TechCrunch en una entrevista. "Hemos llegado a un punto en la evolución de la inteligencia artificial donde es inevitable contar con chips especializados que puedan rendir mejor que las GPU de propósito general, y los tomadores de decisiones técnicas del mundo saben esto".

El chip de Etched, llamado Sohu, es un circuito integrado específico de aplicación (ASIC, por sus siglas en inglés) diseñado para correr transformadores. Fabricado usando el proceso de 4nm de TSMC, Sohu puede ofrecer un rendimiento de inferencia significativamente mejor que las GPU y otros chips de inteligencia artificial de propósito general, con un menor consumo energético, según afirma Uberti. "Sohu es un orden de magnitud más rápido y más barato que incluso la próxima generación de GPU Blackwell GB200 de Nvidia al ejecutar transformadores de texto, imagen y video", dijo Uberti. "Un servidor Sohu reemplaza 160 GPUs H100 […] Sohu será una opción más asequible, eficiente y respetuosa con el medio ambiente para líderes empresariales que necesitan chips especializados".

¿Cómo logra Sohu todo esto? De varias maneras, pero la más obvia (e intuitiva) es a través de un sistema simplificado de hardware y software para inferencias. Dado que Sohu no ejecuta modelos que no sean transformadores, el equipo de Etched pudo prescindir de componentes de hardware no relevantes para los transformadores y reducir la sobrecarga de software tradicionalmente utilizada para implementar y ejecutar modelos que no son transformadores.

Etched está llegando en un momento crucial en la competencia por la infraestructura de inteligencia artificial generativa. Más allá de las preocupaciones de costo, las GPUs y otros componentes de hardware necesarios para ejecutar modelos a gran escala en la actualidad son extremadamente consumidores de energía. Goldman Sachs predice que la inteligencia artificial está lista para impulsar un aumento del 160% en la demanda de electricidad de los centros de datos para 2030, lo que contribuirá a un aumento significativo en las emisiones de gases de efecto invernadero.

Investigadores de UC Riverside, por su parte, estiman que el uso global de inteligencia artificial podría hacer que los centros de datos consuman de 1.1 a 1.7 billones de galones de agua dulce para 2027, afectando los recursos locales. (Muchos centros de datos utilizan agua para enfriar los servidores). Uberti presenta a Sohu como la solución al problema de consumo de la industria. "En resumen, nuestros futuros clientes no podrán darse el lujo de no cambiar a Sohu", dijo Uberti. "Las empresas están dispuestas a apostar por Etched porque la velocidad y el costo son esenciales para los productos de inteligencia artificial que intentan construir".

Pero, ¿podrá Etched, siempre y cuando cumpla con su objetivo de llevar Sohu al mercado masivo en los próximos meses, tener éxito cuando muchos otros le siguen de cerca? La compañía actualmente no tiene competidores directos, pero la startup de chips de inteligencia artificial, Perceive, recientemente presentó un procesador con aceleración de hardware para transformadores. Groq también ha invertido considerablemente en optimizaciones específicas para transformadores en su ASIC. Dejando de lado la competencia, ¿qué sucederá si algún día los transformadores caen en desuso? Uberti dice que, en ese caso, Etched diseñará un nuevo chip. Aunque es una opción de último recurso bastante drástica, considerando el tiempo que ha tomado llevar a Sohu a la realidad.

Ninguna de estas preocupaciones ha disuadido a los inversores de invertir una gran cantidad de dinero en Etched. Hoy, Etched anunció el cierre de una ronda de financiación de Serie A de $120 millones, copatrocinada por Primary Venture Partners y Positive Sum Ventures. Con esto, Etched ha recaudado un total de $125.36 millones, y la ronda contó con la participación de importantes inversores ángeles, incluidos Peter Thiel (Uberti, Zhu y Wachen son becarios Thiel), el CEO de GitHub, Thomas Dohmke, el cofundador de Cruise (y de The Bot Company), Kyle Vogt, y el cofundador de Quora, Charlie Cheever. Estos inversores probablemente creen que Etched tiene una posibilidad razonable de escalar con éxito su negocio de venta de servidores. Tal vez así sea, Uberti afirma que clientes no revelados ya han reservado "decenas de millones de dólares" en hardware hasta el momento.

El próximo lanzamiento de la Sohu Developer Cloud, que permitirá a los clientes previsualizar Sohu a través de un entorno de pruebas en línea, debería impulsar ventas adicionales, sugirió Uberti. Aun así, parece demasiado pronto para determinar si esto será suficiente para impulsar a Etched y su equipo de 35 personas hacia el futuro que sus cofundadores están visualizando. El segmento de chips de inteligencia artificial puede ser implacable en los mejores momentos. Uberti, sin embargo, hace una fuerte declaración de ventas: "La generación de video, las modalidades de audio a audio, la robótica y otros casos de uso de inteligencia artificial futuros solo serán posibles con un chip más rápido como Sohu. Todo el futuro de la tecnología de inteligencia artificial estará moldeado por la capacidad de escalabilidad de la infraestructura".