Se informa que Google está desarrollando un sistema de inteligencia artificial denominado 'agente que utiliza computadora'.
Se informa que en un principio solo funcionará en un navegador web.
Se espera que Google presente su propia interpretación del modelo de grandes acciones de Rabbit en diciembre, según reportes. Este proyecto, conocido como "Project Jarvis", tendría como objetivo ejecutar tareas para los usuarios, que incluyen la recopilación de investigaciones, la compra de productos y la reserva de vuelos. La información proviene de tres fuentes cercanas al proyecto.
Basado en una futura versión de Google Gemini, Jarvis funcionaría exclusivamente en un navegador web, con una optimización particular para Chrome. La herramienta está diseñada para ayudar a las personas a “automatizar tareas cotidianas basadas en la web”, utilizando la capacidad de tomar y analizar capturas de pantalla para interactuar, ya sea haciendo clic en botones o ingresando texto. En su estado actual, se informa que tarda “unos segundos” entre cada acción.
Las principales compañías de inteligencia artificial están desarrollando modelos con características similares a las que describe esta herramienta. Por ejemplo, Microsoft está trabajando en Copilot Vision, que permitirá interactuar con páginas web que se estén visualizando. Por su parte, Apple Inteligencia se espera que reconozca el contenido de la pantalla y realice acciones a través de múltiples aplicaciones en el transcurso del próximo año. Anthropic lanzó una versión beta de Claude que, aunque presenta fallas, puede realizar acciones utilizando un ordenador, mientras que OpenAI también se encuentra trabajando en una versión similar.
Cabe señalar que la intención de Google de presentar Jarvis en diciembre podría cambiar, ya que la empresa está considerando la posibilidad de lanzarlo a un número reducido de probadores para identificar y resolver posibles errores.