Cover Image for Probé el competidor de OpenAI, Browser Use, y es impresionante, aunque requiere cierta habilidad técnica para utilizarlo.

Probé el competidor de OpenAI, Browser Use, y es impresionante, aunque requiere cierta habilidad técnica para utilizarlo.

El control de la inteligencia artificial sobre el uso de internet requiere cierto esfuerzo.

La reciente presentación de Operator, el primer agente de inteligencia artificial de OpenAI, ha generado atención en el mundo de la automatización de tareas. Sin embargo, ya existe un nuevo competidor en el mercado: Browser Use, una herramienta que permite realizar acciones en línea de manera autónoma. Este agente, conocido como Computer-Using Agent (CUA), tiene la capacidad de escribir, buscar, hacer clic y copiar información de sitios web sin necesidad de utilizar el mouse o el teclado, además de no requerir la suscripción de ChatGPT Pro a un costo de $200 al mes.

Browser Use está disponible de forma gratuita, especialmente para quienes tengan la habilidad de trabajar con código API. Aunque la instalación puede resultar desafiante para quienes no son expertos en programación, este recurso acaba de lanzar una versión en la nube que utiliza el modelo GPT-4o de OpenAI. Esta opción simplifica enormemente el proceso, brindando una interfaz más fácil de usar. Si bien esta versión tiene un costo de $30 y ciertas limitaciones, puede ser más accesible para quienes buscan automatizar tareas sin profundizar demasiado en el código.

Durante las pruebas de Browser Use, se llevaron a cabo varias tareas en situaciones reales. En un ejercicio de comparación de precios, se le solicitó que buscara "MacBook Air M2" en Amazon, Best Buy y Walmart, y que extrajera los detalles de los primeros cinco resultados en cada sitio. La herramienta cumplió bien esta función, aunque no logró encontrar descuentos ocultos. La capacidad de automatizar la monitorización de precios en diversos sitios resultó ser bastante impresionante.

Otro desafío fue planificar un viaje, donde se pidió buscar un vuelo de ida y vuelta entre Nueva York y Londres. Browser Use encontró una opción con British Airways a un precio de $750, presentando todos los detalles relevantes. Esta funcionalidad podría ser muy útil para quienes viajan con frecuencia, permitiendo la automatización de la búsqueda de tarifas.

En una prueba de predicción climática, se solicitó un resumen de la previsión del tiempo para Nueva York, incluyendo tendencias de temperatura y probabilidad de lluvia. La herramienta no solo recuperó la información necesaria, sino que también ofreció consejos sobre cómo vestirse según las condiciones climáticas esperadas.

La principal diferencia entre Browser Use y Operator radica en la accesibilidad. Browser Use se asemeja a un "cuchillo suizo" para desarrolladores, permitiendo una gran flexibilidad, pero requiere cierto nivel de conocimiento técnico. A diferencia de esto, Operator funciona como un asistente personal que simplifica muchas tareas, aunque con limitaciones en personalización y costos.

Aunque Browser Use presenta desafíos, especialmente en el diseño de solicitudes y la necesidad de empezar nuevas interacciones, ofrece una plataforma potente para quienes están dispuestos a explorar y experimentar. Por otro lado, si se busca una opción más amigable y sencilla, Operator podría ser la mejor elección. En cualquier caso, el futuro de la automatización web parece prometedor y en plena expansión.