ChatGPT ahora es capaz de leer algunas aplicaciones de escritorio en tu Mac.
ChatGPT de OpenAI ha comenzado a integrarse con otras aplicaciones en tu computadora. El jueves, la startup reveló que la aplicación de escritorio de ChatGPT para macOS ahora tiene la capacidad de leer.
OpenAI ha comenzado a integrar ChatGPT con diversas aplicaciones en computadoras, facilitando a los desarrolladores su trabajo. Recientemente, la startup presentó una app de ChatGPT para macOS que puede leer el código en varias aplicaciones orientadas a programadores, tales como VS Code, Xcode, TextEdit, Terminal e iTerm2. Esta mejora elimina la necesidad de copiar y pegar el código en ChatGPT, un proceso que se había vuelto habitual. Al habilitar esta función, el sistema enviará automáticamente el segmento de código en el que se está trabajando junto con la consulta realizada, ofreciendo un contexto más completo.
A pesar de esta innovación, ChatGPT no puede escribir código directamente dentro de las aplicaciones de desarrollo, a diferencia de otras herramientas de inteligencia artificial como Cursor o GitHub Copilot. La característica, conocida como "Work with Apps", no funciona como un agente autónomo, aunque OpenAI considera que esto es un "elemento fundamental" para el desarrollo de sistemas más avanzados. Uno de los principales obstáculos para la creación de agentes de inteligencia artificial es la capacidad de comprender lo que aparece en la pantalla de la computadora, más allá de las consultas. En esta primera fase, OpenAI se centra en aplicaciones de codificación, dado el auge de los asistentes de programación como uno de los usos más populares de los modelos de lenguaje.
La nueva función ya está disponible para los usuarios de Plus y Teams, y se prevé su incorporación a las versiones Enterprise y Edu en las próximas semanas. OpenAI tiene planes de expandir la compatibilidad de ChatGPT con otros tipos de aplicaciones, especialmente aquellas basadas en texto para tareas de redacción.
En una demostración con TechCrunch, un empleado de OpenAI mostró cómo abrir ChatGPT y un entorno de Xcode con un proyecto simple que modelaba el sistema solar, aunque sin incluir a la Tierra. El empleado utilizó una pestaña de Xcode dentro de ChatGPT para que el chatbot pudiera acceder a la aplicación y le pidió que "agregara los planetas faltantes". El chatbot pudo completar la tarea, generando el código correspondiente para representar a la Tierra, aunque aún debieron pegar la respuesta de ChatGPT en su entorno.
Para leer distintas aplicaciones, OpenAI utiliza principalmente la API de accesibilidad de macOS, que permite la lectura de texto. Aunque esta funcionalidad es relativamente fiable, depende de la instalación de extensiones en determinadas aplicaciones como VS Code. Sin embargo, esta solución tiene limitaciones ya que la API solo puede leer texto y no comprender elementos visuales como imágenes o videos. "Work with Apps" enviará hasta las últimas 200 líneas de código junto a las peticiones de algunos usuarios y, en otros casos, utilizará todo el código de la ventana activa como entrada.
Aún permanece la incógnita sobre cómo OpenAI planea extender esta característica a otras aplicaciones que no sean compatibles con la tecnología de lectura de pantalla de Apple. Competidores como Anthropic han desarrollado sistemas que analizan capturas de pantalla del escritorio para interactuar con otros programas, aunque su implementación actual presenta varios errores y lentitud.
En una reciente reunión, un representante de OpenAI aclaró que la nueva función no tiene la intención de funcionar como un agente, sino de facilitar la colaboración con herramientas de codificación, anticipando que más herramientas serán lanzadas pronto. Este avance hacia la creación de agentes es especialmente relevante dado que OpenAI se encuentra cerca del lanzamiento de un agente de inteligencia artificial de propósito general, conocido como "Operator", que se espera esté disponible a inicios de 2025.
Por ahora, las actualizaciones están limitadas a macOS, justo antes de que Apple implemente una integración con ChatGPT en diciembre, y todavía no hay claridad sobre cuándo "Work with Apps" estará disponible en Windows, sistema operativo respaldado por Microsoft, la mayor inversionista de OpenAI.