Google Lens ahora permite realizar búsquedas utilizando videos.
Más que simples fotografías.
Google Lens ha introducido una nueva funcionalidad que permite a los usuarios realizar búsquedas mediante video. Ahora, si no puedes capturar lo que deseas con solo una imagen, puedes grabar un video y hacer preguntas usando tu voz sobre lo que estás observando. Esta característica genera una Visión General de inteligencia artificial y resultados de búsqueda, todo basado en el contenido del video y tu consulta. La funcionalidad se implementa hoy en Search Labs tanto en Android como en iOS.
Durante el evento I/O en mayo, Google presentó por primera vez esta capacidad de búsqueda a través de video. Por ejemplo, si alguien se encuentra en un acuario y está curioso acerca de los peces que está viendo, puede apuntar su teléfono hacia el tanque, abrir la aplicación de Google Lens y mantener presionado el botón de obturador para comenzar a grabar. Mientras graba, puede preguntar: “¿Por qué nadan juntos?” Google Lens utiliza el modelo de inteligencia artificial Gemini para proporcionar una respuesta adecuada.
Rajan Patel, vicepresidente de ingeniería en Google, explicó que el video es capturado “como una serie de cuadros de imágenes y luego se aplican las técnicas de visión por computadora” que ya se utilizaban en Lens. Sin embargo, han llevado el proceso más allá al transmitir la información a un modelo Gemini “personalizado” diseñado para comprender múltiples cuadros de forma secuencial y ofrecer respuestas basadas en información de la web.
Aunque por el momento no se puede identificar el sonido en un video, como el canto de un pájaro, Patel mencionó que es un área en la que Google está experimentando. Además, Google Lens está renovando su función de búsqueda de fotos, permitiendo realizar preguntas de forma más directa utilizando la voz. Para usar esta opción, solo hay que enfocar la cámara en el objeto, sostener el botón de obturador y preguntar. Anteriormente, los usuarios solo podían escribir sus consultas después de tomar una foto. Esta función de preguntas por voz se implementará a nivel global en Android e iOS, aunque por ahora está disponible solo en inglés.