Esta nueva tecnología de inteligencia artificial mejora el análisis de videos al detectar acciones humanas en tiempo real.
Un sistema ha demostrado ser capaz de analizar grabaciones de video caóticas con una alta precisión.
Investigadores de la Escuela de Ingeniería y Ciencias Aplicadas de la Universidad de Virginia han avanzado en las capacidades visuales de la inteligencia artificial con el desarrollo de un nuevo analizador de video denominado Semantic and Motion-Aware Spatiotemporal Transformer Network (SMAST). Este sistema presenta una notable precisión en la detección de acciones humanas, lo que abre la puerta a aplicaciones en áreas como la seguridad pública, el seguimiento de movimientos y la navegación de vehículos autónomos.
Uno de los aspectos más destacados de SMAST es su capacidad para procesar material de video complejo, enfocándose en las partes más relevantes de una escena. El sistema combina un modelo de atención selectiva de múltiples características con un algoritmo de codificación posicional 2D consciente del movimiento. Estas características colaboran para permitir que la inteligencia artificial detecte e interprete las acciones humanas con alta precisión.
El modelo de atención selectiva permite a SMAST concentrarse en elementos críticos, como una persona o un objeto en movimiento, ignorando detalles que no son relevantes. Por ejemplo, es capaz de diferenciar entre alguien que lanza una pelota y otra persona que simplemente levanta el brazo. Por su parte, el algoritmo consciente del movimiento permite a la inteligencia artificial rastrear desplazamientos a través del tiempo, recordando cómo los objetos y las personas se han movido en una escena. Esto potencia la habilidad de SMAST para entender las relaciones entre diferentes acciones, haciéndolo más efectivo en el reconocimiento de comportamientos complejos.
En el ámbito de la seguridad y vigilancia, este sistema puede mejorar la seguridad pública al detectar amenazas potenciales en tiempo real. Por ejemplo, puede identificar comportamientos sospechosos en espacios concurridos o reconocer si alguien está en una situación de peligro. En la atención sanitaria, la tecnología tiene el potencial de seguir los movimientos de los pacientes, facilitando un mejor análisis del movimiento para la rehabilitación o el monitoreo durante cirugías.
Los investigadores afirman que SMAST se distingue por su capacidad para manejar material grabado caótico y sin editar. Gracias a su enfoque impulsado por inteligencia artificial, el sistema puede aprender de los datos, adaptándose a diversos entornos y perfeccionando sus capacidades de detección de acciones. SMAST ha sido objeto de varias pruebas académicas, incluyendo AVA, UCF101-24 y EPIC-Kitchens, obteniendo resultados favorables.
El profesor Scott T. Acton, que se desempeña como presidente del Departamento de Ingeniería Eléctrica y de Computación, afirmó que esta tecnología de inteligencia artificial abre puertas para la detección de acciones en tiempo real en algunos de los entornos más exigentes. Destacó que es el tipo de avance que puede contribuir a prevenir accidentes, mejorar diagnósticos e incluso salvar vidas.