Cover Image for Se informa que el equipo de IA de NVIDIA extrajo videos de YouTube y Netflix sin autorización.

Se informa que el equipo de IA de NVIDIA extrajo videos de YouTube y Netflix sin autorización.

En un nuevo caso que refleja una preocupante tendencia en la industria tecnológica, parece que Nvidia ha recopilado grandes cantidades de contenido protegido por derechos de autor para su entrenamiento de inteligencia artificial. La empresa de 2.4 billones...

NVIDIA, una de las compañías más prominentes en el sector tecnológico con un valor de 2.4 billones de dólares, se encuentra en el centro de una controversia por supuestamente haber extraído grandes cantidades de contenido protegido por derechos de autor para el entrenamiento de inteligencia artificial. Según un informe reciente, la empresa solicitó a sus empleados descargar videos de plataformas como YouTube y Netflix, entre otros, para el desarrollo de proyectos comerciales de IA. Este comportamiento refleja una tendencia preocupante en la industria, donde las empresas parecen adoptar una mentalidad de "moverse rápido y romper cosas" en su afán de alcanzar el liderazgo en el cada vez más competitivo y problemático mercado de la IA.

Estos entrenamientos estaban destinados a crear modelos para productos como su generador de mundos 3D Omniverse, sistemas de autos autónomos y otros esfuerzos relacionados con "humanos digitales". NVIDIA defendió su enfoque, afirmando que su investigación cumple con las leyes de derechos de autor, argumentando que estas protegen expresiones específicas, pero no hechos, ideas, datos ni información. La empresa comparó su práctica con el derecho de una persona a aprender y utilizar información de diversas fuentes para generar sus propias expresiones.

YouTube, sin embargo, tiene una postura opuesta. En declaraciones anteriores, el CEO de YouTube, Neal Mohan, mencionó que el uso de su plataforma para entrenar modelos de IA constituiría una “violación clara” de sus términos de uso. Esta afirmación se hizo tras informaciones que indicaban que OpenAI había entrenado su generador de texto a video Sora utilizando videos de YouTube sin obtener permiso, un patrón que también fue seguido por la startup Runway AI.

Empleados de NVIDIA que expresaron preocupaciones éticas y legales sobre estas prácticas fueron informados de que la decisión ya había sido respaldada por las más altas instancias de la compañía. Un ejecutivo de NVIDIA, Ming-Yu Liu, afirmó que había una "aprobación general para todos los datos". A pesar de los temores sobre la legalidad del scraping, algunos en la compañía describieron esta cuestión como un “problema legal abierto” que se abordaría en el futuro.

Las acciones de NVIDIA son reminiscencias del antiguo lema de Facebook (Meta), que enfatizaba la agilidad en la innovación, pero que también resultó en violaciones serias de la privacidad de muchas personas. Además de YouTube y Netflix, la compañía supuestamente instruyó a sus empleados a utilizar bases de datos de trailers de películas, bibliotecas internas de material de videojuegos y conjuntos de datos de video como WebVid e InternVid-10M.

Parte de los datos en los que se afirma que NVIDIA entrenó su IA solo estaban designados para uso académico. A pesar de esto, la empresa aparentemente desestimó las preocupaciones relacionadas con las restricciones de uso académico, considerando que sus conjuntos de datos eran apropiados para sus productos comerciales de IA. Para eludir las detecciones de YouTube, NVIDIA habría utilizado máquinas virtuales (VM) con direcciones IP cambiantes para evitar restricciones. Cuando un empleado sugirió el uso de una herramienta de rotación de IP de terceros, otro de NVIDIA respondió que el sistema en uso ya proporcionaba una solución adecuada para mantener la operación.

  • NVIDIA
  • inteligencia artificial
  • derechos de autor