Acusan a Meta de utilizar libros descargados ilegalmente para entrenar su inteligencia artificial.
Una investigación revela que Meta estaba alimentando su inteligencia artificial utilizando descargas de torrents ilegales.
Meta se enfrenta a un nuevo escándalo tras su anuncio de finalizar la moderación en sus plataformas. Una investigación revela que la empresa, dirigida por Mark Zuckerberg, ha estado utilizando libros obtenidos de manera ilegal a través de servidores torrent. Documentos judiciales recientemente revelados indican que Meta recurrió a la plataforma Library Genesis para entrenar sus modelos de inteligencia artificial, según lo informado por diversos medios.
Esta cuestión ha surgido en el contexto de una demanda presentada por un grupo de autores, que incluye a figuras como Ta-Nehisi Coates y la comediante Sarah Silverman. La divulgación total de los documentos ocurrió después de que un juez desestimara los intentos de Meta por mantener partes de los mismos en secreto. Según se menciona en los informes, el juez consideró que la empresa estaba intentando ocultar información para evitar la mala publicidad, citando un comentario inquietante de un empleado no identificado de Meta: la compañía temía que la cobertura mediática acerca del uso de un conjunto de datos pirateado, como LibGen, pudiera debilitar su posición ante reguladores.
Library Genesis, conocido como LibGen, es un sitio que ofrece acceso gratuito a una vasta colección de libros, artículos académicos y revistas. Meta, junto con otros líderes en el campo de la inteligencia artificial, sostiene que el uso de datos extraídos de la web puede considerarse un "uso justo", pero esta afirmación se verá sometida a un riguroso escrutinio en el ámbito legal. Un ingeniero de la compañía compartió su incomodidad respecto a la situación, anotando que "descargar torrents desde una computadora portátil corporativa no se siente bien".
El descontento entre los empleados ha llegado incluso a la dirección superior de la empresa. Un memorando sugiere que tras un aumento en las discusiones sobre el uso de LibGen, el equipo de IA obtuvo aprobación para utilizar ese material. Los demandantes han argumentado que Meta ha tratado la "disponibilidad pública" de estos conjuntos de datos como una justificación para su uso, a pesar de que los registros internos revelan que tanto Zuckerberg como otros altos ejecutivos eran conscientes de la naturaleza pirateada de LibGen.