¿Podría la inteligencia artificial poner fin al dominio de SEO de Reddit? Investigadores relacionan el aumento de ChatGPT con la disminución del intercambio de conocimientos en plataformas públicas.
La disminución de contenido humano en línea podría afectar negativamente el entrenamiento de la inteligencia artificial en el futuro.
Un reciente estudio publicado en el PNAS Nexus indica que el aumento de modelos de inteligencia artificial como ChatGPT podría estar desafiando la hegemonía de plataformas tradicionales de intercambio de conocimientos, como Reddit y el foro de programación Stack Overflow. Este cambio podría afectar la disponibilidad de información pública accesible de manera gratuita.
La investigación, llevada a cabo por Maria del Rio-Chanona y su equipo, revela que la actividad de los usuarios en Stack Overflow disminuyó un 25% en solo seis meses tras el lanzamiento de ChatGPT. Este descenso no se observó en otros sitios similares donde el acceso a ChatGPT está restringido, lo que resalta el impacto significativo de la rápida adopción de este modelo de IA. Según los hallazgos, los usuarios podrían estar optando por respuestas generadas por IA en lugar de buscar contenido creado por humanos, transformando así la manera en que se obtiene información en línea.
Maria del Rio-Chanona, quien también es miembro del cuerpo docente asociado en el Complexity Science Hub, expresó que "los LLM son tan poderosos, tienen un alto valor y generan un gran impacto en el mundo. Uno comienza a cuestionar sobre su futuro". Los resultados plantean preocupaciones sobre cómo una mayor dependencia de la IA podría traducirse en una disminución de las contribuciones en foros públicos, lo que llevaría a una escasez de datos diversos y auténticos necesarios para entrenar modelos futuros. “Esto tiene implicaciones bastante grandes. Esto significa que podría no haber suficientes datos públicos para entrenar modelos en el futuro”, advierte.
La tendencia podría alterar el ecosistema de la web abierta, ya que herramientas de IA como ChatGPT dependen del conocimiento compartido públicamente para sus datos de entrenamiento. Johannes Wachs, miembro del cuerpo docente en CSH, aclara que "incluso modelos de IA como ChatGPT son entrenados con contenido generado por humanos, como publicaciones de Stack Overflow". Es irónico que, a medida que la IA desplaza estas plataformas, la calidad de los datos de entrenamiento podría deteriorarse con el tiempo.
El impacto es especialmente notable en publicaciones relacionadas con lenguajes de programación ampliamente utilizados como Python y JavaScript, donde la actividad ha caído de manera significativa. El estudio sugiere que este cambio no solo afecta a los novatos, sino a usuarios de todos los niveles de experiencia, indicando un movimiento general de interacciones públicas a privadas en plataformas de IA. Con menos personas contribuyendo a plataformas públicas, los modelos de IA podrían depender eventualmente de datos de menor calidad, lo que podría degradar su rendimiento. Los investigadores proponen un enfoque equilibrado que mantenga el intercambio abierto de conocimientos mientras se abrazan los avances en IA.