Cover Image for El CEO de Reddit afirma que Microsoft debe pagar para acceder al sitio.

El CEO de Reddit afirma que Microsoft debe pagar para acceder al sitio.

Reddit afirma que Bing de Microsoft, Anthropic y Perplexity han recolectado datos de su plataforma sin autorización. "Ha sido muy complicado obstaculizar las actividades de estas empresas".

Steve Huffman, CEO de Reddit, ha instado a Microsoft y otras empresas a que compensen a la plataforma si desean continuar accediendo a sus datos. En una reciente entrevista, Huffman expresó que, sin acuerdos establecidos, Reddit carece de control sobre cómo se presenta su información y para qué se utiliza, lo que ha llevado a la red social a bloquear a aquellos que no aceptan sus condiciones sobre el uso de datos. Según él, ha sido problemático gestionar a empresas como Microsoft, Anthropic y Perplexity, que se han negado a negociar.

Recientemente, Reddit ha intensificado sus esfuerzos contra los web crawlers, comenzando por actualizar su archivo robots.txt para prohibir el acceso a aquellos que carecen de acuerdos. Los usuarios han observado que los resultados de Reddit sólo aparecían en Google, donde la compañía recibe pago por mostrar sus datos, mientras que en otros motores de búsqueda como Bing, los contenidos eran inaccesibles.

Huffman acusó a Microsoft de utilizar datos de Reddit para entrenar su inteligencia artificial y resumir contenidos en los resultados de Bing sin previo aviso. Además, mencionó que la información de Reddit se ha vendido a través de la API de Bing a otros motores de búsqueda. Él refutó las afirmaciones del CEO de Microsoft AI, Mustafa Suleyman, quien había calificado los datos públicos en internet como "software libre".

En respuesta a la desaparición de contenidos de Reddit en Bing, Jordi Ribas, jefe de búsqueda de Microsoft, afirmó que Reddit había bloqueado el acceso de Bing a su sitio, favoreciendo a otro motor de búsqueda y afectando la competencia. Por su parte, un portavoz de Microsoft indicó que la empresa respeta las directrices de los sitios que no desean que su contenido sea utilizado por sus modelos de inteligencia artificial generativa.

Huffman también subrayó que el reciente anuncio de OpenAI sobre SearchGPT, que mostrará resultados de Reddit gracias a un acuerdo previo, es un modelo a seguir. El portavoz de Reddit, Tim Rathschmidt, aclaró que hasta ahora, los acuerdos de licencias no han incluido usos exclusivos de los datos.

Al abogar por acuerdos de licencia, Reddit se une a otros medios tradicionales que buscan compensaciones por permitir que su contenido alimente la inteligencia artificial generativa. Huffman concluyó que el intercambio tradicional de valor entre los motores de búsqueda ha cambiado, ya que la búsqueda, la resumización y el entrenamiento de modelos están comenzando a fusionarse, lo que ha complicado la dinámica entre el rastreo y el tráfico de retorno.

Después de la publicación de esta noticia, un portavoz de Anthropic afirmó que la compañía ha mantenido a Reddit en su lista de bloqueo para rastreo desde mediados de mayo y que no han añadido ningún URL de Reddit a su rastreador desde entonces, respetando las normas de robots.txt. Microsoft no ofreció comentarios adicionales, y Perplexity no respondió a la solicitud de información.

  • Reddit
  • Microsoft
  • Web Crawlers