El modelo de negocio de Internet se ha basado durante años en una idea tácita: si algo es gratuito, probablemente el producto somos nosotros. Esta lógica se aceptaba sin mayor problema, pero la llegada de la inteligencia artificial está cambiando las reglas del juego. Plataformas que reúnen conversaciones de usuarios se han convertido en auténticas minas de oro para entrenar estos modelos, lo que ha puesto sobre la mesa nuevamente el debate sobre el valor de los datos. En este contexto, Reddit ha tomado una postura firme: aunque sus millones de usuarios no reciben pago por el contenido que generan, la empresa no permitirá que terceros lo utilicen sin remuneración.
Esta determinación se ha plasmado en una denuncia presentada ante la justicia de Estados Unidos. Reddit acusa a Perplexity AI y a tres proveedores de servicios de recolección automatizada de datos, de evadir sus mecanismos de protección para acceder a contenido protegido por derechos de autor. En la demanda, Reddit habla de un “raspado a escala industrial” y sostiene que estas empresas buscan obtener ilegalmente el material necesario para alimentar sus motores de inteligencia artificial. Es parte de una estrategia clara de la plataforma para controlar el uso de su contenido.
El caso es particular. En el centro de la denuncia están Perplexity AI y tres intermediarios especializados en el raspado masivo: SerpApi, Oxylabs y AWMProxy. Reddit los califica como “aspirantes a ladrones de bancos”, usando esta metáfora para ilustrar que intentan acceder a su contenido de forma indirecta, en lugar de negociar licencias. Según la demanda, estas firmas habrían optado por usar terceros para recolectar publicaciones, comentarios y otros datos con derechos de autor. Además, Perplexity AI figura como cliente de al menos uno de estos proveedores.
El documento judicial describe un comportamiento que, según Reddit, se ha repetido durante meses. Estas compañías habrían utilizado métodos automatizados para extraer información pese a las restricciones en la plataforma. El resultado, denuncian, fue un flujo constante de publicaciones que terminaron integradas dentro del motor de inteligencia artificial de Perplexity. Para Reddit esto no es solo raspado masivo, sino un uso comercial claro.
Uno de los momentos clave en la denuncia fue un experimento realizado por Reddit en mayo de 2024. Tras ordenar a Perplexity que dejara de recolectar sus datos, observaron poco después un aumento en las menciones de Reddit dentro del motor de respuestas de la empresa acusada. Para comprobarlo, publicaron una entrada visible solo para Google y, según la denuncia, en pocas horas ese texto completo apareció en los resultados de Perplexity, demostrando que seguían accediendo a su contenido.
Perplexity respondió públicamente en Reddit, señalando que es una “compañía de capa de aplicación” y que no entrena modelos de inteligencia artificial con contenido de Reddit, asegurando que “nunca lo ha hecho”. Por eso, argumentan, no pueden firmar acuerdos de licencia como los que Reddit tiene con otras empresas. También comentaron que, hace un año, tras explicar esta diferencia, Reddit insistió igualmente en que pagaran. “No cedemos ante ese tipo de tácticas”, concluyeron.
La postura de Reddit frente a Perplexity contrasta con los acuerdos que sí ha alcanzado con otras compañías. En febrero de 2024 amplió su colaboración con Google, permitiendo el acceso a su contenido mediante una API con licencia y control estructurado. Tres meses después, firmó una alianza con OpenAI para que productos como ChatGPT puedan mostrar publicaciones recientes de Reddit en sus respuestas.
Un detalle importante que muchos usuarios pasan por alto son los Términos de Servicio de Reddit. Al crear una cuenta, cada persona otorga a la plataforma una licencia mundial, perpetua, irrevocable y sublicenciable para usar su contenido. Esta licencia permite copiar, modificar, distribuir o publicar cualquier aporte, incluso con socios externos. Además, Reddit puede usar ese material para “entrenar modelos de inteligencia artificial y aprendizaje automático”, lo que implica que el permiso para ese uso ya está concedido.
Reddit ha ido definiendo una línea clara de actuación. En 2023 endureció las condiciones de acceso a su API, lo que generó protestas y el cierre temporal de miles de comunidades. En mayo de 2024 envió una carta de cese a Perplexity por uso no autorizado de sus datos y posteriormente presentó una demanda contra Anthropic por razones similares. La actual batalla legal responde a la misma estrategia: proteger el valor de su contenido y controlar quién puede usarlo.
Aunque el caso entre Reddit y Perplexity aún está en sus etapas iniciales, sus consecuencias son evidentes. La decisión de los tribunales podría sentar un precedente importante en la relación entre plataformas y desarrolladores de inteligencia artificial. Por un lado está la defensa del acceso libre a la información; por otro, el derecho de las plataformas a proteger el contenido que sus comunidades generan día a día. El resultado definirá hasta dónde puede llegar el control de estas empresas sobre el material compartido por sus usuarios.



