Reddit bloquea sus datos públicos en una nueva política de contenido y dice que su uso ahora requiere un contrato

El jueves, Reddit implementará una nueva política destinada a equilibrar su deseo de otorgar licencias de su contenido a empresas tecnológicas más grandes, como Googley proteger la privacidad de los usuarios. La “Política de contenido público” recientemente anunciada ahora se unirá a la política de privacidad y la política de contenido existentes de Reddit para guiar cómo las entidades comerciales y otros socios acceden y utilizan los datos de Reddit. En relación con esto, la compañía también anunció un subreddit dedicado a los investigadores que trabajan con los datos de Reddit.

El anuncio se produce poco después del debut en el mercado de valores de Reddit, en el que la compañía se posiciona para aumentar los ingresos no solo de los anuncios que se ejecutan en su plataforma y el uso de API por parte de los desarrolladores, sino también de su corpus de datos. La compañía en su prospecto de IPO dijo que ya había ganado 203 millones de dólares a través de acuerdos de licencia de datos y espera que esa cifra aumente con el tiempo.

Si bien Reddit históricamente no había bloqueado el acceso a sus datos con fines de entrenamiento de IA, cambió su rumbo el año pasado. El director ejecutivo de Reddit, Steve Huffman, dijo al New York Times que no tenía sentido que Reddit siguiera dando “todo ese valor a algunas de las empresas más grandes del mundo de forma gratuita”, lo que indica el plan de la empresa de pasar al sector de las licencias de datos. espacio.

Con esos esfuerzos ya en marcha, la nueva Política de Contenido Público bloqueará el acceso a los datos de Reddit sin un acuerdo. (Reddit dice que no agregará nuevas restricciones, solo publicará la política que ha implementado internamente durante algún tiempo).

“Desafortunadamente, vemos cada vez más entidades comerciales que utilizan el acceso no autorizado o hacen un mal uso del acceso autorizado para recopilar datos públicos en masa, incluido el contenido público de Reddit”. Reddit escribe en su blog. “Peor aún, estas entidades perciben que no tienen limitación en el uso de esos datos, y lo hacen sin tener en cuenta los derechos o la privacidad del usuario, ignorando solicitudes legales, de seguridad y de eliminación razonables del usuario. Si bien continuaremos nuestros esfuerzos para bloquear a los malos actores conocidos, debemos hacer más para restringir el acceso al contenido público de Reddit a escala a actores confiables que hayan aceptado cumplir con nuestras políticas. Pero también debemos seguir garantizando que los usuarios, mods, investigadores y otros actores no comerciales de buena fe tengan acceso”.

En otras palabras, el acceso a los datos de Reddit para investigación y otros esfuerzos no comerciales continuará, pero aquellas entidades que quieran utilizar los datos de Reddit para otros fines, incluido el entrenamiento en IA, tendrán que pagar. En un gráfico compartido en el blog, Reddit deja esto claro y dice que las empresas interesadas en utilizar los datos de Reddit para “potenciar, aumentar o mejorar su producto para cualquier fin comercial” requieren un contrato.

Créditos de imagen: Reddit

Mientras tanto, los anunciantes son dirigidos a una API de anuncios para administrar campañas y realizar un seguimiento de su rendimiento.

Debido a que la empresa es esencialmente un sitio web grande, indexable por los motores de búsqueda, esta nueva política tiene como objetivo bloquear el contenido de Reddit de cualquier colección no autorizada y al mismo tiempo respetar los derechos de los usuarios.

Por ejemplo, Reddit dice que sus socios tendrán que subir las decisiones de los usuarios para eliminar su contenido. Entonces, si los usuarios no quieren que sus publicaciones personales se conviertan en material para futuros motores de IA, deberían poder optar por no participar. La nueva política también restringe a los socios el uso del contenido de Reddit para identificar personas o su información personal, incluso para la orientación de anuncios. Los socios tampoco pueden usar el contenido de Reddit para enviar spam o acosar a sus usuarios o para realizar “verificaciones de antecedentes, reconocimiento facial, vigilancia gubernamental o ayudar a las autoridades a hacer cualquiera de las cosas anteriores”.

La política además restringe el acceso a medios para adultos y aclara que Reddit no venderá la información personal de sus usuarios. La compañía también señala que nunca otorgará licencias para contenido no público, como mensajes privados o información de cuentas no públicas, como correos electrónicos de usuarios o historial de navegación, entre otras cosas.

Para ayudar a los investigadores que quieran utilizar los datos de Reddit con fines no comerciales, la empresa ha creado un nuevo subreddit, r/reddit4investigadores. La compañía dice que se está asociando con Minado abierto también desarrollar un programa para guiar y hacer crecer la colaboración de los investigadores con Reddit.

Fuente