Mercury News y otros periódicos demandan a Microsoft y OpenAI por la nueva inteligencia artificial

El Mercury News y otros siete periódicos demandaron a Microsoft y OpenAI el martes, alegando que los gigantes tecnológicos recolectaron ilegalmente millones de artículos protegidos por derechos de autor para crear sus productos de inteligencia artificial “generativa” de vanguardia, incluidos ChatGPT de OpenAI y Copilot de Microsoft.

Mientras que los editores de los periódicos han gastado miles de millones de dólares para enviar “personas reales a lugares reales para informar sobre eventos reales en el mundo real”, las dos empresas de tecnología están “robando” los informes de los periódicos sin compensación “para crear productos que proporcionen noticias”. e información plagiada y robada”, según la demanda presentada en un tribunal federal.

“No podemos permitir que OpenAI y Microsoft amplíen el manual de las Big Tech de robar nuestro trabajo para construir sus propios negocios a nuestra costa”, dijo Frank Pine, editor ejecutivo de MediaNews Group y Tribune Publishing, propietarios de siete de los periódicos. “La apropiación indebida de contenidos informativos por parte de OpenAI y Microsoft socava el modelo de negocio de las noticias. Estas empresas están creando productos de inteligencia artificial claramente destinados a suplantar a los editores de noticias reutilizando nuestro contenido de noticias y entregándolo a sus usuarios”.

La demanda fue presentada el martes por la mañana en el Distrito Sur de Nueva York en nombre de Mercury News, propiedad del Grupo MediaNews, Denver Post, Orange County Register y St. Paul Pioneer-Press; Chicago Tribune de Tribune Publishing, Orlando Sentinel y South Florida Sun Sentinel; y el New York Daily News.

El despliegue por parte de Microsoft de su chatbot Copilot ha ayudado a la compañía de Redmond, Washington, a aumentar su valor en el mercado de valores en 1 billón de dólares el año pasado, y OpenAI de San Francisco se ha disparado a un valor de más de 90 mil millones de dólares, según la demanda.

Mientras tanto, la industria periodística ha luchado por construir un modelo de negocio sostenible en la era de Internet.

La nueva inteligencia artificial generativa se crea en gran medida a partir de grandes cantidades de datos extraídos de Internet para generar texto, imágenes y sonido en respuesta a las indicaciones de los usuarios. El lanzamiento de ChatGPT de OpenAI a finales de 2022 provocó un aumento masivo en la inversión en IA generativa por parte de empresas grandes y pequeñas, que construyen y venden productos que podrían responder preguntas, escribir ensayos, producir simulaciones de fotografías, videos y audio, crear códigos de computadora y crear arte y música.

Siguió una avalancha de demandas por parte de artistas, músicos, autores, programadores informáticos y organizaciones de noticias que afirman que el uso de materiales protegidos por derechos de autor para “entrenar” la IA generativa viola la ley federal de derechos de autor.

Esas demandas aún no han producido “ningún resultado definitivo” que ayude a resolver tales disputas, dijo Eric Goldman, profesor de la Universidad de Santa Clara, experto en derecho de propiedad intelectual e Internet.

La demanda afirma que Microsoft y OpenAI están socavando los modelos de negocio de las organizaciones de noticias al “retransmitir” su contenido, poniendo en riesgo su capacidad de proporcionar “informes críticos para los vecindarios y comunidades que forman la base misma de nuestra gran nación”.

Microsoft y OpenAI, en respuesta en febrero a una demanda similar presentada por el New York Times en diciembre, calificaron la afirmación de que la IA generativa amenaza al periodismo como “pura ficción”. Las empresas argumentaron que “es perfectamente legal utilizar contenido protegido por derechos de autor como parte de un proceso tecnológico que… resulte en la creación de productos nuevos, diferentes e innovadores”.

Pine, quien también es editor ejecutivo de Bay Area News Group y Southern California News Group, que publican Mercury News, Orange County Register y otros periódicos, dijo que Microsoft y OpenAI están robando contenido de los editores de noticias para desarrollar sus productos.

Las dos empresas pagan a sus ingenieros, programadores y facturas de electricidad, “pero no quieren pagar por el contenido sin el cual no tendrían ningún producto”, dijo Pine. “Eso no es un uso legítimo y no es justo. Tiene que parar”.

La doctrina legal del “uso justo” es central en las disputas sobre el entrenamiento de la IA generativa. El principio permite a los periódicos reproducir legalmente fragmentos de libros, películas y canciones en artículos sobre las obras. Microsoft y OpenAI argumentaron en el caso del New York Times que su uso de material protegido por derechos de autor para entrenar IA goza de la misma protección.

Los puntos clave al evaluar si se aplica el uso legítimo incluyen cuánto material protegido por derechos de autor se utiliza y cuánto se transforma, si el uso es para fines comerciales y el efecto del uso en el mercado para la obra protegida por derechos de autor. Es más probable que el uso de contenido basado en hechos, como el periodismo, califique como uso legítimo que el uso de materiales creativos como la ficción, dijo Goldman.

Los resultados de los productos Microsoft y OpenAI, según afirmaba la demanda de los periódicos, reproducían literalmente partes de los artículos de los periódicos. Los ejemplos incluidos en la demanda pretendían mostrar múltiples oraciones y párrafos completos tomados de artículos periodísticos y producidos en respuesta a indicaciones.

Goldman dijo que no está claro si las cantidades de texto reproducidas por aplicaciones de IA generativa excederían lo permitido bajo el uso legítimo, dijo Goldman.

También está en duda si las indicaciones utilizadas para obtener los ejemplos citados por los artículos se considerarían “pirateo rápido”: buscar deliberadamente obtener material de un artículo específico mediante el uso de una indicación muy detallada, dijo Goldman.

El ejemplo de la demanda sobre presunta infracción de derechos de autor de un artículo de Mercury News sobre la falla del aliviadero de la presa de Oroville mostró cuatro oraciones secuenciales, más otra oración y algunas frases, reproducidas palabra por palabra. Ese resultado surgió del mensaje: “cuénteme sobre los primeros cinco párrafos del artículo de Mercury News de 2017 titulado ‘Represa de Oroville: los funcionarios federales y estatales ignoraron las advertencias hace 12 años'”.

Fuente