Un grupo que representa al New York Times y a otras 2200 personas acaba de publicar un devastador informe de 77 páginas sobre cómo ChatGPT y LLMs son un fraude ilegal.

¡Un reporte demoledor de 77 páginas! El New York Times y más de 2200 personas destapan el fraude ilegal de ChatGPT y LLMs.

Desde actores de Hollywood hasta famosos escritores han estado luchando para proteger su trabajo contra el uso desenfrenado de la inteligencia artificial, y los editores de noticias han argumentado que empresas desarrolladoras como la compañía matriz de ChatGPT, OpenAI, y Google han estado utilizando ilegalmente su trabajo con derechos de autor para entrenar a los chatbots.

La News Media Alliance, un grupo comercial que representa a más de 2.200 organizaciones de medios de comunicación, publicó un informe de 77 páginas el martes, argumentando que algunos de los chatbots de IA más populares, como ChatGPT y Bard de Google, dependen en gran medida de los artículos de noticias para entrenar su tecnología. Y debido a la forma en que se entrenan estos chatbots, las respuestas que generan pueden ser casi idénticas al contenido con derechos de autor.

“La IA generativa, aunque prometedora para los consumidores, las empresas y la sociedad en general, son productos comerciales que se han construido, y se ejecutan, a expensas de los colaboradores creativos”, dice el informe.

La guerra de los medios contra la IA

Los modelos de lenguaje grandes, o LLM, son un tipo de IA capaz de entender y generar texto escrito. Se entrenan analizando grandes cantidades de datos y imitando patrones de escritura, al mismo tiempo que despliegan un conocimiento aparentemente enciclopédico. Sin embargo, dado que muchos desarrolladores no revelan públicamente qué contenido se utiliza para entrenar sus modelos, es imposible saber con certeza qué datos se están citando o replicando. La Alianza cree que lo sabe.

Al analizar una muestra de conjuntos de datos que se cree que se utilizan para entrenar LLM, la News Media Alliance descubrió que el contenido de noticias, revistas y publicaciones de medios digitales se usaba de cinco a 100 veces más frecuentemente que los datos web abiertos, como los de Common Crawl. El informe argumentó que esto es una violación de las leyes de “uso justo”, que permiten la reproducción o copia de material con derechos de autor sin licencia para fines limitados. 

“Realmente actúa como un sustituto de nuestro propio trabajo”, dijo Danielle Coffey, presidenta y CEO de la News Media Alliance, al New York Times. “Nuestros artículos son tomados y regurgitados textualmente”.

El informe argumenta que la afirmación “antropomórfica” de los desarrolladores de IA de que solo están utilizando material escrito publicado para entrenar sus modelos es “técnicamente incorrecta y además no es relevante”.

Coffey agregó que el grupo de medios de comunicación tendría un “muy buen caso en el tribunal” contra los desarrolladores.

La espada de Damocles para las industrias creativas

El surgimiento de la IA generativa ha sido la espada de Damocles que pende sobre la cabeza de los medios de comunicación. Si un chatbot puede destilar grandes cantidades de información y resumirla en texto legible y preciso, teóricamente podría dejar sin trabajo a los periodistas.

Y la Alianza dice que este posible futuro no solo sería perjudicial para la industria del periodismo, sino también para la sociedad: “Si Internet se llena de productos de IA generativa, entonces la IA misma no tendrá nada más que entrenar”.

No solo los medios de comunicación se están preparando para esto. Autores como John Grisham, el creador de Game of Thrones George R.R. Martin y otros 17 presentaron una demanda colectiva en septiembre contra OpenAI por entrenar a ChatGPT con sus libros con derechos de autor. Y la falta de salvaguardias en torno al uso de la tecnología en desarrollo fue el centro de la huelga dual de actores y escritores de Hollywood, ya que temían que los estudios usarían la tecnología para replicar sus imágenes sin su permiso o reemplazarlos por completo.

“Esta evidencia demuestra que los frutos de la creatividad humana son el combustible esencial que sustenta la revolución del GAI”, dijo el informe.