Un grupo de escritores, entre los que se encuentran el ex gobernador de Arkansas Mike Huckabee y la autora de éxitos de venta cristianos Lysa TerKeurst, presentó una demanda ante una corte federal de Nueva York en la que acusa a Meta, Microsoft y Bloomberg de utilizar sin permiso sus obras para entrenar a robots de chat basados en inteligencia artificial.
La demanda colectiva por derechos de autor presentada el martes afirma que las empresas utilizaron el controvertido conjunto de datos «Books3», que según los autores contiene miles de libros pirateados, para enseñar a sus modelos de gran tamaño a responder a preguntas humanas.
La demanda también acusaba al grupo de investigación en inteligencia artificial EleutherAI de violación de los derechos de autor por haber proporcionado supuestamente los datos utilizados para entrenar los sistemas de las empresas que incluyen Books3.
Un portavoz de Bloomberg declaró este miércoles que la empresa no utilizaba Books3 para entrenar las versiones comerciales de su chatbot BloombergGPT, aunque sí utilizaba el conjunto de datos para entrenar su modelo de investigación. Los representantes de las otras empresas no respondieron inmediatamente a las solicitudes de comentarios sobre la demanda este miércoles.
«Demasiadas empresas han estado avanzando en sistemas de inteligencia artificial y grandes modelos de lenguaje por todos los medios necesarios, incluido el robo de los libros de nuestros autores», dijeron los abogados de los autores en un comunicado este miércoles. «No nos oponemos a la innovación; nos oponemos al robo que hay detrás de la innovación.
Los titulares de derechos de autor, incluidos artistas visuales y otros autores, también han presentado recientemente demandas contra grandes empresas tecnológicas por el uso no autorizado de sus contenidos para entrenar sistemas generativos de IA. Las empresas de IA han alegado que el uso que hacen de los datos está protegido por la doctrina de uso justo de la legislación estadunidense sobre derechos de autor.
Muchas de las demandas de los autores se centran en Books3, que supuestamente incluye textos de miles de libros extraídos de «bibliotecas en la sombra» ilegales de Internet.
Huckabee, TerKeurst y los escritores David Kinnaman, Tsh Oxenreider y John Blase declararon ante el tribunal que sus libros formaban parte del conjunto de datos y se utilizaron indebidamente para entrenar el modelo de gran lenguaje Llama 2 de Meta, desarrollado en colaboración con Microsoft, y BloombergGPT de Bloomberg.
Los autores afirman que las empresas «obtuvieron ilícitamente un enorme valor» de sus libros. Piden al tribunal una indemnización por daños y perjuicios no especificada y una orden que impida el uso indebido de su trabajo.