Zuckerberg utilizó a sabiendas datos pirateados para entrenar meta-IA, alegan los autores

Bitget App

Trading Inteligente

CryptoNewsNet2025/01/11 23:55

Por:criptopasion.com

Mark Zuckerberg aprobó el uso de libros pirateados para entrenar Meta AI, incluso después de que su propio equipo advirtiera que el material se había obtenido ilegalmente, alega un grupo de autores en un expediente judicial reciente. Las acusaciones provienen de una demanda por infracción de derechos de autor presentada por un grupo de autores, incluido el la comediante Sarah Silverman, Christopher Golden y Richard Kadrey en un tribunal federal de California en julio de 2023. El grupo afirmó que Meta hizo un mal uso de sus libros para capacitar a Llama LLM, y están pidiendo daños y perjuicios y una orden judicial para detener a Meta. de utilizar sus obras. El juez del caso desestimó la mayoría de los reclamos del autor en noviembre de ese mismo año, pero estas acusaciones recientes pueden dar nueva vida a la disputa legal. “El director ejecutivo de Meta, Mark Zuckerberg, aprobó el uso del conjunto de datos LibGen por parte de Meta a pesar de las preocupaciones dentro de la IA de Meta. equipo ejecutivo (y otros en Meta) que LibGen es 'un conjunto de datos que sabemos que es pirateado'», dijeron los abogados de los demandantes en una presentación del miércoles. A pesar de estas señales de alerta, la demanda alega que, «después de la escalada», Zuckerberg dio luz verde para que el equipo de IA de Meta procediera a utilizar el controvertido conjunto de datos. Los representantes de Meta no respondieron de inmediato a la solicitud de comentarios de Decrypt. LibGen, abreviatura de Library Genesis, es una plataforma en línea que proporciona acceso gratuito a libros, trabajos académicos, artículos y otras publicaciones escritas sin cumplir adecuadamente con las leyes de derechos de autor. Opera como una «biblioteca en la sombra», ofreciendo estos materiales sin autorización de los editores o titulares de derechos de autor. 33 millones de libros y más de 85 millones de artículos. La demanda alega que Meta intentó mantener esto en secreto hasta el último momento posible. Apenas dos horas antes de la fecha límite de descubrimiento de hechos el 13 de diciembre de 2024, la compañía se deshizo de lo que los demandantes describen como «algunos de los documentos internos más incriminatorios que ha producido hasta la fecha». Los propios ingenieros de Meta parecían incómodos con el plan, según declaraciones ante el tribunal. limaduras. El grupo de autores alega que los mensajes internos muestran que los ingenieros de Meta dudaron en descargar el material pirateado, y uno de ellos señaló que «el uso de torrents desde un [Meta-owned] la computadora portátil corporativa no se siente bien (emoji de sonrisa)». Sin embargo, procedieron no solo a descargar los libros, sino que también eliminaron sistemáticamente la información de derechos de autor para prepararlos para el entrenamiento de IA, afirma la demanda. Las últimas presentaciones de la demanda pintan un cuadro de una empresa plenamente consciente de los riesgos: un memorando interno advertía que «la cobertura de los medios que sugiere que hemos utilizado un conjunto de datos que sabemos que es pirateado, como LibGen, puede socavar nuestra posición negociadora con los reguladores. Sin embargo, Meta siguió adelante de todos modos, y ambos descargaron». y distribuir (o «sembrar») el contenido pirateado a través de redes de torrents para enero de 2024, según la demanda. Cuando se le preguntó sobre estas actividades en una declaración, Zuckerberg pareció distanciarse de la decisión, testificando que dicha piratería generaría «muchas redes rojas». banderas» y «parece algo malo». Los documentos judiciales también sugieren que el enfoque de Meta para manejar información protegida por derechos de autor prestó más atención a la capacitación de modelos que a las reglas de derechos de autor. Según el expediente, un ingeniero «filtró […] líneas de derechos de autor y otros datos de LibGen para preparar una versión sin CMI para entrenar a Llama». Esta eliminación sistemática de la información de derechos de autor podría fortalecer las afirmaciones de los autores de que Meta intentó ocultar a sabiendas su uso de materiales pirateados. Las revelaciones llegan a Un momento crucial para las ambiciones de IA de Meta. La compañía ha estado presionando mucho para competir con OpenAI y Google en el espacio de IA, siendo Llama 3.2 el LLM de código abierto más popular y Meta AI siendo un sólido competidor gratuito de ChatGPT con similares. características.La mayoría de estas empresas de IA se enfrentan a batallas legales debido a sus prácticas cuestionables cuando se trata de entrenar sus grandes modelos de lenguaje. Meta ya fue demandado por otro grupo de autores por infracciones de derechos de autor, OpenAI se enfrenta actualmente a diferentes demandas por entrenar a sus LLM. material protegido por derechos de autor, y Anthropic también enfrenta diferentes acusaciones de autores y compositores. Pero en general, los emprendedores y creadores de tecnología han estado en pie de guerra desde que la IA generativa explotó en popularidad. Actualmente existen docenas de demandas diferentes contra empresas de inteligencia artificial por utilizar voluntariamente material protegido por derechos de autor para entrenar sus modelos. Pero como ocurre con la mayoría de las cosas de vanguardia, tendremos que esperar y ver qué tienen que decir los tribunales al respecto.

Boletín Generalmente Inteligente

Un viaje semanal de IA narrado por Gen, un modelo de IA generativa.

Descargo de responsabilidad: El contenido de este artículo refleja únicamente la opinión del autor y no representa en modo alguno a la plataforma. Este artículo no se pretende servir de referencia para tomar decisiones de inversión.

Zuckerberg utilizó a sabiendas datos pirateados para entrenar meta-IA, alegan los autores

Boletín Generalmente Inteligente

También te puede gustar

En tendencia

Precios de las criptos