Pirateria de llibres: per què Meta s'arrisca a un multa multimilionaria

Pirateria de llibres: per què Meta s’arrisca a un multa multimilionaria

Clément Solym

És un dilema multimilionari que està sacsejant els tribunals dels Estats Units i del Regne Unit. Al cor del cas: la intel·ligència artificial desenvolupada per Meta, capaç de repetir paraula per paraula el contingut de llibres amb drets d’autor. El descobriment ha tremolat els gegants tecnològics i encantat els advocats dels autors.

Tot va començar amb una observació vergonyosa, segons informa New Scientist. Investigadors van provar tretze models d’intel·ligència artificial, inclosos els de Meta, OpenAI, Google, DeepSeek, EleutherAI i Microsoft. L’objectiu: verificar fins a quin punt aquests sistemes, entrenats en milions de documents, són capaços de regurgitar text dels llibres que han ingerit. Els resultats són concloents.

Només cal que ho utilitzeu!

Tot i que la majoria de models reprodueixen molt pocs fragments exactes, el model LLaMA 3.1 de Meta recita certes obres gairebé íntegrament. Clàssics com Harry Potter i la pedra filosofal, El gran Gatsby i 1984 d’Orwell.

«Això significa que les IA no només identifiquen patrons lingüístics generals. Aprenen molt més que només relacions entre paraules», observa Mark Lemley, professor de dret de Stanford i expert en tecnologia. Assenyala que la capacitat de memorització varia segons els models i els llibres de text, cosa que fa que qualsevol intent d’establir una norma jurídica universal sigui particularment complex.

El tema ha estat un tema candent als tribunals durant mesos. Als Estats Units, escriptors com Sarah Silverman han demandat Meta. La seva denúncia acusa l’empresa d’utilitzar les seves obres sense permís per entrenar els seus models d’IA. El cas, anomenat Kadrey contra Meta Platforms, està actualment en tràmit en un tribunal federal del nord de Califòrnia.

Les revelacions dels investigadors arriben en el pitjor moment possible per al grup de Mark Zuckerberg. L’equip de Lemley va demostrar que Meta havia entrenat la seva IA amb la base de dades “Books3”, que conté gairebé 200.000 llibres, molts dels quals eren pirates. Un detall obtingut de les comunicacions internes entre els enginyers de l’empresa ho confirma: “Descarregar un torrent des d’un ordinador de treball de Meta… això no sembla gaire legal”, es preocupava un d’ells en missatges produïts al jutjat.

No és tan estúpid per ser tan directe.

La qüestió no és si es va utilitzar contingut protegit per a la formació. Les empreses reconeixen fàcilment aquesta pràctica. El que es debat és el seu dret a fer-ho. Als Estats Units, la defensa es basa en el principi d'”ús legítim”, que se suposa que permet, sota certes condicions, l’ús no autoritzat de contingut protegit.

Per a Meta, aquesta excepció és vital. “L’ús legítim d’obres amb drets d’autor és essencial per al desenvolupament dels nostres models”, insisteix Emil Vázquez, portaveu del grup.

Article publicat a l’Actualitté, clica aquí per accedir a l’article sencer.