La società madre di Facebook, Meta, si trova a fronteggiare una potenziale situazione legale complicata a causa di una causa intentata da un gruppo di autori. Quest’azione legale accusa Meta di aver utilizzato materiale protetto da copyright senza autorizzazione per lo sviluppo di prodotti basati su intelligenza artificiale. Secondo recenti aggiornamenti, si sostiene che Meta abbia scaricato fino a 82TB di contenuti per la formazione dell’AI.
Dimensione dei dataset utilizzati da Meta per l’AI training
La causa contro Meta, risalente alla metà di gennaio 2025, è un seguito di un’altra già presentata nel 2023, che era stata respinta in precedenza. I querelanti affermano che Meta abbia utilizzato illegalmente contenuti da libri per addestrare i propri modelli Llama AI. Inizialmente, si stimava che il volume del materiale protetto utilizzato fosse di circa 32TB, ottenuto da LibGen, un dataset disponibile online che comprendeva contenuti di vario genere, dalla comicità alla scienza.
I dataset di Meta: un volume maggiore del previsto
Le ultime informazioni sul caso rivelano che Meta potrebbe aver utilizzato una quantità di dati significativamente maggiore. Oltre a LibGen, la società ha presumibilmente utilizzato i dataset di Anna’s Archive e Z-Library, per un totale di 82TB di file utilizzati per la formazione dell’AI.
Le evidenze presentate nel processo mostrano preoccupazioni espresse da alcuni dipendenti di Meta coinvolti nel progetto. Un ricercatore senior dell’AI avrebbe commentato: “Non credo che dovremmo usare materiale piratato. È necessario tracciare un confine qui”. Un altro ricercatore ha aggiunto: “L’uso di materiale piratato dovrebbe andare oltre il nostro livello etico”.
Le azioni di Meta per evitare tracciabilità dei download
I documenti indicano anche che Meta avrebbe tentato di nascondere le proprie operazioni. La compagnia avrebbe cercato di evitare di lasciare tracce che potessero permettere di rintracciare l’attività di download dei dataset sui propri server, suggerendo che Meta potrebbe aver deliberatamente tentato di eludere le leggi sul copyright.
La risoluzione di questo caso non sembra imminente. Si prevedono le prime sentenze nel giro di qualche mese e, in caso di esito negativo per Meta, è probabile che la società faccia appello, il che potrebbe ulteriormente allungare la durata del processo. È possibile che una sentenza definitiva non venga raggiunta prima di anni. Questa azione legale, insieme ad altre, evidenzia come il tema del copyright per la formazione AI rimanga una zona grigia, persino anni dopo.
Lascia un commento