Meta e il Torrente di 82TB di Libri Protetti da Copyright per l’Addestramento dell’IA: Cosa C’è da Sapere

La società madre di Facebook, Meta, si trova a fronteggiare una potenziale situazione legale complicata a causa di una causa intentata da un gruppo di autori. Quest’azione legale accusa Meta di aver utilizzato materiale protetto da copyright senza autorizzazione per lo sviluppo di prodotti basati su intelligenza artificiale. Secondo recenti aggiornamenti, si sostiene che Meta abbia scaricato fino a 82TB di contenuti per la formazione dell’AI.

Dimensione dei dataset utilizzati da Meta per l’AI training

La causa contro Meta, risalente alla metà di gennaio 2025, è un seguito di un’altra già presentata nel 2023, che era stata respinta in precedenza. I querelanti affermano che Meta abbia utilizzato illegalmente contenuti da libri per addestrare i propri modelli Llama AI. Inizialmente, si stimava che il volume del materiale protetto utilizzato fosse di circa 32TB, ottenuto da LibGen, un dataset disponibile online che comprendeva contenuti di vario genere, dalla comicità alla scienza.

I dataset di Meta: un volume maggiore del previsto

Le ultime informazioni sul caso rivelano che Meta potrebbe aver utilizzato una quantità di dati significativamente maggiore. Oltre a LibGen, la società ha presumibilmente utilizzato i dataset di Anna’s Archive e Z-Library, per un totale di 82TB di file utilizzati per la formazione dell’AI.

Le evidenze presentate nel processo mostrano preoccupazioni espresse da alcuni dipendenti di Meta coinvolti nel progetto. Un ricercatore senior dell’AI avrebbe commentato: “Non credo che dovremmo usare materiale piratato. È necessario tracciare un confine qui”. Un altro ricercatore ha aggiunto: “L’uso di materiale piratato dovrebbe andare oltre il nostro livello etico”.

Le azioni di Meta per evitare tracciabilità dei download

I documenti indicano anche che Meta avrebbe tentato di nascondere le proprie operazioni. La compagnia avrebbe cercato di evitare di lasciare tracce che potessero permettere di rintracciare l’attività di download dei dataset sui propri server, suggerendo che Meta potrebbe aver deliberatamente tentato di eludere le leggi sul copyright.

La risoluzione di questo caso non sembra imminente. Si prevedono le prime sentenze nel giro di qualche mese e, in caso di esito negativo per Meta, è probabile che la società faccia appello, il che potrebbe ulteriormente allungare la durata del processo. È possibile che una sentenza definitiva non venga raggiunta prima di anni. Questa azione legale, insieme ad altre, evidenzia come il tema del copyright per la formazione AI rimanga una zona grigia, persino anni dopo.

Continue reading

NEXT

Novità degli Aggiornamenti di Sistema Google di Android di Febbraio 2025: Tutto Quello che Devi Sapere

novità nei servizi google di febbraio 2025 Le ultime registrazioni mensili riguardanti il sistema Google forniscono dettagli su quanto di nuovo è stato integrato nei servizi Google Play, Play Store e nel sistema di aggiornamenti sui dispositivi Android, Wear OS, […]
PREVIOUS

Nuova serie Roborock Saros 10: tecnologie avanzate e sconti imperdibili fino a 200 dollari

Recentemente presentati al CES 2025, i modelli di robot aspirapolvere Roborock Saros 10 e Saros 10R sono ora disponibili per l’acquisto, apportando importanti miglioramenti tecnologici e strumenti di pulizia più efficaci, con un’offerta di $200 di sconto sul prezzo di […]

Potrebbero interessarti

Commenti

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *

I più popolari

Di tendenza