La legge 23 settembre 2025, n. 132 (entrata in vigore il 10 ottobre scorso) - “legge IA”, contiene una serie di disposizioni che definiscono l’assetto regolatorio scelto dal legislatore nazionale in materia di intelligenza artificiale. Indubbiamente è “la prima legge organica di uno Stato membro in materia IA” (come si legge nella relazione illustrativa), benché non si possa dimenticare che l’Unione europea ha emanato nel giugno dello scorso anno l’AI Act (Regolamento UE 2024/1689).
In questo assetto, appare non completamente infondato domandarsi se le disposizioni nazionali siano pienamente compatibili con la disciplina europea, che rimane gerarchicamente sovraordinata. O se, in alternativa, possano essere considerate conformi solo a condizione di una loro interpretazione restrittiva.
Una rilettura delle norme domestiche è sollecitata anche dalla recente decisione nel caso GEMA/OpenAI (Tribunale di Monaco, 11 novembre 2025), tra le prime a qualificare, alla luce della normativa introdotta nei paesi europei, le attività per l’addestramento di AIGen.
In ambito nazione, ad esempio, con riferimento al diritto d’autore, è stata modificata la definizione di opere protette – che ora include le opere dell’ingegno umano di carattere creativo “anche laddove create con l’ausilio di strumenti di intelligenza artificiale, purché costituenti risultato del lavoro intellettuale dell’autore” (art. 1 legge autore).
La modifica non appare, in realtà, introdurre una novità sostanziale.
È infatti pacifico che il requisito della creatività umana non venga meno per il solo fatto che l’autore si avvalga di strumenti di ausilio: come non si è mai dubitato che fosse proteggibile un’opera figurativa ottenuta tramite l’uso di uno scalpello, un’opera letteraria scritta con il supporto di un programma per la correzione grammaticale o una fotografia rielaborata in post-produzione, altrettanto evidente è che il distinguo tra “opera dell’ingegno” e “materiale non creativo” non risiede nella completa assenza di qualsivoglia ausilio, ma nel grado di creatività che residua all’artista quando ricorre al suo uso.
Su questo tema, basti pensare all’ampio dibattito, anche oltreoceano, in relazione a tecniche come quella di dripping, di cui Jackson Pollock fu maestro.
Per queste ragioni, l’intervento sull’art. 1 della legge sul diritto d’autore non sembra idoneo ad attrarre automaticamente nella sfera della protezione gli output generati da sistemi di AI generativa.
Maggiori dubbi pone la nuova eccezione di TDM espressamente riferita all’AI, tema sul quale interviene anche la citata sentenza del Tribunale di Monaco dell’11 novembre 2025.
La “legge IA” in Italia ha introdotto nella disciplina sul diritto d’autore una nuova disposizione in materia di eccezione per text and data mining (TDM) e intelligenza artificiale generativa. Si tratta dell’art. 70 septies legge autore, che consente di applicare l’eccezione per TDM alle riproduzioni ed estrazioni (da opere o da altri materiali contenuti in rete o in banche di dati a cui si ha legittimamente accesso) effettuate “ai fini dell’estrazione di testo e di dati attraverso modelli e sistemi di intelligenza artificiale, anche generativa”.
Si può osservare innanzitutto che la nuova disposizione italiana ammette espressamente che l’estrazione (di testo e di dati) possa essere realizzata anche attraverso modelli e sistemi di intelligenza artificiale, anche generativa. In questo senso (e così interpretato) il nuovo art. 70 septies della legge autore appare assolutamente in linea con la normativa europea, posto che la direttiva digital copyright (direttiva 2019/790), nell’introdurre l’eccezione di TDM, ha adottato il principio di neutralità tecnologica, non limitando a specifici strumenti l’attività di riproduzione ed estrazione di testo e dati. Non ha detto, in altre parole, che la riproduzione può essere effettuata nell’ambito dell’eccezione solo con un certo strumento di scraping, una piattaforma cloud o determinato software.
È tuttavia legittimo chiedersi se il richiamo espresso ai sistemi di AI generativa miri, almeno nelle intenzioni, a ricomprendere nell’ambito applicativo dell’eccezione di TDM anche tutte le operazioni di addestramento dei Large Language Model (LLM).
In senso contrario parrebbe militare la stessa lettera della disposizione, che limita il fine delle riproduzioni e delle estrazioni alla “estrazione di testo e di dati”, senza menzionare l’addestramento di modelli.
Si potrebbe tuttavia ritenere che l’addestramento sia di fatto riducibile a una mera attività di estrazione e analisi di informazioni.
Su questo punto si è soffermato il Tribunale di Monaco nel caso GEMA/OpenAI, analizzando le caratteristiche dei diversi atti di riproduzione che si realizzano nelle varie fasi di preparazione (pre-training - fase 1) e addestramento (training - fase 2) di un sistema AI, prima del suo uso (nel caso di specie mediante chatbot).
Il tribunale tedesco ha innanzitutto osservato che per realizzare un sistema AI sono necessari alcuni atti preparatori (fase 1) che possono incidere sui diritti di utilizzazione, come la riproduzione di un’opera mediante la sua trasposizione in un diverso formato (digitale) o salvataggi nella memoria di lavoro. Si tratta di riproduzioni, viene precisato, in linea di principio lecite (ovviamente a condizione che derivino da fonti alle quali si ha legittimo accesso) nella misura in cui le copie “siano create unicamente per successive finalità di analisi e, con ciò, non pregiudichino gli interessi di sfruttamento dell’autore sull’opera”.
A questo tipo di riproduzioni si riferiscono espressamente gli artt. 70 ter e 70 quater della nostra legge autore, emanati in attuazione della direttiva digital copyright (direttiva 2019/790), che le consentono nel limite in cui siano realizzate “ai fini dell’estrazione di testo e di dati” (ossia proprio per godere dell’eccezione di TDM).
Può tuttavia accadere che nella successiva fase di addestramento del LLM (fase 2) non ci si limiti a estrarre informazioni dai dati di training, ma si riproducano opere, o loro porzioni dotate di creatività. Questa operazione, precisa il tribunale, “non costituisce text and data mining”.
La prospettazione del distinguo si fonda su una constatazione di merito: si è dedotto dall’osservazione dei risultati di output del sistema di OpenAI che, durante il processo di addestramento, il modello non si era limitato a estrarre regolarità statistiche dal dataset, ma aveva conservato porzioni di contenuti strutturati riconducibili alle opere originarie, rendendone possibile una successiva riproduzione in output.
Ove ciò accada, ha sottolineato il tribunale tedesco, l’atto di riproduzione rileva ai sensi della direttiva InfoSoc (direttiva 2001/29) e non è attratto nell’ambito dell’eccezione di TDM introdotta dalla direttiva digital copyright (direttiva 2019/790).
Alla luce delle direttive InfoSoc e digital copyright, quindi, il nuovo art. 70 septies della legge italiana sembra di fatto idoneo a confermare che le attività di deep learning attraverso reti neurali profonde possono rientrare nell’ambito dell’eccezione di TDM nella misura in cui:
- analizzino testi, immagini, video o audio,
- estraggano automaticamente pattern, caratteristiche, relazioni, strutture,
- e li trasformino in rappresentazioni numeriche utili all’apprendimento.
Restano invece comunque esclusi dall’ambito dell’eccezione di TDM gli atti di riproduzione finalizzati a far assumere nel modello porzioni creative dell’opera.
Tali atti sono soggetti ad autorizzazione da parte del titolare dei diritti, senza che l’eccezione di TDM possa trovare applicazione – precisa la corte tedesca.
Nella recente decisione ha trovato qualificazione giuridica alla luce delle norme UE anche l’atto di rendere le opere utilizzate in fase di pre-addestramento pubblicamente accessibili, in tutto o in parte e/o in forma di rielaborazioni, negli output di un assistente linguistico generativo (chatbot). Alle prospettazioni della decisione tedesca, particolarmente interessanti anche oltre l’ambito della AIGen, riserveremo un prossimo contributo.
Per quanto concerne il tema della relazione tra attività di addestramento dell’AI ed eccezione di TDM, il richiamo, operato da questo primo precedente in Europa, della distinzione tra atti di riproduzione di “porzioni creative di opere” e di analisi di “informazioni” che possono essere estratte da un’opera – riporta al centro della questione il tema, classico, dei requisiti di creatività e originalità dell’opera.
Sembra dunque ragionevole ritenere che, anche nella legislazione italiana, lo sviluppo di sistemi AI possa essere pienamente garantito nel rispetto dei principi, anche di bilanciamento, alla base della disciplina di protezione di diritti d’autore.
(Beatrice Cunegatti)
