Un importante passo nella regolamentazione dei diritti d'autore nel campo dell'intelligenza artificiale è stato compiuto dal Tribunale Distrettuale degli Stati Uniti del Delaware. La sentenza parziale emessa dal giudice Stephanos Bibas è a favore di Thomson Reuters nel suo contenzioso per violazione del copyright contro Ross Intelligence, una startup nel settore legale basata sull'AI. Questa causa, avviata nel 2020, rappresenta una delle prime in cui si affrontano le questioni legali legate all'uso di strumenti di intelligenza artificiale e alla loro formazione, spesso inclusiva di dati protetti da copyright estratti senza licenza o autorizzazione.
Una causa pionieristica per l’Intelligenza Artificiale
Il caso che coinvolge Thomson Reuters e Ross Intelligence è emblematico delle sfide legali che affrontano le aziende tecnologiche nel 2025. Numerose azioni legali simili sono attualmente pendenti nei confronti di colossi dell'AI come OpenAI e Microsoft. Gli interrogativi centrali riguardano le possibilità di invocare la giustificazione dell’"uso lecito" per l'uso di materiale protetto da copyright nei processi di sviluppo del software. Il giudice Bibas ha chiarito, però, che la tipologia di AI in questione è “non-generativa”, in netto contrasto con strumenti di intelligenza artificiale generativa come i modelli di linguaggio di grandi dimensioni .
L'azienda Ross, operativa fino al 2021, ha definito la battaglia legale “spuria”, ma si è dichiarata incapace di reperire finanziamenti sufficienti per continuare le proprie attività. Questa battaglia legale si configura come un'ulteriore prova dell’incertezza legata all'applicazione delle normative sul copyright nel settore dell'AI e della difficoltà per le startup di operare in un panorama così complesso e in continua evoluzione.
Dettagli della Sentenza e Impatti sul Mercato
La sentenza del giudice Bibas, come riportato da Wired, evidenzia che le potenziali difese di Ross non sono valide di fronte alle accuse di violazione del copyright. La corte ha ritenuto che l'uso del materiale protetto avesse un impatto significativo sul mercato del lavoro originale, poiché Ross stava costruendo un concorrente diretto a Thomson Reuters. I problemi sorgono dalla modalità in cui Ross ha utilizzato il motore di ricerca Westlaw di Thomson Reuters, un sistema che non solo indicizza una gran parte di materiale non soggetto a copyright, come le sentenze legali, ma integra anche contenuti originali.
Le note introduttive e i riassunti legali, creati da editor umani, sono tra le caratteristiche chiave che rendono l'abbonamento a Westlaw attraente per i legali. Ciò ha sollevato interrogativi riguardo l'equità e la sostenibilità del modello di business di Ross, dando vita a una domanda cruciale: in che misura è giustificato l'uso di materiali di proprietà intellettuale per alimentare modelli di AI?
Le Tecniche di Allenamento di Ross e le Risposte in Giudizio
Il giudice ha esaminato in dettaglio le tecniche utilizzate da Ross per costruire il suo motore di ricerca legale. Ross ha trasformato le annotazioni e le note in dati numerici riguardanti le relazioni tra termini legali, utilizzando tali informazioni per addestrare i suoi algoritmi di intelligenza artificiale. Tuttavia, dopo che Thomson Reuters ha rifiutato la richiesta di licenza, Ross ha deciso di acquistare 25.000 documenti da un'altra società, LegalEase, contenenti domande e risposte redatte da avvocati basate sulle note di Westlaw, che sono poi state utilizzate come dati di addestramento.
Andrew Arruda, CEO di Ross, ha sostenuto che i dati di Westlaw rappresentassero solo “rumore aggiuntivo” e che il suo strumento fosse finalizzato a riconoscere ed estrarre risposte direttamente dalla legge usando l’apprendimento automatico. Tuttavia, la corte ha trovato che le prove di copiatura fossero evidenti, talmente chiare che nessun giurì ragionevole avrebbe potuto giungere a una conclusione differente. Questo caso non solo chiarisce le dinamiche interne del settore legale, ma altresì offre uno spaccato su come la tecnologia e il diritto d’autore interagiscano in un contesto in rapida evoluzione come quello dell'AI.