Si chiama Simpliciter e utilizza diversi meccanismi per mitigare le allucinazioni, come la Retrieval Augmented Generation, una tecnica che utilizza un motore di ricerca semantico per interrogare una banca dati in modo da fornire al modello informazioni corrette e aggiornate [...]

Antonio Cappiello Fondatore Simpliciter.Ai

L’intelligenza artificiale ha rivoluzionato numerosi settori, ma fa ancora fatica a entrare negli studi legali. Simpliciter è una versione di ChatGPT per avvocati, che combina modelli di linguaggio con una ampia banca dati giuridica per generare contenuto basato su normative e sentenze giudiziarie realmente esistenti.

I rischi nell’utilizzo di ChatGPT per gli avvocati

Una delle principali obiezioni mosse a ChatGPT nella versione fornita da OpenAI (chat.openai.com) è la tendenza del modello di linguaggio a generare citazioni inesistenti e norme con contenuti inesatti, che possono compromettere l’accuratezza delle risposte fornite dal sistema. Questo fenomeno viene chiamato allucinazione o confabulazione.

Questi errori e limiti sono riconducibili al fatto che il ChatGPT di OpenAI è un modello fondazionale, cioè una versione base di un modello linguistico con caratteristiche che possano renderlo utile al maggior numero di persone possibile.

Inoltre, c’è da specificare che ChatGPT non ha accesso in tempo reale a banche dati e non ha la possibilità di analizzare documenti.

I modelli di base come questo di solito vengono addestrati offline, rendendo il modello indipendente da qualsiasi dato creato dopo che il modello è stato addestrato. Inoltre, i modelli di base vengono addestrati su corpora di dominio molto generale, rendendoli meno efficaci per compiti specifici del dominio.

È proprio da queste limitazioni che è nato Simpliciter.ai: uno strumento che unisce una banca dati aggiornata ai più recenti modelli di linguaggio.

Come Simpliciter mitiga le allucinazioni

Simpliciter utilizza diversi meccanismi per mitigare le allucinazioni, come la Retrieval Augmented Generation, una tecnica che utilizza un motore di ricerca semantico per interrogare una banca dati in modo da fornire al modello informazioni corrette e aggiornate.

Con RAG, i dati esterni utilizzati per guidare la generazione possono provenire da diverse fonti di dati, come raccolte di documenti, database o API. Il primo passo consiste nel convertire i documenti e le query degli utenti in un formato compatibile per eseguire la ricerca di rilevanza. Per rendere i formati compatibili, una banca dati e le query inviate dagli utenti vengono convertite in rappresentazioni numeriche utilizzando modelli di linguaggio di embedding.

L’embedding è il processo mediante il quale il testo viene rappresentato numericamente in uno spazio vettoriale. Le architetture dei modelli RAG confrontano gli embedding delle query degli utenti all’interno del vettore della libreria di conoscenze.

Il risultato è una strategia che mitiga le allucinazioni del modello, dal momento che la banca dati a cui il modello attinge viene curata e gestita da persone in carne ed ossa. Simpliciter aggiorna la banca dati e i relativi embedding ciclicamente in modo da includere le ultime massime e sentenze pubblicate.

A differenza di OpenAI, non stiamo costruendo un modello che sia in grado di rispondere a qualunque domanda l’utente possa immaginare spiega, ma abbiamo adattato il nostro modello ad alcuni casi d’uso per avvocati che sono notoriamente dispendiosi, come la ricerca legale oppure l’analisi dei documenti. In questo modo possono dedicarsi ad attività di maggior valore, come la gestione del cliente.

Il vero vantaggio competitivo sta nella integrazione del modello con la corposa banca dati, che contiene la normativa aggiornata oltre che a massime ufficiali e sentenze degli ultimi 25 anni, per più di un milione di documenti indicizzati che non sono pubblicamente disponibili su Internet.

Le opportunità offerte dai modelli di linguaggio

L’automazione attraverso l’intelligenza artificiale generativa può semplificare molti compiti legali che di solito richiedono del tempo. In questo modo i professionisti possono aumentare la produttività concentrandosi su lavori di maggior impatto per la pratica legale. Ad esempio, l’AI generativa può aiutare a ricercare argomentazioni all’interno di sentenze o di documenti caricati ad-hoc, consentendo agli avvocati di dedicarsi allo sviluppo di nuove teorie legali.

Questo processo è definito “argument mining” e permette l’identificazione e l’estrazione automatica delle strutture di inferenza e ragionamento, che si manifestano come argomenti presentati nel linguaggio naturale. Comprendere la struttura argomentativa consente di determinare non solo le posizioni adottate dalle parti, ma anche il motivo per cui sostengono le opinioni che hanno, fornendo intuizioni preziose nel settore legale.

Nel contesto dell’evoluzione delle tecnologie legali, è importante notare che i professionisti legali devono sempre guidare il processo, utilizzando gli strumenti AI come assistenti. L’obiettivo è trovare il giusto equilibrio tra l’utilizzo delle tecnologie e la supervisione umana, evitando di cadere nell’automazione acritica e mantenendo la capacità di prendere decisioni informate.

Sicurezza, protezione dei dati e riservatezza delle informazioni legali

L’importanza della privacy e della sicurezza delle informazioni legali sono fondamentali per uno strumento che rispetti la riservatezza delle informazioni degli utenti. Sebbene Simpliciter.AI sia agnostico rispetto al tipo di modello di linguaggio utilizzato, attualmente abbiamo un accordo con il nostro partner OpenAI che garantisce che le generazioni prodotte da Simpliciter.AI non vengano utilizzate per successivi allenamenti dei modelli di base come GPT-3, GPT-3.5-turbo e GPT-4. Ciò ci consente di preservare la privacy e la confidenzialità dei dati dei nostri utenti. I documenti caricati, invece, vengono conservati presso sistemi certificati SOC3, uno dei più sicuri attualmente sul mercato.

Conclusioni

In conclusione, Simpliciter.AI offre un modo innovativo per facilitare il lavoro degli avvocati, combinando la potenza dei modelli generativi con una solida banca dati legale. Grazie alla generazione supervisionata e alla possibilità di interagire attraverso chat e caricamento di documenti, Simpliciter.AI consente agli avvocati di accedere a informazioni accurate e tempestive per supportare le loro attività professionali.