Non lo sai ? Allora, chiedilo all'oracolo Retrieval Augmented Generation ! AI - Parte 2
- texservice13
- 8 set 2024
- Tempo di lettura: 1 min
Aggiornamento: 11 gen
La Retrieval Augmented Generation (RAG) è una tecnica avanzata utilizzata nei modelli di linguaggio che combina la generazione di testo (LLM, tipica di modelli come GPT) con il recupero di informazioni da fonti esterne o database specifici. L'obiettivo principale è migliorare la qualità e la pertinenza delle risposte generative grazie all'integrazione di conoscenze aggiornate e specifiche, che vanno oltre le informazioni memorizzate dal modello durante la fase di addestramento,
Quando viene ricevuta una richiesta, il sistema RAG prima cerca nei documenti o nelle fonti di dati pertinenti (che possono essere pagine web, database, articoli, ecc.). Il recupero delle informazioni si basa su tecniche come la ricerca testuale o algoritmi di similarità semantica (gli algoritmi di similarità semantica sono tecniche utilizzate per misurare quanto due unità di testo come parole, frasi, o documenti siano simili nel loro significato, piuttosto che nel loro aspetto letterale...)
Dopo aver recuperato i dati, li utilizza come contesto per generare una risposta: a differenza della sola generazione, che si basa sulla conoscenza preesistente del modello (LLM) , il modello RAG incorpora i blocchi di informazioni (o chunk) recuperate in tempo reale (fase Retrieval) che vengono, poi, inserite direttamente, utilizzando comunque un modello predeterminato, nelle risposte che sono coerenti dal punto di vista linguistico ed anche accurate e aggiornate (Augmented Generation).
Il sistema RAG si distingue dal LLM per il fatto che questo tipo di utilizzano informazioni senza dover essere riaddestrati, e pertanto è applicato nelle chatbot aziendali, nella ricerca dei documenti (in particolari scientifici) e come assistenti virtuali in genere.







Commenti