Il Gen AI engineer è una specializzazione del cosiddetto “AI engineer”, nome reso popolare da questo articolo di Latent Space, assolutamente consigliato.
Cosa fa un Gen AI engineer
Un Gen AI engineer:
- Sviluppa progetti che integrino e combinino modelli di AI generativa di diversa natura (es: text-to-text, text-to-image)
- Testa modelli di AI generativa sia proprietari che open source
- Sviluppa progetti basati su tecniche di RAG (Retrieval di informazioni da documenti)
- Effettua il fine-tuning di modelli di AI generativa preesistenti
- Crea agenti AI che usano i vari modelli
E tanto altro in realtà, questi sono solo i compiti più importanti.
Come si diventa Gen AI engineer
Cerco di riassumere in alcuni punti chiave le risorse utili per sviluppare le competenze che servono per diventare Gen AI engineer:
- Basi di Gen AI moderna:
- The Illustrated Transformer (e tutto il blog)
- LLM Bootcamp (ottima playlist)
- Building LLM for Production
- What are Embedding
- Uso dei modelli
- Imparare a usare i modelli tramite API, i migliori sono quelli di OpenAI e Anthropic, ma anche Cohere e Mistral sono validi
- Imparare bene come costruire le chiamate, come i vari parametri influenzano i risultati
- In particolare concentrarsi su context window, few shot learning, costi e latenza
- Prompting
- Imparare le tecniche di prompting avanzate, soprattutto quelle per “spremere” al massimo le capacità dei modelli di ragionare, come Tree of Thoughts e la Self Reflection
- Consultare la guida di Dair.ai per avere tutto quello che serve
- Imparare i pattern per creare workflow avanzati con i prompt.
- Imparare quali sono i design pattern emergenti per LLM Engineering (video sotto)
- RAG e Vector DBs
- Imparare a usare i vector Database per archiviare i vettori che rappresentano la “memoria” dei modelli, i cosiddetti embeddings
- Imparare a costruire sistemi RAG per dare contesto rilevanti ai modelli quando rispondono, partendo dalle implementazioni più semplici a quelle più complesse
- Capire quando ha senso una ricerca tradizionale, quando il RAG, o quando una architettura ibrida
- Consiglio le guide di Llama Index
- Seguire Jerry Liu su X per rimanere aggiornato sul tema dei vector DB
- Fine-tuning
- Imparare le basi del fine-tuning (una buona intro, una più approfondita)
- Capire quando ha senso fare fine-tuning di un modello oppure no
- Tutorial per fare il fine-tuning di un modello (LLama)
- Tool, framework e siti utili
- Huggingface (migliaia di modelli open source)
- LlamaIndex (la base per fare il RAG)
- Qdrant (alternativa validissima per il RAG)
- DSPy (un nuovo approccio al “LLM programming”)
- Langchain (da non usare ma sfruttare per vedere le implementazioni dei vari paper)
- Cheshire Cat (framework italiano per la costruzione di app con LLM)
- Repository
- Newsletter e blog tecnici
- Le ricerche più importanti
- Articoli di blog di valore
Conclusioni
Come si può vedere, i temi sono tanti, e quello del Gen AI engineer è anche un ruolo un po’ difficile da inquadrare, che richiede di essere sempre aggiornati e che probabilmente si evolverà molto nei prossimi anni. Ma che ripagherà molto bene chi saprà costruire applicazioni usando i modelli di GenAI.
Un’ultima considerazione: se qualcuno dice che devi conoscere complessi algoritmi di ottimizzazione o matematica avanzata per diventare AI engineer, rispondi: “Quindi devo sapere come funziona la teoria dei segnali per fare l’elettricista?”.
Tornando seri, le nuove famiglie di modelli AI permettono di costruire cose fenomenali a un livello di astrazione piuttosto alto, e non serve per forza una laurea STEM o un background matematico per lavorarci e costruire applicazioni AI.