Cosa ti proponiamo
La direzione AI & Advanced Analytics è alla ricerca di un Junior Foundation AI Engineer da inserire nel team di sviluppo del nostro foundation LLM EngGPT3, attualmente in forte espansione. Il ruolo è centrato sul training di modelli AI from scratch: dalla preparazione dei dati, al design delle architetture, fino allo sviluppo, esecuzione e valutazione delle pipeline di training, con una collaborazione costante con i team di delivery che utilizzano EngGPT nei diversi contesti applicativi
Quali saranno le tue attività e responsabilità?
- Definire e gestire i dataset di training attraverso attività di data curation
- Progettare e iterare sulle architetture del modello, conducendo ablation studies per guidare le scelte progettuali
- Sviluppare, eseguire e monitorare le pipeline di training
- Valutare le performance del modello e guidare i cicli di miglioramento
- Definire e ottimizzare le modalità di serving del modello
- Supportare i team di delivery nell'utilizzo del modello nei diversi contesti applicativi
- Collaborare con i team di delivery per raccogliere feedback operativi
- Monitorare continuamente lo stato dell'arte e integrare le innovazioni della ricerca
Qualifiche e competenze richieste
-
Recente laurea in discipline correlate come Informatica, Ingegneria o discipline scientifiche quantitative (es. Fisica, Matematica, Statistica)
- Solida conoscenza della teoria dei modelli generativi e LLM
- Conoscenza dello stato dell'arte delle principali fasi e tecniche di training dei modelli linguistici, tra cui pre-training, adattamento al contesto lungo, Supervised Fine-Tuning (SFT), Direct Preference Optimization (DPO), Reinforcement Learning from Human Feedback (RLHF), Reinforcement Learning from Verifiable Rewards (RLVR), Model Merging e Model Pruning
- Esperienza in Python e nelle principali librerie per il training di modelli LLM (es. Hugging Face, TRL, Accelerate, PEFT, ..)
- Capacità di gestione e processamento di dati su larga scala
- Esperienza nel training di modelli LLM e familiarità con le relative modalità di serving
- Esperienza nell'uso di sistemi di versionamento del codice (es. Git)
- Attitudine alle attività di ricerca e analisi
- Buon livello di inglese (B2)
Competenze aggiuntive preferenziali:
- Master, Dottorato o comunque specializzazione in ambito Data Science
- Conoscenza di ambienti HPC e job scheduler (es. SLURM) per la gestione di workload di training distribuito
- Familiarità con framework per il training distribuito su larga scala (es. Megatron, DeepSpeed)
- Conoscenza dei framework core di training (es. PyTorch, Triton, CUDA, NCCL)
- Esperienza nell'uso di tecnologie cloud IaaS su almeno uno dei principali hyperscaler (AWS, Azure, Google Cloud Platform), con familiarità con workflow su ambienti cloud con accesso a GPU
- Conoscenza di framework e best practice per il serving LLM in Production (es. vLLM, LLMOps, Pachyderm, ...)
Cosa cerchiamo nelle nostre persone?
Ambizione, nel perseguire grandi obiettivi e nell'investire sul miglioramento continuo;
Proattività, nell’anticipare e affrontare le sfide con iniziativa;
Trasparenza, nel comunicare apertamente e fornire feedback costruttivi;
Motivazione a migliorare e a crescere insieme agli altri, manifestando apertura al confronto per favorire la crescita collettiva e il raggiungimento degli obiettivi comuni.
Inquadramento e retribuzione
CCNL: Metalmeccanico
Livello: a partire dal livello B1
Contratto: Tempo Indeterminato
RAL: a partire da 30.814,29€
Benefit: buoni pasto, welfare aziendale, smart working, assicurazione sanitaria, formazione
Invia la tua candidatura e raccontaci come puoi fare la differenza.
Sede di inserimento
Milano | Torino
L’annuncio è rivolto a tutti i candidati, senza distinzione di sesso, nel rispetto del Codice delle pari opportunità di cui al D.Lgs. 198/2006 e ss.mm.ii.