E

Junior Foundation AI Engineer

Engineering Group
1 day ago
Full-time
Remote friendly (Milan, Lombardy, Italy)
Worldwide
ML & AI Engineering

Cosa ti proponiamo

La direzione AI & Advanced Analytics è alla ricerca di un Junior Foundation AI Engineer da inserire nel team di sviluppo del nostro foundation LLM EngGPT3, attualmente in forte espansione. Il ruolo è centrato sul training di modelli AI from scratch: dalla preparazione dei dati, al design delle architetture, fino allo sviluppo, esecuzione e valutazione delle pipeline di training, con una collaborazione costante con i team di delivery che utilizzano EngGPT nei diversi contesti applicativi

Quali saranno le tue attività e responsabilità?

  • Definire e gestire i dataset di training attraverso attività di data curation
  • Progettare e iterare sulle architetture del modello, conducendo ablation studies per guidare le scelte progettuali
  • Sviluppare, eseguire e monitorare le pipeline di training
  • Valutare le performance del modello e guidare i cicli di miglioramento
  • Definire e ottimizzare le modalità di serving del modello
  • Supportare i team di delivery nell'utilizzo del modello nei diversi contesti applicativi
  • Collaborare con i team di delivery per raccogliere feedback operativi
  • Monitorare continuamente lo stato dell'arte e integrare le innovazioni della ricerca

Qualifiche e competenze richieste

  • Recente laurea in discipline correlate come Informatica, Ingegneria o discipline scientifiche quantitative (es. Fisica, Matematica, Statistica)
  • Solida conoscenza della teoria dei modelli generativi e LLM
  • Conoscenza dello stato dell'arte delle principali fasi e tecniche di training dei modelli linguistici, tra cui pre-training, adattamento al contesto lungo, Supervised Fine-Tuning (SFT), Direct Preference Optimization (DPO), Reinforcement Learning from Human Feedback (RLHF), Reinforcement Learning from Verifiable Rewards (RLVR), Model Merging e Model Pruning
  • Esperienza in Python e nelle principali librerie per il training di modelli LLM (es. Hugging Face, TRL, Accelerate, PEFT, ..)
  • Capacità di gestione e processamento di dati su larga scala
  • Esperienza nel training di modelli LLM e familiarità con le relative modalità di serving
  • Esperienza nell'uso di sistemi di versionamento del codice (es. Git)
  • Attitudine alle attività di ricerca e analisi
  • Buon livello di inglese (B2)

Competenze aggiuntive preferenziali:

  • Master, Dottorato o comunque specializzazione in ambito Data Science
  • Conoscenza di ambienti HPC e job scheduler (es. SLURM) per la gestione di workload di training distribuito
  • Familiarità con framework per il training distribuito su larga scala (es. Megatron, DeepSpeed)
  • Conoscenza dei framework core di training (es. PyTorch, Triton, CUDA, NCCL)
  • Esperienza nell'uso di tecnologie cloud IaaS su almeno uno dei principali hyperscaler (AWS, Azure, Google Cloud Platform), con familiarità con workflow su ambienti cloud con accesso a GPU
  • Conoscenza di framework e best practice per il serving LLM in Production (es. vLLM, LLMOps, Pachyderm, ...)

Cosa cerchiamo nelle nostre persone?

  • Ambizione, nel perseguire grandi obiettivi e nell'investire sul miglioramento continuo;

  • Proattività, nell’anticipare e affrontare le sfide con iniziativa;

  • Trasparenza, nel comunicare apertamente e fornire feedback costruttivi;

  • Motivazione a migliorare e a crescere insieme agli altri, manifestando apertura al confronto per favorire la crescita collettiva e il raggiungimento degli obiettivi comuni.

Inquadramento e retribuzione

  • CCNL: Metalmeccanico

  • Livello: a partire dal livello B1

  • Contratto: Tempo Indeterminato

  • RAL: a partire da 30.814,29€

  • Benefit: buoni pasto, welfare aziendale, smart working, assicurazione sanitaria, formazione

Invia la tua candidatura e raccontaci come puoi fare la differenza. 

Sede di inserimento

Milano | Torino

L’annuncio è rivolto a tutti i candidati, senza distinzione di sesso, nel rispetto del Codice delle pari opportunità di cui al D.Lgs. 198/2006 e ss.mm.ii.