Vai al contenuto

Filippo Pellegrino

Computational Linguist · NLP Researcher

Profilo di Ricerca

Linguista computazionale con competenze in elaborazione del linguaggio naturale e machine learning. Ha contribuito all'avanzamento di tecniche di valutazione automatica nella scrittura degli studenti e allo sviluppo di sistemi AI conversazionali per applicazioni di patrimonio culturale. Il lavoro coniuga la linguistica computazionale teorica con implementazioni pratiche, combinando il deep learning con l'analisi linguistica tradizionale per creare soluzioni NLP interpretabili.

Esperienza Accademica e Professionale

Collaboratore di RicercaFeb 2026 – Mar 2026

Eurac Research · Bolzano, IT

  • Progettato e sviluppato una pipeline automatizzata di conversione EPUB-to-Markdown per l'elaborazione di documenti multilingue
  • Costruito un dataset benchmark multilingue (italiano, tedesco) per task di comprensione documentale image-to-Markdown tramite Project Gutenberg
  • Implementato un framework di valutazione VLM con metriche NED, BLEU, Structure F1 e BERTScore
  • Confrontato modelli vision-language allo stato dell'arte (Qwen2.5-VL, Pixtral) sulla generazione page-image-to-Markdown
Tirocinante Ingegnere NLPMag 2025 – Ago 2025

Compet-e Srl · Italia

  • Progettato e implementato architetture AI/NLP per applicazioni industriali
  • Sviluppato sistemi REST API per task di elaborazione del linguaggio naturale
  • Implementato strategie di deployment locale di LLM tramite il framework Ollama
  • Sviluppato applicazioni web basate su NLP
Assistente di Ricerca JuniorLug 2024 – Feb 2025

Università di Napoli L'Orientale · Napoli, IT

  • Ricercatore principale sul progetto 'Testa di Marianna' per applicazioni interattive di patrimonio culturale
  • Collaborazione con il gruppo Unior NLP e la 'Casa delle Tecnologie Emergenti'
  • Sviluppato sistemi di AI conversazionale per la valorizzazione del patrimonio culturale
  • Ricerca sull'adattamento e il fine-tuning di LLM open-source (famiglia LLaMA)
  • Curato dataset specializzati su contenuti culturali napoletani
Tirocinante di RicercaFeb 2024 – Lug 2024

Eurac Research · Bolzano, IT

  • Ricercatore principale nella fase finale del progetto ITACA per la valutazione automatica dei temi
  • Sviluppato metodologia di valutazione della coerenza per testi specifici al contesto
  • Implementato modelli basati su BERT per l'analisi di testi educativi
  • Co-autore di pubblicazione peer-reviewed sulla valutazione automatica della coerenza
  • Presentato i risultati della ricerca alla conferenza CliC-it 2024 (poster)
Tirocinante di RicercaFeb 2023 – Mar 2023

Eurac Research · Bolzano, IT

  • Partecipazione ai task condivisi EVALITA 2023 (DisCoTex, LangLearn)
  • Sviluppato modelli di machine learning per la valutazione dell'apprendimento linguistico
  • Co-autore di articolo sulla valutazione interpretabile dell'apprendimento linguistico

Formazione

Laurea Magistrale in Linguistica ApplicataOtt 2021 – Mar 2024

Libera Università di Bolzano · Bolzano, IT

Tesi: Local Coherence Modeling for the Italian Language

Relatore: Prof. Luca Ducceschi

Focus: Linguistica Computazionale, NLP

Laurea Triennale in Mediazione LinguisticaOtt 2017 – Lug 2021

Università di Torino · Torino, IT

Tesi: Vida del Escudero Marcos de Obregon: oltre la picaresca

Relatore: Prof. Veronica Orazi

Pubblicazioni e Conferenze

2024

Towards an Automatic Evaluation of (In)coherence in Student Essays

Pellegrino, F., Frey, J. C., & Zanasi, L.

Proceedings of CliC-it 2024

2023

bot.zen at LangLearn: regressing towards interpretability

Stemle, E. W., Tebaldini, M., Bonanni, F., Pellegrino, F., et al.

Proceedings of EVALITA 2023

Presentazioni a Conferenze

CliC-it 2024: Automatic Coherence Evaluation in Educational Texts (Presentazione Poster)

Competenze Tecniche

Linguaggi di Programmazione: Python (Avanzato), R (Base), Bash/Linux (Base), LaTeX

Framework ML/NLP: PyTorch, Hugging Face Transformers, BERT Models, Scikit-learn, OpenAI API, Ollama

Strumenti di Sviluppo: Git/GitHub/GitLab, Flask, REST API Development, Vector Databases, Pandas, BeautifulSoup

Interessi di Ricerca

Linguistica ComputazionaleHuman-AI InteractionModelli MultimodaliLanguage Encoding & Information RetrievalTecnologie per l'EducazioneExplainable AI

Lingue

Italiano

Madrelingua

Inglese

Avanzato, C1

Spagnolo

Avanzato, C1

Tedesco

Intermedio, B1

Chatta con me