Filippo Pellegrino
Computational Linguist · NLP Researcher
Profilo di Ricerca
Linguista computazionale con competenze in elaborazione del linguaggio naturale e machine learning. Ha contribuito all'avanzamento di tecniche di valutazione automatica nella scrittura degli studenti e allo sviluppo di sistemi AI conversazionali per applicazioni di patrimonio culturale. Il lavoro coniuga la linguistica computazionale teorica con implementazioni pratiche, combinando il deep learning con l'analisi linguistica tradizionale per creare soluzioni NLP interpretabili.
Esperienza Accademica e Professionale
Eurac Research · Bolzano, IT
- Progettato e sviluppato una pipeline automatizzata di conversione EPUB-to-Markdown per l'elaborazione di documenti multilingue
- Costruito un dataset benchmark multilingue (italiano, tedesco) per task di comprensione documentale image-to-Markdown tramite Project Gutenberg
- Implementato un framework di valutazione VLM con metriche NED, BLEU, Structure F1 e BERTScore
- Confrontato modelli vision-language allo stato dell'arte (Qwen2.5-VL, Pixtral) sulla generazione page-image-to-Markdown
Compet-e Srl · Italia
- Progettato e implementato architetture AI/NLP per applicazioni industriali
- Sviluppato sistemi REST API per task di elaborazione del linguaggio naturale
- Implementato strategie di deployment locale di LLM tramite il framework Ollama
- Sviluppato applicazioni web basate su NLP
Università di Napoli L'Orientale · Napoli, IT
- Ricercatore principale sul progetto 'Testa di Marianna' per applicazioni interattive di patrimonio culturale
- Collaborazione con il gruppo Unior NLP e la 'Casa delle Tecnologie Emergenti'
- Sviluppato sistemi di AI conversazionale per la valorizzazione del patrimonio culturale
- Ricerca sull'adattamento e il fine-tuning di LLM open-source (famiglia LLaMA)
- Curato dataset specializzati su contenuti culturali napoletani
Eurac Research · Bolzano, IT
- Ricercatore principale nella fase finale del progetto ITACA per la valutazione automatica dei temi
- Sviluppato metodologia di valutazione della coerenza per testi specifici al contesto
- Implementato modelli basati su BERT per l'analisi di testi educativi
- Co-autore di pubblicazione peer-reviewed sulla valutazione automatica della coerenza
- Presentato i risultati della ricerca alla conferenza CliC-it 2024 (poster)
Eurac Research · Bolzano, IT
- Partecipazione ai task condivisi EVALITA 2023 (DisCoTex, LangLearn)
- Sviluppato modelli di machine learning per la valutazione dell'apprendimento linguistico
- Co-autore di articolo sulla valutazione interpretabile dell'apprendimento linguistico
Formazione
Libera Università di Bolzano · Bolzano, IT
Tesi: Local Coherence Modeling for the Italian Language
Relatore: Prof. Luca Ducceschi
Focus: Linguistica Computazionale, NLP
Università di Torino · Torino, IT
Tesi: Vida del Escudero Marcos de Obregon: oltre la picaresca
Relatore: Prof. Veronica Orazi
Pubblicazioni e Conferenze
2024
Towards an Automatic Evaluation of (In)coherence in Student Essays
Pellegrino, F., Frey, J. C., & Zanasi, L.
Proceedings of CliC-it 2024
2023
bot.zen at LangLearn: regressing towards interpretability
Stemle, E. W., Tebaldini, M., Bonanni, F., Pellegrino, F., et al.
Proceedings of EVALITA 2023
Presentazioni a Conferenze
CliC-it 2024: Automatic Coherence Evaluation in Educational Texts (Presentazione Poster)
Competenze Tecniche
Linguaggi di Programmazione: Python (Avanzato), R (Base), Bash/Linux (Base), LaTeX
Framework ML/NLP: PyTorch, Hugging Face Transformers, BERT Models, Scikit-learn, OpenAI API, Ollama
Strumenti di Sviluppo: Git/GitHub/GitLab, Flask, REST API Development, Vector Databases, Pandas, BeautifulSoup
Interessi di Ricerca
Lingue
Italiano
Madrelingua
Inglese
Avanzato, C1
Spagnolo
Avanzato, C1
Tedesco
Intermedio, B1