Il corso si propone di trattare di alcuni dei temi di maggior rilievo nell’ambito del trattamento automatico delle lingue e dell’elaborazione del linguaggio naturale (in inglese Natural Language Processing – NLP). Al termine del corso, gli studenti e le studentesse conoscono le potenzialità e i limiti del NLP, e sono in grado di individuare e applicare alcune tecniche statistiche e gli algoritmi fondamentali di questa disciplina.
Prerequisiti
È necessario aver superato l’esame del corso di Linguistica Computazionale (insegnamento del primo semestre). È consigliato aver seguito il corso Dati Empirici e Teorie Linguistiche.
Metodi didattici
Lezioni frontali ed esercitazioni pratiche.
Verifica Apprendimento
L’esame consiste di due parti: un progetto scritto su uno degli argomenti del corso e concordato con i docenti e una verifica orale sul progetto e sul programma d'esame che mira a valutare le capacità critiche e le conoscenze metodologiche maturate al termine del corso. L’esame coprirà tutti gli argomenti del programma, sia quelli approfonditi durante le lezioni frontali, sia quelli lasciati allo studio individuale. I quesiti consisteranno in definizioni domande aperte di natura teorica e/o argomentativa. La valutazione dell’apprendimento terrà conto del numero di risposte corrette (alle risposte parzialmente corrette verrà riconosciuto un punteggio ridotto) e dell'adeguatezza formale ed espositiva.
Testi
Elisabetta Jezek & Rachele Sprugnoli (2023). Linguistica computazionale: Introduzione all’analisi automatica dei testi. Bologna: Il Mulino. (capitoli 4 Apprendimento automatico (sezioni 4-5), 5 Semantica Distribuzionale e tipi di vettori, 8 Strumenti per l’analisi dei testi).
Contenuti
Il corso fornisce strumenti metodologici di larga applicazione nella linguistica computazionale e nel trattamento automatico delle lingue e del linguaggio. In particolare, verranno affrontati i seguenti argomenti: la semantica distribuzionale e i tipi di vettori (count-based, embeddings e contextual embeddings), la regressione lineare e logistica, le reti, i modelli neurali e il Deep Learning.
Lingua Insegnamento
ITALIANO
Altre informazioni
Le diapositive proiettate durante la lezione e i materiali di supporto verranno caricati su KIRO – la piattaforma di E-Learning della didattica dell'Università degli Studi di Pavia.