ID:
501165
Durata (ore):
36
CFU:
6
SSD:
GLOTTOLOGIA E LINGUISTICA
Anno:
2023
Dati Generali
Periodo di attività
Secondo Semestre (26/02/2024 - 15/05/2024)
Syllabus
Obiettivi Formativi
Il corso si propone di trattare di alcuni dei temi di maggior rilievo nell’ambito del trattamento automatico delle lingue e dell’elaborazione del linguaggio naturale (in inglese Natural Language Processing – NLP). Al termine del corso, gli studenti e le studentesse conoscono le potenzialità e i limiti del NLP, e sono in grado di individuare e applicare alcune tecniche statistiche e gli algoritmi fondamentali di questa disciplina.
Prerequisiti
È necessario aver superato l’esame del corso di Linguistica Computazionale (insegnamento del primo semestre). È consigliato aver seguito il corso Dati Empirici e Teorie Linguistiche.
Metodi didattici
Lezioni frontali ed esercitazioni pratiche.
Verifica Apprendimento
L’esame consiste di due parti: un progetto scritto su uno degli argomenti del corso e concordato con i docenti e una verifica orale sul progetto e sul programma d'esame che mira a valutare le capacità critiche e le conoscenze metodologiche maturate al termine del corso. L’esame coprirà tutti gli argomenti del programma, sia quelli approfonditi durante le lezioni frontali, sia quelli lasciati allo studio individuale. I quesiti consisteranno in definizioni domande aperte di natura teorica e/o argomentativa. La valutazione dell’apprendimento terrà conto del numero di risposte corrette (alle risposte parzialmente corrette verrà riconosciuto un punteggio ridotto) e dell'adeguatezza formale ed espositiva.
Testi
Daniel Jurafsky & James H. Martin (2023, online in open-access). Speech and Language Processing. (capitoli 15 Chatbots and Dialogue Systems, 16 Automatic Speech Recognition and Text-to-Speech).
Elisabetta Jezek & Rachele Sprugnoli (2023). Linguistica computazionale: Introduzione all’analisi automatica dei testi. Bologna: Il Mulino. (capitoli 4 Apprendimento automatico (sezioni 4-5), 5 Semantica Distribuzionale e tipi di vettori, 7 Task di Natural Language Processing e 8 Strumenti per l’analisi dei testi).
Fabio Tamburini (2022). Neural Models for the Automatic Processing of Italian. Bologna: Pàtron Editore. (Parte II The Automatic Analysis of Italian: capitolo 8 Let the Speech Speak! Parte III Surfing on the next wave)
Contenuti
Il corso si articola in una parte generale e in una parte monografica. La parte generale fornisce strumenti metodologici di larga applicazione nella linguistica computazionale e nel trattamento automatico delle lingue e del linguaggio. In particolare, verranno affrontati i seguenti argomenti: la semantica distribuzionale e i tipi di vettori (count-based, embeddings e contextual embeddings), la regressione lineare e logistica, le reti e i modelli neurali e il Deep Learning. Verranno approfonditi diversi task di NLP come la classificazione del sentiment, il Named Entity Recognition, la misurazione del grado di soggettività di un testo e il riconoscimento delle fake news. La parte monografica si concentrerà sui chatbots e sui dialog agents, sull’elaborazione del parlato (in inglese Speech Processing), sul riconoscimento vocale automatico (in inglese Automatic Speech Recognition – ASR) e sulla sintesi vocale (in inglese Text-to-Speech). Verranno esaminati in dettaglio i vari tipi di i filtri, le forme d’onda, gli spettrogrammi, l’estrazione automatica dei tratti segmentali e soprasegmentali, la scala Mel, i coefficienti spettrali Mel, i sistemi di ASR basati su Hidden Markov Model e quelli di tipo Deep Neural Networks.
Lingua Insegnamento
ITALIANO
Altre informazioni
Le diapositive proiettate durante la lezione e i materiali di supporto verranno caricati su KIRO – la piattaforma di E-Learning della didattica dell'Università degli Studi di Pavia.
Corsi
Corsi
LINGUISTICA TEORICA, APPLICATA E DELLE LINGUE MODERNE
Laurea Magistrale
2 anni
No Results Found
Persone
Persone (2)
No Results Found