L'analisi automatica dei testi è oggi essenziale per scopi di ricerca nelle scienze umane e sociali e per applicazioni di varia natura, dalla traduzione automatica, alla estrazione di opinioni, alla costruzione di agenti conversazionali. Il corso introduce i concetti, le metodologie e gli strumenti fondamentali della linguistica computazionale e del trattamento automatico del linguaggio, fornendo agli studenti competenze per analizzare automaticamente o semiautomaticamente dati testuali di varia natura (letterari, storici, scientifici, socio-politici, giornalistici). Sono inoltre fornite le basi metodologiche dell'annotatione linguistica dei testi per l'apprendimento automatico supervisionato.
Prerequisiti
Nozioni di base di linguistica, che saranno riprese all'inizio del corso.
Metodi didattici
Lezioni frontali interattive. Slides. Laboratorio con esercitazioni.
Verifica Apprendimento
Prova orale di verifica dell’apprendimento dei contenuti del corso. Indagine empirica di un fenomeno linguistico (sintattico, semantico, lessicale, discorsivo) o di un fenomeno storico, culturale, sociale attraverso l'analisi linguistica, a scelta dello studente, concordato con la docente, utilizzando gli strumenti di analisi automatica dei testi illustrati nel corso. Elaborato scritto di 5 cartelle (inclusa bibliografia, escluse le tabelle e le figure) riportante i risultati del task svolto, da inviare a jezek@unipv.it 5 gg prima della data dell'appello d’esame.
Testi
Testo di riferimento:
Elisabetta Jezek & Rachele Sprugnoli (2023). Linguistica computazionale. Introduzione all’analisi automatica dei testi. Bologna: Il Mulino. (capitoli I, Definizione, scopi e cenni storici, II Basi di Linguistica, III Basi di statistica, IV Apprendimento automatico (sezioni 1-3), VI L'annotazione dei testi.
Ulteriori letture saranno indicate durante le lezioni e indicate nella piattaforma KIRO.
Contenuti
Il corso costituisce una introduzione ai fondamenti della linguistica computazionale e del trattamento automatico dei testi.
Coprirà i seguenti argomenti:
- Definizione, scopi e cenni storici della Linguistica Computazionale - Elementi di linguistica per l'analisi computazionale dei testi - Basi di Statistica - Apprendimento automatico tradizionale: la regressione lineare e logistica e i modelli probabilistici del linguaggio - La annotazione di dati linguistici per l'apprendimento automatico - I principali task nel trattamento automatico dei testi
Lingua Insegnamento
ITALIANO
Altre informazioni
Tutto il materiale didattico è disponibile sul portale della didattica KIRO (accesso con credenziali di Ateneo).