Il corso si propone di fornire i fondamenti dell'apprendimento statistico, dell’apprendimento automatico (Machine Learning) e dell’apprendimento profondo (Deep Learning). L’illustrazione di specifiche tecniche statistiche e dei principali modelli di apprendimento statistico e automatico consentirà agli studenti di acquisire le competenze essenziali e necessarie per condurre un’analisi approfondita dei dati reali con particolare riferimento al contesto finanziario. Allo scopo di allinearsi con i requisiti di affidabilità dei modelli black-box, avanzati dalla Commissione Europea ed esplicitati all’interno del regolamento per un’Intelligenza Artificiale affidabile, saranno anche presentati alcuni approcci statistici recentemente proposti in letteratura ed orientati alla valutazione del livello di “sicurezza” delle metodologie di Intelligenza Artificiale. Al temine del corso lo studente dovrà dimostrare una completa padronanza dei contenuti teorici e di programmazione in virtù della quale affrontare autonomamente un’analisi dei dati ed esprimere i risultati ottenuti attraverso un linguaggio statistico appropriato.
Prerequisiti
Ai fini del superamento dell'esame è necessario che lo studente abbia maturato un’adeguata conoscenza dei contenuti previsti nell’area matematico-statistica e nell’area della programmazione.
Metodi didattici
- Lezioni frontali, in cui saranno affrontati gli argomenti del corso dal punto di vista teorico e pratico mediante l'illustrazione di esempi. In particolare, le lezioni frontali saranno supportate dall'impiego di slide e dall'utilizzo della lavagna per approfondimenti relativi agli sviluppi di calcolo e alla formalizzazione degli aspetti teorici. - Lezioni applicative, in cui saranno verranno proposte analisi di dati reali attraverso l’impiego dei modelli e delle tecniche statistiche presentati durante il corso. L’implementazione avverrà mediante l’impiego del software statistico R. Sulla piattaforma della didattica online KIRO sarà reso disponibile il materiale proposto durante le lezioni.
Verifica Apprendimento
Prova intermedia scritta e prova finale con discussione orale di un caso studio [analisi di un dataset e presentazione dei risultati tramite slide].
Testi
- Gareth James, Daniela Witten, Trevor Hastie, Robert Tibshirani: An Introduction to Statistical Learning with Applications in R, II Edition, Springer (2023) - Bret Lanzt: Machine Learning with R, PUCKY Publishing open source (2013) - Articoli scientifici segnalati durante il corso.
Contenuti
Gli argomenti specifici trattati nel corso riguardano: 1) i modelli di apprendimento statistico: modelli di regressione lineare e modelli di regressione logistica; 2) i modelli di apprendimento automatico: modelli ad albero, modelli a foresta casuale; 3) i modelli di apprendimento profondo: modelli a rete neurale; 4) l’approccio SAFE per la valutazione dell’affidabilità dei modelli; 5) i modelli fattoriali; 6) l’applicazione delle metodologie del Data Science alla finanza.