Il corso intende fornire agli studenti le conoscenze di base per l’analisi e la modellizzazione di dati. In particolare, verranno presentati gli algoritimi più comunemente usati nell’analisi statistica, quali il modello di regressione lineare semplice e multipla, l'analisi dei residui, le tecniche di selezione del modello, con attenzione sia agli aspetti teorici sia a quelli pratici, attraverso numerose esercitazioni su dati reali e simulati. Il corso presenterà anche strumenti più avanzati, quali gli alberi decisionali e la cluster analysis.
Prerequisiti
Non ci sono prerequisiti specifici
Metodi didattici
Lezioni teoriche e sessioni di programmazione in R
Verifica Apprendimento
Prova scritta finalizzata a verificare l’acquisizione dei fondamenti teorici e delle competenze di base di programmazione, nonché la capacità di interpretare correttamente gli output derivanti dall’analisi dei dati.
Testi
James, G., Witten, D., Hastie, T., & Tibshirani, R. (2021). An Introduction to Statistical Learning: with Applications in R (2nd ed.). Springer. ISBN 978-1-0716-1418-1.
Contenuti
- Analisi esplorativa univariata - Analisi esplorativa multivariata - Modello lineare semplice - Modello lineare multiplo - Analisi dei residui - Confronto fra modelli e scelta del modello migliore - Alberi decisionali - Cluster analysis I metodi presentati verranno implementati con l'ausilio del linguaggio di programmazione R.