Gli studenti acquisiranno le conoscenze di base per la modelizzazioone di dati. In particolare verranno presentati gli algoritimi più comuni quali il modello lineare multiplo, le tecniche di scelta del modello. Le tecniche di analisi esplorativa multivariata. Gli alberi decisionali e la cluster analysis. Modelli per la classificazione e cenni alle reti neurali artificiali
Prerequisiti
Non ci sono prerequisiti specifici
Metodi didattici
Lezioni teoriche e sessioni di programmazione in python
Verifica Apprendimento
Progetto di analisi di dati con implementazione in python
Testi
Introduction to Statistical Learning Hastie and Tibshirani
Contenuti
* Concetti linguaggio di programmazione Python * Analisi esplorativa multivariata *Divisione train e test set, overfitting, cross-validazione *Modello Lineare multiplo *Regressione con Random Forest *Classificazione con Support Vector Machines *cluster analysis *confronto fra modelli e scelta del modello migliore *Reti neurali artificiali
Il tutto verrà implementato con l'ausilio del linguaggio di programmazione Python.