L’insegnamento fornisce gli strumenti analitici per comprendere risultati di ricerca e analisi dati che fanno uso di tecniche di machine learning e per interagire con esperti del campo.
Prerequisiti
Non sono richieste competenze specifiche di carattere tecnico. E’ utile una minima competenza di carattere statistico che sarà accertata all’inizio delle lezioni. Qualora questa non fosse presente il docente proporrà letture integrative.
Metodi didattici
Lezioni frontali e laboratori che prevedono l'utilizzo di R
Verifica Apprendimento
Analisi critica e commento di un articolo di ricerca che tratta un'applicazione delle tecniche viste durante il corso più domande generali sul programma. Lo studente avrà la possibilità di produrre un progetto di data science in R (svolto in gruppo) per ottenere punti aggiuntivi (facoltativo). Entrambe le modalità d'esame includono
Testi
Testo suggerito: G. James, D. Witten, T. Hastie, R. Tibshirani, An introduction to statistical learning with applications in R, Springer
Contenuti
I principali argomenti di insegnamento sono: -Introduzione alla data science - Introduzione a R. -Analisi esplorativa dei dati -Modelli supervisionati, tra cui regressione lineare, regressione logistica, K-NN, Alberi di regressione e classificazione - Tecniche di stima dell'errore (cross validazione) -Modelli ensemble: Random forest e adaboost -Tecniche di clustering -Market basket analysis -Neural Network -Text mining
L'insegnamento prevede lezioni frontali ricche di esempi e laboratori pratici in R.
Lingua Insegnamento
INGLESE
Altre informazioni
Programma dettagliato, slides, materiali, casi, letture e informazioni sono progressivamente caricati sulla piattaforma KIRO, accessibile dagli studenti con credenziali ateneo.