- Oggetto:
- Oggetto:
Statistica di Base e Data Mining per le Applicazioni (DM 270) - a.a. 2011/12
- Oggetto:
Anno accademico 2011/2012
- Codice dell'attività didattica
- MFN1454
- Docenti
- Prof. Rosa Meo (Titolare del corso)
Prof. Maria Teresa Giraudo (Titolare del corso)
Prof. Rossella Cancelliere - Corso di studi
- Laurea in Matematica
- Anno
- 3° anno
- Periodo didattico
- Secondo semestre
- Tipologia
- D.M. 270 - TAF D
- Crediti/Valenza
- 6
- SSD dell'attività didattica
- INF/01 - informatica
MAT/06 - probabilita' e statistica matematica - Oggetto:
Sommario insegnamento
- Oggetto:
Obiettivi formativi
Il corso si prefigge di fornire agli studenti le nozioni necessarie all’impiego pratico della statistica in vari contesti di tipo applicativo nel caso in cui si disponga di set di dati di diversa complessità e di numerosità anche elevata. Si forniscono quindi nel contempo agli studenti gli elementi basilari per l’uso del software SAS finalizzato all’analisi statistica e al data mining. Si integrano inoltre le nozioni apprese nei corsi precedenti di Statistica con alcune tecniche di tipo non parametrico e multivariato. Il corso intende inoltre fornire le nozioni di base riguardanti il più diffuso modello di rete neurale, il percettrone multilivello, la sua struttura e l’algoritmo di addestramento.
- Oggetto:
Risultati dell'apprendimento attesi
Lo studente dovrà essere in grado di effettuare un’analisi statistica approfondita di dati provenienti da situazioni applicative di tipo diverso e di varia complessità e raccolti in campioni di dimensioni anche elevate utilizzando il software statistico SAS. Avrà acquisito la capacità di utilizzare gli strumenti dell’analisi statistica di base e i fondamenti della teoria delle reti neurali per trarre informazioni rilevanti dai set di dati disponibili. Nel contempo avrà acquisito una buona padronanza delle risorse basilari del software SAS. Lo studente acquisirà i principali elementi di teoria e sarà in grado di effettuare prove d’utilizzo del software SAS per la risoluzione di compiti di classificazione e/o regressione su alcuni semplici insiemi di dati.
- Oggetto:
Programma
Introduzione al software SASIntroduzione all’uso di tecniche di statistica con il SAS:
• Statistica descrittiva;
• Test di ipotesi parametrici e non parametrici;
• Analisi della varianza a una e più vie;
• Regressione lineare univariata e multivariata;
• Cenni alla regressione non lineare.
Introduzione al Data Mining:
• il processo di estrazione della conoscenza dai dati;
• la classificazione con una selezione di algoritmi;
• il clustering con una selezione di alcuni algoritmi;
• classificazione, diagnosi e predizione tramite reti neurali multilivello a propagazione in avanti.
Introduction to the software SASIntroduction to the use of statistical techniques with the software SAS:
• Descriptive Statistics;
• Parametric and Non Parametric Hypothesis Testing;
• One and Multi-Way Analysis of Variance;
• Univariate and Multivariate Linear Regression;
• Elementary Nonlinear Regression.
Introduction to Data Mining:
• the knowledge discovery process;
• classification with a selection of some algorithms;
• clustering with a selection of some algorithms;
• classification, diagnosis and prediction using feedforward multilayer neural networks.
Testi consigliati e bibliografia
- Oggetto:
1) Materiale fornito dai docenti
2) Manuale di Statistica per SAS
3) Siti WEB di consultazione, tra cui http://www.okstate.edu/sas/ per il SAS
4) R. J. Roiger, M. W. Geatz, “Introduzione al data mining”, McGraw-Hill Companies, 2003.
- Oggetto:
Note
Statistica di Base e Data Mining per le Applicazioni MFN1454 (DM 270) 6 CFU: 3 CFU MAT/06, 3 CFU INF/01, TAF D Libero, Ambito a scelta dello studente
Il corso si svolge per la maggior parte secondo modalità di erogazione tradizionale, con lezioni frontali in aula informatizzata, e in piccola parte secondo modalità di e-learning tramite la visione individuale di filmati disponibili sulla pagina Moodle del corso e lo svolgimento di esercitazioni collegate. E’ prevista una conseguente attività di tutorato da parte dei docenti del corso.
Modalità di verifica/esame: Esame in aula informatizzata durante il quale verrà richiesto agli studenti di eseguire un’analisi statistica di set di dati utilizzando il software SAS, fornendo conclusioni e suggerimenti per l’interpretazione dei risultati ottenuti. Esercizi da svolgere relativi agli argomenti di data mining.
- Oggetto: