Vai al contenuto principale
Oggetto:
Oggetto:

Statistica di Base e Data Mining per le Applicazioni (DM 270) - a.a. 2011/12

Oggetto:

Anno accademico 2011/2012

Codice dell'attività didattica
MFN1454
Docenti
Prof. Rosa Meo (Titolare del corso)
Prof. Maria Teresa Giraudo (Titolare del corso)
Prof. Rossella Cancelliere
Corso di studi
Laurea in Matematica
Anno
3° anno
Periodo didattico
Secondo semestre
Tipologia
D.M. 270 - TAF D
Crediti/Valenza
6
SSD dell'attività didattica
INF/01 - informatica
MAT/06 - probabilita' e statistica matematica
Oggetto:

Sommario insegnamento

Oggetto:

Obiettivi formativi

Il corso si prefigge di fornire agli studenti le nozioni necessarie all’impiego pratico della statistica in vari contesti di tipo applicativo nel caso in cui si disponga di set di dati di diversa complessità e di numerosità anche elevata. Si forniscono quindi nel contempo agli studenti gli elementi basilari per l’uso del software SAS finalizzato all’analisi statistica e al data mining. Si integrano inoltre le nozioni apprese nei corsi precedenti di Statistica con alcune tecniche di tipo non parametrico e multivariato. Il corso intende inoltre fornire le nozioni di base riguardanti il più diffuso modello di rete neurale, il percettrone multilivello, la sua struttura e l’algoritmo di addestramento.

Oggetto:

Risultati dell'apprendimento attesi

Lo studente dovrà essere in grado di effettuare un’analisi statistica approfondita di dati provenienti da situazioni applicative di tipo diverso e di varia complessità e raccolti in campioni di dimensioni anche elevate utilizzando il software statistico SAS. Avrà acquisito la capacità di utilizzare gli strumenti dell’analisi statistica di base e i fondamenti della teoria delle reti neurali per trarre informazioni rilevanti dai set di dati disponibili. Nel contempo avrà acquisito una buona padronanza delle risorse basilari del software SAS. Lo studente acquisirà i principali elementi di teoria e sarà in grado di effettuare prove d’utilizzo del software SAS per la risoluzione di compiti di classificazione e/o regressione su alcuni semplici insiemi di dati.

Oggetto:

Programma

Introduzione al software SAS

Introduzione all’uso di tecniche di statistica con il SAS:

•           Statistica descrittiva;

•           Test di ipotesi parametrici e non parametrici;

•           Analisi della varianza a una e più vie;

•           Regressione lineare univariata e multivariata;

•          Cenni alla regressione non lineare.

Introduzione al Data Mining:      

•           il processo di estrazione della conoscenza dai dati;

•           la classificazione con una selezione di algoritmi;

•           il clustering con una selezione di alcuni algoritmi;

•           classificazione, diagnosi e predizione tramite reti neurali multilivello a propagazione in avanti.

 

Introduction to the software SAS

Introduction to the use of statistical techniques with the software SAS:

•           Descriptive Statistics;

•           Parametric and Non Parametric Hypothesis Testing;

•           One and Multi-Way Analysis of Variance;

•           Univariate and Multivariate Linear Regression;

•          Elementary Nonlinear Regression.

Introduction to Data Mining:

•           the knowledge discovery process;

•           classification with a selection of some algorithms;

•           clustering with a selection of some algorithms;

•          classification, diagnosis and prediction using feedforward multilayer neural networks.

Testi consigliati e bibliografia

Oggetto:

1) Materiale fornito dai docenti

2) Manuale di Statistica per SAS

3) Siti WEB di consultazione, tra cui http://www.okstate.edu/sas/ per il SAS

4) R. J. Roiger, M. W. Geatz, “Introduzione al data mining”, McGraw-Hill Companies, 2003.



Oggetto:

Note

Statistica di Base e Data Mining per le Applicazioni  MFN1454  (DM 270) 6 CFU: 3 CFU MAT/06, 3 CFU INF/01, TAF D Libero, Ambito a scelta dello studente

Il corso si svolge per la maggior parte secondo modalità di erogazione tradizionale, con lezioni frontali in aula informatizzata, e in piccola parte secondo modalità di e-learning tramite la visione individuale di filmati disponibili sulla pagina Moodle del corso e lo svolgimento di esercitazioni collegate. E’ prevista una conseguente attività di tutorato da parte dei docenti del corso.

Modalità di verifica/esame: Esame in aula informatizzata durante il quale verrà richiesto agli studenti di eseguire un’analisi statistica di set di dati utilizzando il software SAS, fornendo conclusioni e suggerimenti per l’interpretazione dei risultati ottenuti. Esercizi da svolgere relativi agli argomenti di data mining.

Oggetto:
Ultimo aggiornamento: 24/04/2015 09:37

Non cliccare qui!