Vai al contenuto principale
Oggetto:
Oggetto:

Statistica di Base e Data Mining per le Applicazioni (DM 270) - a.a. 2012/13

Oggetto:

Anno accademico 2012/2013

Codice dell'attività didattica
MFN1454
Docenti
Prof. Rossella Cancelliere
Prof. Maria Teresa Giraudo
Prof. Rosa Meo
Prof. Cristina Zucca
Corso di studi
Laurea in Matematica
Anno
3° anno
Periodo didattico
Secondo semestre
Tipologia
D.M. 270 - TAF D
Crediti/Valenza
6
SSD dell'attività didattica
INF/01 - informatica
MAT/06 - probabilita' e statistica matematica
Modalità di erogazione
A distanza
Lingua di insegnamento
Italiano
Modalità di frequenza
Facoltativa
Tipologia d'esame
Prova pratica
Mutuato da
SSD: 3 cfu MAT/06, 3 cfu INF/01
Oggetto:

Sommario insegnamento

Oggetto:

Obiettivi formativi

Il corso si prefigge di fornire agli studenti le nozioni necessarie all’impiego pratico della statistica in vari contesti di tipo applicativo nel caso in cui si disponga di set di dati di diversa complessità e di numerosità anche elevata. Si forniscono quindi nel contempo agli studenti gli elementi basilari per l’uso del software SAS finalizzato all’analisi statistica e al data mining. Si integrano inoltre le nozioni apprese nei corsi precedenti di Statistica con alcune tecniche di tipo non parametrico e multivariato.

Reti neurali: il corso intende fornire le nozioni di base riguardanti il più diffuso modello di rete neurale, il percettrone multilivello, la sua struttura, l’algoritmo di addestramento.

Oggetto:

Risultati dell'apprendimento attesi

Lo studente dovrà essere in grado di effettuare un’analisi statistica approfondita di dati provenienti da situazioni applicative di tipo diverso e di varia complessità, raccolti in campioni di dimensioni anche elevate, utilizzando il software statistico SAS. Avrà acquisito la capacità di utilizzare gli strumenti dell’analisi statistica di base e i fondamenti della teoria delle reti neurali per trarre informazioni rilevanti dai set di dati disponibili. Nel contempo avrà acquisito una buona padronanza delle risorse basilari del software SAS.

Lo studente acquisirà i principali elementi di teoria e sarà in grado di effettuare prove d’utilizzo del software SAS per la risoluzione di compiti di classificazione e/o regressione su alcuni semplici insiemi di dati.

Oggetto:

Attività di supporto

E' previsto un tutorato sia per la parte di Statistica che per la parte di data mining.

Oggetto:

Programma

Introduzione al SAS e introduzione all'analisi statistica con il SAS:

•           Il software SAS

•           Statistica descrittiva e istogrammi

•           Test di ipotesi

•           Analisi della varianza

•           Regressione lineare.

 

Introduzione al Data Mining:

•           il processo di estrazione della conoscenza dai dati

•           la classificazione con una selezione di algoritmi

•           il clustering con una selezione di alcuni algoritmi

Si prevede l’utilizzo di esempi ed esercizi su SAS Enterprise Miner.

 

Laboratorio: analisi di dati reali (svolto da personale del CSI-Piemonte):

•           Presentazione di situazioni reali.

 

Introduction to the software SAS and to statistical analysis with SAS:

•           The software SAS

•           Descriptive statistics and histograms

•           Hypothesis testing

•           ANOVA

•           Linear regression.

 

Introduction to Data Mining:

•           Extracting knowledge from data

•           A selection of classification algorithms

•           A selection of clustering algorithms.

Examples and exercises will be given with SAS Enterprise Miner.

 

Practical laboratory:

•           Presentation of the analysis of some real data (given by CSI-Piemonte).

Testi consigliati e bibliografia

Oggetto:

1) Materiale fornito dai docenti

2) Manuale di Statistica per SAS, scaricabile per esempio al sito per esempio http://support.sas.com/documentation/cdl/en/procstat/63104/PDF/default/procstat.pdf

3) Siti WEB di consultazione

4) R. J. Roiger, M. W. Geatz, “Introduzione al data mining”, McGraw-Hill Companies, 2003.



Oggetto:

Note

Statistica di Base e Data Mining per le Applicazioni  MFN1454  (DM 270) 6 CFU: 3 CFU MAT/06, 3 CFU INF/01, TAF D Libero, Ambito a scelta dello studente

L'esame consiste nell'elaborazione e presentazione dell'analisi statistica di un set di dati e nella risoluzione di alcuni esercizi di data mining, da consegnare prima della data prevista per l'appello.

Oggetto:
Ultimo aggiornamento: 17/12/2014 10:41

Location: https://www.matematica.unito.it/robots.html
Non cliccare qui!