- Oggetto:
- Oggetto:
Statistica di Base e Data Mining per le Applicazioni (DM 270) - a.a. 2012/13
- Oggetto:
Anno accademico 2012/2013
- Codice dell'attività didattica
- MFN1454
- Docenti
- Prof. Rossella Cancelliere
Prof. Maria Teresa Giraudo
Prof. Rosa Meo
Prof. Cristina Zucca - Corso di studi
- Laurea in Matematica
- Anno
- 3° anno
- Periodo didattico
- Secondo semestre
- Tipologia
- D.M. 270 - TAF D
- Crediti/Valenza
- 6
- SSD dell'attività didattica
- INF/01 - informatica
MAT/06 - probabilita' e statistica matematica - Modalità di erogazione
- A distanza
- Lingua di insegnamento
- Italiano
- Modalità di frequenza
- Facoltativa
- Tipologia d'esame
- Prova pratica
- Mutuato da
- SSD: 3 cfu MAT/06, 3 cfu INF/01
- Oggetto:
Sommario insegnamento
- Oggetto:
Obiettivi formativi
Il corso si prefigge di fornire agli studenti le nozioni necessarie all’impiego pratico della statistica in vari contesti di tipo applicativo nel caso in cui si disponga di set di dati di diversa complessità e di numerosità anche elevata. Si forniscono quindi nel contempo agli studenti gli elementi basilari per l’uso del software SAS finalizzato all’analisi statistica e al data mining. Si integrano inoltre le nozioni apprese nei corsi precedenti di Statistica con alcune tecniche di tipo non parametrico e multivariato.
Reti neurali: il corso intende fornire le nozioni di base riguardanti il più diffuso modello di rete neurale, il percettrone multilivello, la sua struttura, l’algoritmo di addestramento.
- Oggetto:
Risultati dell'apprendimento attesi
Lo studente dovrà essere in grado di effettuare un’analisi statistica approfondita di dati provenienti da situazioni applicative di tipo diverso e di varia complessità, raccolti in campioni di dimensioni anche elevate, utilizzando il software statistico SAS. Avrà acquisito la capacità di utilizzare gli strumenti dell’analisi statistica di base e i fondamenti della teoria delle reti neurali per trarre informazioni rilevanti dai set di dati disponibili. Nel contempo avrà acquisito una buona padronanza delle risorse basilari del software SAS.
Lo studente acquisirà i principali elementi di teoria e sarà in grado di effettuare prove d’utilizzo del software SAS per la risoluzione di compiti di classificazione e/o regressione su alcuni semplici insiemi di dati.
- Oggetto:
Attività di supporto
E' previsto un tutorato sia per la parte di Statistica che per la parte di data mining.
- Oggetto:
Programma
Introduzione al SAS e introduzione all'analisi statistica con il SAS:
• Il software SAS
• Statistica descrittiva e istogrammi
• Test di ipotesi
• Analisi della varianza
• Regressione lineare.
Introduzione al Data Mining:
• il processo di estrazione della conoscenza dai dati
• la classificazione con una selezione di algoritmi
• il clustering con una selezione di alcuni algoritmi
Si prevede l’utilizzo di esempi ed esercizi su SAS Enterprise Miner.
Laboratorio: analisi di dati reali (svolto da personale del CSI-Piemonte):
• Presentazione di situazioni reali.
Introduction to the software SAS and to statistical analysis with SAS:
• The software SAS
• Descriptive statistics and histograms
• Hypothesis testing
• ANOVA
• Linear regression.
Introduction to Data Mining:
• Extracting knowledge from data
• A selection of classification algorithms
• A selection of clustering algorithms.
Examples and exercises will be given with SAS Enterprise Miner.
Practical laboratory:
• Presentation of the analysis of some real data (given by CSI-Piemonte).
Testi consigliati e bibliografia
- Oggetto:
1) Materiale fornito dai docenti
2) Manuale di Statistica per SAS, scaricabile per esempio al sito per esempio http://support.sas.com/documentation/cdl/en/procstat/63104/PDF/default/procstat.pdf
3) Siti WEB di consultazione
4) R. J. Roiger, M. W. Geatz, “Introduzione al data mining”, McGraw-Hill Companies, 2003.
- Oggetto:
Note
Statistica di Base e Data Mining per le Applicazioni MFN1454 (DM 270) 6 CFU: 3 CFU MAT/06, 3 CFU INF/01, TAF D Libero, Ambito a scelta dello studente
L'esame consiste nell'elaborazione e presentazione dell'analisi statistica di un set di dati e nella risoluzione di alcuni esercizi di data mining, da consegnare prima della data prevista per l'appello.
- Oggetto: