Vai al contenuto principale
Oggetto:
Oggetto:

Statistica di Base e Data Mining per le Applicazioni (DM 270) - a.a. 2014/15

Oggetto:

Statistics and data mining for application

Oggetto:

Anno accademico 2014/2015

Codice dell'attività didattica
MFN1454
Docenti
Prof. Rosa Meo (Titolare del corso)
Dott. Angelica Yohana Pachon Pinzon (Titolare del corso)
Corso di studi
Laurea in Matematica
Anno
3° anno
Periodo didattico
Secondo semestre
Tipologia
D.M. 270 TAF D - A scelta dello studente
Crediti/Valenza
6 CFU
SSD dell'attività didattica
INF/01 - informatica
MAT/06 - probabilita' e statistica matematica
Modalità di erogazione
Tradizionale
Lingua di insegnamento
Italiano
Modalità di frequenza
Facoltativa
Tipologia d'esame
Prova pratica
Prerequisiti
Il corso utilizza materiale in inglese e quindi si richiede una conoscenza
base di inglese.
The course adopts materials in the English language. Therefore a basic
knowledge of English is required.
Mutuato da
SSD: 4 cfu MAT/06, 2 cfu INF/01
Oggetto:

Sommario insegnamento

Oggetto:

Obiettivi formativi

Il corso si prefigge di fornire agli studenti le nozioni necessarie all’
impiego pratico della statistica in vari contesti di tipo applicativo nel caso
in cui si disponga di set di dati di diversa complessità e di numerosità
anche elevata. Si forniscono quindi nel contempo agli studenti gli
elementi basilari per l’uso del software SAS finalizzato all’analisi statistica
e al data mining. Si integrano inoltre le nozioni apprese nei corsi
precedenti di Statistica con alcune tecniche di tipo non parametrico e
multivariato.
Per quanto riguarda le conoscenze sulle reti neurali, il corso intende
fornire le nozioni di base riguardanti il più diffuso modello di rete neurale,
il percettrone multilivello, la sua struttura, l'algoritmo di addestramento.
Conoscenza e capacità di comprensione:
Il corso, partendo dalle conoscenze di base relative alla statistica ed alla
sua trattazione computazionale (obiettivo 4) ed alla programmazione
informatica (obiettivo 9), introduce all'uso del software SAS per le
metodologie statistiche e di data mining basilari (obiettivo 18). Il corso
utilizza materiale in inglese, favorendo in questo modo l’abitudine alla
lettura di letteratura matematica e statistica in lingua inglese.
Capacità di applicare conoscenza e comprensione:
Il corso presenta l'utilizzo del software SAS per effettuare analisi il più
possibili complete di set di dati corrispondenti a situazioni reali e per la
risoluzione di compiti di classificazione e/o regressione su alcuni semplici
insiemi di dati. Gli studenti sono quindi messi in condizione di estrarre
informazioni qualitative da dati quantitativi (obiettivo 4). L'utilizzo di un
software statistico dedicato (obiettivo 5) consente loro di sperimentare le
conoscenze apprese acquisendo nel contempo ulteriori informazioni.
Autonomia di giudizio:
Le analisi statistiche che vengono proposte possono venire eseguite
individualmente o in gruppo (obiettivo 4). Il confronto con i compagni di
corso nel lavoro personale favorisce lo sviluppo della capacità critica nel
proporre, analizzare e confrontare semplici modelli matematici e statistici
associati a situazioni concrete (obiettivo 3) derivanti da altre discipline.
Abilità comunicative:
L'utilizzo di dati provenienti da diversi contesti applicativi allena lo 

studente ad interagire in modo costruttivo con interlocutori non
matematici (obiettivo 2). Il corso utilizza materiale in lingua inglese,
favorendo la familiarizzazione dello studente con l’uso scientifico di tale
lingua (obiettivo 3).
Capacità di apprendimento:
Il corso fornisce le competenze di base per l'esecuzione di analisi
statistiche e di data mining con il software SAS. L’apprendimento di un
software dedicato costituirà il presupposto per poter seguire l'evoluzione
di strumenti informatici dedicati (obiettivo 3) e l'esposizione a realtà
applicative renderà più facile l'adattamento ad attività lavorative anche
lontane dalla formazione specifica (obiettivo 4) e contribuirà a creare una
mentalità flessibil utile per facilitare l'apprendimento di competenze
ulteriori utili in ambito lavorativo (obiettivo 2).

This course has the goal of provide students the necessary notions for
the practical employment of the statistics in various applicative contexts
in which there is a data-set of a certain complexity and high cardinality.
The course provides at the same time the basic elements for the use of
the software SAS Enterprise Miner whose purpose is the data analysis
and data model construction (both descriptive and predictive of some
interest variable). As regards the neural networks, it provides the basic
notions regarding the most wide spread model, the multilevel perceptron,
its structure and the training algorithm.
Knowledge and ability to understand:
This course, starting from the basic knowledge about statistics and its
treatment from the computational viewpoint (see Dublin goal 4) and to
the computer programming skills (see goal 9), introduces to the use of
software SAS as regards the basic statistical methodologies and data
mining (goal 18). This course uses materials which is in the English
language, thus favoring the reading ability of Mathematics and Statistics
in the English language.
Ability to apply knowledge and comprehension:
This course presents the use of software SAS for the complete analysis of
set of data corresponding to real use cases and for the solution of
classification, regression, clustering and feature selection tasks on some
simple datasets. The students can extract qualitative information from
quantitative data (goal 4).
The use of a specific statistical software (goal 5) allows them to train the
acquired knowledge.
Autonomy in judgement:
The proposed statistical analysis can be executed alone by each student
or in group (goal 4).
The comparative evaluation with others in the individual work favours the
develoipment of a critical ability in the proposal, analysis and comparison
of simple methematical, statistical and computatiuonal models
associated to interdisciplinary concrete situations (goal 3) .
Communication skills:
The use of data coming from different applicative contests trains the
student to interact in a costructive way with other people which are non 

mathematicians (goal 2).
This course uses materials in the English language, and thus favors the
student with the use of this language in the scientific field (goal 3).
Comprehension skills:
This course favors the basic competences for the execution of statistical
and data mining analysis with the SAS software.
The training with a specific software is the precondition to follow the
evolution of dedicated software (goal 3) and the exposition to applicative
contexts
will make easier the adjustment to working activities that could be al;so
much far from their specific education (goal 4) and will contribute to
create
a flexible mentality, useful to make easier the acquisition of further
competences in teh working contex (goal 2).

Oggetto:

Risultati dell'apprendimento attesi

Lo studente dovrà essere in grado di effettuare un’analisi statistica
approfondita di dati provenienti da situazioni applicative di tipo diverso e
di varia complessità, raccolti in campioni di dimensioni anche elevate,
utilizzando il software di Data Mining SAS Enterprise Miner. Avrà acquisito
la capacità di utilizzare gli strumenti di Data Mining principali (selezione
delle caratteristiche, classificazione e clustering) e i fondamenti della
teoria delle reti neurali per trarre informazioni rilevanti dai set di dati
disponibili. Nel contempo avrà acquisito una buona padronanza delle
risorse basilari del software SAS e SAS Enterprise Miner.
Lo studente acquisirà i principali elementi di teoria e sarà in grado di
effettuare prove d’utilizzo del software SAS EM per la risoluzione di
compiti di classificazione, clustering, regressione su alcuni semplici
insiemi di dati.

The student will be able to develop an in-depth data analysis on data
whose origin is in some applicative domain. The sample could be large
and of different complexity. The student will be able to use and choose
the correct algorithm choosing it from the SAS Enterprise Miner suite.
She/he will be able to use the principal Data Mining primitives (feature
selection, classification, clustering) and the fundamental theory of the
neural networks with the purpose to extract the relevant information
available from the data. In an analogous way, she/he will be able to use
the basic resources available in SAS and SAS Enterprise Miner.
The student will be able to master the main theoretical concepts and will
be able to use them in practice by SAS Enterprise Miner for the solution
of tasks such as classification, clustering and regression in some simple
cases.

Oggetto:

Modalità di verifica dell'apprendimento

E' previsto un tutorato sia a distanza che in presenza del docente presso i
laboratori su richiesta dello studente previo invio di messaggio (mail).

A support by e-learning and with the presence of the teacher is foreseen (this latter might be requested by the student by sending of a mail to the teacher the day before).

L'esame prevede una parte scritta e una orale. Per lo scritto: La prova scritta è costitutita da esercizi di analisi dei dati da svolgere sui sistemi software (R e SAS Enterprise Miner) adottati durante il corso. Il risultato di tali elaborazioni dovrà essere descritto in sede d'esame in un elaborato scritto nel quale vi saranno anche alcune domande di tipo teorico. La prova è valutata in 30simi. Per l'orale: La prova orale consiste in una discussione degli errori della prova scritta. Per superare l'esame occorre raggiungere il punteggio di 18/30.
The examination is written and oral. As regards the written test: It is constituted by exercizes of data analysis to be developed in software statistical systems (R and SAS Enterprise Miner) employed and learnt during the course. The result of the data analysis session will be described during the examination in a report that will foresee also some theoretical questions. The test is evaluated in thirtieths. As regards the oral test: The oral test consists in a discussion of the mistakes possibly present in the written report. The examination is passed with the score of 18/30.
Oggetto:

Programma

Il corso introduce ai concetti principali del Data Mining (selezione delle
caratteristiche, pulizia dei dati, classificazione, clustering), ad alcuni
algoritmi (per la modellazione predittiva o descrittiva) e insegna l'uso di
uno strumento pratico di analisi dei dati (SAS Enterprise Miner).
Introduzione al SAS e introduzione all'analisi statistica con il SAS: Il
software SAS, Statistica descrittiva e istogrammi, Test di ipotesi, Analisi
della varianza, Regressione.
Introduzione al Data Mining: il processo di estrazione della conoscenza
dai dati, la classificazione con una selezione di algoritmi, il clustering con
una selezione di alcuni algoritmi.
Si prevede l’utilizzo di esempi ed esercizi su SAS Enterprise Miner.

The courses introduces to the main concepts of Data Mining (feature
selection, data cleaning, classification, clustering),, to some main
algorithms for the data analysis (predictive or descriptive modeling) and
teaches the use of a practical system for Data Mining (SAS Enterprise
Miner).
Introduction to Data Mining:
• Extracting knowledge from data
• A selection of classification algorithms
• A selection of clustering algorithms.
Examples and exercises will be given with SAS Enterprise Miner.

Testi consigliati e bibliografia

Oggetto:

R. J. Roiger, M. W. Geatz, “Introduzione al data mining”, McGraw-Hill
Companies, 2003

R. J. Roiger, M. W. Geatz, “Introduzione al data mining”, McGraw-Hill
Companies, 2003



Oggetto:

Orario lezioni

GiorniOreAula
Lezioni: dal 02/03/2015 al 16/01/2015

Nota: Per l'orario delle lezioni consultare la pagina "Orario Lezioni":http://www.educmatematica.unito.it/CMSOrari/index.html

Oggetto:

Note

Statistica di Base e Data Mining per le Applicazioni  MFN1454  (DM 270) 6 CFU: 3 CFU MAT/06, 3 CFU INF/01, TAF D Libero, Ambito a scelta dello studente

Oggetto:
Ultimo aggiornamento: 06/07/2015 17:14

Location: https://www.matematica.unito.it/robots.html
Non cliccare qui!