• Edizioni di altri A.A.:
  • 2019/2020
  • 2020/2021
  • 2021/2022
  • 2022/2023
  • 2023/2024
  • 2024/2025
  • 2025/2026

  • Lingua Insegnamento:
    Le lezioni saranno svolte in Italiano. Slides e libri di testo saranno principalmente il lingua Inglese 
  • Testi di riferimento:
    - Dispense del corso ed esercitazioni pratiche utili per gli studenti non frequentanti
    - Maindonald, Braun (2010) Data Analysis and Graphics Using R: An Example-Based Approach. 3rd edition, Cambridge University Press
    - James, Witten, Hastie, Tibshirani (2013) An Introduction to Statistical Learning (with Applications in R), Springer-Verlag
    - Kevin Murphy (2012) Machine learning : a probabilistic perspective, The MIT Press, Cambridge, Massachusetts, London, England
    - Luìs Torgo (2011) Data Mining with R. Learning with case studies. CRC Press 
  • Obiettivi formativi:
    L’insegnamento si inserisce nel generale obiettivo del corso di studio di fornire conoscenza riguardo all’analisi multivariata per dati complessi.
    L’insegnamento si propone di fornire allo studente gli strumenti per estrarre informazioni rilevanti da grandi moli di dati, con particolare
    attenzione all'apprendimento statistico (statistical learning) sia in contesto predittivo che non (apprendimento supervisionato e non).

    RISULTATI DELL'APPRENDIMENTO ATTESI
    L'insegnamento prevede di completare la formazione dello studente con nozioni e strumenti utili ad approfondire gli aspetti dell’analisi statistica multivariata per dati complessi. La formazione sarà quindi completata e arricchita dalle seguenti competenze:

    Conoscenza e capacità di comprensione
    - Conoscenza di concetti statistici per l’analisi multivariata e relativa terminologia specializzata
    - Capacità di applicare i principi di ragionamento statistico nell'elaborazione e nell'interpretazione dei risultati derivanti da analisi di dati reali
    - Capacità di utilizzare il software R e MATLAB per l’analisi statistica di dati a struttura complessa

    Capacità di applicare conoscenza e comprensione
    Al termine del corso di insegnamento, lo studente anche con l’aiuto di casi di studi concreti svolti con il software statistico R, sarà in grado di analizzare dati complessi (ad esempio, immagini, testi, dati spaziali e temporali, dati funzionali), anche di grandi dimensione, con le moderne tecniche statistiche. Le conoscenze acquisite gli consentiranno di trattare "oggetti" non strutturati e comprendere le complesse strutture relazionali e correlazioni insite nei dati

    Autonomia di giudizio
    - Apprendere i concetti logici e statistici che sono indispensabili per lavorare autonomamente nella ricerca,
    - Selezione, preparazione ed elaborazione di dati a struttura complessa

    Abilità comunicative
    - Imparare la terminologia e le tecniche statistiche di analisi multivariata per comunicare o discutere correttamente i risultati dell'analisi dei dati 
  • Prerequisiti:
    Conoscenze di matematica generale, algebra lineare, matrici, statistica inferenziale 
  • Metodi didattici:
    Lezione frontale ed esercitazioni in aula informatica con utilizzo del software R 
  • Modalità di verifica dell'apprendimento:
    Conoscenza e capacità di comprensione
    L’esame si articola in una prova orale volta a verificare la conoscenza della parte teorica degli argomenti trattati a lezione e in una discussione orale di un report redatto per l’analisi di
    data sets (sceltti dallo studente) mediante l’uso di un software (R, Python o Matlab).
    Nella determinazione del voto finale dell’esame, il peso della discussione del report è pari al 30%.

    Capacità di applicare conoscenza e comprensione

    Con la valutazione della presentazione di un report basato su casi di studio reali si verifica la capacità degli studenti di applicare le tecniche ed i modelli introdotti durante il corso, nonché la comprensione e la capacità di analisi critica degli argomenti trattati. 
  • Sostenibilità:
    I temi trattati nel corso sono riconducibili ad alcuni dei 17 obiettivi caratterizzanti l'Agenda 2030 per lo sviluppo sostenibile. In particolare, le tematiche trattate faranno riferimento ad alcuni target dei goal "Salute e benessere", "Città e comunità sostenibili" e "Lotta al cambiamento climatico" 
  • Altre Informazioni:
    E-mail: ippoliti@unich.it

    Giorni ed orari di ricevimento studenti: Lunedì e Mercoledì 15:00 – 16:00 e per appuntamento da concordarsi via e-mail.

    Risultati dell'apprendimento attesi: conoscenza delle principali tecniche di data mining e apprendimento statistico per l'analisi di dati a struttura complessa. Abilità nell'utilizzo della conoscenza acquisita in questo e in precedenti corsi per trattare problemi applicativi, anche attraverso l'uso di specifiche librerie del software statistico R. Comprensione critica delle caratteristiche, delle potenzialità e dei limiti delle tecniche trattate, in modo da saper valutare quali siano gli strumenti più adatti nelle specifiche situazioni da sottoporre ad analisi. 

Il corso prevede la trattazione dei seguenti argomenti per il raggiungimento dei risultati di apprendimento attesi: introduzione all'apprendimento statistico, Tecniche di visualizzazione dei dati, Tecniche di regressione e classificazione, Apprendimento non
supervisionato (analisi delle componenti principali e metodi di raggruppamento, Procruste), Analisi di dati complessi (dati spaziali e social data mining) con R

Il corso si propone di introdurre metodi e modelli per estrarre informazioni rilevanti da grandi moli di dati, con particolare attenzione
all'apprendimento statistico (statistical learning) sia in contesto predittivo che non (apprendimento supervisionato e non). Al fine di fornire le
competenze per l'analisi e la modellazione di dati reali complessi, le lezioni saranno integrate da esercitazioni in R svolte in aula informatica.

Programma:

1. Introduzione al data mining e statistical learning.
2. La matrice dei dati e object oriented data analysis (OODA)
3. Tecniche di visualizzazione dei dati
4. Richiami di probabilità
5. La distribuzione Normale multivariata
6. Modelli di previsione per dati indipendenti con R (LDA, K-NN, SVM)
7. Analisi di dati complessi (Object Oriented Data Analysis) con R
7.1 OODA e analisi di Procruste
7.2 OODA nell’analisi dei dati spaziali
7.3 OODA e Social Data Mining (Text Mining and Natural Language Processing)

Avvisi

Nessun avviso in evidenza

Documenti

Nessun documento in evidenza

Scopri cosa vuol dire essere dell'Ud'A

SEDE DI CHIETI
Via dei Vestini,31
Centralino 0871.3551

SEDE DI PESCARA
Viale Pindaro,42
Centralino 085.45371

email: info@unich.it
PEC: ateneo@pec.unich.it
Partita IVA 01335970693

icona Facebook   icona Twitter

icona Youtube   icona Instagram