Modelli statistici per la Data Science

Insegnamento
Modelli statistici per la Data Science
Insegnamento in inglese
Statistical Models for Data Science
Settore disciplinare
SECS-S/01
Corso di studi di riferimento
DATA SCIENCE PER LE SCIENZE UMANE E SOCIALI
Tipo corso di studio
Laurea Magistrale
Crediti
6.0
Ripartizione oraria
Ore Attività Frontale: 36.0
Anno accademico
2024/2025
Anno di erogazione
2025/2026
Anno di corso
2
Lingua
ITALIANO
Percorso
PERCORSI COMUNE/GENERICO

Descrizione dell'insegnamento

Il programma dell'insegnamento è provvisorio e potrebbe subire delle modifiche

Lo studente dovrebbe avere una conoscenza di base dei processi coinvolti

nell'analisi dei dati, nonché la rappresentazione e l'interpretazione dei dati in uno spazio multidimensionale. E' richiesta la conoscenza del software R.

Il corso presenta i concetti essenziali e le tecniche di apprendimento statistico con particolare attenzione  per problemi di apprendimento supervisionato e non supervisionato

Il corso di Modelli statistici per la data science è finalizzato a fornire agli studenti strumenti avanzati di analisi dei dati, attraverso cui estrapolare informazioni rilevanti dai dati e guidare i collegati processi decisionali.

Obiettivi del corso sono:

  1. introdurre le tecniche di base dell'Analisi Multivariata e del Data science;
  2. sviluppare la capacità di scegliere il modello ottimale per analizzare i dati;
  3. discutere lo studio di alcune applicazioni reali utilizzando software per l’elaborazione dei dati open source.

Il corso riguarderà attività finalizzate all'acquisizione di conoscenze avanzate dei metodi e delle tecniche per l’analisi statistica e dei metodi di ottimizzazione, applicate a gestione, trattamento e analisi dei dati. Il corso intende fornire agli studenti i principali strumenti statistici per l’analisi e la comprensione di fenomeni reali di tipo sociale.

Conoscenze e comprensione.

Al termine del corso lo studente avrà: Conoscenza della terminologia scientifica e comprensione degli aspetti teorici e applicativi presentati nel corso. Capacità di applicare conoscenza e comprensione degli strumenti statistici e computazionali per la statistica multivariata e il Data science.

Capacità di applicare conoscenze e comprensione.


Applicare e discutere metodi quantitativi avanzati nell'ambito dell'analisi dei dati reali, formulando in maniera chiara il problema e interpretando i risultati in un ambiente multidisciplinare e tradurli in decisioni operative.

 

Autonomia di giudizio.

Autonomia di giudizio e conseguente possibilità di sviluppare considerazioni logiche e deduttive indispensabili per lavorare autonomamente nella ricerca, nella selezione e nello studio di dati con il supporto delle tecniche di apprendimento statistico per la risoluzione di problemi reali in particolare in ambito sociale.

 

Abilità comunicative.

Abilità comunicative per divulgare con chiarezza i metodi, le  tecniche utilizzate per l'analisi dei dati a interlocutori specialisti e non specialisti utilizzando metodi efficaci e lessico appropriato.

Capacità di apprendimento.

Capacità di applicare conoscenza e Aver sviluppato le competenze necessarie per intraprendere studi successivi e approfondire autonomamente gli strumenti statistici

Le lezioni tradizionali di tipo frontale verranno accompagnate da esercitazioni svolte nel laboratorio informatico, in modo da rendere autonomi gli studenti nell’utilizzo del software statistico R per l’analisi dei modelli statistici.

Lavori di gruppo su analisi di casi di studio con discussione comune.

L’esame si compone di una prova scritta con quesiti teorici e una parte orale che comprende la discussione di un report di ricerca in cui siano analizzati dati reali e che mostri l'apprendimento delle tecniche quantitative di analisi dei dati e l'uso del software R.

 

Il superamento dell'esame presuppone il conferimento di un voto non inferiore ai diciotto/trentesimi (con eventuale assegnazione della lode) e prevede l'attribuzione dei corrispondenti CFU.

Per aggiornamenti si prega di consultare la Sezione "Notizie" della pagina docente.

Ricevimento studenti e laureandi, da concordare con il docente

Gareth, j., Daniela W., Trevor H., Robert T., “Introduzione all’apprendimento statistico con applicazioni in R”, 2020 Piccin

A. Agresti, M. Kateri (2022) Statistica per data scientist, EGEA (per consultazione)

Hastie T, Tibshirani R, Friedman J - The Elements of Statistical Learning: Data Mining, Inference, and Prediction, Second Edition, Springer, 2009 (per consultazione)

Semestre

Tipo esame
Obbligatorio

Valutazione
Orale - Voto Finale

Orario dell'insegnamento
https://easyroom.unisalento.it/Orario

Scarica scheda insegnamento (Apre una nuova finestra)(Apre una nuova finestra)