Altro VERIFICATO

Detailed index of arguments - Applied Statistics 2020

Politecnico di Milano mathematical engineering - ingegneria matematica 2020
11 visualizzazioni
13 download
Nessun voto ancora
Condividi: WhatsApp Telegram
Anteprima pagina 1 — Detailed index of arguments - Applied Statistics 2020

Di cosa parla

  • Esplorazione di Dataset Multivariati: Copre problematiche di predizione, la 'maledizione della dimensionalità' e il trade-off bias-variance. Analizza la geometria dei dati, gli stimatori per la media e la covarianza, e la variabilità multivariata, includendo la distanza di Mahalanobis.
  • Analisi delle Componenti Principali (PCA): Un metodo per trovare combinazioni lineari dei dati che massimizzano la varianza, essenziale per la riduzione della dimensionalità, con una chiara visione geometrica delle basi ortonormali ottimali.
  • Distribuzione Gaussiana Multivariata: Approfondisce le proprietà fondamentali di questa distribuzione, i teoremi di caratterizzazione, le relazioni di gaussianità e indipendenza tra variabili, e gli stimatori per i parametri in contesti multivariati.
  • Inferenza sul Vettore Medio: Dettaglia le procedure di inferenza sia per campioni grandi che piccoli (usando il teorema di Hotelling), gli intervalli di confidenza per combinazioni lineari della media (simultanei e con metodo di Bonferroni), e il confronto delle medie di distribuzioni gaussiane.
  • Analisi Multivariata della Varianza (MANOVA): Estende l'ANOVA per analizzare simultaneamente le differenze tra medie vettoriali di più gruppi, affrontando scenari con p=1 o p≥1 dimensioni.
  • Classificazione:
    • Supervisionata: Introduce modelli predittivi, criteri di ottimizzazione (ECM), classificatori ottimali (Bayes, MLE), casi specifici come QDA e LDA, valutazione tramite tasso di errore (AER, K-fold CV) e Support Vector Machines (SVM).
    • Non Supervisionata: Si concentra su funzioni di dissimilarità, clustering gerarchico (dendrogramma, metodo di Ward) e non gerarchico (K-means), e tecniche grafiche come il Multidimensional Scaling (MDS).
  • Regressione: Comprende approcci data-driven (CART) e parametrici (modelli lineari OLS, GLS) con analisi del coefficiente di determinazione R², e diagnostica per la linearità (analisi dei residui, collinearità VIF) e selezione delle variabili (PCA Regression, Ridge, Lasso).
  • Test di Permutazione: Metodi non parametrici robusti per testare ipotesi su popolazioni univariate e multivariate, inclusi ANOVA/MANOVA e regressione, basati su permutazioni di unità o residui.
  • Dati Spaziali (Geostatistica): Indaga la dipendenza spaziale tramite assunzioni su media e covarianza, variogrammi e covarigrammi, e tecniche di predizione spaziale come l'Ordinary e Universal Kriging.
  • Analisi dei Dati Funzionali (FDA): Modella i dati come funzioni in spazi di Hilbert, trattando tecniche di smoothing, interpolazione, riduzione della dimensionalità e allineamento/clustering funzionale.

Altri appunti di APPLIED STATISTICS

Condividi questi appunti

WhatsApp Telegram