Detailed index of arguments - Applied Statistics 2020
Di cosa parla
- Esplorazione di Dataset Multivariati: Copre problematiche di predizione, la 'maledizione della dimensionalità' e il trade-off bias-variance. Analizza la geometria dei dati, gli stimatori per la media e la covarianza, e la variabilità multivariata, includendo la distanza di Mahalanobis.
- Analisi delle Componenti Principali (PCA): Un metodo per trovare combinazioni lineari dei dati che massimizzano la varianza, essenziale per la riduzione della dimensionalità, con una chiara visione geometrica delle basi ortonormali ottimali.
- Distribuzione Gaussiana Multivariata: Approfondisce le proprietà fondamentali di questa distribuzione, i teoremi di caratterizzazione, le relazioni di gaussianità e indipendenza tra variabili, e gli stimatori per i parametri in contesti multivariati.
- Inferenza sul Vettore Medio: Dettaglia le procedure di inferenza sia per campioni grandi che piccoli (usando il teorema di Hotelling), gli intervalli di confidenza per combinazioni lineari della media (simultanei e con metodo di Bonferroni), e il confronto delle medie di distribuzioni gaussiane.
- Analisi Multivariata della Varianza (MANOVA): Estende l'ANOVA per analizzare simultaneamente le differenze tra medie vettoriali di più gruppi, affrontando scenari con p=1 o p≥1 dimensioni.
- Classificazione:
- Supervisionata: Introduce modelli predittivi, criteri di ottimizzazione (ECM), classificatori ottimali (Bayes, MLE), casi specifici come QDA e LDA, valutazione tramite tasso di errore (AER, K-fold CV) e Support Vector Machines (SVM).
- Non Supervisionata: Si concentra su funzioni di dissimilarità, clustering gerarchico (dendrogramma, metodo di Ward) e non gerarchico (K-means), e tecniche grafiche come il Multidimensional Scaling (MDS).
- Regressione: Comprende approcci data-driven (CART) e parametrici (modelli lineari OLS, GLS) con analisi del coefficiente di determinazione R², e diagnostica per la linearità (analisi dei residui, collinearità VIF) e selezione delle variabili (PCA Regression, Ridge, Lasso).
- Test di Permutazione: Metodi non parametrici robusti per testare ipotesi su popolazioni univariate e multivariate, inclusi ANOVA/MANOVA e regressione, basati su permutazioni di unità o residui.
- Dati Spaziali (Geostatistica): Indaga la dipendenza spaziale tramite assunzioni su media e covarianza, variogrammi e covarigrammi, e tecniche di predizione spaziale come l'Ordinary e Universal Kriging.
- Analisi dei Dati Funzionali (FDA): Modella i dati come funzioni in spazi di Hilbert, trattando tecniche di smoothing, interpolazione, riduzione della dimensionalità e allineamento/clustering funzionale.