che cosa è la statistica
Di cosa parla
- Introduzione e Scopi della Statistica Medica:
- La statistica è cruciale per la sintesi e l'analisi dei dati in ambito biomedico, aiutando a comprendere la variabilità biologica e gli errori.
- Permette di eseguire studi clinici, interpretare la letteratura e rappresentare efficacemente i dati.
- Definizioni chiave: unità statistica (oggetto di studio), popolazione (insieme completo) e campione (sottoinsieme rappresentativo).
- Statistica Descrittiva:
- Si occupa di riassumere e presentare i dati attraverso metodi numerici e grafici.
- Tipologie di variabili: quantitative (numeriche, continue o discrete), ordinali (con ranghi) e nominali (categoriche, anche dicotomiche).
- Frequenze: assolute, relative (proporzioni), percentuali e cumulative per descrivere la distribuzione dei dati.
- Indici di posizione (tendenza centrale): includono la media aritmetica (per quantitative), la mediana (valore centrale, robusta agli estremi) e la moda (valore più frequente).
- Indici di variabilità (dispersione): come la deviazione standard e il coefficiente di variazione percentuale per le quantitative, e i quantili (quartili, percentili) per descrivere la dispersione.
- Rappresentazioni grafiche: istogrammi, grafici a linee, a torta, box plot per visualizzare le distribuzioni e i dati riassunti.
- Statistica Inferenziale e Teoria della Probabilità:
- Scopo: fare affermazioni sulla popolazione partendo dai dati di un campione, quantificando l'incertezza con la probabilità.
- Concetti di probabilità: classica, frequentista e soggettivista. Include il calcolo della probabilità per eventi (somma per esclusivi, prodotto per indipendenti) e la probabilità condizionata (Teorema di Bayes).
- Distribuzioni di probabilità: descrivono il comportamento delle variabili (es. binomiale per discrete, normale/gaussiana per continue), con la distribuzione normale che ha forma a campana e dipende da media (μ) e deviazione standard (σ).
- Campionamento e Stima:
- La scelta del campione (tramite randomizzazione e stratificazione) è fondamentale per la rappresentatività e la validità delle conclusioni, riducendo vizi (bias) ed errori casuali.
- La dimensione del campione influenza la precisione delle stime.
- Stima della media: il teorema del limite centrale spiega come le medie campionarie si distribuiscono intorno alla media vera della popolazione.
- Intervalli di confidenza: forniscono un range di valori plausibili per un parametro della popolazione (es. media o proporzione) con un dato livello di confidenza, essendo più informativi del solo p-value.
- Verifica delle Ipotesi:
- Metodo per determinare se le differenze osservate tra gruppi sono statisticamente significative o dovute al caso.
- Comprende la formulazione di ipotesi (nulla H₀ e alternativa Hₐ), la scelta del livello di significatività, il calcolo di una statistica test e la verifica del p-value.
- Test comuni: t di Student (confronto tra medie), chi quadrato (confronto tra frequenze), analisi della correlazione (associazione tra variabili), ANOVA (confronto di medie tra più gruppi).
- Errori di I e II tipo: l'errore di tipo I (falso positivo, probabilità α) si ha rifiutando H₀ quando è vera; l'errore di tipo II (falso negativo, probabilità β) si ha non rifiutando H₀ quando è falsa.
- Metodi Non Parametrici:
- Sono utilizzati quando le assunzioni dei test parametrici (es. distribuzione normale) non sono soddisfatte, tipicamente per dati non-normali, ordinali o categorici.
- Esempi includono i test di Mann-Whitney, Wilcoxon, Kruskal-Wallis, Friedman, McNemar e il coefficiente di correlazione di Spearman.