Biostatistica
Di cosa parla
- La Statistica in ambito biomedico (Biometrica) si divide in Descrittiva (sintesi dati) e Inferenziale (generalizzazione da campioni alla popolazione).
- Le variabili sono classificate in Qualitative (Nominali, Ordinali) e Quantitative (Discrete, Continue), rappresentabili tramite tabelle e grafici (barre, torte, istogrammi, box plot).
- Gli Indici di Disposizione descrivono il centro della distribuzione: Media (somma/N, sensibile agli outlier), Mediana (valore centrale), Moda (valore più frequente).
- Gli Indici di Dispersione misurano la variabilità dei dati: Range (max-min), Varianza (media dei quadrati degli scarti dalla media), Deviazione Standard (radice della varianza) e Coefficiente di Variabilità (deviazione standard/media, adimensionale).
- La precisione delle misure è valutata da Ripetibilità e Riproducibilità, mentre l'accuratezza indica la prossimità al valore vero.
- Le distribuzioni di probabilità, come la Distribuzione Normale (curva di Gauss), sono fondamentali; la Standardizzazione (Z-score) permette di confrontare distribuzioni diverse.
- Il Teorema del Limite Centrale stabilisce che le medie campionarie tendono a una distribuzione normale con l'aumentare della dimensione del campione, rendendo cruciale l'Errore Standard della Media.
- Gli Intervalli di Confidenza stimano un range di valori per un parametro della popolazione (es. media, proporzione) con un certo livello di probabilità (es. 95%).
- Il Test d'Ipotesi è un processo decisionale che confronta un'Ipotesi Nulla (H0) con un'Ipotesi Alternativa (H1) usando un campione; il P-value indica la probabilità dei dati sotto H0. Si possono commettere Errori di I tipo (α) o di II tipo (β), e la Potenza del Test (1-β) ne misura l'efficacia.
- Test specifici includono il Z-test (per medie con deviazione standard nota) e il t-test di Student (per medie con deviazione standard ignota o per campioni appaiati o indipendenti).
- Per l'associazione tra variabili continue si usano Covarianza e Correlazione (r): r varia da -1 (negativa perfetta) a +1 (positiva perfetta), con 0 per assenza di correlazione.
- La Regressione Lineare Semplice (y = a + bx) modella la relazione lineare tra una variabile dipendente (y) e una indipendente (x), con 'b' che rappresenta la pendenza (cambiamento di y per unità di x) e 'a' l'intercetta.
- Per le variabili categoriche, il Test Chi-quadro (χ²) valuta l'adattamento a una distribuzione teorica o l'indipendenza tra due variabili in tabelle di contingenza (gradi di libertà = (righe-1)*(colonne-1)).
- L'Odds Ratio (OR) quantifica l'associazione tra esposizione a un fattore di rischio e un evento/malattia, dove OR=1 indica assenza di associazione, OR>1 un effetto dannoso, OR<1 un effetto protettivo. Anche per l'OR si calcolano gli intervalli di confidenza.