elaborazione dati 3
Di cosa parla
- Elaborazione Dati e Distribuzioni Quanti-Qualitative: Il documento esplora le situazioni in cui una variabile indipendente è qualitativa e una dipendente è quantitativa, introducendo il concetto di 'confronto fra medie'.
- Confronto Fra Medie:
- La forza dell'associazione è misurata da Devianza Totale, Devianza Interna e Devianza dei Gruppi.
- Viene introdotto il coefficiente η² (eta quadro) come rapporto tra Devianza dei Gruppi e Devianza Totale, indicando la proporzione di varianza della variabile dipendente spiegata dalla variabile indipendente.
- η² varia tra 0 e 1, sebbene in ambiti sociali sia spesso inferiore al 30%.
- ANOVA (Analisi della Varianza):
- Vengono presentati gli aspetti inferenziali dell'ANOVA per testare ipotesi sulle differenze tra medie.
- Un esempio pratico coinvolge l'analisi del BMI in relazione al 'colore della pelle'.
- Si illustra l'interpretazione della tabella ANOVA, includendo devianza, gradi di libertà (df), medie dei quadrati, statistica F e p-value (Sig.) per la decisione sul rifiuto dell'ipotesi nulla.
- Correlazione tra Variabili Quantitative:
- Si affronta l'associazione tra due variabili quantitative attraverso la 'correlazione' e la 'regressione'.
- Viene illustrata la rappresentazione grafica con 'diagrammi di dispersione'.
- Si sottolinea l'importanza di 'standardizzare' le variabili per omogeneizzare la dispersione e interpretare correttamente i grafici.
- Viene introdotto il coefficiente di correlazione lineare di Pearson (ρxy), la sua formula e l'interpretazione dei suoi valori tra -1 e +1 (perfetta correlazione negativa, assenza di correlazione lineare, perfetta correlazione positiva).
- Vengono definite le categorie di intensità della correlazione (bassa, media, alta).
- Si discute il concetto di 'comunalità' o 'variabile latente' per spiegare alte correlazioni (es. 'forza rapida' per corsa e salto).
- Regressione Lineare:
- Si passa dal modello di relazione simmetrico (correlazione) a quello asimmetrico (regressione), dove una variabile è dipendente dall'altra.
- La relazione è espressa da Y = a + bX, dove 'a' e 'b' permettono di prevedere i valori di Y in base a X.
- Ulteriori Approfondimenti e Avvertenze:
- Si accenna all'uso di tecniche di Analisi Multivariata (Componenti Principali, Corrispondenze Multiple, Cluster Analysis) per sintetizzare dati complessi con molte variabili.
- Anomalie della Correlazione: Si avverte che il coefficiente di Pearson misura solo relazioni lineari e che r=0 non esclude relazioni non lineari. La presenza di outlier può generare correlazioni spurie o soppresse, rendendo indispensabile l'analisi grafica.
- Fallacia Ecologica: Si spiega che le correlazioni basate su dati aggregati (es. comuni, regioni) non possono essere interpretate come correlazioni a livello individuale.
- Relazione Spuria: Si illustrano casi di covariazione apparente non dovuta a causalità diretta, spesso mediata da una terza variabile non considerata.