elaborazione dati 2
Di cosa parla
- Elaborazione dei Dati: Il primo passo nell'analisi statistica è la descrizione e sintesi delle informazioni tramite il conteggio delle unità statistiche per ogni modalità di risposta.
- Distribuzioni di Frequenza:
- Le risposte sono sintetizzate in categorie con la loro frequenza assoluta.
- Vengono calcolate la frequenza percentuale (o relativa), utile per confrontare collettivi di numerosità diversa, e la percentuale valida, calcolata solo sulle unità che hanno risposto.
- La percentuale cumulata mostra l'ammontare progressivo del fenomeno ed è applicabile solo a categorie gerarchicamente ordinabili.
- Le rappresentazioni grafiche includono grafici a torta e diagrammi a barre per variabili qualitative o quantitative discrete con poche modalità.
- Per le variabili quantitative continue (es. età, altezza), si utilizzano gli istogrammi, dove l'area è proporzionale alla frequenza. Quando le classi hanno ampiezze diverse, gli istogrammi devono essere costruiti ad hoc.
- Misure di Tendenza Centrale e Variabilità:
- Dopo le distribuzioni, si calcolano misure di tendenza centrale (es. media aritmetica, mediana, moda) per sintetizzare la distribuzione con un unico valore.
- Le misure di variabilità (es. deviazione standard, differenza interquartilica, range) tengono conto della dispersione dei valori.
- Per variabili qualitative ordinali, mediana e differenza interquartilica possono essere usate, anche se tecnicamente scorretto per scale come Likert/Cantril.
- Relazioni Bivariate (Associazione):
- Si analizzano le relazioni tra due variabili per vedere se esiste un legame e come una influenzi l'altra (fase esplicativa).
- Le relazioni statistiche non implicano un nesso di causa-effetto diretto. Il ruolo di indipendente/dipendente è spesso assegnato soggettivamente dal ricercatore.
- Le relazioni possono essere tra: a) due variabili qualitative, b) due quantitative, c) indipendente qualitativa e dipendente quantitativa, d) indipendente quantitativa e dipendente qualitativa. Spesso si riducono i casi c) e d) al caso a) raggruppando le variabili quantitative.
- Si introduce la tabella di contingenza (o tavola a doppia entrata) per rappresentare l'associazione tra variabili qualitative, mostrando le frequenze di associazione tra le modalità.
- Si calcolano le percentuali di riga, di colonna e sul totale per interpretare l'associazione. Le percentuali di colonna sono spesso più efficaci per confrontare i "profili" delle variabili dipendenti tra le categorie della variabile indipendente.
- Vengono calcolate le frequenze attese (valori teorici che si avrebbero in caso di totale indipendenza tra le variabili). La divergenza tra frequenze osservate e attese indica la forza dell'associazione.
- Il Chi-quadrato (χ²) e il Test di Ipotesi:
- Il Chi-quadrato è un indice di associazione, pari a 0 in assenza di associazione. Il suo massimo dipende da N, numero di righe e colonne.
- Per normalizzare il Chi-quadrato tra 0 e 1, si usa il V di Cramer.
- Nel test di ipotesi, il Chi-quadrato è associato ai gradi di libertà (df = (r-1)*(c-1)) e al p-value.
- Un p-value significativo (es. < 0.05) indica che si può rifiutare l'ipotesi nulla di indipendenza, affermando l'esistenza di un'associazione con un rischio di errore pari al p-value stesso.
- È importante verificare che la percentuale di celle con frequenze attese inferiori a 5 non superi il 20%, altrimenti il risultato del Chi-quadrato non è affidabile.