Dispense VERIFICATO

elaborazione dati 2

Università degli Studi di Roma - La Sapienza statistica, economia e società 2018
Nessun voto ancora
Condividi: WhatsApp Telegram
Anteprima pagina 1 — elaborazione dati 2 Anteprima pagina 2 — elaborazione dati 2 Anteprima pagina 3 — elaborazione dati 2 Anteprima pagina 4 — elaborazione dati 2

Di cosa parla

  • Elaborazione dei Dati: Il primo passo nell'analisi statistica è la descrizione e sintesi delle informazioni tramite il conteggio delle unità statistiche per ogni modalità di risposta.
  • Distribuzioni di Frequenza:
    • Le risposte sono sintetizzate in categorie con la loro frequenza assoluta.
    • Vengono calcolate la frequenza percentuale (o relativa), utile per confrontare collettivi di numerosità diversa, e la percentuale valida, calcolata solo sulle unità che hanno risposto.
    • La percentuale cumulata mostra l'ammontare progressivo del fenomeno ed è applicabile solo a categorie gerarchicamente ordinabili.
    • Le rappresentazioni grafiche includono grafici a torta e diagrammi a barre per variabili qualitative o quantitative discrete con poche modalità.
    • Per le variabili quantitative continue (es. età, altezza), si utilizzano gli istogrammi, dove l'area è proporzionale alla frequenza. Quando le classi hanno ampiezze diverse, gli istogrammi devono essere costruiti ad hoc.
  • Misure di Tendenza Centrale e Variabilità:
    • Dopo le distribuzioni, si calcolano misure di tendenza centrale (es. media aritmetica, mediana, moda) per sintetizzare la distribuzione con un unico valore.
    • Le misure di variabilità (es. deviazione standard, differenza interquartilica, range) tengono conto della dispersione dei valori.
    • Per variabili qualitative ordinali, mediana e differenza interquartilica possono essere usate, anche se tecnicamente scorretto per scale come Likert/Cantril.
  • Relazioni Bivariate (Associazione):
    • Si analizzano le relazioni tra due variabili per vedere se esiste un legame e come una influenzi l'altra (fase esplicativa).
    • Le relazioni statistiche non implicano un nesso di causa-effetto diretto. Il ruolo di indipendente/dipendente è spesso assegnato soggettivamente dal ricercatore.
    • Le relazioni possono essere tra: a) due variabili qualitative, b) due quantitative, c) indipendente qualitativa e dipendente quantitativa, d) indipendente quantitativa e dipendente qualitativa. Spesso si riducono i casi c) e d) al caso a) raggruppando le variabili quantitative.
    • Si introduce la tabella di contingenza (o tavola a doppia entrata) per rappresentare l'associazione tra variabili qualitative, mostrando le frequenze di associazione tra le modalità.
    • Si calcolano le percentuali di riga, di colonna e sul totale per interpretare l'associazione. Le percentuali di colonna sono spesso più efficaci per confrontare i "profili" delle variabili dipendenti tra le categorie della variabile indipendente.
    • Vengono calcolate le frequenze attese (valori teorici che si avrebbero in caso di totale indipendenza tra le variabili). La divergenza tra frequenze osservate e attese indica la forza dell'associazione.
  • Il Chi-quadrato (χ²) e il Test di Ipotesi:
    • Il Chi-quadrato è un indice di associazione, pari a 0 in assenza di associazione. Il suo massimo dipende da N, numero di righe e colonne.
    • Per normalizzare il Chi-quadrato tra 0 e 1, si usa il V di Cramer.
    • Nel test di ipotesi, il Chi-quadrato è associato ai gradi di libertà (df = (r-1)*(c-1)) e al p-value.
    • Un p-value significativo (es. < 0.05) indica che si può rifiutare l'ipotesi nulla di indipendenza, affermando l'esistenza di un'associazione con un rischio di errore pari al p-value stesso.
    • È importante verificare che la percentuale di celle con frequenze attese inferiori a 5 non superi il 20%, altrimenti il risultato del Chi-quadrato non è affidabile.

Altri appunti di STATISTICA SOCIALE

Condividi questi appunti

WhatsApp Telegram