Dispense VERIFICATO

elaborazione dati 3

Università degli Studi di Roma - La Sapienza statistica, economia e società 2018
Nessun voto ancora
Condividi: WhatsApp Telegram
Anteprima pagina 1 — elaborazione dati 3 Anteprima pagina 2 — elaborazione dati 3 Anteprima pagina 3 — elaborazione dati 3 Anteprima pagina 4 — elaborazione dati 3

Di cosa parla

  • Elaborazione Dati e Distribuzioni Quanti-Qualitative: Il documento esplora le situazioni in cui una variabile indipendente è qualitativa e una dipendente è quantitativa, introducendo il concetto di 'confronto fra medie'.
  • Confronto Fra Medie:
    • La forza dell'associazione è misurata da Devianza Totale, Devianza Interna e Devianza dei Gruppi.
    • Viene introdotto il coefficiente η² (eta quadro) come rapporto tra Devianza dei Gruppi e Devianza Totale, indicando la proporzione di varianza della variabile dipendente spiegata dalla variabile indipendente.
    • η² varia tra 0 e 1, sebbene in ambiti sociali sia spesso inferiore al 30%.
  • ANOVA (Analisi della Varianza):
    • Vengono presentati gli aspetti inferenziali dell'ANOVA per testare ipotesi sulle differenze tra medie.
    • Un esempio pratico coinvolge l'analisi del BMI in relazione al 'colore della pelle'.
    • Si illustra l'interpretazione della tabella ANOVA, includendo devianza, gradi di libertà (df), medie dei quadrati, statistica F e p-value (Sig.) per la decisione sul rifiuto dell'ipotesi nulla.
  • Correlazione tra Variabili Quantitative:
    • Si affronta l'associazione tra due variabili quantitative attraverso la 'correlazione' e la 'regressione'.
    • Viene illustrata la rappresentazione grafica con 'diagrammi di dispersione'.
    • Si sottolinea l'importanza di 'standardizzare' le variabili per omogeneizzare la dispersione e interpretare correttamente i grafici.
    • Viene introdotto il coefficiente di correlazione lineare di Pearson (ρxy), la sua formula e l'interpretazione dei suoi valori tra -1 e +1 (perfetta correlazione negativa, assenza di correlazione lineare, perfetta correlazione positiva).
    • Vengono definite le categorie di intensità della correlazione (bassa, media, alta).
    • Si discute il concetto di 'comunalità' o 'variabile latente' per spiegare alte correlazioni (es. 'forza rapida' per corsa e salto).
  • Regressione Lineare:
    • Si passa dal modello di relazione simmetrico (correlazione) a quello asimmetrico (regressione), dove una variabile è dipendente dall'altra.
    • La relazione è espressa da Y = a + bX, dove 'a' e 'b' permettono di prevedere i valori di Y in base a X.
  • Ulteriori Approfondimenti e Avvertenze:
    • Si accenna all'uso di tecniche di Analisi Multivariata (Componenti Principali, Corrispondenze Multiple, Cluster Analysis) per sintetizzare dati complessi con molte variabili.
    • Anomalie della Correlazione: Si avverte che il coefficiente di Pearson misura solo relazioni lineari e che r=0 non esclude relazioni non lineari. La presenza di outlier può generare correlazioni spurie o soppresse, rendendo indispensabile l'analisi grafica.
    • Fallacia Ecologica: Si spiega che le correlazioni basate su dati aggregati (es. comuni, regioni) non possono essere interpretate come correlazioni a livello individuale.
    • Relazione Spuria: Si illustrano casi di covariazione apparente non dovuta a causalità diretta, spesso mediata da una terza variabile non considerata.

Altri appunti di STATISTICA SOCIALE

Condividi questi appunti

WhatsApp Telegram