capitolo 2
Di cosa parla
- Sintesi e Rappresentazione dei Dati: Dopo la raccolta, i dati devono essere sintetizzati e rappresentati efficacemente per l'analisi. La statistica descrittiva utilizza grafici, tabelle e indici per questo scopo.
- Esplorazione dei Dati: Include la scelta del grafico appropriato, la descrizione della forma della distribuzione, il calcolo di misure di tendenza centrale e indici di dispersione.
- Rappresentazione delle Variabili Qualitative:
- Distribuzione di Frequenze: Tabella con valori e frequenze.
- Grafici a Barre: Ideali per evidenziare la frequenza di ogni categoria.
- Grafici a Torta: Utili per mostrare la proporzione di ciascuna categoria.
- Diagrammi di Pareto: Barre decrescenti che rappresentano le frequenze delle cause di difettosità, separando le cause rilevanti da quelle irrilevanti.
- Grafici per Serie Storiche: Rappresentano dati rilevati in istanti di tempo diversi (tempo sull'asse orizzontale, variabile sull'asse verticale).
- Rappresentazione delle Variabili Quantitative:
- Per dati raggruppati in classi si usano Istogrammi e Ogive.
- Per dati grezzi si può usare il diagramma ramo-foglia.
- La determinazione del numero di classi (solitamente 5-20) e dell'ampiezza (max-min / numero classi, arrotondato per eccesso) è cruciale, assicurando che ogni osservazione ricada in una sola classe.
- Tipi di Distribuzioni di Frequenze: Relative (frequenza/totale), Cumulate (somma delle frequenze precedenti, per variabili numeriche o qualitative ordinali), Relative Cumulate (cumulate in percentuale).
- Istogramma: Grafico a rettangoli verticali, la cui area è proporzionale al numero di osservazioni della classe. Se l'ampiezza delle classi è uniforme, l'altezza è proporzionale alle osservazioni. Rivelano la simmetria o asimmetria dei dati (destra se la coda si estende verso valori positivi, sinistra verso valori negativi).
- Ogiva (Curva di Frequenze Cumulate): Spezzata che rappresenta le frequenze percentuali cumulate.
- Rappresentazione delle Relazioni tra Variabili:
- Diagrammi di Dispersione: Per due variabili quantitative, mostrano la relazione, la distribuzione dei dati e l'eventuale presenza di valori anomali.
- Tabelle a Doppia Entrata (o Tabelle di Contingenza): Per due variabili qualitative, mostrano le frequenze per ogni combinazione di classi. Le variabili sono definite dipendente (y) e indipendente (x).
- Errori Comuni nella Rappresentazione Grafica:
- Istogrammi Ingannevoli: Spesso dovuti all'ampiezza non omogenea delle classi; l'area, non l'altezza, dovrebbe essere proporzionale al numero di osservazioni.
- Serie Storiche Ingannevoli: Possono dare un'impressione errata di stabilità.