DRD exam
Di cosa parla
- Metodi di Linkage per Clustering Gerarchico:
- Utilizzati per calcolare le distanze tra i cluster nell'ambito del clustering gerarchico.
- Minimum (o single): La distanza tra due cluster è definita come la distanza tra i due punti più vicini all'interno dei cluster.
- Maximum (o complete): La distanza è calcolata tra i due punti più lontani all'interno dei cluster.
- Average (il più usato): Considera tutti i campioni o geni all'interno dei due gruppi e la distanza è calcolata come la somma delle distanze tra tutti i geni all'interno dei gruppi divisa per il prodotto del numero di geni nel primo e nel secondo cluster.
- Illumina Beadchip 450K per l'Assay di Metilazione del Genoma Intero:
- Piattaforma per calcolare il livello di metilazione del DNA. Il processo include l'estrazione del DNA, la conversione con bisolfito (che converte tutte le C non metilate in U) e la PCR.
- Esistono due approcci chimici principali: Infinium 1 e Infinium 2, che differiscono per il tipo di perline (beads).
- Infinium 1: Utilizza due tipi di perline, una per il DNA non metilato e una per il DNA metilato. Le sonde terminano con A (non metilato) o G (metilato). La metilazione è rilevata tramite estensione di una singola base.
- Infinium 2: Utilizza un solo tipo di perlina per entrambi i CpG metilati e non metilati. Le sonde terminano un nucleotide prima di C o T. La condizione di metilazione è discriminata misurando il colore della fluorescenza (A e T sono rossi, G e C sono verdi).
- Test U di Mann Whitney:
- Test statistico che non assume una distribuzione normale.
- È simile al test di Wilcoxon sign-rank, ma funziona su dati non accoppiati.
- Utilizzato per trovare geni differenzialmente espressi, ad esempio per confrontare l'espressione genica tra due gruppi indipendenti.
- La formula per calcolare U è U = n1n2 + n1(n1+1)/2 - R1, dove n1 e n2 sono il numero di dati dal primo e dal secondo campione, e R1 è la somma dei ranghi del gruppo più grande. Il valore di U viene confrontato con una tabella precalcolata per ottenere il p-value.
- MA Plot:
- Grafico utile per valutare se i dati necessitano di normalizzazione.
- L'asse Y (M) rappresenta il log in base 2 del rapporto Cy5/Cy3 (trattato/controllo).
- L'asse X (A) rappresenta il valore medio del log in base 2 di Cy5+Cy3 (media dell'intensità).
- Se i dati sono correttamente normalizzati, la curva risultante è uguale a log1, quindi parallela all'asse X, indicando che i dati sono indipendenti dall'intensità media.
- È uno strumento utile per verificare problemi di bilanciamento tra la fluorescenza rossa e verde e per individuare geni up-regolati o down-regolati (valori di M sopra/sotto una soglia, ad esempio, 2 fold change).
- La normalizzazione può essere intra-array (approccio globale) o inter-array (con 3 passaggi: scalatura, centraggio e normalizzazione).