08 genomica
TRANSCRIPT
Capitolo 8
La genomica:la mappatura e il sequenziamento
dei genomi
Peter J Russell, Genetica © 2010 Pearson Italia S.p.A
http://web.unife.it/progetti/genetica/Guido/index.php?lng=it&p=4
Domande 8
• In che modo possiamo isolare un tratto di DNA?• In che modo possiamo clonarlo, e perché occorre farlo?• Come si determina la sequenza di un tratto di DNA, o di un cromosoma, o di un intero genoma?• Come si identificano e come si descrivono i geni e le altre regioni importanti del genoma?
Al 20 aprile 2014, era stato completato il sequenziamento di 18798 genomi e si lavorava su oltre 21626 altri progetti
Al 19 marzo 2015, è stato completato il sequenziamento di 58151 genomi (44430 di procarioti, 1031 di Archea, 7777 di Eucarioti)
Confronti fra genomi a diverse distanze filogenetiche permettono di rispondere a diverse domande
Studiare proteine e DNA comporta problemi tecnici differenti
Si possono separare alleli proteici che differiscono perché più basici o più acidi, grazie alla loro diversa capacità di migrare in campo elettrico
Ma tutto il DNA ha la stessa carica elettrica
Con l’elettroforesi si possono solo separare frammenti di DNA di diversa grandezza (i più piccoli sono più mobili)
È possibile trattare il DNA in modo da ottenere da tutte le cellule un frammento della stessa regione, e riconoscerlo? Enzimi di restrizione
Figura 8.1
Peter J Russell, Genetica © 2010 Pearson Italia S.p.A
Gli enzimi di restrizione riconoscono sequenze palindrome e operano un taglio del DNA
Figura 8.2
Peter J Russell, Genetica © 2010 Pearson Italia S.p.A
Diversi enzimi di restrizione riconoscono diverse sequenze palindrome e operano tagli diversi (estremità adesive, estremità piatte)
Sequenze palindrome riconosciute da diversi enzimi di restrizione
Risultati della digestione con diversi enzimi di restrizione del genoma mitocondriale di due specie di ape Melipona
Figura 8.3
Peter J Russell, Genetica © 2010 Pearson Italia S.p.A
Un taglio che produce estremità adesive permette di generare molecole di DNA ricombinante
ligasi
Figura 8.4
Peter J Russell, Genetica © 2010 Pearson Italia S.p.A
Si possono incorporare tratti di DNAEucariote in plasmidi batterici, ovettori di clonaggio.
I vettori contengono:1.Una sequenza ori;2.Un marcatore (qui: ampR) che consenta di selezionare le cellule batteriche contenenti il vettore;3.Uno o più siti unici di taglio per enzimi di restrizione, dove verrà incorporato il DNA Eucariote
Clonaggio del DNA in vettori plasmidici
Due strategie per isolare una specifica sequenza di DNA
Via mRNA e trascrittasi inversa Via enzimi di restrizione e Southern blotting
Separazione in colonna
Trascrizione inversa
cDNA
Digestione con enzimi di restrizione
Ibridazione con una sonda
LavaggioDNA
Un esempio di Southern blotting.
Inserimento di un tratto di DNA (vettore TNS9.3/fNG, marcato) in 9 cloni cellulari, trattati con due diversi enzimi di restrizione
Figura 8.5
Peter J Russell, Genetica © 2010 Pearson Italia S.p.A
La β galattosidasi, se integra e funzionante, scinde un analogo del galattosio presente sul terreno e provoca la colorazione in blu della colonia batterica
Vettore di clonaggio pBluescript II
Dimensioni < 15 kb
Figura 8.6
Peter J Russell, Genetica © 2010 Pearson Italia S.p.A
Per clonare frammenti di dimensioni maggiori si usano vettori BAC (fino a 300 kb) e YAC (fino a 2 Mb)
Cromosomi artificiali
Banche genomiche
Una banca genomica o library è un insieme di cloni che contiene, o si spera contenga, tutto il DNA di un cromosoma o di un genoma
Figura 8.7
Peter J Russell, Genetica © 2010 Pearson Italia S.p.A
Creazione di banche genomiche
Figura 8.8
Peter J Russell, Genetica © 2010 Pearson Italia S.p.A
Separazione dei frammenti di DNA per elettroforesi
Polymerase Chain Reaction (PCR): come ottenere tante copie dello stesso DNA
Kary Mullis
La PCR produce, attraverso n cicli di denaturazione, annealing ed estensione, 2n copie della molecola di DNA
Figura 8.9
Peter J Russell, Genetica © 2010 Pearson Italia S.p.A
1. Sequenziamento del DNA tramite estensione del primer
Il DNA stampo viene denaturato, il primer si appaia alla sequenza complementare, presente in una sola delle eliche
DNA stampo + primer + desossinucleotidi trifosfati + didesossinucleotidi trifosfati
Frederick SangerPremio Nobel 1958, 1980
Figura 8.10
Peter J Russell, Genetica © 2010 Pearson Italia S.p.A
Quando sono incorporati nella nuova sequenza, i didesossinucleotidi impediscono che venga aggiunto un
nuovo desossinucleotide, e interrompono la reazione
Ciascun tipo di didesossinucleotide viene marcato con un fluorocromo che, se stimolato, emette luce a diversa λ
Figura 8.11 (a)
Peter J Russell, Genetica © 2010 Pearson Italia S.p.A
Replicando molte copie (milioni) dello stesso tratto di DNA con una opportuna miscela (1/100) di didesossinucleotidi e desossinucleotidi, si ottengono frammenti in cui la reazione si è interrotta all’altezza di
ogni posizione
Figura 8.11 (b)(c)
Peter J Russell, Genetica © 2010 Pearson Italia S.p.A
Il sequenziatore automatico riconosce le λ delle fluorescenze associate ad ogni didesossinucleotide, e produce un grafico in cui il colore di ciascun picco indica la base nella sequenza
Riassumendo
1. Taglio con enzimi di restrizione. Il genoma, o un singolo cromosoma, o parte di un cromosoma, viene ridotto in piccoli frammenti
2. Clonaggio. I frammenti vengono trasferiti su vettori plasmidici o cromosomi artificiali, così creando una banca genomica
3. PCR. Vengono prodotte molte copie dei cloni di DNA da sequenziare
4. Sequenziamento. La sequenza dei nucleotidi di un’elica, o di tutte e due, viene determinata sintetizzando l’elica complementare e utilizzando didesossinucleotidi
5. Assemblaggio. Sequenze di cloni diversi si sovrappongono, e allineandole con metodi bioinformatici si ottengono sequenze più lunghe
Figura 8.9
Peter J Russell, Genetica © 2010 Pearson Italia S.p.A
2. Pirosequenziamento del DNA tramite estensione del primer
Il DNA stampo viene replicato; quando un nucleotide viene incorporato, si libera una molecola di pirofosfato che attiva gli enzimi e provoca il rilascio di una radiazione luminosa. La radiazione è correlata col nucleotide presente.
DNA stampo legato a una microsfera + primer + solforilasi, luciferasi, apirasi; desossinucleotidi trifosfati aggiunti e rimossi ripetutamente uno alla volta
Figura 8.12
Peter J Russell, Genetica © 2010 Pearson Italia S.p.A
Con il sequenziamento a shotgun, si sequenziano i cloni di una library di BAC e li si allinea sfruttando le regioni di
sovrapposizione
Craig Venter
Figura 8.13
Peter J Russell, Genetica © 2010 Pearson Italia S.p.A
Schema di sequenziamento completo di genoma con un metodo shotgun
Allineando e confrontando più genomi si individuano polimorfismi di singolo nucleotide, o SNPs (Single-Nucleotide
Polymorphisms)
Topic Statistic Total size of the genome: approximately 3,200,000,000 bp* Percentage of adenine (A) in the genome:
54%
Percentage of cytosine (C) in the genome:
38%
Percentage of bases not yet determined:
9%
Highest gene-dense chromosome: chromosome 19 with 23 genes per 1,000,000 bp*
Least gene-dense chromosomes: chromosome 13 and Y with 5 genes per 1,000,000 bp*
Percentage of DNA spanned by genes:
between 25% and 38%
Percentage of exons: 1.1 to 1.4% Percentage of introns: 24% to 37% Percentage of intergenic DNA: 74% to 64%
The average size of a gene: 27,000 bp*
The longest gene: dystrophin (a muscle protein) with 2,400,000 bp*
Average length of an intron: 3,300 bp*
Most common length of an intron: 87 bp*
Occurrence rate of SNPs: roughly 1 per 1,500 bp*
Occurrence rate of genes: about 12 per 1,000,000 bp*
Table of Human Genome Statistics
Ma quanto siamo diversi? Quante basi del DNA lo sono?
Due cellule dello stesso individuo 0/1000
Due gemelli identici 0/1000
Due di noi a caso 1/1000
Uno di noi e uno scimpanzè 10-30/1000
Uno di noi e una banana 750/1000
Albero evolutivo del cromosoma X: Kaessmann et al. (2001).
Le differenze genetiche nella nostra specie sono le più basse di tutti i primati
I nostri genomi sono o specificamente africani o
genericamente umani
26%
2% 2%
51%
Africa
AsiaEuropa
81% of SNPs cosmopolitan.
Alleles present in one continent only: 0.91% in Africa, 0.75% in Eurasia, practically 0 elsewhere.
Jakobsson et al. 2008(525,910 SNPs)
In tutti i continenti ci sono molti alleli in comune
18% of haplotypes Africa-specific
>70% of haplotypes observed in the native populations of two or more continents.
Jakobsson et al. 2008(525,910 SNPs)
Africa Eurasia
East Asia
In tutti i continenti ci sono molti aplotipi in comune
61% of CNVs cosmopolitan.
Oceania-specific CNVs exceeed those only found in Africa or Eurasia
Jakobsson et al. 2008(396 CNVs)
In tutti i continenti ci sono molti CNV in comune
C’è una struttura geografica della diversità genomica umana
Modified from Lopez-Herràez et al. 2009
Due persone dello stesso continente possono essere geneticamente più distanti di persone di continenti diversi.
In the 117 megabases (Mb) of sequenced exome-containing intervals, the average rate of nucleotide difference between a pair of the Bushmen was 1.2 per kb, compared to an average of 1.0 per kb between a European and Asian individual. Schuster et al. (2010)
In media, ci sono differenze più grandi fra due africani che fra europei e asiatici
ASIP A8818G
MATP C374G
Geni diversi raccontano storie diverse
Colori simili della pelle dipendono da combinazioni diverse di geni
MATP C374G
ASIP A8818G
Same diagnosis and treatment
Little or no response Side effects or toxicity
Genetic polymorphisms affect drug response
Good response
Why does it matter? Pharmacogenomics
Target genes
DME genes (Drug-Metabolising Enzymes)
Transporter genes
Classes of genes causing variation in drug response
Metabolic rate – CYP2D6
Slow Normal RapidAmount of metabolite in urine
N of individuals
ChineseSwedes
Populations differ as for allele frequencies, but the whole spectrum of phenotypes is generally present in each of them
Figura 8.14
Peter J Russell, Genetica © 2010 Pearson Italia S.p.A
E allora, se non vogliamo sequenziare tutto?Microarrays
Come si identificano i geni?
1.Metodi biomolecolari: Isolando gli mRNA, sintetizzando un’elica di DNA complementare con la trascrittasi inversa e poi sequenziando il DNA copia
2.Metodi bioinformatici: Cercando Open Reading Frames (ORF), cioè regioni che iniziano con un’AUG e terminano, dopo un numero di basi multiplo di 3, con un codone di stop
Sintesi 8• Gli enzimi di restrizione permettono di tagliare il DNA ottenendo da diverse cellule gli stessi frammenti • Le tecnologie del DNA ricombinante permettono di integrare tratti di DNA in vettori o cromosomi artificiali, da cui possono essere escissi• Si ottengono molte copie di un tratto di DNA attraverso la PCR• Esistono diverse tecniche per ottenere la sequenza di un frammento di DNA; le principali sono l’estensione del primer con l’uso di didesossinucleotidi e il pirosequenziamento• Se si fa in modo di ottenere cloni sovrapposti, il loro allineamento consente di ottenere sequenze via via più lunghe• Una volta ottenuta una sequenza più o meno completa, si può scegliere di caratterizzare solo alcuni siti noti per essere polimorfici, o SNP• Geni funzionali possono essere identificati con approcci biomolecolari (a partire dall’mRNA) o bioinformatici (individuando ORF)