08 genomica

Post on 24-Jul-2015

352 Views

Category:

Education

1 Downloads

Preview:

Click to see full reader

TRANSCRIPT

Capitolo 8

La genomica:la mappatura e il sequenziamento

dei genomi

Peter J Russell, Genetica © 2010 Pearson Italia S.p.A

http://web.unife.it/progetti/genetica/Guido/index.php?lng=it&p=4

Domande 8

• In che modo possiamo isolare un tratto di DNA?• In che modo possiamo clonarlo, e perché occorre farlo?• Come si determina la sequenza di un tratto di DNA, o di un cromosoma, o di un intero genoma?• Come si identificano e come si descrivono i geni e le altre regioni importanti del genoma?

Al 20 aprile 2014, era stato completato il sequenziamento di 18798 genomi e si lavorava su oltre 21626 altri progetti

Al 19 marzo 2015, è stato completato il sequenziamento di 58151 genomi (44430 di procarioti, 1031 di Archea, 7777 di Eucarioti)

Confronti fra genomi a diverse distanze filogenetiche permettono di rispondere a diverse domande

Studiare proteine e DNA comporta problemi tecnici differenti

Si possono separare alleli proteici che differiscono perché più basici o più acidi, grazie alla loro diversa capacità di migrare in campo elettrico

Ma tutto il DNA ha la stessa carica elettrica

Con l’elettroforesi si possono solo separare frammenti di DNA di diversa grandezza (i più piccoli sono più mobili)

È possibile trattare il DNA in modo da ottenere da tutte le cellule un frammento della stessa regione, e riconoscerlo? Enzimi di restrizione

Figura 8.1

Peter J Russell, Genetica © 2010 Pearson Italia S.p.A

Gli enzimi di restrizione riconoscono sequenze palindrome e operano un taglio del DNA

Figura 8.2

Peter J Russell, Genetica © 2010 Pearson Italia S.p.A

Diversi enzimi di restrizione riconoscono diverse sequenze palindrome e operano tagli diversi (estremità adesive, estremità piatte)

Sequenze palindrome riconosciute da diversi enzimi di restrizione

Risultati della digestione con diversi enzimi di restrizione del genoma mitocondriale di due specie di ape Melipona

Figura 8.3

Peter J Russell, Genetica © 2010 Pearson Italia S.p.A

Un taglio che produce estremità adesive permette di generare molecole di DNA ricombinante

ligasi

Figura 8.4

Peter J Russell, Genetica © 2010 Pearson Italia S.p.A

Si possono incorporare tratti di DNAEucariote in plasmidi batterici, ovettori di clonaggio.

I vettori contengono:1.Una sequenza ori;2.Un marcatore (qui: ampR) che consenta di selezionare le cellule batteriche contenenti il vettore;3.Uno o più siti unici di taglio per enzimi di restrizione, dove verrà incorporato il DNA Eucariote

Clonaggio del DNA in vettori plasmidici

Due strategie per isolare una specifica sequenza di DNA

Via mRNA e trascrittasi inversa Via enzimi di restrizione e Southern blotting

Separazione in colonna

Trascrizione inversa

cDNA

Digestione con enzimi di restrizione

Ibridazione con una sonda

LavaggioDNA

Un esempio di Southern blotting.

Inserimento di un tratto di DNA (vettore TNS9.3/fNG, marcato) in 9 cloni cellulari, trattati con due diversi enzimi di restrizione

Figura 8.5

Peter J Russell, Genetica © 2010 Pearson Italia S.p.A

La β galattosidasi, se integra e funzionante, scinde un analogo del galattosio presente sul terreno e provoca la colorazione in blu della colonia batterica

Vettore di clonaggio pBluescript II

Dimensioni < 15 kb

Figura 8.6

Peter J Russell, Genetica © 2010 Pearson Italia S.p.A

Per clonare frammenti di dimensioni maggiori si usano vettori BAC (fino a 300 kb) e YAC (fino a 2 Mb)

Cromosomi artificiali

Banche genomiche

Una banca genomica o library è un insieme di cloni che contiene, o si spera contenga, tutto il DNA di un cromosoma o di un genoma

Figura 8.7

Peter J Russell, Genetica © 2010 Pearson Italia S.p.A

Creazione di banche genomiche

Figura 8.8

Peter J Russell, Genetica © 2010 Pearson Italia S.p.A

Separazione dei frammenti di DNA per elettroforesi

Polymerase Chain Reaction (PCR): come ottenere tante copie dello stesso DNA

Kary Mullis

La PCR produce, attraverso n cicli di denaturazione, annealing ed estensione, 2n copie della molecola di DNA

Figura 8.9

Peter J Russell, Genetica © 2010 Pearson Italia S.p.A

1. Sequenziamento del DNA tramite estensione del primer

Il DNA stampo viene denaturato, il primer si appaia alla sequenza complementare, presente in una sola delle eliche

DNA stampo + primer + desossinucleotidi trifosfati + didesossinucleotidi trifosfati

Frederick SangerPremio Nobel 1958, 1980

Figura 8.10

Peter J Russell, Genetica © 2010 Pearson Italia S.p.A

Quando sono incorporati nella nuova sequenza, i didesossinucleotidi impediscono che venga aggiunto un

nuovo desossinucleotide, e interrompono la reazione

Ciascun tipo di didesossinucleotide viene marcato con un fluorocromo che, se stimolato, emette luce a diversa λ

Figura 8.11 (a)

Peter J Russell, Genetica © 2010 Pearson Italia S.p.A

Replicando molte copie (milioni) dello stesso tratto di DNA con una opportuna miscela (1/100) di didesossinucleotidi e desossinucleotidi, si ottengono frammenti in cui la reazione si è interrotta all’altezza di

ogni posizione

Figura 8.11 (b)(c)

Peter J Russell, Genetica © 2010 Pearson Italia S.p.A

Il sequenziatore automatico riconosce le λ delle fluorescenze associate ad ogni didesossinucleotide, e produce un grafico in cui il colore di ciascun picco indica la base nella sequenza

Riassumendo

1. Taglio con enzimi di restrizione. Il genoma, o un singolo cromosoma, o parte di un cromosoma, viene ridotto in piccoli frammenti

2. Clonaggio. I frammenti vengono trasferiti su vettori plasmidici o cromosomi artificiali, così creando una banca genomica

3. PCR. Vengono prodotte molte copie dei cloni di DNA da sequenziare

4. Sequenziamento. La sequenza dei nucleotidi di un’elica, o di tutte e due, viene determinata sintetizzando l’elica complementare e utilizzando didesossinucleotidi

5. Assemblaggio. Sequenze di cloni diversi si sovrappongono, e allineandole con metodi bioinformatici si ottengono sequenze più lunghe

Figura 8.9

Peter J Russell, Genetica © 2010 Pearson Italia S.p.A

2. Pirosequenziamento del DNA tramite estensione del primer

Il DNA stampo viene replicato; quando un nucleotide viene incorporato, si libera una molecola di pirofosfato che attiva gli enzimi e provoca il rilascio di una radiazione luminosa. La radiazione è correlata col nucleotide presente.

DNA stampo legato a una microsfera + primer + solforilasi, luciferasi, apirasi; desossinucleotidi trifosfati aggiunti e rimossi ripetutamente uno alla volta

Figura 8.12

Peter J Russell, Genetica © 2010 Pearson Italia S.p.A

Con il sequenziamento a shotgun, si sequenziano i cloni di una library di BAC e li si allinea sfruttando le regioni di

sovrapposizione

Craig Venter

Figura 8.13

Peter J Russell, Genetica © 2010 Pearson Italia S.p.A

Schema di sequenziamento completo di genoma con un metodo shotgun

Allineando e confrontando più genomi si individuano polimorfismi di singolo nucleotide, o SNPs (Single-Nucleotide

Polymorphisms)

Topic                         Statistic Total size of the genome:   approximately 3,200,000,000 bp* Percentage of adenine (A) in the genome: 

 54%

Percentage of cytosine (C) in the genome: 

 38%

Percentage of bases not yet determined: 

 9%

Highest gene-dense chromosome:    chromosome 19 with 23 genes per 1,000,000 bp*

Least gene-dense chromosomes:    chromosome 13 and Y with 5 genes per 1,000,000 bp*

Percentage of DNA spanned by genes: 

  between 25% and 38%

Percentage of exons:    1.1 to 1.4% Percentage of introns:    24% to 37% Percentage of intergenic DNA:    74% to 64%

The average size of a gene:    27,000 bp*

The longest gene:    dystrophin (a muscle protein) with 2,400,000 bp*

Average length of an intron:    3,300 bp*

Most common length of an intron:    87 bp*

Occurrence rate of SNPs:    roughly 1 per 1,500 bp*

Occurrence rate of genes:    about 12 per 1,000,000 bp*

Table of Human Genome Statistics

Ma quanto siamo diversi? Quante basi del DNA lo sono?

Due cellule dello stesso individuo 0/1000

Due gemelli identici 0/1000

Due di noi a caso 1/1000

Uno di noi e uno scimpanzè 10-30/1000

Uno di noi e una banana 750/1000

Albero evolutivo del cromosoma X: Kaessmann et al. (2001).

Le differenze genetiche nella nostra specie sono le più basse di tutti i primati

I nostri genomi sono o specificamente africani o

genericamente umani

26%

2% 2%

51%

Africa

AsiaEuropa

81% of SNPs cosmopolitan.

Alleles present in one continent only: 0.91% in Africa, 0.75% in Eurasia, practically 0 elsewhere.

Jakobsson et al. 2008(525,910 SNPs)

In tutti i continenti ci sono molti alleli in comune

18% of haplotypes Africa-specific

>70% of haplotypes observed in the native populations of two or more continents.

Jakobsson et al. 2008(525,910 SNPs)

Africa Eurasia

East Asia

In tutti i continenti ci sono molti aplotipi in comune

61% of CNVs cosmopolitan.

Oceania-specific CNVs exceeed those only found in Africa or Eurasia

Jakobsson et al. 2008(396 CNVs)

In tutti i continenti ci sono molti CNV in comune

C’è una struttura geografica della diversità genomica umana

Modified from Lopez-Herràez et al. 2009

Due persone dello stesso continente possono essere geneticamente più distanti di persone di continenti diversi.

In the 117 megabases (Mb) of sequenced exome-containing intervals, the average rate of nucleotide difference between a pair of the Bushmen was 1.2 per kb, compared to an average of 1.0 per kb between a European and Asian individual. Schuster et al. (2010)

In media, ci sono differenze più grandi fra due africani che fra europei e asiatici

ASIP A8818G

MATP C374G

Geni diversi raccontano storie diverse

Colori simili della pelle dipendono da combinazioni diverse di geni

MATP C374G

ASIP A8818G

Same diagnosis and treatment

Little or no response Side effects or toxicity

Genetic polymorphisms affect drug response

Good response

Why does it matter? Pharmacogenomics

Target genes

DME genes (Drug-Metabolising Enzymes)

Transporter genes

Classes of genes causing variation in drug response

Metabolic rate – CYP2D6

Slow Normal RapidAmount of metabolite in urine

N of individuals

ChineseSwedes

Populations differ as for allele frequencies, but the whole spectrum of phenotypes is generally present in each of them

Figura 8.14

Peter J Russell, Genetica © 2010 Pearson Italia S.p.A

E allora, se non vogliamo sequenziare tutto?Microarrays

Come si identificano i geni?

1.Metodi biomolecolari: Isolando gli mRNA, sintetizzando un’elica di DNA complementare con la trascrittasi inversa e poi sequenziando il DNA copia

2.Metodi bioinformatici: Cercando Open Reading Frames (ORF), cioè regioni che iniziano con un’AUG e terminano, dopo un numero di basi multiplo di 3, con un codone di stop

Sintesi 8• Gli enzimi di restrizione permettono di tagliare il DNA ottenendo da diverse cellule gli stessi frammenti • Le tecnologie del DNA ricombinante permettono di integrare tratti di DNA in vettori o cromosomi artificiali, da cui possono essere escissi• Si ottengono molte copie di un tratto di DNA attraverso la PCR• Esistono diverse tecniche per ottenere la sequenza di un frammento di DNA; le principali sono l’estensione del primer con l’uso di didesossinucleotidi e il pirosequenziamento• Se si fa in modo di ottenere cloni sovrapposti, il loro allineamento consente di ottenere sequenze via via più lunghe• Una volta ottenuta una sequenza più o meno completa, si può scegliere di caratterizzare solo alcuni siti noti per essere polimorfici, o SNP• Geni funzionali possono essere identificati con approcci biomolecolari (a partire dall’mRNA) o bioinformatici (individuando ORF)

top related