flujo génico en poblaciones estructuradas

Post on 06-Jan-2016

67 Views

Category:

Documents

0 Downloads

Preview:

Click to see full reader

DESCRIPTION

Ecología Molecular – Clase 4. Flujo génico en poblaciones estructuradas. Población. Diversidad genética. Cromosoma. Individuo. DNA. Alelo a un locus. Población. Diversidad genética. Cromosoma. Individuo. DNA. inferencia. Alelo a un locus. Estructura. Especie. 50 km. - PowerPoint PPT Presentation

TRANSCRIPT

Flujo génico en poblaciones estructuradas

Ecología Molecular – Clase 4

DNA

CromosomaIndividuo

Alelo a un locus

Población

Diversidad genética

DNA

CromosomaIndividuo

Alelo a un locus

Población

Especie

Diversidad genéticaE

stru

ctu

ra

inferen

cia

50 km

La diferenciación genética

1.Mecanismo

2.Detección

Las fuerzas evolutivas

Selección natural

Deriva genética

Flujo genético

Pool génico

Mutaciones

Factores que cambian las frecuencias génicas en las poblaciones

N

pt = 0.5

pobl

ació

nt

N

pt+1 = 0.6

pobl

ació

nt+

1p = 0.5

Pool alélico

Binomial sampling (N, pt)

Deriva genética

N

ppppNpNp tt

tttt

)1()Var()1()Var( 11

Cambios en frecuencias alélicas

2N = 18 2N = 36

Diferenciación: cambios aleatorios independientes en distintas poblaciones

La diferenciación genética

1.Mecanismo

2.Detección

- Distribución de los alelos entre poblaciones

- Calculo de un índice de diferenciación

A a

p1 q1

A a

p2 q2?n1

A a

Pob1 n1p1 n1q1 n1

Pob2 n2p2 n2q2 n2

Σ Σ

n2

A a

0,3 0,7A a

0,6 0,4?20

30

A a

Pob1 6 14 20

Pob2 18 12 30

24 26

6 14 20

18 12 30

24 26

9,6 10,4 20

14,4 15,6 30

24 26

esp

espobs 22 )(

Critical values of chi-square for df= 3

[.050]   7.81[.025]   9.35[.010]   11.35[.005]   12.84[.001]   16.27 0732,0

21,32

P

20 0 20

4 26 30

24 26

19 1 20

5 25 30

24 26

0 20 20

24 6 30

24 26

Fisher´s Exact test

Calculo de la probabilidad de cada tabla asumiendo una distribución aleatoria de los alelos

P1 P2 P21

20 0 20

4 26 30

24 26

19 1 20

5 25 30

24 26

0 20 20

24 6 30

24 26

0475,0P

Tabla de contingencia r x k

r poblaciones k alelos

Generalización

)1(

V

ppF p

ST

A a

0,3 0,7

?20

30

A a

0,6 0,4

0225,0)(

V

2

i

ppi

i

p45,02

)6,03,0(

i

ii

i

pp

091,0STF

Medir la diferencia

p = 0.5, Vp = 0, FST = 0

p = 0.5 , Vp = 0.25, FST = 1

)1(

V

ppF p

ST

¿Y qué?

A a

0,3 0,7 2030

A a

0,6 0,4

091,0STF

Permutaciones de los alelos y construcción de la distribución de probabilidad de Fst

A a

p1 q1

A a

p2 q2

A a

p3 q3

n subpoblaciones

1. Conjunto

2. Por pares

Análisis de la Varianza Molecular (AMOVA)

Excoffier L., Smouse P.E. and Quattro J.M., 1992. Analysis of molecular variance inferred from metric distances among DNA haplotypes: Application to human mitochondrial DNA restriction data. Genetics 131: 479-491

0 1p1 p2 p3 p4 p5 p6

pR1 pR2pR1+R2

R1 R2

R1 + R2

A a

p2 q2

A a

p1 q1

A a

p3 q3

R1

A a

p5 q5

A a

p4 q4

A a

p6 q6

R2

0 1p1 p2 p3 p4 p5 p6

pR1+R2

R1 R2

R1 + R2

6

)(V

6

1

221

21

i

RRi

RR

pp

0 1p1 p2 p3 p4 p5 p6

pR1 pR2

R1 R2

R1 + R2

3

)(V

3

1

21

1

i

Ri

R

pp

3

)(V

6

4

22

2

i

Ri

R

pp

0 1

pR1 pR2pR1+R2

R1 R2

R1 + R2

2

)(V

2

1

221

2/1

i

RRRi

RR

pp

A a

p2 q2

A a

p1 q1

A a

p3 q3

A a

p5 q5

A a

p4 q4

A a

p6 q6

R1

R2

3

)(V

3

1

21

1

i

Ri

R

pp

3

)(V

6

4

22

2

i

Ri

R

pp

6

)(V

6

1

221

21

i

RRi

RR

pp

2

)(V

2

1

221

2/1

i

RRRi

RR

pp

21

2/1

V

V)2/1(

RR

RRST RRF

Proporción de la varianza total en las frecuencias alélicas, debida a la subdivisión en 2 regiones.

)1(

VVV

)1(

V)21( 212/121

ppppRRF RRRRRR

ST

Índice de estructuración de la población total en regiones y en sub-poblaciones dentro de regiones

p1,q1

p2,q2

p2,q2

AA Aa aa

p12 2p1q1 q1

2

AA Aa aa

p22 2p2q2 q2

2

AA Aa aa

p32 2p3q3 q3

2

Diploides

p1,q1

p3,q3

p2,q2

AA Aa aa

p12 2p1q1 q1

2

AA Aa aa

p22 2p2q2 q2

2

AA Aa aa

p32 2p3q3 q3

2

Genotipo A AA Aa aa

Pop1 0,2 0,04 0,32 0,64

Pop2 0,6 0,36 0,48 0,16

Pop3 1 1 0 0

Pop1 Pop2 Pop2

Tres poblaciones, cada una en equilibrio de HW

Genotipo A AA Aa aa

Pop1 0,2 0,04 0,32 0,64

Pop2 0,6 0,36 0,48 0,16

Pop3 1 1 0 0

Juntas 0,6 0,47 0,27 0,26

H0 = 0,27

Pop1 Pop2 Pop2

Freq A AA Aa aa

Pop1 0,2 0,04 0,32 0,64

Pop2 0,6 0,36 0,48 0,16

Pop3 1 1 0 0

Total 0,6 0,47 0,27 0,26

Esperado (HW)

0,6 0,36 0,48 0,16

Déficit en Heterocigotos

H0 = 0,27

He = 0,48

En cada población i, observamos (bajo HW)

pi² individuos AA, 2piqi Aa, qi² aa.

 

Sobre el conjunto:

n

i ii pn

pEp 1

1)(

)1(2 ppHe

n

iii

n

iiio pp

npp

nH

1

2

1

)(2

)1(21

2

1

2

1

2222

pppn

pn

Hn

ii

n

iio

Pero:

22

1

2)(1

)( ppppn

pVar i

n

ii

)var(2)1(22)var(22 2 ppppppHo

)1(2 ppHe

Sabemos que:

Entonces:

)var(2 pHH eo

)var(2 pHH eo Déficit en Heterocigotos

)var(2 pHH eo

))1(

)var(1)(1(2)var(2)1(2

pp

ppppppHo

)1(

)(

pp

pVarFst

e

oest H

HHF

Ho = 2pq (1 – FST)

Estructura genotípica observada (Hardy-Weinberg generalizado a una metapoblación con cada población panmictica):

(AA) = p² + pq FST

(Aa) = 2pq (1 – FST)

(aa) = q² + pq FST

Efecto Wahlund: observamos un déficit en heterocigotos cuando muestreamos una población estructurada (que creímos panmictica).

Fis se transforma en un Fst

Freq A AA Aa aa

Pop1 0,2 0,04 0,32 0,64

Pop2 0,6 0,36 0,48 0,16

Pop3 1 1 0 0

Total 0,6 0,47 0,27 0,26

Esperado (HW)

0,6 0,36 0,48 0,16

Déficit en Heterocigotos

2pq(1-Fst) = 0,48

Fst = 0.44

Efecto Wahlund: observamos un déficit en heterocigotos cuando muestreamos una población estructurada (que creímos panmictica).

Fis se transforma en un Fst

¿Cómo interpretar un Fis estadísticamente significativo?

• Sistema de reproducción• Efecto Wahlund• Selección• Alelos nulos

Las fuerzas evolutivas

Selección natural

Deriva genética

Flujo génico

Pool génico

Mutaciones

Factores que cambian las frecuencias génicas en las poblaciones

Tiem

po

Modelo de Wright – Fisher2 poblaciones

J : Probabilidad de que dos haplotipos sean idénticos por descendencia

B

Bw

J

JJFst

1

J ?

)1

)1(()1()1( 22

NJJm

twtw

)1

)1(()1)(1( 2

NJJmm

twtw

)1

)1(()1( 22

NJJm

twtw

1tJ

2 de la misma población

2 de la otra población

1 de cada población

Con J = F

¡Muy complicado!

Modelo infinito de Islas

Poblaciones Wright-Fisher

Poblaciones de mismo tamaño N

Misma tasa de migración entre islas

Deriva genética + mutaciones + migraciones

Generaciones

Tasa de migración mm

Tasa de mutación u

1- u

Equilibrio migración-deriva<=>

Equilibrio mutación-deriva

)1

)1(()1()1( 221 N

JJmJ ttt

Equilibrio: tt JJ 1 1)(2

1

mNJ

Deriva genética + mutaciones + migraciones

)]1

1(1

)[21)(21(1 NJ

NmJ tt

1)μ(2

)μ(2

mN

mNH

e

e

)1)(μ(2 Hm

HNe

1)(2

1

mNJFst w

B

Bw

J

JJFst

1

0BJEn el modelo infinito de Islas:

1)(2

1

mNFst

Si μ <<m

12

1

NmFst

Con Nem : Número de inmigrantes efectivos por generaciones

Modelos de dispersión

Modelo n-Islas

Modelo Continente-Isla

Modelo 2-Islas

Modelo Continente-Isla

N muy grandek muy grande

Cada inmigrante lleva un alelo nuevo

tt mPpPp )1)(( 0

pt = Frecuencia después de t generacionesp0 = Frecuencia inicialP = Frecuencia del alelo en el continentem = Tasa de migración por generación

pt

P

Aplicaciones

Ese tipo de modelo suele aplicarse cuando la migración se produce principalmente de un grupo hacia un otro.

Ejemplo: Flujo génico de la población blanca hacia la población negra en Estados-Unidos (los mulatos siendo considerado como perteneciente a la población negra).

El alelo Fya del locus Duffy es casi inexistente en África Oeste, lugar de originen de los Afro-americanos, pero esta bien representado en la población blanca.

Estudio de Adams et Ward (1973, Science 180:1137) en Georgia

PFya(blanca) = 0.422PFya(negra) = 0.045

t = 10 generaciones

Es decir un flujo génico promedio de 1 % en cada genéración.

tt mPpPp )1)(( 0

10)1)(422.00(422.0045.0 m011.0m

Beta vulgaris ssp maritimaBeta vulgaris

Arnaud et al. 2003 Proc. R. Soc. Lond. B 270:1565–1571

Flujo génico desde la variedad cultivada (y transgénica) hacia la variedad silvestre

Modelo Infinito de Islas

- Cada poblacion (isla) cumple el modelo de Wright-Fisher- Cada poblacion tiene la misma probabilidad de recibir un inmigrante- Cada inmigrante tiene la misma probabilidad de llegar desde cualquier poblacion

1)μ(2

1ST

mN

F

Modelo Q-Islas Modelo 2-Islas

Q = numero de poblacionesCon mutacion:…

Aislamiento por distancia

Modelo Stepping-stone(migración paso a paso)

Stepping-stone circular

Stepping-stone a 2 dimensiones Modelo continuo

Incremento de la diferenciación genética con la distancia entre poblaciones

Distancia geograficaó

Log (Distancia)

FS

T /

(1-F

ST)

Stepping-stone model(isolation by distance)

Island model

Test de Mantel

Pendiente es inversamente proporcional a la distancia promedia de dispersionRousset 1997 Genetics 145:1219-1228

Distancia geográfica

Dis

tanc

ia g

enét

ica

Distancia geográfica

Dis

tanc

ia g

enét

ica

Distancia geográfica

Dis

tanc

ia g

enét

ica

¿Cuando estimar un flujo genético?

Fst

FstmNe 2

1

FST

0

0,1

0,2

0,3

0,4

0,5

0,6

0,7

0,8

0,9

1

0 200 400 600 800 1000

N=100

Generaciones

Nm

0

10

20

30

40

50

60

0 20 40 60 80 100

Flujo génico fantasma…

Después de la separación, Fst aumenta con el tiempo

AA Aa aa

p2 2pq q2

1 Locus, 2 alelos A(p) y a(q = 1-p)

p,q

p,q

p,q

AA Aa aa

p2 2pq q2

AA Aa aa

p2 2pq q2

AA Aa aa

p2 2pq q2

p,q

p,q

p,q

AA Aa aa

p2 2pq q2

AA Aa aa

p2 2pq q2

AA Aa aa

p2 2pq q2 T = 0

Fst = 0 Nm =

¿Conclusiones?

Fst

FstmNe 2

1

¿Cómo rastrear los eventos de migración sobre pocas generaciones?

Análisis de asignamiento individual

1.Aproximación basada en diferencias de frecuencia

2. Aproximación basada en agrupamiento

?

Genotipo: 125/129, 255/259, …

Aproximación basada en diferencias de frecuencia

Aproximación basada en agrupamiento

Tiempo esperado para fijación

N

N/2 N/2

0

00 )1log()1(2

p

ppNt

?m

Estructura genética y tamaño efectivo

N

N/2 N/2m

?

Tiempo esperado para fijación

0

00 )1log()1(2

p

ppNt

Deriva con m = 0

Deriva con m = 0.01

Deriva con m = 0.1

Fst

NN T

e

1

Perú Centro-Norte

Perú Sur Chile Norte

Chile Centro-Sur

El ejemplo de la anchovetaEngraulis ringens

n = 48

n = 47

n = 31

S = 31 K = 43126 individuos (secuencias)

0,00

0,10

0,20

0,30

0,40

H1 H3 H5 H11 H7 H10 H31 H12 H14 H16 H18 H20 H22 H25 H27 H29 H32 H34 H36 H39 H41 H43

Talcahuano Iquique Perú

43 haplotipos (o alelos)

Comparación de las frecuencias haplotípicas

Estructura genética de la anchoveta

0,0020

0,0021

0,0022

0,0023

0,0024

0,0025

0,0026

0,0027

0,0028

1 1,5 2 2,5 3 3,5

Distancia geográfica (miles de km)

Dis

tan

cia

ge

tic

a

(Ju

ke

s &

Ca

nto

r)

Aislamiento por distancia- Distribución continua- Diferenciación aumenta con la distancia

geográfica

Modelo de flujo génico

Presente estudio

400 km

200 km

Datos captura - recaptura

Informe FIP 1998

Metapoblaciones

Metapoblaciones

Distintos tamaños poblacionales=> intensidad de la deriva variable

Distintas tasas de migración=> acción homogeneisante variable

Extincciones=> pérdida de diversidad globalmente

Recolonisaciones=> efectos fundadores

Metapoblaciones

Como estudiar la estructura genética de una metapoblación?

Necesidad de integrar la información destacada por el análisis de la estructura genética (diferenciación global y diferenciación por par de poblaciones) con informaciones acerca de la dinámica de esta metapoblación

Para esto se ha desarrollado nuevos análisis

Instantáneo

Pro

med

io h

istó

rico

Responden diferentes preguntas

Instantáneo:

- basados en análisis de asignación individual

Estadística bayesiana (ej. BAYESASS)

Ind Loc1 Loc2 Loc21 1223 3436 64682 1416 3636 62723 1216 3234 60604 1212 3436 6870

Ind Loc1 Loc2 Loc21 1212 3234 68682 1418 3236 68743 1216 3234 60604 1216 3636 6670

A

B

Calcula parametros independientes para A y B (Fi, M, etc) a partir de MCMC

A

B

Positivo: permite estimar migración asimétricaNegativo: no es muy eficiente cuando A y B son muy cercanas

Histórico:

- Basados en coalescencia (utiliza una tasa de mutación)

- Los supuestos son menos estrictas

Infiere parámetros poblacionales utilizando máximo de verosimilitud basado en la teoría de coalescencia

Probabilidad de una genealogía GDatos las variables P

Incluye:Tamaño poblacional

Crecimiento poblacionalTasa de migración

Tasa de recombinación

Verosimilitud de los datos D Según la genealogía G

Rabidosa rabida

top related