medida de la diversidad genetica

Upload: andreslass

Post on 07-Jul-2018

214 views

Category:

Documents


0 download

TRANSCRIPT

  • 8/18/2019 Medida de La Diversidad Genetica

    1/86

    Derechos de Autor: IPGRI y Cornell University, 2004 Medidas de diversidad 1

    Medidas de la diversidad

    genética

    Análisis de la diversidad genética

    utilizando datos de marcadores moleculares:Módulo de aprendizaje 

  • 8/18/2019 Medida de La Diversidad Genetica

    2/86

    Derechos de Autor: IPGRI y Cornell University, 2004 Medidas de diversidad 2

    Análisis básico de la diversidad genética Tipos de variables Cuantificación de la diversidad genética:

    • Medidas de la diversidad genética dentro de unapoblación

    • Medidas de la diversidad genética entrepoblaciones

    Cuantificación de las relaciones genéticas:• Diversidad y diferenciación a nivel de nucleótido• Distancia genética

    Visualización de las relaciones:• Clasificación o agrupación• Ordenación

    Apéndices

    Contenido

  • 8/18/2019 Medida de La Diversidad Genetica

    3/86

    Derechos de Autor: IPGRI y Cornell University, 2004 Medidas de diversidad 3

    1. Descripción de la variacióndentro de poblaciones,regiones, etc. y entre ellas

    2. Evaluación de las relacionesentre individuos, poblaciones,regiones, etc.

    3. Expresión de las relacionesentre los resultados obtenidoscon diferentes tipos decaracteres

    Ind5

    Ind3

    Ind6Ind4Ind2Ind1

    Análisis básico de la diversidad genética

    00.460.370.560.560.3306

    00.280.370.430.3205

    00.500.260.4704

    00.330.3303

    00.5602

    001

    060504030201

    Datos

    de 000111

    110101

    001100

    110001

    010110

    110001

    101101marcadores

    Individuos

    La mayoría de los análisis de diversidad genética en los que podríamos estarinteresados incluiría los siguientes pasos:

    1. La descripción de la diversidad. Esto se puede hacer dentro de unapoblación o entre poblaciones. También puede extenderse a unidadesmás grandes como zonas y regiones.

    2. El cálculo de las relaciones entre las unidades analizadas en el paso uno.

    Esto implica el cálculo de las distancias (geométrica o genética) entretodos los pares de clases analizadas en el estudio.

    3. La expresión de estas relaciones con cualquier método de ordenación y/oclasificación disponible. Algunos de estos métodos permitirán compararlos resultados de nuestro estudio molecular con otros tipos de datos (porejemplo, geográficos). En la diapositiva, los Ind1, Ind2, … puedenrepresentar poblaciones o regiones, en vez de individuos.

  • 8/18/2019 Medida de La Diversidad Genetica

    4/86

    Derechos de Autor: IPGRI y Cornell University, 2004 Medidas de diversidad 4

    Cualitativas. Se refieren a caracteres ocualidades, y son binarias o categóricas:

    • Binarias, cuando reciben solamente dos valores:presente (1) o ausente (0)

    • Categóricas, cuando reciben un valor entre variasposibilidades y pueden ser ordinales o nominales:

    − Ordinales: categorías que tienen un orden− Nominales: categorías que no tienen relación

    entre sí

    Cuantitativas. Son numéricas y pueden sercontinuas o discretas:

    • Continuas, cuando toman un valor dentro de unrango dado

    • Discretas, cuando toman números enteros odecimales

    Tipos of variables

    Ejemplos de variables cualitativas:• Binarias: p. ej., pubescencia foliar: presente (1), ausente (0)• Categóricas:

    − Ordinales: p. ej., pubescencia caulinar: escaso (1), común (2),abundante (3), o

    longitud del pecíolo: corto (1), intermedio (2), largo (3)− Nominales: p. ej., color de los pétalos: amarillo (1), rojo (2), blanco (3),

    púrpura (4)

    Ejemplos de variables cuantitativas:• Continuas: p. ej., peso de la raíz (g); longitud de la hoja (cm)• Discretas: p. ej., número de estambres: 2, 3, 4, …

    número de frutos: 1, 2, 3, …

    Las variables categóricas pueden convertirse en variables binarias; sin embargo, existenalgunas limitaciones puesto que, como veremos, algunos coeficientes de similitud le danmayor importancia a la categoría de algún carácter determinado, lo que puede generar unsesgo en contra de otros caracteres que se estén evaluando. Es decir, cuántas máscategorías tenga una variable, más importancia tendrá cuando se combine con otrasvariables binarias o categóricas que tengan pocas categorías.

    A continuación presentamos un ejemplo de conversión de una variable categórica en unabinaria:

    Longitud del pecíolo: corto (1), intermedio (2), largo (3)− Corto: presente (1), ausente (0)− Intermedio: presente (1), ausente (0)− Largo: presente (1), ausente (0)

    Las variables cuantitativas también se pueden convertir en variables binarias, p.e.:De 0 a 3 frutos: presente (1), ausente (0)De 4 a 7 frutos: presente (1), ausente (0), ...

  • 8/18/2019 Medida de La Diversidad Genetica

    5/86

    Derechos de Autor: IPGRI y Cornell University, 2004 Medidas de diversidad 5

    Cuantificación de la diversidad genética: Medidade la diversidad genética intrapoblacional

    Con base en el número de variantes• Polimorfismo o tasa de polimorfismo (Pj)

    • Proporción de loci polimórficos

    • Abundancia de variantes alélicas (A)

    • Número promedio de alelos por locus

    Con base en la frecuencia de variantes• Número efectivo de alelos (Ae)

    • Heterocigosidad esperada (He; diversidad genéticade Nei)

  • 8/18/2019 Medida de La Diversidad Genetica

    6/86

    Derechos de Autor: IPGRI y Cornell University, 2004 Medidas de diversidad 6

    Un gen se define como polimórfico si la frecuenciade uno de sus alelos es menor o igual a 0.95 ó0.99

    Pj = q ≤ 0.95 o Pj = q ≤ 0.99

    Polimorfismo o tasa de polimorfismo (Pj)

    Donde,Pj = tasa de polimorfismo

    q = frecuencia alélica

    • Esta medida proporciona el criterio para determinar si un gen presentavariación.

    • Su cálculo se hace por observación directa respecto a si se cumple ladefinición o no se cumple.

    • La medida puede usarse con marcadores codominantes y, de manera muyrestrictiva, con marcadores dominantes, debido a que la estimación basadaen los marcadores dominantes presentaría una tendencia al sesgo inferior alnúmero real.

    Por lo general, un gen polimórfico es aquel para el cual el alelo más común tiene

    una frecuencia de menos de 0.95. Los alelos raros o poco comunes se definencomo aquellos cuyas frecuencias son menores a 0.005. El límite de la frecuenciaalélica, que se fija en 0.95 (ó 0.99) es arbitrario, y su objetivo es ayudar aidentificar aquellos genes en los cuales es común la variación alélica.

    Referencia

    Cavalli-Sforza, L. L. y W. F. Bodmer. 1981. Genética de las PoblacionesHumanas. Ed. Omega, Barcelona.

  • 8/18/2019 Medida de La Diversidad Genetica

    7/86

    Derechos de Autor: IPGRI y Cornell University, 2004 Medidas de diversidad 7

    Es el número de loci polimórficos dividido por elnúmero total de loci (polimórficos y monomórficos),es decir:

    P = npj/ntotal

    Proporción de loci polimórficos

    Donde,P = la proporción de loci polimórficos

    npj = el número de loci polimórficos

    ntotal = el número total de loci

    • Expresa el porcentaje de loci variables en una población.

    • Su cálculo se basa en el conteo directo de los loci polimórficos y totales.

    • Puede usarse con marcadores codominantes y, de manera muy restrictiva,con marcadores dominantes (ver la diapositiva anterior para la explicación).

  • 8/18/2019 Medida de La Diversidad Genetica

    8/86

    Derechos de Autor: IPGRI y Cornell University, 2004 Medidas de diversidad 8

    Se refiere al número de variantes en unamuestra

    La medida de la diversidad es (A - 1) variantesporque, dentro de una población monomórfica,el grado de diversidad es cero (A - 1 = 0)

    Abundancia de variantes alélicas (A)

    • Para un gen dado en una muestra, esta medida indica cuántas variantes alélicaspueden encontrarse.

    • Es sensible al tamaño de la muestra.

    • Aunque la distribución de alelos no afecta, el número máximo de alelos sí esimportante.

    • La medida solamente puede aplicarse con marcadores codominantes.

  • 8/18/2019 Medida de La Diversidad Genetica

    9/86

    Derechos de Autor: IPGRI y Cornell University, 2004 Medidas de diversidad 9

    ( )∑=

    =K

    1i

    in1/Kn

    Número promedio de alelos por locus

    Es la suma de todos los alelos detectados en todoslos loci, dividido por el número total de loci

    Donde,K = el número de loci

    ni = el número de alelos detectados por locus

    • Esta medida brinda información complementaria a la información sobrepolimorfismo.

    • Requiere únicamente el conteo del número de alelos por locus y luego, elcálculo del promedio.

    • Se aplica mejor a marcadores codominantes, dado que los dominantes nopermiten la detección de todos los alelos.

  • 8/18/2019 Medida de La Diversidad Genetica

    10/86

    Derechos de Autor: IPGRI y Cornell University, 2004 Medidas de diversidad 10

    Número efectivo de alelos (Ae)

    Es el número de alelos que pueden estar presentesen una población

    Ae = 1/(1 – h) = 1/Σpi2

    Donde,pi = frecuencia del i-ésimo alelo en un locus

    h = 1 –  Σpi2 = heterocigosidad en un locus

    • Indica el número de alelos que se esperaría en un locus, en cadapoblación.

    • Se calcula invirtiendo la medida de la homocigosidad en un locus.

    • Puede utilizarse con datos de marcadores codominantes.

    • Su cálculo puede verse afectado por el tamaño de la muestra.

    Esta medida de diversidad puede proporcionar información útil paraestablecer estrategias de colecta. Por ejemplo, estimamos el número

    efectivo de alelos en una muestra. Luego, la comprobamos en unamuestra diferente o en toda la colección. Si la cifra obtenida la segundavez es menor que la primera, esto podría significar que nuestra estrategiade colecta necesita revisión.

  • 8/18/2019 Medida de La Diversidad Genetica

    11/86

    Derechos de Autor: IPGRI y Cornell University, 2004 Medidas de diversidad 11

     ⎯ 0.30 ⎯  ⎯  ⎯  ⎯ Frecuencia del alelo 4

    2.00

    0.50

     ⎯ 

    0.50

    0.50

    2

    A1 A2

    A2 A2

    A2 A2

    A1 A1

    A1 A1

    Población 2

    3.33

    0.70

    0.20

    0.10

    0.40

    4

    B4 B4

    B1 B1

    B1 B4

    B2 B3

    B1 B3

    1.002.942.172.17Número efectivo de alelos

    0.000.660.540.54Heterocigosidad (h)

    0.000.400.300.30Frecuencia del alelo 3

    0.000.300.100.10Frecuencia del alelo 2

    1.000.300.600.60Frecuencia del alelo 1

    1333Número de alelos

    C1 C1C3 C3B3 B3A3 A3Individuo 5

    C1 C1C2 C3B1 B3A1 A3Individuo 4

    C1 C1C1 C3B1 B1A1 A1Individuo 3

    C1 C1C2 C2B1 B2A1 A2Individuo 2

    C1 C1C1 C1B1 B1A1 A1Individuo 1Población 1Loci (A, B, C)

    Cálculo de Ae: Un ejemplo

    El cuadro que aparece en esta diapositiva presenta un ejemplo de cómo calcular elnúmero efectivo de alelos. Cada una de las dos poblaciones tiene 5 individuos.Para cada individuo, se analizan 3 loci, cada uno con un número diferente de

    alelos, dependiendo de la población (el locus A tiene 3 alelos en la población 1 ysólo 2 alelos en la población 2, y así sucesivamente). Primero se calculan lasfrecuencias alélicas para cada locus y para cada población. Luego se calcula laheterocigosidad en cada locus y, por último, el número efectivo de alelos, Ae, deacuerdo con la fórmula que aparece en la diapositiva anterior.

  • 8/18/2019 Medida de La Diversidad Genetica

    12/86

    Derechos de Autor: IPGRI y Cornell University, 2004 Medidas de diversidad 12

    Es la probabilidad de que, en un locus único,cualquier par de alelos, escogidos al azar de lapoblación, sean diferentes entre sí

    Tres cálculos son posibles:• Un locus con dos alelos: h j = 1 – p

    2 – q2

    • Un locus j con i alelos: h j = 1 –  Σpi2

    • Promedio para varios loci: H = Σ jLhj/L

    La He promedio de todos los loci es unaestimación del grado de variabilidad genética enla población

    Heterocigosidad promedio esperada (He)(diversidad genética de Nei [D])

    Donde,h j = la heterocigosidad por locus

    p y q = las frecuencias alélicas

    H = la heterocigosidad promedio para varios lociL = el número total de loci

    • La heterocigosidad promedio esperada se calcula al restar de 1 lasfrecuencias esperadas de homocigotos en un locus. La operación se repitepara todos los loci y luego se saca el promedio.

    • Puede aplicarse con todos los marcadores, ya sean codominantes odominantes.

    • El valor calculado puede verse afectado por aquellos alelos presentes enfrecuencias mayores.

    • Varía de 0 a 1.

    • Se maximiza cuando hay muchos alelos cuyas frecuencias son iguales.

    • Debe analizarse un mínimo de 30 loci en 20 individuos por población, parareducir el riesgo de sesgo estadístico.

  • 8/18/2019 Medida de La Diversidad Genetica

    13/86

    Derechos de Autor: IPGRI y Cornell University, 2004 Medidas de diversidad 13

    Cálculo de la diversidad con un marcadormolecular codominante

    Individuos

    Locus A

    Locus B

    Locus E

    Locus C

    Locus D

    M 1 2 3 4 5 6 7 8 9 10Gel 11 12 13 14 15 16 17 18 19 21 22 23 24 25 26 27 28 2920 30

    Lecturade datos

    Locus ALocus B

    Locus E

    Locus CLocus D

    1,1 0,1 1,1 0,1 0,1 0,1 0,1 0,1 0,1 1,0 0,1 0,1 0,1 0,1 0,1 1,1 0,1 0,1 0,1 0,1 0,1 0,1 0,1 1,0 0,1 0,1 1,1 0,1 0,1 0,1

    M 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 21 22 23 24 25 26 27 28 2920 30

    0,1 0,1 0,1 0,1 0,1 1,1 0,1 0,1 0,1 0,1 0,1 0,1 0,1 1,0 1,0 1,0 0,1 0,1 0,1 0,1 0,1 0,1 1,0 0,1 1,1 0,1 1,0 1,0 1,0 1,1

    1,0 1,0 1,0 1,0 1,0 1,0 1,0 1,0 1,0 1,0 1,0 1,0 1,0 1,0 1,0 1,0 1,0 1,0 1,0 1,0 1,0 1,0 1,0 1,0 1,0 1,0 1,0 1,0 1,0 1,0

    1,0 1,0 1,0 1,0 1,0 1,0 1,0 1,0 1,0 1,0 1,0 1,0 1,0 1,0 1,0 1,0 1,0 1,0 1,0 1,0 1,0 1,0 1,0 1,0 1,0 1,0 1,0 1,0 1,0 1,0

    0,1 1,1 0,1 1,1 0,1 1,0 1,1 1,0 1,1 1,1 1,1 1,0 1,0 1,0 1,0 1,0 1,0 1,0 1,0 0,1 0,1 1,0 1,0 1,0 1,0 1,0 1,1 1,1 0,1 0,1

    (continúa en la siguiente)

    En la mitad superior de esta diapositiva aparece un dibujo de un gel con un

    marcador de tamaño a la izquierda (M) y 30 individuos analizados con un marcadorcodominante, que detectó cinco loci (A, B, C, D y E). De estos loci, solamente tresson polimórficos (A, B y E).

    En la mitad inferior de la diapositiva aparecen los resultados de la lectura debandas, por individuo y por locus. Obsérvese que, para facilitar la presentación, nose ilustraron más de dos alelos por locus. Aunque las bandas que pertenecen a losloci C y D fueron registradas como (1,0) para todos los individuos, la lectura nohubiera sido necesaria puesto que las bandas no dieron información de diversidad.

    Los cálculos se presentan en la siguiente diapositiva.

  • 8/18/2019 Medida de La Diversidad Genetica

    14/86

    Derechos de Autor: IPGRI y Cornell University, 2004 Medidas de diversidad 14

    0.22

    Hi

    0.46

    0.41

    0.23

    hj =(1 - p2 - q2)

    0.37

    q

    0.72

    q

    0.87

    q

    0.63

    p

    0.28

    p

    0.13

    p

    Frecuenciaalélica

    1

    30

    1

    Total

    1

    30

    1

    Total

    1

    30

    1

    Total

    E2 E2E1 E2E1 E1Genotipos

    Eq22pqp2Frecuencia genotípica (esp.)

    7815Individuos (no.)

    P22 = 0.23P12 = 0.27P11 = 0.50Frecuencia genotípica (obs.)

    B2 B2B1 B2B1 B1Genotipos

    Bq22pqp2Frecuencia genotípica (esp.)

    2037Individuos (no.)

    P22 = 0.67P12 = 0.10P11 = 0.23Frecuencia genotípica (obs.)

    P22 = 0.80P12 = 0.13P11 = 0.07Frecuencia genotípica (obs.)

    Análisis de datosLocus

    2

    p2

    A1 A1

    244Individuos (no.)

    q22pqFrecuencia genotípica (esp.)

    A2 A2A1 A2Genotipos

    A

    Cálculo de la diversidad con un marcadormolecular codominante (continuación)

    1. En primer lugar, observamos que los loci A, B y E son polimórficos porquesatisfacen el requisito de tener frecuencias alélicas por debajo de 0.99. Los lociC y D son monomórficos (esp. = valor esperado; obs. = valor observado).

    2. La proporción de loci polimórficos es de P = (3/5) = 0.6 ó 60%. Es decir, elnúmero de loci polimórficos se divide por el número total de loci analizados.

    3. Para calcular la heterocigosidad promedio (Ho), se procede de la siguientemanera:

    a. Contamos el número de loci, del total, que son heterocigotos. Porejemplo, el Individuo1 tiene un locus heterocigoto (A), el Individuo2también (E); el Individuo27 tiene 2 loci heterocigotos (A y E), ... .En total, 16 individuos fueron monomórficos (es decir, teníanúnicamente una banda en cada uno de los cinco loci), 13 individuostenían 1 locus heterocigótico y 1 individuo tenía 2 loci heterocigóticos.

    b. Calculamos la heterocigosidad promedio observada, de la siguientemanera:

    Ho = [16(0/5) + 13(1/5) + 1(2/5)]/(30) = 0.1

    4. La diversidad génica dentro de un locus (h j) se calcula para cada locus, deacuerdo con la fórmula que aparece en la fila superior del cuadro, lo que nos dalos siguientes resultados: locus A = 0.23, locus B = 0.41 y locus E = 0.46.

    5. La diversidad génica promedio esperada (Hi) se calcula a partir de la fórmulaque aparece en la diapositiva número 12:

    Hi = (0.23 + 0.41 + 0.46)/5 = 0.22

  • 8/18/2019 Medida de La Diversidad Genetica

    15/86

    Derechos de Autor: IPGRI y Cornell University, 2004 Medidas de diversidad 15

    Locus A

    Locus B

    Locus E

    Individuos

    Locus C

    Locus D

    M 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 21 22 23 24 25 26 27 28 2920 30

    Lecturade datos

    1 0 1 0 0 0 0 0 0 1 0 0 0 0 0 1 0 0 0 0 0 0 0 1 0 0 1 0 0 0

    M 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 21 22 23 24 25 26 27 28 2920 30

    0 0 0 0 0 1 0 0 0 0 0 0 0 1 1 1 0 0 0 0 0 0 1 0 1 0 1 1 1 1

    1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1

    0 1 0 1 0 1 1 1 1 1 1 1 1 1 1 1 1 1 1 0 0 1 1 1 1 1 1 1 0 0

    1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1

    Locus ALocus B

    Locus E

    Locus CLocus D

    Cálculo de la diversidad con un marcadormolecular dominante

    (continúa en la siguiente)

    En la mitad superior de esta diapositiva aparece un dibujo de un gel (marcador de

    tamaño a la izquierda, M) con 30 individuos analizados con un marcadordominante. Se identifican cinco loci (A, B, C, D y E), de los cuales tres estánsegregando (A, B y E), en tanto que los otros dos, C y D, son monomórficos.

    En la mitad inferior de la diapositiva están los resultados de la lectura de bandas,por individuo y por locus. Como se trata de un marcador dominante, a las bandaspresentes se les asigna un 1 y a las ausentes un 0. La lectura de las bandas paralos loci C y D puede omitirse o bien atribuirles un 1 a todos, como aparece en ladiapositiva.

    Los cálculos figuran en la siguiente diapositiva.

  • 8/18/2019 Medida de La Diversidad Genetica

    16/86

    Derechos de Autor: IPGRI y Cornell University, 2004 Medidas de diversidad 16

    0.198

    Hi

    0.50

    0.30

    0.19

    hj =(1 - p2 – q2)

    0.48

    q

    0.82

    q

    0.89

    q

    0.52

    p

    0.18

    p

    0.11

    p

    Frecuenciaalélica

    1

    30

    1Total

    1

    30

    1

    Total

    1

    30

    1

    Total

    eeEeEEGenotipos

    Eq22pqp2Frecuencia genotípica (esp.)

    723Individuos (no.)

    P2 = 0.23P1 = 0.77Frecuencia genotípica (obs.)

    bbBbBBGenotipos

    Bq22pqp2Frecuencia genotípica (esp.)

    2010Individuos (no.)

    P2 = 0.67P1 = 0.33Frecuencia genotípica (obs.)

    P2 = 0.80P1 = 0.20Frecuencia genotípica (obs.)

    Análisis de datosLocus

    6

    p2

    Aa

    24Individuos (no.)

    q22pqFrecuencia genotípica (esp.)

    aaAaGenotipos

    A

    Cálculo de la diversidad con un marcadormolecular dominante (continuación)

    1. En primer lugar, tomamos en consideración el polimorfismo mostrado por todoslos loci. Los loci A, B y E satisfacen el requisito de tener frecuencias alélicaspor debajo de 0.99 y, como tales, se puede decir que son polimórficos. Los loci

    C y D son monomórficos (esp. = valor esperado;obs. = valor observado).

    2. La proporción de loci polimórficos (P) es de P = (3/5) = 0.6 ó 60%. No sepuede estimar la heterocigosidad promedio (He) porque los marcadoresdominantes no permiten discriminar entre individuos heterocigotos yhomocigotos.

    3. A pesar de lo anterior (2), se puede calcular la diversidad génica dentro de unlocus (h j) para cada locus, utilizando la fórmula que aparece en la fila superiordel cuadro, columna 4, del siguiente modo: locus A = 0.19;locus B = 0.30; y locus E = 0.50.

    4. La diversidad génica promedio (Hi) se calcula a partir de la fórmula queaparece en la diapositiva número 12:

    Hi = (0.19 + 0.30 + 0.50)/5 = 0.198

  • 8/18/2019 Medida de La Diversidad Genetica

    17/86

    Derechos de Autor: IPGRI y Cornell University, 2004 Medidas de diversidad 17

    Diferenciación entre poblaciones respecto a unlocus (gST)

    Diferenciación entre poblaciones respecto avarios loci (GST)

    Aporte de la población a la diversidad genéticatotal

    Estadísticos F (Wright)

    Análisis de varianza molecular (AMOVA)

    Cuantificación de la diversidad genética: Medidade la diversidad genética entre poblaciones

    La ‘diferenciación’ se refiere a las diferencias polimórficas entre las poblaciones, aniveles diferentes de estructura (poblaciones e individuos).

  • 8/18/2019 Medida de La Diversidad Genetica

    18/86

    Derechos de Autor: IPGRI y Cornell University, 2004 Medidas de diversidad 18

    gST = 1 – (hS/hT)

    hS = diversidad de la población

    hT = diversidad total

    Diferenciación entre poblaciones respecto aun locus (gST)

    Donde,hS = (ñ/(ñ - 1)[1 – (1/s)∑∑xij

    2 – (ho /2ñ)]

    hT = 1 - ∑[(1/s)∑xij]2 + (hS /ñs) – (ho /2ñs)

    ñ = el promedio armónico de los tamaños de población

    s = el número de poblaciones

    ho = la heterocigosidad promedio observada

    xij = la frecuencia calculada del i-ésimo alelo en la j-ésima población

    • La fórmula que aparece en la diapositiva provee una medida de ladiferenciación en función de los alelos por locus, en dos poblaciones o más.

    • Varía de 0 a 1. Podría obtenerse un valor negativo si se cometiera un erroren el muestreo o si se empleara un tipo de marcadores inapropiado.

    • Dada la complejidad de sus componentes, para su cálculo se requierenprogramas informáticos especializados.

    • Puede utilizarse con marcadores codominantes y, con algunas restricciones,con marcadores dominantes debido a que es una medida de laheterocigosidad. Son necesarias varias generaciones para tener unaapreciación razonable del valor real.

  • 8/18/2019 Medida de La Diversidad Genetica

    19/86

    Derechos de Autor: IPGRI y Cornell University, 2004 Medidas de diversidad 19

    gST = 1 – (hs/hT) = 1 – (0.4196/0.8065) = 0.4797

    hT = 1 – 0.1967 + [0.4196/(33.33 x 3)] – [0.20/(2 x 33.33 x 3)] = 0.8065

    ∑[1/3∑xij]2 = (1/3(0.35))2 + (1/3(0.65))2 + (1/3(0.20))2 + … + (1/3(0.35))2 = 0.1967

    hs = (33.33/33.33 – 1)[1 – 1/3(1.77) – (0.20/2(33.33))] = 0.4196

    ñ = 33.331/ñ = 1/n1 + 1/n2 + 1/n3 = 1/100 + 1/100 + 1/100 = 0.03

    ∑(p2 + q2) = 1.77s = 3ho = 1/3(0.3 + 0.2 + 0.1) = 0.20

    0.5450.350.65301060Población 3

    0.6800.800.20702010Población 2

    0.5450.650.35503020Población 1

    p2 + q2qpA2 A2A1 A2A1 A1Genotipos

    Cálculo de gST

    En este ejemplo, tenemos el número de individuos para cada genotipo, para unlocus (A), en tres poblaciones diferentes. Mediante este número, queremosconocer el grado de diferenciación en las tres poblaciones. En el cuadro, se

    realizan los cálculos para todos los elementos necesarios en la fórmula queaparece en la diapositiva anterior.

    El resultado (gST = 0.4797) muestra que existe una diferenciación significativa entrelas poblaciones con respecto a las frecuencias alélicas. En consecuencia,podemos afirmar que un porcentaje alto de la diversidad genética se encuentradistribuido entre las poblaciones.

  • 8/18/2019 Medida de La Diversidad Genetica

    20/86

    Derechos de Autor: IPGRI y Cornell University, 2004 Medidas de diversidad 20

    HS HSDST

    Pob1

    Pob2

    Pob3

    HS

    DST DSTHT

    Diferenciación entre poblaciones respecto avarios loci (GST)

    GST es el coeficiente de diferenciación génica

    GST = DST/HT

    Donde,HT = la diversidad génica total = HS + DST

    HS = la diversidad génica dentro de una población

    DST = la diversidad entre poblaciones(HT /HT) = (HS /HT) + (DST /HT) = 1

    • GST mide la proporción de diversidad génica que está distribuida entre laspoblaciones.

    • Debe tomarse una muestra de un número suficiente de loci.

    • Las ecuaciones son complejas y deben calcularse con programasinformáticos específicos.

    Por ejemplo, suponiendo que:

    HT = 0.263

    HS = 0.202

    DST = 0.263 – 0.202 = 0.061

    Entonces, GST = (DST /HT) ∗ 100 = (0.061/0.263) ∗ 100 = 23.19%, lo que significaque, en esta especie, existe una diferenciación del 23% entre las poblaciones.

  • 8/18/2019 Medida de La Diversidad Genetica

    21/86

    Derechos de Autor: IPGRI y Cornell University, 2004 Medidas de diversidad 21

    El aporte se calcula retirando una población delconjunto, de manera que se pueda evaluar suaporte a la diversidad génica total

    CT(K) = (HT – HT/K)/HT

    CS(K) = (HS – HS/K)/HT

    CST(K) = (DST – DST/K)/HT

    Aporte de la población a la diversidadgénica total

    Donde,CT(K) = el aporte de K a la diversidad total

    CS(K) = el aporte de K a la diversidad dentro de una población

    CST(K) = el aporte de K a la diversidad entre poblaciones

    HT = la diversidad génica total

    HS = la diversidad génica dentro de una población

    DST = la diversidad entre poblaciones

    HT/K = la diversidad génica total, después de retirar la población K

    HS/K = la diversidad génica dentro de una población, después de retirar lapoblación K

    DST/K = la diversidad génica entre poblaciones, después de retirar lapoblación K

    • La medida permite cuantificar la variación de la diversidad génica totalcuando se introduce o se retira una población de un sitio (por ejemplo, alintroducir una variedad nueva en el campo de un agricultor, como parte de unprograma de conservación in situ ).

    • También sirve para medir el impacto ocasionado, en términos de diversidadgénica, por la pérdida de una población en un lugar dado.

    • Puede utilizarse únicamente con marcadores codominantes.

  • 8/18/2019 Medida de La Diversidad Genetica

    22/86

    Derechos de Autor: IPGRI y Cornell University, 2004 Medidas de diversidad 22

    La ecuación para la estructura genética depoblaciones es:

    (1 - FIT) = (1 – FIS)(1 – FST)

    FIT = 1 – (HI/HT)

    FIS = 1 – (HI/HS)

    FST = 1 – (HS/HT)

    Estadísticos F (Wright)

    Donde,HT = la diversidad génica total o la heterocigosidad esperada en lapoblación total, estimada a partir de las frecuencias alélicas combinadas

    HI = la diversidad génica dentro de una población o la heterocigosidadpromedio observada en un grupo de poblaciones

    HS = la heterocigosidad promedio esperada, estimada a partir de cadasubpoblación

    Los estadísticos F permiten el análisis de estructura en poblaciones subdivididas.También puede emplearse para medir la distancia genética entre lassubpoblaciones, un concepto que se fundamenta en la idea de que aquellassubpoblaciones que no presentan apareamiento entre sí tendrán frecuenciasalélicas diferentes a las de la población total.

    La distancia genética también provee una manera de medir la probabilidad de

    encuentro entre alelos iguales (endogamia). Los índices estadísticos involucradosmiden:

    FIS = la deficiencia o el exceso de heterocigotos promedio en cadapoblación

    FST = el grado de diferenciación génica entre las poblaciones, en funciónde las frecuencias alélicas

    FIT = la deficiencia o el exceso de heterocigotos promedio en un grupo depoblaciones

  • 8/18/2019 Medida de La Diversidad Genetica

    23/86

    Derechos de Autor: IPGRI y Cornell University, 2004 Medidas de diversidad 23

    El rango de FST es:

    10

    (fijación para alelosalternos en diferentes

    subpoblaciones)

    (no existe divergenciagenética)

    Cuando FST es: entonces la diferenciación genética es:

    de 0 a 0.05 pequeñade 0.05 a 0.15 moderadade 0.15 a 0.25 grande>0.25 muy grande

    Interpretación de valores FST

  • 8/18/2019 Medida de La Diversidad Genetica

    24/86

    Derechos de Autor: IPGRI y Cornell University, 2004 Medidas de diversidad 24

    (0.495 + 0.420)/2 = 0.4575

    Frecuencia genotípica

    HS

    (0.45 + 0.30)/2 = 0.375qo(0.3 + 0.2)/2 = 0.25HI

    (0.55 + 0.70)/2 = 0.625po2(0.625)(0.375) = 0.4688HT

    0.52380.42000.300.700.200.200.602

    0.39390.49500.450.550.300.300.401

    F2piqiqipiA2 A2A1 A2A1 A1

    Pob.

    FIT = 1 – (0.25/0.4688) = 0.4667

    FIS = 1 – (0.25/0.4575) = 0.4536

    FST = 1 – (0.4575/0.4688) = 0.0241

    Cálculo de los estadísticos F

    (continúa en la siguiente)

    Esta diapositiva presenta un ejemplo de dos poblaciones y el análisis de un locus

    (A). Se calculan las frecuencias alélicas (p y q), al igual que sus promedios.También se calculan las variables HT, HI y HS, y se utilizan para calcular losestadísticos F. El análisis muestra una diferenciación baja en las frecuenciasalélicas entre las dos poblaciones (FST). Podemos concluir que casi todo el déficitde heterocigotos se debió al apareamiento no aleatorio dentro de las poblaciones(FIS = 0.4536).

    F = índice de fijación (primera columna a la derecha del cuadro), que es laprobabilidad de que los dos alelos de un individuo sean los mismos. Su cálculodebe hacerse sólo con marcadores codominantes. Si se hace con marcadoresdominantes, el cálculo puede resultar sesgado.

  • 8/18/2019 Medida de La Diversidad Genetica

    25/86

    Derechos de Autor: IPGRI y Cornell University, 2004 Medidas de diversidad 25

    qo

    Frecuencia genotípica

    (0.500 + 0.255)/2 = 0.3775HS

    (0.50 + 0.15)/2 = 0.325(0.5 + 0.1)/2 = 0.30HI

    (0.50 + 0.85)/2 = 0.675po2(0.675)(0.325) = 0.4388HT

    0.60780.2550.150.850.100.100.802

    0.00000.5000.500.500.250.500.251

    F2piqiqipiA2 A2A1 A2A1 A1

    Pob.

    FIT = 1 – (0.30/0.4388) = 0.3163

    FIS = 1 – (0.30/0.3775) = 0.2053

    FST = 1 – (0.3775/0.4388) = 0.1397

    Cálculo de los estadísticos F (continuación)

    Este es otro ejemplo para el cual se siguieron los mismos procedimientos que en ladiapositiva anterior. La diferenciación en las frecuencias alélicas entre las dospoblaciones parece mayor (FST = 0.1397), con solo un efecto moderado del

    apareamiento no aleatorio dentro de las poblaciones (FIS = 0.2053).

  • 8/18/2019 Medida de La Diversidad Genetica

    26/86

    Derechos de Autor: IPGRI y Cornell University, 2004 Medidas de diversidad 26

    AMOVA es un método que sirve para estudiarla variación molecular dentro de una especie

    Se basa en un modelo jerárquico o anidado

    Se diferencia de un análisis de varianza(ANOVA) en que:

    • Puede contener diferentes suposiciones evolutivassin modificar la estructura básica del análisis

    • La hipótesis utiliza métodos de permutación que no

    requieren la suposición de una distribución normal

    Análisis de varianza molecular (AMOVA)

    Los diferentes niveles jerárquicos de la diversidad génica, estudiados por medio delmétodo AMOVA, pueden abarcar:

    1. Continentes, que pueden contener niveles jerárquicos menores

    2. Regiones geográficas dentro de un continente

    3. Zonas dentro de una región, en un continente

    4. Poblaciones dentro de una zona de una región, en un continente

    5. Individuos dentro de una población en una zona de una región, en uncontinente

    En los Apéndices 2 y 3 está la descripción matemática del modelo para lassituaciones 3 y 4, respectivamente. Para consultarlos, haga clic aquí.

    En las dos diapositivas que aparecen a continuación, se explica el modo deanalizar la situación 4.

  • 8/18/2019 Medida de La Diversidad Genetica

    27/86

    Derechos de Autor: IPGRI y Cornell University, 2004 Medidas de diversidad 27

    01101115

    01011114

    10111113

    01110012

    11100111

    10011110

    0111019

    0011008

    1111117

    0010006

    1010005

    1101014

    1011003

    1110112

    1110001

    A2A1A2A1A2A1

    Pob. 3Pob. 2Pob. 1Ind.

    AusenteA1 = 0

    PresenteA1 = 1

    2916X...254182115∑∑∑Xijk

    2

    88283327∑∑Xi...k2

    990324441225X...k2

    54182115X...k

    0.22222222CMw10SCw

    0.26190476CMb11SCb

    0.3CMa0.6Sca

    Un ejemplo de AMOVA

    (continúa en la siguiente)

    En este cuadro, aparecen los datos obtenidos con 15 individuos de cada una de las trespoblaciones, en un análisis realizado con un marcador codominante. Mediante un análisis

    de varianza, estos datos nos permitirán calcular los estadísticos F.

    El primer paso es convertir en variables binarias las bandas detectadas en los geles,asignándoles un valor de 0 ó de 1. Luego, se calculan las sumas de las presencias (1) paraque podamos proceder con la suma de cuadrados. Se realizan primero loscálculos para una población y se continúa con las demás hasta completar (X...k). Tenemos i= 15 individuos (efecto b), j = 2 alelos (efecto w), k = 3 poblaciones (efecto a).

    Donde,X...k es el resultado de la suma de todas las bandas presentes en los individuospor población

    X...k2 es el resultado de elevar al cuadrado el número obtenido anteriormente

      Xi...k2 es el resultado de sumar los cuadrados de la suma de alelos

    presentes en cada individuo (por ejemplo, Indiv.1 en la Pob.1 será (0 + 0)2 +Indiv.2 en la Pob.1 (1 + 1)

    2 + Indiv. ...)

      Xijk2 es la suma de cada valor al cuadrado

    SC es la suma de los cuadrados para los efectos a, b y w

    Un ejemplo para calcular SC:

    SCa = X...k2 /ij – X...2 /ijk = [990/(15 x 2)] - [2916/(15 x 2 x 3)] = 0.6

    CM son los cuadrados medios para los efectos a, b y w

    Un ejemplo para calcular CM: SCa /gla = 0.6/2 = 0.3, donde gla se refiere a losgrados de libertad para el efecto a (poblaciones).

  • 8/18/2019 Medida de La Diversidad Genetica

    28/86

    Derechos de Autor: IPGRI y Cornell University, 2004 Medidas de diversidad 28

    σw20.222222221045Dentro de indiv.

    σw2 + 2σb

    20.261904761142Indiv./población

    σw2 + 2σb

    2 + 2*15σa20.30.62Poblaciones

    CMECMSCglFV

    0.91324(1 - FIS)(1 - FST)

    0.91324(1 - FIT)

    0.0052185FST

    0.0819672FIS

    0.086758FIT

    0.24333σ2

    0.2222222σw2

    0.0198413σb2

    0.0012698σa2

    Cálculos de varianzas y estadísticos F

    Un ejemplo de AMOVA (continuación)

    Donde,FV = fuentes de variación

    gl = grados de libertad

    SC = la suma de los cuadrados (ver diapositiva anterior)

    CM = cuadrados medios (ver diapositiva anterior)

    σ2 = varianza total calculada

    CME = cuadrados medios esperados

    σw2 = 0.2222222

    σb2 = (CMb – CMw)/2 = (0.26190476 – 0.22222222)/2 = 0.0198413

    σa2 = (CMa – CMb)/2 ∗ 15 = (0.3 – 0.26190476)/2 ∗ 15 = 0.0012698

    σ2 = σw2 + σb

    2 + σa2 = 0.24333 (varianza total calculada)

    En la diapositiva 22, ya se ha explicado la forma de calcular los estadísticos F.Para este ejemplo en particular, sería de la siguiente manera:

    FIT = (σa2 + σb

    2)/ σ2 = (0.0012698 + 0.0198413)/0.24333 = 0.086758

    FST = σa2 / σ2 = 0.0012698/0.24333 = 0.0052185

    FIS = σb2 /(σb

    2 + σw2) = 0.0198413/(0.0198413 + 0.222222) = 0.0819672

    La diferenciación de las frecuencias alélicas entre las tres poblaciones es muy baja(FST = 0.0052185) y probablemente es un resultado de muchos apareamientos alazar. Para sacar una conclusión, es necesario analizar un mayor número de loci.

  • 8/18/2019 Medida de La Diversidad Genetica

    29/86

    Derechos de Autor: IPGRI y Cornell University, 2004 Medidas de diversidad 29

    Usando datos de secuencia• Diversidad de nucleótidos dentro de una población

    • Diversidad de nucleótidos entre poblaciones

    Usando datos de restricción• Variaciones en los patrones de bandas

    • Diversidad de nucleótidos dentro de una población

    • Diversidad de nucleótidos entre poblaciones

    Cuantificación de las relaciones genéticas:Diversidad y diferenciación a nivel denucleótido

    Para realizar estos cálculos, se parte del supuesto de que cada nucleótido es unlocus.

  • 8/18/2019 Medida de La Diversidad Genetica

    30/86

    Derechos de Autor: IPGRI y Cornell University, 2004 Medidas de diversidad 30

    Mide la diversidad de nucleótidos entre variassecuencias en una región dada del genoma, dentrode una población (πX)

    πX = n/(n – 1)ΣXiXjπij

    Utilización de datos de secuencia:Diversidad de nucleótidos dentro de unapoblación

    Donde,n = el número de secuencias analizadas en los individuos de la población

    Xi = la frecuencia estimada de la i-ésima secuencia en la población

    X j = la frecuencia calculada de la j-ésima secuencia en la poblaciónπij = la proporción de nucleótidos diferentes entre las secuencias i y j

    • La medida brinda información acerca del grado de diversidad de nucleótidosentre varias secuencias, en una región dada del genoma. Equivale a lamedida de la diversidad alélica dentro de un locus.

    • Varía de 0 a 1 (0 <  πX < 1).

    • Entre los factores que limitan el uso de esta herramienta de análisis están lossiguientes:

    Debe haber disponibilidad de secuencias genómicas parcialesLa ecuación sólo puede aplicarse a datos haploides

    Este parámetro da información acerca de las secuencias de nucleótidos, y elmodelo supone la presencia de haplotipos (genotipos haploides). Aunque elestudio se basa en individuos diploides, es necesario secuenciar cada copia delgenoma.

  • 8/18/2019 Medida de La Diversidad Genetica

    31/86

    Derechos de Autor: IPGRI y Cornell University, 2004 Medidas de diversidad 31

    10

    2

    1

    2

    5

    n

    2/10 = 0.2TCC G CGAT T ATTC T CAGGGTGC G GATG A ATSec4

    1/10 = 0.1TCC A CGAT C ATTC C CAGGGTGC A GATG G ATSec3

    2/10 = 0.2TCC A CGAT T ATTC G CAGGGTGC C GATG A ATSec2

    5/10 = 0.5TCC T CGAT T ATTC C CAGGGTGC C GATG A ATSec1

    Frec. XiSecuencia

    Π1,2 = 2/30, Π1,3 = 4/30, Π1,4 = 3/30, Π2,3 = 4/30, Π2,4 = 3/30, Π3,4 = 5/30

    πX = 10/(10 – 1)Σ

    XiX jπ

    ij

    = (10/9)[0.5 ∗ 0.2 ∗ (2/30) + 0.5 ∗ 0.1 ∗ (4/30) + ... + 1 ∗ 0.2 ∗ (5/30)]

    = 0.037

    Cálculo de la diversidad de nucleótidosdentro de una población

    Este ejemplo presenta 10 individuos en una población X. Para cada individuo,analizamos una secuencia de 30 nucleótidos y observamos que las secuenciasindividuales difieren en 5 nucleótidos (azul). En total, en la población hay cuatro

    secuencias alternas para estos 30 nucleótidos. La primera columna muestra elnúmero de individuos (n) que tienen cada una de las alternativas de secuencia.

    Calculamos el número de diferencias de nucleótidos en cada par de secuenciasdentro de la población. Por ejemplo, Π1,2 = 2/30 significa que entre las secuencias1 y 2 hay dos diferencias entre los nucleótidos (T versus A en la posición 4, y Cversus G en la posición 14).

    Luego, calculamos πX para toda la población. El número obtenido es 0.037, o seauna diversidad de nucleótidos del 3.7%, con base en la secuencia analizada en lamuestra de 10 individuos.

  • 8/18/2019 Medida de La Diversidad Genetica

    32/86

    Derechos de Autor: IPGRI y Cornell University, 2004 Medidas de diversidad 32

    VXY mide la divergencia poblacional con base en el gradode variación de la secuencia (1 secuencia, 2 poblaciones)

    VXY = dXY – (πX + πY)/2

    VW mide la diversidad promedio en una población con baseen diversas secuencias

    VW = (1/s)ΣπX

    Vb mide la diferenciación total en diversas poblaciones

    Vb = [1/(s(s – 1))]ΣXΣYVXY

    NST es la diferenciación relativa

    NST = Vb/(Vb + VW)

    Utilización de datos de secuencia:Diversidad de nucleótidos entre poblaciones

    Donde,VXY = la divergencia entre las poblaciones X y Y

    πX = la diversidad de nucleótidos en la población X

    dXY = la probabilidad de que dos nucleótidos al azar, en las poblacionesX y Y, sean diferentes

    s = el número de poblaciones

    • La medida brinda información acerca del nivel de diferenciación entresecuencias de nucleótidos en las poblaciones.

    • Requiere datos de secuencia en una muestra de individuos para cadapoblación.

    • Necesita programas informáticos específicos con atributos que permitan laalineación de secuencias, por ejemplo CLUSTAL W, MALIGN y PAUP*.

  • 8/18/2019 Medida de La Diversidad Genetica

    33/86

    Derechos de Autor: IPGRI y Cornell University, 2004 Medidas de diversidad 33

    Diferenciación relativaNST = Vb/(Vb + VW) = 0.03825/(0.03825 + 0.0635) = 0.3759

    Diversidad promedio en cada poblaciónVW = (1/s)ΣπX = ½(0.037 + 0.09) = 0.0635

    Diferenciación totalVb = [1/(s(s – 1))]ΣXΣYVXY = [1/(2(2 – 1))]0.0765 = 0.03825

    Divergencia de nucleótidos entre X y Y

    VXY = dXY – (πXπY)/2 = 0.14 – (0.037 + 0.09)/2 = 0.0765

    Cálculo de la diversidad de nucleótidosentre poblaciones

    Digamos que tenemos otra población Y en la cual la diversidad de nucleótidos parala misma secuencia analizada en la diapositiva 31 es πY = 0.09.

    También sabemos que la probabilidad de que dos nucleótidos tomados al azarsean diferentes en X y Y es de 0.14 (dXY).

    En esta diapositiva, presentamos la divergencia entre las poblaciones X y Y (VXY),la diferenciación total (Vb), la diversidad promedio en cada población (Vw) y ladiferenciación relativa (NST)..

  • 8/18/2019 Medida de La Diversidad Genetica

    34/86

    Derechos de Autor: IPGRI y Cornell University, 2004 Medidas de diversidad 34

    …GACTGAATTC CACGGCACTGACGAATTC GA…AGTGAATTC TTACTTAAGCTAGCCTGAATTC GATAC…

    …CTGACTTAAGGTGCCGTGACTGCTTAAGCT…TCACTTAAGAATGAATTCGATCGGACTTAAGCTATG…

    …GACTGAT TTC CACGGCACTGACGAATTC GA…AGTGAATTC TTACTTAAGCTAGCCTGAATTC GATAC…

    …CTGACT  A AAGGTGCCGTGACTGCTTAAGCT…TCACTTAAGAATGAATTCGATCGGACTTAAGCTATG…

    ADNIndiv. 1

    ADNIndiv. 2

    Sitio de restricción Eco RI

    No existe sitio dereconocimiento

    para Eco RI

    Fragmento 1 Fragmento 2

    Fragmento 2

    M I1 I2

    Gel

    Fragmento 2

    Fragmento 1

    Utilización de datos de restricción:Variaciones en patrones de bandas

    La ausencia del fragmento 1 en el Individuo2 indica que porta una secuenciadiferente de ADN, al menos en este sitio de restricción. Basta una pequeñadiferencia de apenas dos nucleótidos, en el dibujo, para hacer que desaparezca el

    sitio de reconocimiento para la enzima.

  • 8/18/2019 Medida de La Diversidad Genetica

    35/86

    Derechos de Autor: IPGRI y Cornell University, 2004 Medidas de diversidad 35

    Esta medición (π) se basa en el número defragmentos de restricción presentes en dosmuestras

    π = - (1/r)ln G

    (si π < 5%)

    Utilización de datos de restricción:Diversidad de nucleótidos dentro de unapoblación

    Donde,r = el número de nucleótidos de reconocimiento de una enzima derestricción

    ln G = el logaritmo natural de la probabilidad de que no hubo substituciónen el sitio de restricción. Se calcula del siguiente modo:

    G = F(3 – 2Gº)1/4

    F = [∑Xi(Xin – 1)]/[∑Xi(n – 1)]

    F = la proporción de fragmentos compartidos

    Gº = F1/4

    n = el número de genotipos haploides en la población

    Xi = la frecuencia estimada del i-ésimo fragmento en lapoblación

    • La medida estima la diversidad en los sitios de restricción en una muestra,

    porque depende de la secuencia de nucleótidos de los sitios dereconocimiento de una enzima de restricción dada.

    • Suministra información acerca de la substitución de nucleótidos en los sitiosde restricción. Varía de 0 a 1 (0 ≤  πX ≤ 1).

    • Las ecuaciones anteriores pueden utilizarse con muestras haploides, ADNmt,ADNcp o haplotipos.

    Referencia

    Karp, A., P. G. Isaac y D. S. Ingram. 1998. Molecular Tools for ScreeningBiodiversity: Plants and Animals. Chapman & Hall, Londres.

  • 8/18/2019 Medida de La Diversidad Genetica

    36/86

    Derechos de Autor: IPGRI y Cornell University, 2004 Medidas de diversidad 36

    Esta medición (VXY) indica la divergencia odiferenciación entre poblaciones, con base enlos datos de restricción

    VXY = dXY – (πX + πY)/2

    También se utiliza esta medida con datos de

    marcadores RAPD

    Utilización de datos de restricción:Diversidad de nucleótidos entre poblaciones

    Donde,VXY = la divergencia o diferenciación entre las poblaciones X y Y

    πX = la diversidad de la restricción en la población X

    dXY = la diversidad de fragmentos entre dos poblaciones = – (2/r)ln (GXY)GXY = FXY(3 – 2GºXY)

    1/4

    Gº = FXY1/4

    FXY = la proporción de alelos compartidos entre las poblaciones X y Y

    = (2ΣXiXXiY)/(Σ(XiX + XiY))

    XiX = la frecuencia calculada del fragmento i en la población X

    • Calcula la diversidad en los sitios de restricción de una muestra de dos poblaciones omás. Brinda información acerca de la substitución de nucleótidos en los sitios derestricción.

    • Resultan prácticos los programas informáticos como BIOSYS y GENEPOP. Losdatos obtenidos son considerados como pertenecientes a organismos haploides.

    Si se utiliza con datos de RAPD, el valor de ‘r’ es reemplazado por la longitud del cebador (r= 10).

    Se hacen, además, ciertas suposiciones:

    Que se emplean los cebadores apropiados

    Que el polimorfismo originado por inserción o deleción es poco común

    Que los fragmentos de tamaño similar en poblaciones diferentes pertenecen al mismolocus

    Que se deben identificar los fragmentos sin error

    Los programas que más se usan son RAPDISTANCE y RAPDIS.

  • 8/18/2019 Medida de La Diversidad Genetica

    37/86

    Derechos de Autor: IPGRI y Cornell University, 2004 Medidas de diversidad 37

    Cálculo de la diversidad de nucleótidosentre poblaciones

    Población

    XπX = -(1/6) ln (0.039358) = 0.539176

    G = 0.0325[3 – 2(0.424591)]1/4 = 0.039358G°= (0.0325)1/4 = 0.424591

    F = [0.30(0.30 ∗ 3 – 1) + 0.25(0.25 ∗ 3 – 1) + 0.45(0.45 ∗ 3 – 1)] = 0.0325

    0.30(3 – 1) + 0.25(3 – 1) + 0.45(3 – 1)

    9/20 = 0.45A3

    5/20 = 0.25A2

    6/20 = 0.30A1

    Frec. Xi2019181716151413121110987654321Sec.

    Pobla

    ción

    YπY = -(1/6) ln (0.272587) = 0.216633

    G = 0.2425[ 3 – 2(0.701743)]1/4 = 0.272587G°= (0.2425)1/4 = 0.701743

    F = [0.25(0.25 ∗ 3 – 1) + 0.65(0.65 ∗ 3 – 1) + 0.10(0.10 ∗ 3 – 1)] = 0.2425

    0.25(3 – 1) + 0.65(3 –1) + 0.10(3 – 1)

    2/20 = 0.10A3

    13/20 = 0.65A2

    5/20 = 0.25A1

    Frec. Xi2019181716151413121110987654321Sec.

    En cada población, detectamos tres fragmentos de ADN, como resultado de una restricción:A1, A2 y A3.

    La diversidad de nucleótidos en las regiones analizadas es más grande en la población X (πX

    = 0.5392) que en la población Y (πY = 0.2166); por tanto, X tiene mayor diversidad génica queY.

    Entre las poblaciones X y Y, la diferenciación de nucleótidos con base en los sitios derestricción es de 0.230766.

    ( ) 0.613051/40.14125XYG   ==°

    [ ]( ) ( ) ( ) 0.141250.100.450.650.250.250.30

    0.10*0.450.65*0.250.25*0.302F   == +++++

    ++

    ( )[ ] 163012.04 / 1

    613052.02314125.0GXY   =−=

    ( ) ( ) 604643.0163012.0ln6 / 2dXY   =−=

    ( ) 226739.0216633.0539176.02

    1604643.0VXY   =+−=

    ( ) 377905.0216633.0539176.02

    1VW   =+=

    ( ) 11337.0226739.02

    1Vb   ==

    0.2307660.3779050.11337

    0.11337NST   =

    +=

  • 8/18/2019 Medida de La Diversidad Genetica

    38/86

    Derechos de Autor: IPGRI y Cornell University, 2004 Medidas de diversidad 38

    La distancia genética entre dos muestras sedescribe como la proporción de elementosgenéticos (alelos, genes, gametos, genotipos)que no son compartidos por ambas muestras

    D = 1 cuando, y solamente cuando, las dosmuestras no tienen elementos genéticos en

    común

    Cuantificación de las relaciones genéticas:Distancia genética

    Según las similitudes de los individuos, son posibles tres tipos de representación dela distancia (D):

    • D = 1 – S, conocida como la distancia lineal porque asume que la relacióncon la similitud es lineal.

    • D = √(1 – S), conocida como la distancia cuadrática porque asume que larelación con la similitud se ajusta a una función cuadrática, de manera quepara volverla lineal es necesario calcular la raíz cuadrada.

    • D = √(1 – S2), conocida como la distancia circular.

    Linear 

    0

    0.2

    0.4

    0.6

    0.8

    1

    0 0.2 0.4 0.6 0.8 1

    Similitud

             D

             i       s        t       a       n

           c         i       a

    Quadratic

    0

    0.2

    0.4

    0.6

    0.8

    1

    0 0.2 0.4 0.6 0.8 1

    Similitud

            D

            i      s        t      a      n      c        i      a

    R

    0

    0.2

    0.4

    0.6

    0.8

    1

    0 0.2 0.4 0.6 0.8 1

    Similitud

          D      i     s      t     a     n     c      i     a

    Lineal Cuadrática

    Circular

  • 8/18/2019 Medida de La Diversidad Genetica

    39/86

    Derechos de Autor: IPGRI y Cornell University, 2004 Medidas de diversidad 39

    El cálculo de la distancia o disimilitud se ajusta auno de estos dos modelos posibles:

    Modelo de equilibrio

    La distancia permanececonstante con el tiempo(existe equilibrio entre

    la migración y la deriva genética)

    d

    d

    t

    t + 1

    La distancia cambia conel tiempo, a través de

    la migración y la derivagenética

    t + 1

    d2

    d1

    t

    Modelo de desequilibrio

    Modelos de distancia

    Para nuestros propósitos, emplearemos el modelo de desequilibrio. Existen dosalternativas:

    • Distancia geométrica

    − No considera los procesos evolutivos

    − Se basa solamente en las frecuencias alélicas

    − Existe una relación compleja entre la distancia y el tiempo de divergencia

    • Distancia genética

    − No considera los procesos evolutivos

    − La distancia aumenta a partir del momento de separación de una poblaciónancestral

    − Requiere un modelo genético de evolución

    ¿Cuándo debemos emplear la distancia geométrica y cuándo la distancia genética?

    • La distancia geométrica se emplea para estudios de diversidad en los cuales sehacen comparaciones según los datos morfológicos o de marcadores recopilados delas unidades taxonómicas operativas (UTO). Las UTO pueden ser individuos,accesiones o poblaciones. La distancia geométrica puede utilizarse con marcadoresdominantes (RAPD, AFLP) o codominantes. Dado que no se consideran los

    aspectos evolutivos, los dendrogramas obtenidos no pueden interpretarse comoárboles filogenéticos que suministran información acerca de la evolución odivergencia entre grupos.

    • Por el contrario, la distancia genética de cualquier UTO dada puede incorporarse enestudios filogenéticos. El modelo contempla las frecuencias alélicas en las UTO y sufundamento matemático es diferente. Puede utilizarse con marcadorescodominantes y dominantes; no obstante, con éstos últimos, se pierde informaciónporque solamente se pueden calificar dos alelos. La distancia genética conmarcadores dominantes requiere que se examinen dos generaciones de la mismapoblación para medir la segregación de los loci (Lynch y Milligan, 1994).

    Referencia

    Lynch, M. y B. G. Milligan. 1994. Analysis of population genetic structure with RAPDmarkers. Mol. Ecol. 3:91-99.

  • 8/18/2019 Medida de La Diversidad Genetica

    40/86

    Derechos de Autor: IPGRI y Cornell University, 2004 Medidas de diversidad 40

    Mide la relación directa entre el índice desimilitud (s) y la distancia (D = 1 – s)

    Son posibles diferentes situaciones; porejemplo:

    • Variables binarias

    • Variables cuantitativas

    • Tipos mixtos de variables

    • Número P de variables

    Modelos de desequilibrio: Distanciageométrica

    (continúa en la siguiente)

    Al analizar datos moleculares, tratamos con variables binarias (1,0). Estas se

    discutirán en las diapositivas que aparecen a continuación.

    En el Apéndice 4, hay información adicional sobre aquellos casos en los cuales esnecesario utilizar también variables cuantitativas, tipos mixtos de variables y unnúmero diverso de variables. En el Apéndice 5, se ha agregado un ejemplo sobrecómo calcular las distancias geométricas con variables cuantitativas. Paraconsultar los Apéndices 4 y 5, haga clic aquí.

    http://xn--apice_4-9m3x.pdf/http://xn--apice_5-9m3x.pdf/http://xn--apice_5-9m3x.pdf/http://xn--apice_4-9m3x.pdf/

  • 8/18/2019 Medida de La Diversidad Genetica

    41/86

    Derechos de Autor: IPGRI y Cornell University, 2004 Medidas de diversidad 41

    Con variables binarias:• Se emplea el análisis multivariado y se elaboran

    matrices de similitud o diferenciación entre los posiblespares de individuos o unidades taxonómicas operativas(UTO)

    • Dos individuos similares tienen, simultáneamente, elvalor mínimo de distancia y el valor máximo de similitud

    • La distancia y la similitud están inversamente

    relacionadas• La similitud se calcula por el número de coincidencias

    Distancia geométrica (continuación)

    Al emplear datos de marcadores moleculares y transformarlos en datos binarios,hay que tener en cuenta los siguientes aspectos:

    • El número de ploidía de una especie puede ocultar la presencia de seriesalélicas en un locus. Si esto sucede, se subestimará la diversidad genética alemplear marcadores dominantes (presencia/ausencia).

    • Si un marcador es codominante, se necesitan muestras de gran tamañopara que se puedan detectar todos los genotipos posibles, especialmente sihay varios alelos por locus.

    • Son comunes las distorsiones de segregación en las especies poliploides.

    • La mayoría de los programas de informática especializados están diseñadospara analizar especies diploides. Por lo tanto, si se usan con especiespoliploides, puede haber sesgos en la estimación de los diversos índices de

    diversidad genética.

    • El sistema reproductivo de ciertas especies no ha sido estudiado, de maneraque no se conoce lo suficiente acerca de su tipo de herencia.

    • Para obtener estimaciones confiables de diversidad genética, se debemuestrear y analizar la mayor cobertura posible (regiones de codificación yde no codificación) del genoma de la especie en estudio.

  • 8/18/2019 Medida de La Diversidad Genetica

    42/86

    Derechos de Autor: IPGRI y Cornell University, 2004 Medidas de diversidad 42

    Cálculo de frecuencias alélicas para diploidesy tetraploides: Marcador dominante

    Locus Adiploide

    (2X)

    Locus Atetraploide

    (4X)

    IndividuosM 1 2 3 4 5 6 7 8 9 1810 11 12 1716151413

    M 1 2 3 4 5 6 7 8 9 1810 11 12 1716151413

    1 1 0 1 1 1 1 0 1 1 1 0 1 1 1 0 1 1

    1 1 0 1 1 1 1 0 1 1 1 0 1 1 1 0 1 1

    Matrizbinaria

    Frec. alélicaGenotiposLocus

    0.69

    q

    0.47

    q

    0.31

    p

    0.53

    p

    Totalaaaa AAAA, AAAa, AAaa,

     AaaaTetraploide

     A

    (4X)1q4

    p4 + 4p3q + 6p2q2 +

    4pq3Frec. geno. (esp.)

    18414No. de indiv.

    1P2 = 0.22P1 = 0.78Frec. geno. (obs.)

    1P2 = 0.22P1 = 0.78Frec. geno. (obs.)

    14

    p2 + 2pq

     AA, Aa

    184No. de indiv.

    1q2Frec. geno. (esp.)

    TotalaaDiploide

     A

    (2X)

    En ambos casos, las frecuencias alélicas deben ser diferentes. No obstante, lapérdida de información en el individuo tetraploide es significativa. ¿A qué se debeesto? A que para calcular la frecuencia del alelo recesivo a, no se consideran los

    heterocigotos AAAa, Aaaa y Aaaa. Este efecto es mucho mayor cuando no seconoce el número de ploidía de la especie en estudio (esp. = valor esperado; obs. =valor observado)

    En este ejemplo, 18 individuos de una especie diploide y 18 de una especietetraploide fueron analizados con un marcador dominante. Los patrones de bandasobtenidos son similares. En ambos casos, las bandas se convierten en un cuadro

    binario. Los cálculos de frecuencias están abajo. Observamos que, por ejemplo, enel tetraploide, el genotipo 1 puede ser AAAA, AAAa, AAaa o Aaaa; pero la banda seleerá como presente (1) al igual que en el diploide (AA o Aa).

  • 8/18/2019 Medida de La Diversidad Genetica

    43/86

    Derechos de Autor: IPGRI y Cornell University, 2004 Medidas de diversidad 43

    Matrizbinaria

    diploide

    I N D I V I D U O S

    (1,0,0) (1,0,1) (0,0,1) (1,0,1) (0,1,1) (1,0,0) (1,0,1) (0,0,1) (0,0,1) (0,1,0) (1,1,0) (0,0,1) (0,0,1) (0,0,1) (0,0,1) (0,1,1) (1,0,1) (0,0,1)

    M 1 2 3 4 5 6 7 8 9 1810 11 12 1716151413

    Cálculo de frecuencias alélicas para diploidesy tetraploides: Marcador codominante

    Locus Adiploide

    (2X)

    Locus Atetraploide

    (4X)

    Individuos

          A      1

          A      1

          A      1

          A      1

       A   1

       A   1

       A   2

       A   3

       A   1

       A   2

       A   2

       A   3

       A   1

       A   2

       A   3

       A   3

          A      3

          A      3

          A      3

          A      3

    M 1 2 3 4 5 6 7 8 9 1810 11 12 1716151413

          A      1

          A      1

       A   1

       A   2

          A      1

          A      3

                                                                                                                                                                                                                                A                                                                                                                                                                                                                           2

                                                                                                                                                                                                                                A                                                                                                                                                                                                                           2

          A      2

          A      3

          A      3

          A      3

    En este ejemplo, hay 18 individuos de una especie diploide y 18 de una especietetraploide analizados utilizando un marcador codominante. En ambas situaciones,se detecta un locus (A) con tres alelos (A1, A2 y A3).

    El cálculo de las frecuencias alélicas en los individuos diploides no es difícil (matrizbinaria, parte inferior de la diapositiva). Sin embargo, con individuos tetraploides,se dificulta la conversión a datos binarios debido a que aquellos que portan losalelos A1 A1 A2 A3 no pueden diferenciarse de los que tienen otras combinacionescomo A1 A2 A2 A3 o A1 A2 A3 A3. Esta situación solamente puede ser resuelta porinferencia, con base en el cálculo del número de copias del fragmento de ADN enel gel.

    0.25

    p

    0.15

    q

    1

    18

    1

    Tota

    l

    P13 =

    0.22

    4

    2pr 

     A1 A

    3

    P22 =

    0.06

    1

    q2

     A2 A

    2

    P23 =

    0.11

    2

    2qr 

     A2 A

    3

    0.60

    P33 =

    0.44

    P12 =

    0.06

    P11 =

    0.11

    Frec. geno.

    (obs.)

    2

    p2

     A1 A1

    81Indiv. (no.)

    r 22pqFrec. geno.

    (esp.)

     A3 A

    3

     A1 A

    2

    Genotipo

    (esp. = valor esperado; obs. = valor observado).

  • 8/18/2019 Medida de La Diversidad Genetica

    44/86

    Derechos de Autor: IPGRI y Cornell University, 2004 Medidas de diversidad 44

    1.250(a + d)/(b + c)Sokal y Sneath 3 (1963)S13

    0.714(a + d)/[a + d + (b + c)/2]Sokal y Sneath 1 (1963)S12

    0.385(a + d)/[a + d + 2(b + c)]Rogers y Tanimoto (1960)S110.556(a + d)/nSokal y Michener (1958)S10

    0.750a/(b + c)Kulczynski 1 (1928)S9

    0.273a/[a +2(b + c)]Sokal y Sneath 5 (1963)S8

    0.429a/(a + b + c)Jaccard (1900, 1901, 1908)S7

    0.625(a/2)([1/(a+b)] + [1/(a+c)])Kulczynski 2S6

    0.612a/[(a + b)(a + c)]1/2Ochiai (1957)S5

    0.600a/[a + (b + c)/2]Dice (1945); Nei y Li (1979)S4

    0.500a/max[(a + b),(a + c)]Braun-BlanquetS3

    0.750a/min[(a + b),(a + c)]SimpsonS2

    0.333a/nRussel y Rao (1940)S1

    Ejemplo del valor del coeficientesi

    a = 3, b = 1, c = 3, d = 2

    ExpresiónAutor

    Coeficientes de similitud para variablesbinarias: Ejemplos

    Donde,n = a + b + c + d

    En el cuadro de la diapositiva, observamos que:

    Los índices S1 a S9 dan valor solamente a la presencia de información

    Los índices S10 a S13 dan valor tanto a la presencia de informacióncomo a su ausencia

    A continuación, discutiremos tres índices (los que aparecen en rojo en ladiapositiva): Concordancia Simple (S10), Jaccard (S7) y Nei-Li (S4).

    c + ddc0

    a +

    bba1

    Indiv.i

    b + d

    0

    a + c

    1

    Indiv. j

    n

  • 8/18/2019 Medida de La Diversidad Genetica

    45/86

    Derechos de Autor: IPGRI y Cornell University, 2004 Medidas de diversidad 45

    Coeficiente de concordancia simple:

    (a + d)/(a + b + c + d)

    Coeficiente de Jaccard:

    a/(a + b + c)

    Coeficiente de Nei-Li, o de Dice:2a/(2a + b + c)

    Índices de distancia geométrica

    Estos tres índices difieren en su enfoque para estimar el número de coincidencias ydiferencias.

    El Coeficiente de Concordancia Simple considera que la ausencia corresponde aloci homocigóticos. Puede usarse con datos de marcadores dominantes (RAPD yAFLP), por cuanto las ausencias podrían corresponder a recesivos homocigóticos.En el Apéndice 6 se da un ejemplo de aplicación del Coeficiente de ConcordanciaSimple para variables categóricas (haga clic aquí).

    El Coeficiente de Jaccard solamente cuenta las bandas presentes para cualquierade los individuos (‘i’ o ‘j’). Las ausencias dobles se consideran como datosausentes. Si se presentan falsos positivos o falsos negativos, la estimación delíndice tiende a ser sesgada. Puede aplicarse con datos de marcadorescodominantes.

    El Coeficiente de Nei-Li cuenta el porcentaje de bandas compartidas entre dosindividuos y le da más importancia a aquellas bandas presentes en ambos.Considera que la ausencia tiene menor importancia biológica y, de esta manera,este coeficiente tiene un significado completo en función de la similitud del ADN.Puede aplicarse con datos de marcadores codominantes (RFLP, SSR).

    http://xn--apice_6-9m3x.pdf/http://xn--apice_6-9m3x.pdf/http://xn--apice_6-9m3x.pdf/http://xn--apice_6-9m3x.pdf/http://xn--apice_6-9m3x.pdf/

  • 8/18/2019 Medida de La Diversidad Genetica

    46/86

    Derechos de Autor: IPGRI y Cornell University, 2004 Medidas de diversidad 46

    Mide la diferencia entre dos genes, proporcionalal tiempo de separación de un ancestro común

    Varios modelos son posibles:• Mutación de alelos infinitos

    p. ej. Distancia genética de Nei

    • Modelo de mutación gradualp. ej. Distancia con microsatélites

    • Mutación en la secuencia de nucleótidos

    Modelos de desequilibrio: Distancia genética

    • Mutación de alelos infinitos (isoenzimas) – Cada mutación da origen a un alelo nuevo. – Si 2 genes son iguales, no ha habido mutación. Si 2 genes son

    diferentes, se presentó un número desconocido de mutaciones. – El número promedio de mutaciones desde el momento t, cuandodivergieron de un ascestro es = 2tµ, donde µ es la tasa de mutación yse multiplica por 2 porque estamos tratando con 2 genesindependientes.

     – La probabilidad de que 2 genes provengan de un mismo progenitordespués del momento t es de P= e-2tµ.

    • Modelo de mutación gradual (SSR) – La mutación es un cambio progresivo de tal manera que los fragmentos

    que migran distancias similares han experimentado pocas mutaciones. – En el caso de las SSR, se asume que la mutación modifica el número

    de repeticiones, aumentando o disminuyendo paso a paso. Puede

    mostrarse que el cuadrado de la diferencia en el número de repeticionesentre 2 microsatélites es proporcional al momento de divergencia de unancestro común.

    • Mutación en la secuencia de nucleótidos – Indica que la substitucion más sencilla es la mutación de una base

    única. – La limitación principal es la pérdida de informacion por desconocer el

    número de mutaciones que podrían haber ocurrido en un sitio. Pararesolver ese problema, algunos métodos asumen la probabilidad detransición (purina → purina o pirimidina → pirimidina) y de transversión(purina → pirimidina o pirimidina → purina).

  • 8/18/2019 Medida de La Diversidad Genetica

    47/86

    Derechos de Autor: IPGRI y Cornell University, 2004 Medidas de diversidad 47

    La distancia genética estándar de Nei es:

    Se basa en el concepto de identidad genética(IXY):

    )J(J

    J

    I yx

    xy

    xy =

    )(IlnD XYXY   −=

    Cálculo de la distancia genética de Nei

    (continúa en la siguiente)Donde,

    JX = la homocigosidad promedio en la población X

    JY = la homocigosidad promedio en la población YJXY = la homocigosidad promedio entre poblaciones

    De manera que,IXY = 1, si dos poblaciones tienen las mismas frecuencias alélicas entodos los loci muestreados

    IXY = 0, si dos poblaciones no comparten las mismas frecuencias alélicasen todos los loci muestreados

    • El valor de DXY varía de 0 (donde las poblaciones tienen frecuencias alélicasidénticas) a infinito (∞, donde las poblaciones no comparten ningún alelo).

    • Asume que la tasa de substitución por locus es igual entre todos los loci y laspoblaciones.

    • Esta distancia calcula las diferencias de codones por locus entre dospoblaciones.

  • 8/18/2019 Medida de La Diversidad Genetica

    48/86

    Derechos de Autor: IPGRI y Cornell University, 2004 Medidas de diversidad 48

    D2,3 = 0.0440D1,3 = 0.0107D1,2 = 0.0852Dii’Distancia genética

    I2,3 = 0.9570I1,3 = 0.9894I1,2 = 0.9183Iii’Identidad genética

    J2,3 = 0.8986J1,3 = 0.9346J1,2 = 0.8733Jii’Homocig. prom. entre poblac.

    0.93270.94530.9567JiHomocigosidad promedio0.06730.05470.0433HiHeterocigosidad promedio

    0.42000.000.0000hijkHeterocigosidad del locus

    0.700.001.00D2

    0.301.000.00D1D

    0.00000.32580.2434hijkHeterocigosidad del locus

    0.000.090.13B3

    0.000.100.01B2

    1.000.810.86B1B

    0.45500.38480.3200hijkHeterocigosidad del locus

    0.350.260.20A2

    0.650.740.80A1A

    Población 3Población 2Población 1

    Frecuencias alélicasAlelosLocus

    Cálculo de la distancia genética de Nei(continuación)

    En este ejemplo hay i = 3 poblaciones, j = 3 loci polimórficos y 10 locimonomórficos. Además, hay diferentes números (K) de alelos por locus (porejemplo, A y D tienen 2 alelos cada uno y B, 3 alelos).

    En el cuadro aparecen los resultados del cálculo de las frecuencias alélicasen cada población, así como la heterocigosidad por locus. A continuación,calculamos la heterocigosidad y la homocigosidad promedio(1 - heterocigosidad) por población.

    Luego, calculamos la homocigosidad entre poblaciones y la identidad genética paraestimar la distancia genética de Nei:

     jii’jk = Σii’j pijk pi’jk, por ejemplo, j1,2jk = la homocigosidad entre las poblaciones1 y 2

     j1,2jk = (0.8)(0.74) + (0.2)(0.26) + (0.86)(0.81) + (0.01)(0.10) + (0.13)(0.09) +

    (0.0)(1.0) + (1.0)(0.0) + 10 = 11.3533J1,2 = la homocigosidad promedio entre poblaciones = j1,2jk /13 = 11.3533/13= 0.8733

    I1,2 = la identidad genética entre las poblaciones 1 y 2 = J1,2 / √(J1J2) =0.8733/ √(0.9567 ∗ 0.9453) = 0.9183

    D1,2 = la distancia genética entre las poblaciones 1 y 2 = -ln(I 1,2) =-ln(0.9183) = 0.0852

    Puesto que aún no hemos explicado los métodos de agrupación, en elApéndice 7 presentamos la matriz de distancia y el dendrograma de este ejemplo(haga clic aquí).

    http://xn--apice_7-9m3x.pdf/http://xn--apice_7-9m3x.pdf/http://xn--apice_7-9m3x.pdf/http://xn--apice_7-9m3x.pdf/http://xn--apice_7-9m3x.pdf/

  • 8/18/2019 Medida de La Diversidad Genetica

    49/86

    Derechos de Autor: IPGRI y Cornell University, 2004 Medidas de diversidad 49

    ∑ <   −−

    = i'i2

    i'i'iiwi )a(a1)2n(2n

    2S

    ∑=  j wjsw S)(1/dS

    Cálculo de la distancia dentro de unapoblación, usando microsatélites

    La distancia dentro de una población es elpromedio de la suma de los cuadrados de lasdiferencias en número de repeticiones entrealelos

    La distancia promedio dentro de una poblaciónpuede calcularse para todos los loci analizados(ds)

    Donde,aij = tamaño del alelo de la i-ésima copia (i = 1, 2, …, 2n) en la j-ésimapoblación (j = 1, 2, …, ds)

    n = número de individuos en la muestra

    Existen dos aspectos que se deben tener en cuenta:

    El cálculo de la distancia entre dos alelos es una transformación delnúmero de repeticiones.

    Una de las dificultades en el uso de las SSR para estimar distanciasgenéticas es que su tasa de mutación es alta.

  • 8/18/2019 Medida de La Diversidad Genetica

    50/86

    Derechos de Autor: IPGRI y Cornell University, 2004 Medidas de diversidad 50

    Este es el componente entre poblaciones para ladistancia promedio entre todas las comparacionesde pares de alelos

    ∑ ∑   −−

    =   <

  • 8/18/2019 Medida de La Diversidad Genetica

    51/86

    Derechos de Autor: IPGRI y Cornell University, 2004 Medidas de diversidad 51

    Es el proceso de agrupar (o conglomerar) objetosen categorías o clases, con base en susparticularidades o relaciones comunes. Laagrupación puede ser:

    • Jerárquica:− Esencialista, la que trata de descubrir su verdadera

    naturaleza o forma− Cladística, la que se basa en la genealogía o filogenia− Evolutiva, la que se basa en la filogenia y en la

    cantidad de cambios evolutivos

    − Fenética, la que se basa en el mayor número decaracteres de un organismo y su ciclo vital

    • No jerárquica

    • Superpuesta

    Visualización de las relaciones: Clasificacióno agrupación

    • Jerárquica: una clase principal que contiene clases menores denominadas‘ramas’.

    • No jerárquica: cada individuo es asignado a un grupo único al compararlo conlas clases iniciales, de suerte que su posicionamiento sea el más apropiado.

    • Superposición: los individuos pueden pertenecer a más de un grupo.

    Los tipos de clasificación se refieren a los procedimientos para catalogarobjetos, organismos, etc., y se utilizan en varios campos del conocimiento. Ennuestro caso, empleamos la clasificación jerárquica debido a la naturaleza delas relaciones entre individuos; es decir, el individuo, la población, la accesión,la variedad, etc., son unidades que no pueden ser asignadas simultánemente ados grupos diferentes.

    Referencia

    García, J. A., M. C. Duque, J. Tohme, S. Xu y M. Levy. 1995. SAS for ClassificationAnalysis; Agrobiotecnology Course, October 1995. Documento de Trabajo.Centro Internacional de Agricultura Tropical (CIAT), Cali, Colombia.

  • 8/18/2019 Medida de La Diversidad Genetica

    52/86

    Derechos de Autor: IPGRI y Cornell University, 2004 Medidas de diversidad 52

    Clasificación fenética

    Muestra las relaciones entre las muestrasmediante el uso de un índice de similitud

    Se selecciona un método de agrupación odistancia, de manera que se pueda trazar undiagrama de árbol (dendrograma) o unfenograma (si la matriz de similitud contienedatos fenotípicos)

    1 2 3 3 2 4 1

    2    3 

    En este ejemplo de agrupación jerárquica, a todos los caracteres se les da lamisma importancia en el proceso de agrupación.

    La similitud total entre dos grupos es la suma de la similitud para cada carácter.

    No tiene en cuenta la genealogía.

    Fenético se refiere a cualquier carácter empleado en el procedimiento declasificación, ya sea morfológico, fisiológico, ecológico, molecular o citológico.

  • 8/18/2019 Medida de La Diversidad Genetica

    53/86

    Derechos de Autor: IPGRI y Cornell University, 2004 Medidas de diversidad 53

    Métodos de agrupación

    Pasos a seguir:

    • Se define la cercanía

    • Se estima cada agrupación, según la distancia

    • Se conforman las ramas del dendrograma en cada

    ciclo

    Los tres métodos principales son:

    • Ligamiento simple (o ‘vecino más cercano’)

    • Ligamiento completo (o ‘vecino más lejano’)• Ligamiento promedio (o UPGMA)

    Hay otros métodos de agrupación disponibles, como:

    • El método de agrupamiento de pares no ponderados utilizando el centroide

    (UPGMC). Se basa en la distancia entre el valor medio para cada grupo.

    • El método de agrupamiento de pares ponderados utilizando el centroide(WPGMC). Considera el valor medio de las UTO en los grupos.

    • Método de Ward. Funciona con la suma de las distancias al cuadrado entrepares de UTO. También se conoce como el método de la varianza mínimaporque, como considera los valores al cuadrado, se vuelve un método muysensible (las UTO diferentes parecerán más disímiles y las UTO similaresparecerán aún más cercanas). Puede utilizarse con distancias euclidianas ydatos moleculares si se dispone de un número alto de bandas de ADN.

    En las siguientes diapositivas, tratamos en más detalle los tres métodos que se

    mencionan en esta diapositiva y presentamos un ejemplo para cada uno de ellos.

  • 8/18/2019 Medida de La Diversidad Genetica

    54/86

    Derechos de Autor: IPGRI y Cornell University, 2004 Medidas de diversidad 54

    O ‘vecino más cercano’ Minimiza la distancia entre grupos al tomar la

    distancia al vecino con el que presenta mayorsimilitud

    Funciona con grupos uniformes y compactos,pero se afecta con los individuos distantes.Esto resulta inconveniente cuando hay gruposdiferentes que no están bien distribuidos en elespacio

    Grupo 1 Grupo 2

    d(1,2)d(1,2) = distancia mínimaentre dos UTO

    Ligamiento simple

  • 8/18/2019 Medida de La Diversidad Genetica

    55/86

    Derechos de Autor: IPGRI y Cornell University, 2004 Medidas de diversidad 55

    Ligamiento simple: Un ejemplo

    00.400.600.28D

    00.350.43C

    00.30B

    0A

    DCBA(1) (2)

    (3)

    00.400.30AD

    00.35C

    0B

    ADCB

    0.100.200.300.400.50 0.0

     A

    D

    B

    C

    (4)

    00.35ADB

    0C

    ADBC

    1. Primero, se elabora la matriz de distancia; luego, en un primer ciclo, seselecciona la distancia más corta, d AD = 0.28.

    2. Se elabora una nueva matriz al agrupar los individuos A y D y se calculan lasdistancias combinadas:

    d B(AD) = min (d BA; d BD) = min (0.30; 0.60) = 0.30

    d C(AD) = min (d CA; d CD) = min (0.43; 0.40) = 0.40

    3. Se elabora una nueva matriz al agrupar el individuo B con el grupo (AD) y secalculan las distancias combinadas:

    d C(ADB) = min (d AC; d CD; d CB) = min (0.43; 0.40; 0.35) = 0.35

    4. Se dibuja el dendrograma.

  • 8/18/2019 Medida de La Diversidad Genetica

    56/86

    Derechos de Autor: IPGRI y Cornell University, 2004 Medidas de diversidad 56

    O ‘vecino más lejano’ Minimiza la distancia entre grupos al tomar la

    distancia al individuo con el que presenta menorsimilitud

    Funciona bien con grupos uniformes ycompactos pero, nuevamente, recibe influenciade los individuos distantes

    Grupo 1 Grupo 2

    d(1,2)

    d(1,2) = distancia mayorentre dos UTO

    Ligamiento completo

  • 8/18/2019 Medida de La Diversidad Genetica

    57/86

    Derechos de Autor: IPGRI y Cornell University, 2004 Medidas de diversidad 57

    Ligamiento completo: Un ejemplo

    00.400.600.28D

    00.350.43C

    00.30B

    0A

    DCBA(1) (2)

    (3) (4)

    00.400.30BD

    00.43C

    0A

    BDCA

    0.100.200.300.400.500.60 0.0

    A

    D

    B

    C

    00.40DB

    0AC

    DBAC

    1. Primero, se elabora la matriz de distancia; luego, en un primer ciclo, seselecciona la distancia más larga, d BD = 0.60.

    2. Se elabora una nueva matriz al agrupar los individuos B y D y se calculan lasdistancias combinadas:

    d A(BD) = max(d BA; d AD) = max(0.30; 0.28) = 0.30

    d C(BD) = max(d CB; d CD) = max(0.35; 0.40) = 0.40

    3. Se elabora la nueva matriz con los grupos AC y BD, y se calculan las distanciascombinadas:

    d (AC)(DB) = max (d AD; d AB; d CD; d CB) = max (0.28; 0.30; 0.40; 0.35) = 0.40

    4. Se dibuja el dendrograma.

  • 8/18/2019 Medida de La Diversidad Genetica

    58/86

    Derechos de Autor: IPGRI y Cornell University, 2004 Medidas de diversidad 58

    O ‘método de agrupamiento de pares noponderados usando la media aritmética’(UPGMA)

    Minimiza la distancia entre grupos, al tomar ladistancia promedio de todos los pares entre losindividuos de la muestra

    Método más empleado

    d(1i,2j) = distancia promedio

    entre UTOi y UTOj de losgrupos 1 y 2

    Grupo 1 Grupo 2

    Ligamiento promedio

  • 8/18/2019 Medida de La Diversidad Genetica

    59/86

    Derechos de Autor: IPGRI y Cornell University, 2004 Medidas de diversidad 59

    Ligamiento promedio: Un ejemplo

    00.400.600.28D

    00.350.43C

    00.30B

    0A

    DCBA(1) (2)

    (3) (4) 0.10.20.30.40.5 0.0

    B

    D

    A

    C

    00.4150.45AD

    00.35C

    0B

    ADCB

    00.42AD

    0BC

    ADBC

    1. Primero, se elabora la matriz de distancia; luego, en un primer ciclo, se seleccionala distancia más corta, d AD = 0.28.

    2. A continuación, se elabora una matriz al agrupar el individuo A con el D y secalculan las distancias combinadas:

    d B(AD) = (d BA + d BD)/2 = (0.30 + 0.60)/2 = 0.45

    d C(AD) = (d CA + d CD)/2 = (0.43 + 0.40)/2 = 0.415

    3. Se elabora una nueva matriz al agrupar los individuos que tengan la distancia máscorta, B con C, y se calculan las distancias combinadas:

    d (AD) (BC) = (d AB + d AC + d BD + d BC)/4 = (0.30 + 0.43 + 0.60 + 0.35)/4 = 0.42

  • 8/18/2019 Medida de La Diversidad Genetica

    60/86

    Derechos de Autor: IPGRI y Cornell University, 2004 Medidas de diversidad 60

    En primer lugar, se reúne información sobre laespecie en estudio, por ejemplo su diversidad,su sistema de reproducción, su número deploidía y sus niveles de heterocigosidad

    Se seleccionan con cuidado los caracteresgenéticos que se van a analizar

    Luego se prueban diferentes metodologías deagrupación y se evalúa el nivel de concordanciaobtenido con cada una de ellas

    Selección de un método de agrupación

    Además, siempre será importante combinar la mayor cantidad deinformación que sea posible. En el Apéndice 8 (haga clic aquí) puedeencontrar un ejemplo en que se presentan datos morfológicos y

    moleculares, y se compara el uso de series de datos separados con el usode datos combinados.

    http://xn--apice_8-9m3x.pdf/http://xn--apice_8-9m3x.pdf/http://xn--apice_8-9m3x.pdf/http://xn--apice_8-9m3x.pdf/

  • 8/18/2019 Medida de La Diversidad Genetica

    61/86

    Derechos de Autor: IPGRI y Cornell University, 2004 Medidas de diversidad 61

    Validación externa

    Validación interna

    Validación relativa

    ‘Bootstrapping’ (Método de remuestreo)

    Validación del análisis de conglomerados

    Validación externa:

    Se compara la matriz de distancia con otra información que no se hayausado en los cálculos de agrupación (por ejemplo, la genealogía).

    Validación interna:Esta técnica cuantifica la distorsión debida al método de agrupaciónempleado. Elabora una nueva matriz de similitud o distancia, la ‘matrizcofenética’, directamente a partir del dendrograma. Se calcula la validaciónmediante un coeficiente de correlación entre los datos de similitud odistancia a partir de la matriz original y los de la nueva matriz cofenética.Al finalizar el ejercicio de agrupación, se evalúa si se mantienen o no lasdistancias originales (Sokal y Rohlf, 1994).

    Validación relativa:

    Se compara la similitud entre métodos.

    Bootstrapping:

    Es un método de remuestreo con reemplazo, con la misma matriz dedatos. Permite el cálculo de las desviaciones estándar y varianzas, y esútil para aquellas situaciones en las cuales el número de muestras o losrecursos (por ejemplo, el tiempo, el presupuesto) son limitados.

    A continuación, se presentan ejemplos de la aplicación de los métodos decorrelación cofenética y bootstrapping.

    Referencia

    Sokal, R. y J. Rohlf. 1994. Biometry: The Principles and Practice of Statistics inBiological Research (3rd edn). Freeman & Co, NY.

  • 8/18/2019 Medida de La Diversidad Genetica

    62/86

    Derechos de Autor: IPGRI y Cornell University, 2004 Medidas de diversidad 62

    00.400.600.28D

    00.350.43C

    00.30B

    0A DCBA

    Matriz de distancia original

    Dendrograma

    0.100.200.300.400.500.60 0.0

    00.430.430.28D

    00.350.43C

    00.43B

    0A

    DCBA

    Matriz cofenética

    B

    D

    A

    C

    0.280.350.43

    Correlación cofenética =0.5557

    Correlación cofenética: Un ejemplo

    Para elaborar la matriz cofenética, observemos el dendrograma que se dibujóanteriormente con la matriz original (este ejemplo corresponde a la diapositiva 58).Vemos que la distancia entre D y C en el dendrograma es de 0.43; entonces,

    llenamos esta celda en la matriz cofenética. La distancia entre B y C es de 0.35, yasí sucesivamente.

    Los cálculos para la correlación cofenética se basan en el coeficiente decorrelación:

    r = (ΣXiYi - ΣXiΣYi /n)/SXiSYi

    Donde,Xi y Yi son los valores de similitud o distancia de la matriz original y de lamatriz cofenética, respectivamente.

    SXi y SYi son las desviaciones estándar para cada variable.

    Si el valor de la correlación es alto, podemos concluir que el dendrograma sí reflejalas distancias en la matriz original y, por tanto, no existe ninguna distorsiónoriginada por el método de agrupación. En el ejemplo anterior, obtuvimos un valorde 0.5557. Este es un valor promedio que podría indicar que las distancias deldendrograma no reflejan los datos de distancia en la matriz original y existe, porconsiguiente, distorsión a causa del método empleado. No obstante, al elaborareste ejemplo, utilizamos muy pocos datos y no eran los resultados reales de unexperimento, lo que puede explicar el valor obtenido.

  • 8/18/2019 Medida de La Diversidad Genetica

    63/86

    Derechos de Autor: IPGRI y Cornell University, 2004 Medidas de diversidad 63

    1000L5

    0011L4

    1101L3

    1010L2

    1001L1

    P4P3P2P1

    Matriz de datos

    Matriz de similitud

    A P1 P2 P3 P4

    Gel

    BC

    DE

    (1) (2)

    (3)

    10.4000.2000.400P4

    10.4000.600P3

    10.400P2

    1P1

    P4P3P2P1

    Validación mediante ‘bootstrapping’:Un ejemplo

    (continúa en la siguiente)

    En el gel que aparece en la esquina superior izquierda, hay 4 individuos (Pi) y

    5 loci (L j). Vamos a suponer que realizamos la validación en tres muestras conreemplazo.

    En primer lugar, registramos los datos de los marcadores en los individuos (matrizde datos) y, a continuación, calculamos la similitud promedio (concordancia simple)y su intervalo.

  • 8/18/2019 Medida de La Diversidad Genetica

    64/86

    Derechos de Autor: IPGRI y Cornell University, 2004 Medidas de diversidad 64

    10.400 ± 0.2000.200 ± 0.0000.533 ± 0.115P4

    10.400 ± 0.2000.600 ± 0.000P3

    10.267 ± 0.115P2

    1P1

    P4P3P2P1

    Matriz de similitud promediocon desviaciones estándar

    Dendrograma antes del reemplazo Dendrograma con reemplazo

    Validación mediante ‘bootstrapping’:Un ejemplo (continuación)

    1

    0.25 0.44 0.63 0.81 1.00

    3

    2

    4

    0.11 0.33 0.56 0.78 1.00

    1

    3

    4

    2

    Para cada indiv