capÍtulo 5. el tratamiento de datos en antropogenÉtica la ley de equilibrio hardy-weinberg

22
CAPÍTULO 5. EL TRATAMIENTO DE DATOS EN CAPÍTULO 5. EL TRATAMIENTO DE DATOS EN ANTROPOGENÉTICA ANTROPOGENÉTICA La ley de equilibrio Hardy-Weinberg. La ley de equilibrio Hardy-Weinberg. La similaridad genética. La similaridad genética. El análisis estadístico de la El análisis estadístico de la similaridad: AFC, MDS, ACP Dendrogramas. similaridad: AFC, MDS, ACP Dendrogramas. Bootstrap. Bootstrap. Geografía y genes: Clinas, Mapas Geografía y genes: Clinas, Mapas sintéticos, Autocorrelación espacial, sintéticos, Autocorrelación espacial, Test de Mantel, AMOVA. Test de Mantel, AMOVA. Otros: Método del centroide, Mestizaje, Otros: Método del centroide, Mestizaje, Redes filogenéticas, Redes filogenéticas, Desequilibrio de Desequilibrio de ligamiento, Genética Forense, Minería de ligamiento, Genética Forense, Minería de datos. datos. Programas de interés en Antropogenética. Programas de interés en Antropogenética.

Upload: aderyn

Post on 08-Jan-2016

72 views

Category:

Documents


1 download

DESCRIPTION

CAPÍTULO 5. EL TRATAMIENTO DE DATOS EN ANTROPOGENÉTICA La ley de equilibrio Hardy-Weinberg. La similaridad genética. El análisis estadístico de la similaridad: AFC, MDS, Dendrogramas. Bootstrap. - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: CAPÍTULO 5. EL TRATAMIENTO DE DATOS EN ANTROPOGENÉTICA La ley de equilibrio Hardy-Weinberg

CAPÍTULO 5. EL TRATAMIENTO DE DATOS ENCAPÍTULO 5. EL TRATAMIENTO DE DATOS ENANTROPOGENÉTICAANTROPOGENÉTICA

La ley de equilibrio Hardy-Weinberg. La ley de equilibrio Hardy-Weinberg. La similaridad genética. La similaridad genética. El análisis estadístico de la similaridad: AFC, MDS, ACP El análisis estadístico de la similaridad: AFC, MDS, ACP Dendrogramas. Bootstrap. Dendrogramas. Bootstrap. Geografía y genes: Clinas, Mapas sintéticos, Autocorrelación Geografía y genes: Clinas, Mapas sintéticos, Autocorrelación espacial, Test de Mantel, AMOVA. espacial, Test de Mantel, AMOVA. Otros: Método del centroide, Mestizaje, Otros: Método del centroide, Mestizaje, Redes filogenéticas, Redes filogenéticas, Desequilibrio de ligamiento, Genética Forense, Minería de Desequilibrio de ligamiento, Genética Forense, Minería de datos. datos. Programas de interés en Antropogenética.Programas de interés en Antropogenética.

Page 2: CAPÍTULO 5. EL TRATAMIENTO DE DATOS EN ANTROPOGENÉTICA La ley de equilibrio Hardy-Weinberg

Geografía y genes: clinasGeografía y genes: clinas

Alfonso-Sánchez Alfonso-Sánchez et alet al, 2018, 2018Heredity. Heredity. 120, 91–99

Las tendencias de variación gradual de un carácter, frecuencia alélica, haplotípica, etc en un sentido determinado del espacio se denominan gradientes clinales o clinas.Cuando se pretende detectar la presencia de una clina, debe realizarse un análisis de correlación de las frecuencias respecto a las coordenadas geográficas. La existencia de una significación en la asociación entre frecuencias génicas y un determinado eje de coordenadas estará revelando la presencia de un gradiente clinal. Figura: Clinas observadas en el oeste de Eurasia para el haplotipo MAPT*H2.

Page 3: CAPÍTULO 5. EL TRATAMIENTO DE DATOS EN ANTROPOGENÉTICA La ley de equilibrio Hardy-Weinberg

Gómez-Pérez Gómez-Pérez et alet al, 2011, 2011Am J Hum Biol. 23(2):177-84. Am J Hum Biol. 23(2):177-84.

Geografía y genes: clinasGeografía y genes: clinas

Los gradientes pueden tener una orientación longitudinal, latitudinal e incluso en relación con la altura, como en el caso de Jujuy (Argentina). Figura: Clinas determinadas por la altura en Jujuy para varias inserciones Alu. Las comarcas más altas son las que tienen un color más claro en el mapa.

Page 4: CAPÍTULO 5. EL TRATAMIENTO DE DATOS EN ANTROPOGENÉTICA La ley de equilibrio Hardy-Weinberg

Beja-Pereira Beja-Pereira et alet al, 2003, 2003Nat Genet. 35(4):311-3. Nat Genet. 35(4):311-3.

Geografía y genes: mapas sintéticosGeografía y genes: mapas sintéticos

Son mapas geográficos que muestran el área estudiada, sobre la que se representan las variaciones locales de una variable mediante diferencias en altura, diferentes tramas o un gradiente de color. Cada muestra se asigna a un punto en el mapa. A partir de los valores de los diferentes puntos, se realiza una extrapolación para todos los puntos intermedios. Este tipo de representación puede realizarse para las frecuencias de un alelo, los valores propios de un eje en un análisis de escalamiento multidimensional, o cualquier otra variable.En la figura se representan los valores de persistencia de actividad lactasa en Europa.

Page 5: CAPÍTULO 5. EL TRATAMIENTO DE DATOS EN ANTROPOGENÉTICA La ley de equilibrio Hardy-Weinberg

Peña Peña et alet al, 2002, 2002Annals of Human Biology 29:176-191Annals of Human Biology 29:176-191

Geografía y genes: autocorrelación espacialGeografía y genes: autocorrelación espacial

Es la correlación de una variable consigo misma, cuando las observaciones son realizadas en diferentes puntos del espacio. Si la presencia de una cualidad en una parte de un territorio convierte su presencia en las zonas vecinas en más o menos probable, existe un efecto de contigüidad en la estructura espacial y en tal caso el fenómeno muestra una autocorrelación espacial. Entre los diferentes índices que se han desarrollado para estimar el grado de autocorrelación, el más utilizado es el de Moran. Los valores del índice de Moran pueden representarse frente a la distancia dando lugar a una figura denominada correlograma. El patrón esperado de acuerdo al modelo de aislamiento por la distancia es el de una progresiva disminución del índice de Moran en las sucesivas clases de distancia. Puede además estimarse la significación de los valores de autocorrelación, de modo que aunque no es una condición decisiva, el gráfico será más fiable si muestra significación en la mayor parte de sus valores.Figura: Autocorrelación espacial para la persistencia de actividad lactasa en Europa. Los puntos verdes indican significación.

Page 6: CAPÍTULO 5. EL TRATAMIENTO DE DATOS EN ANTROPOGENÉTICA La ley de equilibrio Hardy-Weinberg

Geografía y genes: test de MantelGeografía y genes: test de Mantel

Biondi Biondi et alet al, 2005 , 2005 J Biosoc Sci. 37(2):163-74.J Biosoc Sci. 37(2):163-74.

Límite de la minoría provenzal

Es un método utilizado para la comparación de matrices. Se trata de un coeficiente de correlación específico para datos interdependientes, ya que los valores de una matriz lo son. Puesto que no se conoce su distribución nula, es preciso construir una distribución esperada mediante un proceso de remuestreo.

En este ejemplo, se realizó un test de Mantel para la matriz de distancias geograficas y una matriz de distancias basadas en listas de apellidos en la provincia de Cuneo (Italia). La asociación resultó significativa, de modo que la posición geográfica de las localidades condiciona su patrimonio onomástico y presumiblemente genético, más que su origen étnico, italiano o provenzal. R2 = 0,243; p < 0,0001

Page 7: CAPÍTULO 5. EL TRATAMIENTO DE DATOS EN ANTROPOGENÉTICA La ley de equilibrio Hardy-Weinberg

García-Obregón García-Obregón et alet al, 2012, 2012Hum Immunol. 73(7):720-5Hum Immunol. 73(7):720-5

Geografía y genes: AMOVAGeografía y genes: AMOVA

Análisis molecular de la varianza (AMOVA)Es un método que analiza la heterogeneidad entre varios grupos de poblaciones, descomponiendo la varianza en 3 niveles: individuos dentro de las poblaciones, entre poblaciones dentro de los grupos poblacionales y entre grupos, permitiendo obtener una significación estadística.En la tabla: AMOVA para una serie de poblaciones de Europa, Africa y Asia, a partir de varias inserciones Alu del cromosoma 6.

Page 8: CAPÍTULO 5. EL TRATAMIENTO DE DATOS EN ANTROPOGENÉTICA La ley de equilibrio Hardy-Weinberg

Otros métodos: método del centroideOtros métodos: método del centroide

Gómez-Pérez Gómez-Pérez et alet al, 2011, 2011Am J Hum Biol. 23(6):790-5. Am J Hum Biol. 23(6):790-5.

WaoraniWaorani

Se representa la heterocigosidad observada en cada población frente a la varianza introducida por dicha población al conjunto de poblaciones (ri). Refleja el grado de flujo génico que han experimentado.Las poblaciones que quedan por debajo de la línea han mostrado un flujo génico con otras poblaciones menor de lo esperado. Se deduce porque muestran una menor heterocigosidad para la misma cantidad de variabilidadFigura: Método del centroide para frecuencias alélicas de inserciones Alu en poblaciones amerindias. Los Waorani muestran un intenso aislamiento.

Page 9: CAPÍTULO 5. EL TRATAMIENTO DE DATOS EN ANTROPOGENÉTICA La ley de equilibrio Hardy-Weinberg

Otros métodos: estima del grado de mestizajeOtros métodos: estima del grado de mestizaje

Gómez-Pérez Gómez-Pérez et alet al, 2010, 2010Ann Hum Biol. 37(4):488-500Ann Hum Biol. 37(4):488-500

Mediante el método del centroide es posible conocer la existencia de un flujo génico más o menos intenso. Además, puede estimarse el grado de mestizaje originado por este flujo. Para ello, se debe resolver una ecuación con 2 o 3 incógnitas, en función del número de poblaciones de referencia, mediante métodos iterativos.En la tabla se observan las proporciones estimadas mediante 2 métodos de los componentes europeo, africano y amerindio en 2 grupos de colombianos. Los afrocolombianos, descendientes de esclavos huídos, eran refractarios al mestizaje con europeos. Los mestizos mostraron los 3 componentes.Además, hay métodos para visualizar el mestizaje. En la figura, el triángulo muestra las proporciones de los 3 componentes.

Page 10: CAPÍTULO 5. EL TRATAMIENTO DE DATOS EN ANTROPOGENÉTICA La ley de equilibrio Hardy-Weinberg

Otros métodos: estima del grado de mestizajeOtros métodos: estima del grado de mestizaje

Tishkof Tishkof et alet al. 2009. 2009Science 324:1035-1044 Science 324:1035-1044

El gráfico del programa Structure muestra, para cada individuo, la probabilidad de origen de sus genes, para un número de poblaciones originales preestablecido. En la figura, el número de poblaciones se establece entre 2 y 14. El análisis está basado en 1327 marcadores y 3945 individuos.

Page 11: CAPÍTULO 5. EL TRATAMIENTO DE DATOS EN ANTROPOGENÉTICA La ley de equilibrio Hardy-Weinberg

Otros métodos: redes filogenéticas (Otros métodos: redes filogenéticas (Phylogenetic networks)Phylogenetic networks)

Cardoso Cardoso et alet al, 2008, 2008Forensic Science International: Forensic Science International: Genetics Supplement Series 1:269–270 Genetics Supplement Series 1:269–270

WaoraniWaorani

Es un tipo de gráfico en forma de red que muestra relaciones filogenéticas entre secuencias nucleotídicas, genes, cromosomas o genomas. Generalmente se muestran todos los pasos mutacionales y las frecuencias se representan mediante el diámetro de los círculos.En la figura se muestra un haplogrupo característico de los Waorani (A2-Huao) junto a otros de poblaciones amerindias.

Page 12: CAPÍTULO 5. EL TRATAMIENTO DE DATOS EN ANTROPOGENÉTICA La ley de equilibrio Hardy-Weinberg

Peña Peña et alet al, 2002, 2002Annals of Human Biology Annals of Human Biology 29:176-19129:176-191

Otros métodos: desequilibrio de ligamientoOtros métodos: desequilibrio de ligamiento

Cuando dos marcadores se encuentran muy próximos en un cromosoma pueden encontrarse ligados, de modo que los alelos segregarán conjuntamente en forma de haplotipos. Puede entonces analizarse si los diferentes haplotipos se distribuyen al azar o existe un cierto desequilibrio, de modo que algunos sean más frecuentes de lo que cabría esperar en función de sus frecuencias alélicas. Esto habitualmente será un indicativo de procesos de flujo génico ocurridos en el pasado.No pueden calcularse las frecuencias haplotípicas por conteo, excepto para marcadores del cromosoma Y o el ADNmt ya que no se conocen las combinaciones alélicas específicas de cada individuo. Por ello hay que recurrir a métodos iterativos.Se calcula la frecuencia del haplotipo, su desequilibrio de ligamiento y su significación.En la tabla se muestran los valores del desequilibrio de ligamiento para algunos haplotipos de 3 STRs del cromosoma 6

Page 13: CAPÍTULO 5. EL TRATAMIENTO DE DATOS EN ANTROPOGENÉTICA La ley de equilibrio Hardy-Weinberg

Otros métodos: Genética ForenseOtros métodos: Genética Forense

Probabilidad de coincidencia (pM, Matching probability)Es la probabilidad de que dos individuos tomados al azar tengan el mismo genotipo.Para un locus, la probabilidad es:

donde i y j son todos los posibles alelos y P ij es la frecuencia de cada genotipo (que puede ser 2pq o q2) y se eleva al cuadrado porque ha de ocurrir en uno y otro individuo.

La probabilidad combinada para varios loci es el producto de las probabilidades individuales, asumiendo que no hay ligamiento (pML).

La capacidad de discriminación (Pd, Power of discrimination) es

Page 14: CAPÍTULO 5. EL TRATAMIENTO DE DATOS EN ANTROPOGENÉTICA La ley de equilibrio Hardy-Weinberg

Otros métodos: Genética ForenseOtros métodos: Genética Forense

Capacidad de exclusión (PE, Power of exclusion)Se define como la fracción de individuos que tienen un perfil de ADN que es diferente del portado por un individuo tomado al azar de la población.Para un locus dado será:

donde h es la proporción de heterocigotos y H de homocigotos

y para varios loci (PEt):

Page 15: CAPÍTULO 5. EL TRATAMIENTO DE DATOS EN ANTROPOGENÉTICA La ley de equilibrio Hardy-Weinberg

Otros métodos: Genética ForenseOtros métodos: Genética Forense

En la tabla pueden compararse los valores de PM, PD y PE para un STR y una inserción Alu en la población de Finlandia. Los valores son mucho mejores para el análisis forense en el STR.

Match Power of Power ofprobability discrimination exclusion

Locus PM PD PESTR 0,095 0,905 0,496Alu 0,376 0,624 0,186

Se puede comparar el interés de diferentes marcadores con ForensicMarkers, en la sección de SoftwareSe puede comparar el interés de diferentes marcadores con ForensicMarkers, en la sección de Software

Page 16: CAPÍTULO 5. EL TRATAMIENTO DE DATOS EN ANTROPOGENÉTICA La ley de equilibrio Hardy-Weinberg

Otros métodos: Minería de datosOtros métodos: Minería de datos

Imagen con 560 x 315 SNPs Imagen con 560 x 315 SNPs analizados en una placa analizados en una placa

Resultado de un programa de Resultado de un programa de análisis estadístico de minería análisis estadístico de minería

de datosde datosA partir del desarrollo de técnicas de laboratorio de alto rendimiento (high-throughput), la cantidad de datos que pueden obtenerse en un análisis ha crecido espectacularmente. Aunque los métodos estadísticos para su análisis no son radicalmente diferentes, ha sido preciso adaptarlos a un enorme flujo de datos. Es lo que se conoce como minería de datos.Entre los nuevos conceptos destacan la tasa de descubrimientos falsos, es decir, falsos positivos por la mera acumulación de resultados. Por lo demás, se han adaptado métodos clásicos, como los test T de Student, ANOVA, regresión, cluster, etc.

Page 17: CAPÍTULO 5. EL TRATAMIENTO DE DATOS EN ANTROPOGENÉTICA La ley de equilibrio Hardy-Weinberg

Programas de interés en AntropogenéticaProgramas de interés en Antropogenética

Past (Windows) (http://folk.uio.no/ohammer/past/)Programa estadístico que, entre otras opciones incluye MDS, Factorial de correspondencias, test de Mantel cluster ...

Page 18: CAPÍTULO 5. EL TRATAMIENTO DE DATOS EN ANTROPOGENÉTICA La ley de equilibrio Hardy-Weinberg

Programas de interés en AntropogenéticaProgramas de interés en Antropogenética

GeDis (Windows, MacOSX, Linux) (http://www.ehu.es/~ggppegaj/javain.html)MDS, dendrogramas, clinas, mapas sintéticos.

Page 19: CAPÍTULO 5. EL TRATAMIENTO DE DATOS EN ANTROPOGENÉTICA La ley de equilibrio Hardy-Weinberg

Programas de interés en AntropogenéticaProgramas de interés en Antropogenética

PHYLIP (http://evolution.genetics.washington.edu/phylip.html)Coeficientes de distancia, Neighbour joining, bootstrap ...

Page 20: CAPÍTULO 5. EL TRATAMIENTO DE DATOS EN ANTROPOGENÉTICA La ley de equilibrio Hardy-Weinberg

Programas de interés en AntropogenéticaProgramas de interés en Antropogenética

Arlequin (Windows) (http://cmpg.unibe.ch/software/arlequin3/)Test H-W, AMOVA, Frecuencias haplotípicas y desequilibrio de ligamiento, coeficientes de distancia, Tests de diferenciación interpoblacional

Page 21: CAPÍTULO 5. EL TRATAMIENTO DE DATOS EN ANTROPOGENÉTICA La ley de equilibrio Hardy-Weinberg

Programas de interés en AntropogenéticaProgramas de interés en Antropogenética

Network (Windows) (http://www.fluxus-engineering.com/sharenet.htm)Redes

Page 22: CAPÍTULO 5. EL TRATAMIENTO DE DATOS EN ANTROPOGENÉTICA La ley de equilibrio Hardy-Weinberg

Programas de interés en AntropogenéticaProgramas de interés en Antropogenética

Structure (Linux, Solaris, Mac OSX, Windows) (http://pritch.bsd.uchicago.edu/software/structure2_2.html)Evaluación gráfica del grado de mestizaje