1
IBQ. Pedro G. Hernández Sánchez
Director de Tesis:
Dr. Christian A. García SepúlvedaLaboratorio de Genómica Viral y Humana
Asesores:
Dra. Othir G. Galicia CruzLaboratorio de Farmacología Analítica
Dr. J. Flavio Martínez MoralesLaboratorio de Farmacología
Facultad de Medicina, UASLP
UASLPFacultad de Medicina
Laboratorio de Genómica Viral y Humana, UASLPDesarrollo de Herramientas
Moleculares e Informáticas para la Identificación de Mutaciones Asociadas
a Farmacorresistencia en HIV-1.
2
Taxonomía
• Virus de RNA monocatenario.• Género Lentivirus, familia Retroviridae• Grupo VI clasificación de Baltimore
3
Taxonomía
• Virus de RNA monocatenario.• Género Lentivirus, familia Retroviridae• Grupo VI clasificación de Baltimore
• HIV-1 parecido al SIV cpz- Grupo M - Main- Grupo O - Outlier- Grupo N – Non-M/O
• HIV-2 parecido a SIVsmm (mangabeye gris).
4
Impacto Mundial
Estadísticas 2008
•33.4 (31.1-35.8) millones de infectados por HIV a nivel mundial.
•2.7 millones de nuevas infecciones.
•2 millones de defunciones asociadas.
5
Impacto Nacional
6
• Genoma total de 9,719 bp.• Tres regiones génicas principales:
– gag – 1502 bp (p17, p24, p7). – pol – 3011 bp (PR, RT, IN).– env – 2750 bp (gp120, gp41).
• Nueve genes: gag, pol, env, tat, rev, nef, vif, vpr, y vpu. • Codificantes para 19 proteínas.• Empleando las tres fases o marcos de lectura disponibles.
Genómica
7
Mutaciones de Resistencia
10, 11, 16, 20, 24, 30, 32, 33, 34, 36, 43, 46, 47, 48, 50, 53, 54, 58, 60, 62, 63, 64, 69, 71, 73, 74, 76, 77, 82, 83, 84, 85, 88, 89, 90, 93 Proteasa
41, 62, 65, 67, 70, 74, 75, 77, 90, 98, 100, 101, 103, 106, 108, 115, 116, 138, 151, 179, 181, 184, 188, 190, 210, 215, 219, 225, 230.
RT
92, 143, 148, 155
Integrasa
8
Proteasa
PDB: 3OXCResolution: 1.16 Å
Unit Cell:
Length [Å] Angles [°] a = 52.10 α = 90.00 b = 59.78 β = 90.00 c = 62.49 γ = 90.00
Flap
Coro
Terminal
Modelo cristalográfico de un dímero de proteasa de HIV-1 ilustrando los dominios en presencia de Saquinavir (SQV).
9
PDB: 3OXCResolution: 1.16 Å
Unit Cell:
Length [Å] Angles [°] a = 52.10 α = 90.00 b = 59.78 β = 90.00 c = 62.49 γ = 90.00
Proteasa
Mapeo de mutaciones mayores y menores descritas en última publicación (International AIDS Society 2010).
Mutaciones mayores, mutaciones menores.
10
Transcriptasa Inversa
PDB: 2WONResolution: 2.80 Å
Unit Cell:
Length [Å] Angles [°] a = 117.49 α = 90.00 b = 154.25 β = 90.00 c = 154.88 γ = 90.00
p51
RNasa H
Conector
PulgarPalma
Dedos Lervisirina
Modelo cristalográfico de una holoenzima de Transcriptasa inversa de HIV-1 ilustrando los dominios de p66, p51 y el inhibidor lervisirina.
11
Transcriptasa Inversa
PDB: 2WONResolution: 2.80 Å
Unit Cell:
Length [Å] Angles [°] a = 117.49 α = 90.00 b = 154.25 β = 90.00 c = 154.88 γ = 90.00
Mutaciones de resistencia a NRTI y a NNRI.
Lervisirina
Mapeo de mutaciones asociadas a resistencia a NRTI’s y NNRTI’s descritas en última publicación (International AIDS Society 2010).
12
Integrasa
PDB: 1K6YResolution: 2.40 Å
Unit Cell:
Length [Å] Angles [°] a = 102.71 α = 90.00 b = 102.71 β = 90.00 c = 280.56 γ = 90.00
N-terminal
Coro catalítico
Modelo cristalográfico de un dímero de integrasa de HIV-1 ilustrando los dominios.
13
Integrasa
PDB: 1K6YResolution: 2.40 Å
Unit Cell:
Length [Å] Angles [°] a = 102.71 α = 90.00 b = 102.71 β = 90.00 c = 280.56 γ = 90.00
Mutaciones asociadas a resistencia a ARV
Mapeo de mutaciones mayores y menores descritas en última publicación (International AIDS Society 2010).
14
• ARVM entre pacientes naïve entre 3-20% para Norteamérica 5 y 15% para Europa (Girardi, 2003).
• En Argentina se ha reportado una prevalencia del 2.4%, mientras que en Brasil es de un 6.3% (Brindeiro et al., 2003; Kijak et al., 2001).
• Pacientes HIV+ tratamiento naïve residentes de la ciudad de Guadalajara, México, con una prevalencia del 16% (Escoto-Delgadillo et al., 2005).
• Estudios realizados en la ciudad de Monterrey, México han reportado una prevalencia de 2.8% para la región codificante para la RT (Valle-Bahena et al., 2006).
• Estudios realizados en pacientes de la ciudad de Tijuana, México, reportan una prevalencia del 2.5% (Viani et al., 2007).
Frecuencia de ARVM’s
15
Propuesta
• Desarrollar herramientas moleculares para la identificación de mutaciones asociadas a resistencia a anti-retrovirales y para la caracterización de su relevancia clínica.
16
1. Desarrollo de las técnicas moleculares que permitan identificar las mutaciones asociadas a resistencia a fármacos ARV en pacientes infectados por HIV.
2. Desarrollo e implementación de herramientas de bioinformática para evaluar la relevancia clínica de las mutaciones asociadas a ARV.
Objetivos Generales
17
Objetivos Específicos
1. Desarrollo de las técnicas moleculares que permitan identificar las mutaciones asociadas a resistencia a fármacos ARV en pacientes infectados por HIV.
1. Técnica molecular para caracterización genómica en DNA proviral.
2. Técnica molecular para caracterización genómica en RNA viral.
3. Técnica de clonación/secuenciación de fragmentos subgenómicos región pol.
2. Desarrollo de herramientas de bioinformática para evaluar la relevancia clínica de las mutaciones asociadas a ARV.
1. Generación, edición y ensamble de contigs de región pol completa.
2. Mapeo molecular de ARVM ya descritas hacia estructuras cristalográficas.
3. Modelaje de ARVM aun no asociadas a resistencias e inferencia de relevancia.
18
MATERIALES Y MÉTODOS
19
Población de Estudio y Muestras
• Sueros obtenidos como parte de nuestra colaboración en el Grupo de Trabajo en HIV de San Luis Potosí (HIV-WG) CAPASITS, LESP, HCIMP.
• Mexican Genomic DNA Collection- HIV Cohort (MGDC-HIV), 270 plasmas y 419 DNA’s individuales.
• Se eligieron 5 muestras con CV ≥ 70,900 cp/ml (determinada por LESP).
• La extracción del RNA se realizó con el kit High Pure Viral RNA de acuerdo a las instrucciones del fabricante (Roche Diagnostics, Mannheim, Alemania).
2085 2253 2550 3870 4230 5096
PR p51 RTp15
RNase p31 IN
Estrategia de Amplificación
Int-FO
Int-FI Int-RI
Int-RO1st PCR: 1046 bp
2nd PCR: 994 bp
RT-RO3RT-FO2 1st PCR: 1416 bpRT-RI3RT-FI2 2nd PCR: 1058 bp
Prot-FO
Prot-FI Prot-RI
Prot-RO1st PCR: 652 bp
2nd PCR: 514 bp
RT-FO3
RT-FI3
RT-RO2
RT-RI2
1st PCR: 1102 bp
2nd PCR: 986 bp
• Acercamiento anidado para la amplificación de cuatro fragmentos subgenómicos que cubran el 100% de la región pol.
• Longitud total de contig de 2986 bp.
21
Síntesis de cDNA y PCR
• Se empleo RT- PCR en dos pasos.
• RT constó de dos pasos separados de éxito probado para amplificación de AN virales.
• Se optimizó la temperatura de desnaturalización de RNA (65º y 95º).
• Se optmizó la temperatura de síntesis de primer cadena (38º y 42º).
• Primer PCR empleo 4 µl de cDNA.
• Se optimizó Tm para 1ra y 2da PCR de cada fragmento.
Condiciones termociclado Fase T °C Tiempo Ciclos
Inicial 94 2 min 1Desnaturalización 94 30 seg
30*Hibridización 53* 45 seg*Elongación 72 1 minElongación final 72 2 min 1
Programa TM (ºC) Tiempo (seg) Num. CiclosProt-1 50 30 25
Prot-2 60 30 30RTa-1 55 45 35RTa-2 51 45 30RTb-1 54 45 35RTb-2 54 45 30Int-1 60 30 30Int-2 50 30 30
Síntesis de cDNATemp. (°C) Tiempo (min) Ciclos
RT-195 2 14 2 1
RT-242 60 195 10 14 5 1
22
Estrategia de Clonación
pGEM-T Easy Vector (Promega Corporation, Wisconsin EUA)
Se amplifica fragmento subgenómico de interés empleando Taq DNA Pol sin capacidad correctiva (para generar A’s terminales).
El empleo de DNA Pol Pfu o Ttl eliminaría adenilación terminal y evitaría ligación.
Por ello se amplificaron fragmentos pequeños versus región pol completa con Long Range PCR.
Permite almacenar clonas con fragmentos subgenómicos para servir de referencia.
Permite eliminar ambiguedades resultantes de la co-amplificación de cuasiespecies virales.
5'- -A-3'3'-A- -5'
Protocolo Genérico de Clonación
Células competentes JM109 (10 μl)
Producto de PCR
Rx VolumenH2O 3.5 μlpGEM-T vector 0.5 μlProd. PCR 0.5 μlT4 DNA ligasa 0.5 μlVf 10 μl
Incubar ½ hrs a RT seguido de 12 hrs a
4ºCProducto de ligación
(3 μl)
Baño de hielo(30 min)
Choque térmico a 42°C (30 seg)
Baño de hielo(2 min)
Incubación 37°C, 1 h en medio LB (250 μl)
100 μl de inóculo
LBbencilpenicilina (100 g/ml)
IPTG (0.5 mM)X-Gal (80 g/ml) 23
Selección fenotípica de colonias con el inserto
(blancas).
24
Extracción del DNA y Secuenciación
• Kit Wizard Genomic DNA Purification (Promega Corporation, Wisconsin EUA) utilizando el protocolo para el aislamiento de DNA genómico de bacterias Gram-negativas.
• Se realizó PCR sobre el DNA extraido para verificar presencia del fragmento subgenómico insertado.
• El producto restante se envió a secuenciar al Laboratorio Nacional de Genómica para la Biodiversidad del CINVESTAV Irapuato (Guanajuato, México) sin purificar.
• Se solicitó secuenciación en dos direcciones y el envio de electroferogramas sin manipular o editar.
Procesamiento y Edición de Secuencias
• Localmente nosotros editamos los electroferogramas con el programa 4Peaks versión 1.7.2 (A. Griekspoor & Tom Groothuis) para elminar ambigüedades y restringir a regiones de alta calidad.
• Las secuencias fueron exportadas como archivos de texto simple y las correspondientes al mismo fragmento subgenómico combinadas empleando la herramienta ClustalW2 (www.ebi.ac.uk/Tools/msa/clustalw2).
• El ensamblaje del contig (combinando los cuatro fragmentos subgenómicos) para cada muestra se realizó con la aplicación HIValign de Los Alamos National Laboratory HIV Database (www.hiv.lanl.gov/content/sequence/HMM/HmmAlign.html).
• Se utilizó la herramienta Alignment Reformatting de James Robinson para ilustrar unanimidad. Esta se encuentra hospedada en nuestro servidor local (www.genomica.uaslp.mx/Herramientas/reformat.html).
• Esta misma herramienta nos permitió realizar la traducción de la secuencia nucleotídica a la aminoacídica.
• Los contigs armados fueron alimentados a la herramienta Quality Control, de Los Alamos National Laboratory HIV Database (www.hiv.lanl.gov/content/sequence/QC/index.html).
• Los contigs de la región pol completa de las cinco muestras fueron enviados a la base de datos GenBank de NCBI.
Procesamiento y Edición de Secuencias
27
Análisis de Homología
• Se basó en comparaciones filogenéticas y métodos de bootscanning de ventana deslizante empleando la herramienta REGA HIV-1 subtyping tool versión 2.0 (dbpartners.stanford.edu/RegaSubtyping/).
• Para los histogramas de soporte estadístico se empleó una ventana de 400 bp con pasos de 50 bp.
• El umbral para la detección de eventos recombinatoriales se fijó en 70% de soporte estadístico (bootscan confidence).
28
Genotipificación de ARVM
• Se utilizó la herramienta HIVdb: Genotypic Resistance Interpretation Algorithm, de la Universidad de Stanford (sierra2.stanford.edu/sierra/servlet/JSierra).
• Esta herramienta nos permitió identificar la presencia de corrimientos del marco de lectura, inserciones/deleciones y la presencia de codones inusuales.
• También permitió evaluar la presencia de mutaciones asociadas a resistencia a inhibidores de PR, RT (NRTI y NNRTI) e IN.
29
Mapeo de ARVM´s
• Se utilizaron modelos cristalográficos obtenidos de Protein Data Bank para PR (3OXC), RT (2WON) e IN (1K6Y).
• Difracción de rayos X de fuente de radiación sincrotrónica a 1.16, 2.8 y 2.4 Å.
• Las estructuras cristalográficas fueron manipuladas y procesadas empleando MacPyMOL.
• Modelos moleculares fueron generados empleando ExPASy.
30
RESULTADOS
RNA vs DNA Clonado
31
PM 1 2 3 4 5 6 7 8
MX-HIV-0395
Prot RTa RTb Int Prot RTa RTb Int
RNA DNA
• Amplicones limpios de tamaño esperado, sin productos de amplificación inespecífica de menor o mayor peso.
• Rendimiento de amplicones depende de cantidad de template inicial (RNA vs DNA).
• Buen rendimiento de productos largos de RNA (RTa 1058).
• Amplicón Prot (el menor) obtenido incluso de muestras de menor CV.
32
Secuenciación
• Se obtuvieron electroferogramas de excelente calidad en ambas direcciones.
33
Ensamblaje de los Contigs
• La longitud promedio después de armar el contig para cada fragmento fue de 475 para Prot, 954 para RTa, 878 para RTb y 895 bp para Int.
• La longitud promedio de los contigs de la región pol completa fue de 2950 bp.
• Los contigs de la región pol completa fueron enviados para su inclusión a GenBank, bajo los siguientes números de accesión: JN157829, JN157835, JN157836, JN157837 y JN157838.
34
Ensamblaje de los Contigs
• Primera vez que se caracteriza la genómica de regiones pol completas de aislados mexicanos.
• Secuencias clonadas disponibles para distribución a otros investigadores/laboratorios.
• Células competentes clonadas capaces de ser empleadas para generar vectores de expresión de las enzimas.
Cobertura
• Se amplificó la región codificante completa de la región pol, parte de la región de deslizamiento ribosomal y parte de la región Vif.
35
Inserciones/deleciones
• Inserción de tripletes identificada en la región de deslizamiento ribosomal que permite transicionar de gag a pol.
• No presentes en ningún otra región.
2,198 2,199
2,240 2,241
2,220
36
37
Localización de las ARVM de PR
• 19 residuos polimórficos en PR, 19.2% de los residuos totales de la proteína
• El 52.6% (n=10) de dichas substituciones no-sinónimas se concentraron en el dominio de coro, 10.5% (n=2) en el dominio terminal y 36.8% (n=7) en el dominio del flap.
Flap
Coro
Terminal
38
Localización de las ARVM de RT
• En RT se encontraron 72 residuos polimórficos.
• Esto corresponde a 12.8% de los codones totales que conforman a la proteína.
p51
RNasa H
Conector
PulgarPalma
Dedos Lervisirina
• 29.2% se concentraron en el dominio de RNasa H (n=21), 26.4% en el conector (n=19), 16.7% en el la palma (n=12), 15.3% en el pulgar (n=11) y 12.5% en el de dedos de la RT (n=9)
39
Localización de las ARVM de IN
• Para IN se identificó la presencia de 36 residuos polimórficos (substituciones no-sinónimas).
• Corresponden al 12.4% de los codones totales de la proteína.
N-terminal
Coro catalítico
• El 50% de los residuos polimórficos se ubicaron en el coro catalítico de la IN, 27.8% y 22.2% se localizaron en los dominios Amino- y Carboxy-terminales, respectivamente.
40
Codones de Paro
• Para PR se localizó un codón de paro en la muestra MX-HIV-0422 en la región del flap de PR (residuo 43).
• En RT se localizó un codón de paro prematuro en la posición 383 de la muestra MX-HIV-0401.
41
Codones de Paro
• En IN se detectó la presencia de dos codones de paro prematuros en la región del dominio C-terminal en las posiciones 252 y 221 de las muestras MX-HIV-0327 y MX-HIV-0422, respectivamente.
42
Análisis de Homología
• Nuestras secuencias demostraron ser más similares a las de subtipos B en el análisis de fragmento completo (BLAST).
• El análisis de homología proteica realizado para cada enzima por separado demostró una similaridad de:
– 93.82% para las PR (desde 92.3% hasta 94.6%)– 94.38% para las RT (desde 93.3% hasta 95.2%)– 95.44% para las IN (desde 94.7% hasta 95.9%)
• No obstante, también se demostró la presencia de zonas dentro de la región pol con menor homología para con subtipos B y más parecidas a otros subtipos.
43
Eventos de Recombinación
• Ventajas de estrategia de ventana desplazante.
• Evidencia de eventos recombinatoriales ancestrales.
• Información sobre evolución de cepas nacionales.
• Información de soporte estadístico.
• Mapeo de regiones de acuerdo a homología.
44
Mutaciones de Resistencia
• En los cinco aislados clínicos se detectaron 118 mutaciones, 19 en las secuencias de la PR y 99 en las de la RT.
• En PR se detectaron cuatro mutaciones menores asociadas a resistencia a ARV (L10I, G48R, A71T, I84T) y 15 mutaciones no asociadas a resistencia.
• En RT se encontraron 4 mutaciones asociadas a resistencia (M41L, K103N, T215D, T215A) y 95 no asociadas.
• Ningún aislado clínico presentó ARVM de relevancia clínica con relación a inhibidores de IN.
45
Mapeo Cristalográfico de ARVM’s
• G48R es una mutación inusual para esta posición. • A71T es un polimorfismo común a 2-3% de las personas no tratadas pero
cuya frecuencia se incrementa en pacientes que reciben inhibidores de la proteasa.
• I84T es una mutación muy inusual en esta posición.
46
Mapeo Cristalográfico de ARVM’s
• M41L concurre con T215Y y juntas confieren resistencia de nivel intermedio a nivel alto al zidovidina y stavudina al igual que resistencia de bajo nivel a didanosina, abacavir y tenofovir.
• T215D son transiciones entre mutaciones Y y F y wild-type. La mayoría no reducen la susceptibilidad a NRTI’s pero su presencia pudiera sugerir la presencia concurrente de T215Y o F.
47
Mapeo Cristalográfico de ARVM’s
• K103N ocasiona resistencia de alto nivel a nevirapina, delavirina y a efavirenz.
48
• Además de mapear la presencia de ARVM’s ya asociadas a resistencia, el mapeo, mutagénesis in silico y modelaje molecular permiten analizar el impacto de otras mutaciones
– Cambios de estructura de residuos– Cambios de propiedades físicoquímicas (polaridad, electronegatividad, fobicidad, etc).– Proximidad a sitios catalíticos, antigénicos o de relevancia funcional para la dimerización.– Proximidad a lugar de acomplamiento de inhibidores.
Modelaje Cristalográfico de ARVM’s
49
Reporte de las Mutaciones
• Primeros reportes de ARVM ya entregados al HIV-WG de San Luis Potosí.
• Información ha sido acomplada a expedientes de pacientes.
• Grandes expectativas de parte de participantes, en particular de parte del CAPASITS San Luis Potosí.
• Pendiente la referencia de muestras de dos pacientes de Cd. Valles en falla terapéutica con muy mal comportamiento virológico.
50
Reporte de las Mutaciones
• Primeros reportes de ARVM ya entregados al HIV-WG de San Luis Potosí.
• Información ha sido acomplada a expedientes de pacientes.
• Grandes expectativas de parte de participantes, en particular de parte del CAPASITS San Luis Potosí.
• Pendiente la referencia de muestras de dos pacientes de Cd. Valles en falla terapéutica con muy mal comportamiento virológico.
51
Reporte de las Mutaciones
• Primeros reportes de ARVM ya entregados al HIV-WG de San Luis Potosí.
• Información ha sido acomplada a expedientes de pacientes.
• Grandes expectativas de parte de participantes, en particular de parte del CAPASITS San Luis Potosí.
• Pendiente la referencia de muestras de dos pacientes de Cd. Valles en falla terapéutica con muy mal comportamiento virológico.
52
DISCUSIÓN
53
RNA Viral
• Se optó por utilizar RNA ya que éste representa mejor a las cuasiespecies de mayor replicación en en el hospedero humano.
• Se ha comprobado que en el RNA viral se refleja más rapidamente el surgimiento de ARVM en comparación al DNA proviral integrado (Bi et al., 2003; Devereux et al., 2000; Quan et al., 2008).
• Optimizamos técnica para muestras con CV ≈70,000 cp/ml a pesar de que los individuos se consideran en falla terapéutica en presencia de CV ≥ 1,000 cp/ml (Dagnra et al.; Orrell et al.).
• No obstante, en la práctica la mayor parte de los pacientes con HIV sujetos a tratamiento ARV de la cohorte de estudio bajo seguimiento por HIV-WG suelen presentar CV ≥ 100,000 cp/ml.
54
Inserciones/deleciones
• La presencia sólo de inserciones y deleciones en la región de deslizamiento ribosomal, nos indica que es una región sujeta a una menor presión selectiva.
• En regiones como PR, RT o IN cambios de este tipo podrían afectar la actividad catalítica de las enzimas y por consiguiente el fitness viral (Bleiber et al., 2004; Ishima et al., 2001; Villena et al., 2007).
55
Localización de las ARVM’s
• Menos de la mitad de las mutaciones encontradas fueron no-sinónimas (44.2% para PR, 32.6% para RT y 34.6 para IN).
• Para PR e IN se identificaron más mutaciones no-sinónimas en los sitios activos de las enzimas (en el dominio de coro en PR y en IN en el coro catalítico).
Flap
Coro
Terminal
• En el caso de PR, esto se explica por una mayor presión selectiva inducida por el tratamiento ARV (Boden and Markowitz, 1998).
56
Posición de las Mutaciones
• En los dominios de dedos, pulgar y palma de la RT se encontro menor cantidad de mutaciones no-sinónimas versus RNasa H.
• El dominio RNasa H fue el que más mutaciones no-sinónimas presentó.
p51
RNAsa H
Conector
PulgarPalma
Dedos Lervisirina
• Algunos estudios indican que el dominio RNasa H está involucrado en la resistencia a los NRTI (Nikolenko et al., 2005; Santos et al., 2008).
57
Conclusiones
• Se desarrollo la capacidad de inferir la relevancia clínica de mutaciones
aun no caracterizadas.
• Se generó una colección de plásmidos, bacterias transformadas y
partículas virales bien caracterizadas (tanto genómica como clínicamente).
• Sienta las bases para la realización de proyectos de caracterización
genómica y epidemiología molecular de mayor escala.
• Complementa el arsenal de ensayos moleculares disponibles en el LGVH y
permite el manejo integral de pacientes del sector público.
58
Conclusiones
• Estas herramientas tienen como finalidad ser un respaldo en la elección
del tratamiento ARV más adecuado para el paciente, al identificar las
mutaciones que presente que puedan conferir resistencia al tratamiento y
por consiguiente disminuir su eficacia.
• Este proyecto se convirtió en el primero del LGVH en transferir los
beneficios de la era posgenómica a pacientes del sector público.
• Se adoptó y cumplió con la responsabilidad de responder a una demanda
sanitaria impuesta por restricciones económicas del sector público.
• Se desarrollaron herramientas robustas, económicas y de punta
tecnológica para detectar ARVM de conocida relevancia clínica.
59
Agradecimientos
• A mi familia.
• A mis amigos (compañeros de maestría y del laboratorio).
• Y a CONACYT por la Beca otorgada.
60