seleccion de “templates” y alineamiento. energía x nativa

80
SELECCION DE “TEMPLATES” SELECCION DE “TEMPLATES” Y ALINEAMIENTO Y ALINEAMIENTO

Upload: azucena-cortina

Post on 02-Apr-2015

116 views

Category:

Documents


1 download

TRANSCRIPT

Page 1: SELECCION DE “TEMPLATES” Y ALINEAMIENTO. Energía X Nativa

SELECCION DE “TEMPLATES” SELECCION DE “TEMPLATES” Y ALINEAMIENTOY ALINEAMIENTO

Page 2: SELECCION DE “TEMPLATES” Y ALINEAMIENTO. Energía X Nativa

Energía

XNativa

Page 3: SELECCION DE “TEMPLATES” Y ALINEAMIENTO. Energía X Nativa

• Búsqueda homólogos con estructura conocida

• Selección homólogos de interés (miembros más cercanos, criterios adicionales)

• Obtención del alineamiento de la secuencia con los homólogos

• Cálculo del modelo • Contraste del modelo • Experimentación• “Feed-back” con el modelo

Page 4: SELECCION DE “TEMPLATES” Y ALINEAMIENTO. Energía X Nativa

Búsqueda de homólogos de Búsqueda de homólogos de estructura conocidaestructura conocida

Page 5: SELECCION DE “TEMPLATES” Y ALINEAMIENTO. Energía X Nativa

SIMILITUD ENTRE SECUENCIAS

INDICA SIMILITUD ENTRE

ESTRUCTURAS Y FUNCION

Page 6: SELECCION DE “TEMPLATES” Y ALINEAMIENTO. Energía X Nativa

HOMOLOGIA Y COMPARACION DE SECUENCIAS

SIMILITUD ENTRE SECUENCIAS

HOMOLOGIA

(Mismo orígen evolutivo)

Page 7: SELECCION DE “TEMPLATES” Y ALINEAMIENTO. Energía X Nativa

ALINEAMIENTO DE SECUENCIAS

AGGVIIIQVGAGGVL-IQVG

AGGVIIIQVG AGGVLIQVG

Page 8: SELECCION DE “TEMPLATES” Y ALINEAMIENTO. Energía X Nativa

IMPORTANCIA ALINEAMIENTO

• Detección homólogos

• Construcción modelo estructural

Page 9: SELECCION DE “TEMPLATES” Y ALINEAMIENTO. Energía X Nativa

Búsqueda de homólogos

SECUENCIA INCOGNITAATTVG...LMN

BASE DE DATOS DE SECUENCIAS

AGLM...WTKRTCGGLMN..HICGWRKCPGL...

Page 10: SELECCION DE “TEMPLATES” Y ALINEAMIENTO. Energía X Nativa

COMPARACION SECUENCIAS

• Construir alineamiento óptimo

• Puntuar candidato

Page 11: SELECCION DE “TEMPLATES” Y ALINEAMIENTO. Energía X Nativa

COMPARACION DE COMPARACION DE SECUENCIASSECUENCIAS

• HOMOLOGIA ALTA: HOMOLOGIA ALTA:

AWTRRATVHDGLAWTRRATVHDGLMMEDEFAAEDEFAA AWTRRATVHDGLAWTRRATVHDGLCCEDEFAAEDEFAA

• HOMOLOGIA BAJA: HOMOLOGIA BAJA:

AWTAWTRRRRATATAWTAWTKLKLATAVVVATAVVVFEFEGLGLCCEDEEDEWGGWGG

VVHDHDGLGLMMEDEEDEFAAFAA

Page 12: SELECCION DE “TEMPLATES” Y ALINEAMIENTO. Energía X Nativa

Búsqueda de homólogos

• PUNTUACION SECUENCIAS BASE DATOS (Proteínas estructura conocida)

• LOCALIZACION CANDIDATO CON MAYOR PUNTUACION

• PREDICCION FUNCIONAL/ESTRUCTURAL POR ASOCIACION/”HERENCIA”

Page 13: SELECCION DE “TEMPLATES” Y ALINEAMIENTO. Energía X Nativa

PROBLEMAS HABITUALES

• Solo hay familiares remotos:

– BAJA SIMILITUD DE SECUENCIA

– DIFICIL TENER BUENOS ALINEAMIENTOS

Page 14: SELECCION DE “TEMPLATES” Y ALINEAMIENTO. Energía X Nativa

ALINEAMIENTO DE SECUENCIAS

• OBTENER EL ALINEAMIENTO OPTIMO

• NECESARIO: – METODO PARA PUNTUAR AMINOACIDOS

COMPARADOS

– METODO PARA CONSTRUIR LOS ALINEAMIENTOS

Page 15: SELECCION DE “TEMPLATES” Y ALINEAMIENTO. Energía X Nativa

MATRIZ DE IDENTIDADES

A C D ...Y

A 1 0 0 ...0C 0 1 0 ...0 .....Y 0 0 .....1

Page 16: SELECCION DE “TEMPLATES” Y ALINEAMIENTO. Energía X Nativa
Page 17: SELECCION DE “TEMPLATES” Y ALINEAMIENTO. Energía X Nativa

NUMERO TOTAL DE ALINEAMIENTOS

DOS SECUENCIAS DE LONGITUD N Y M:

N + M

N

N = M = 1000 10600

Page 18: SELECCION DE “TEMPLATES” Y ALINEAMIENTO. Energía X Nativa

HERRAMIENTAS BASICAS

• MATRIZ COMPARACION AMINOACIDOS (Dayhoff, 1972)

• ALGORITMOS DE COMPARACION DE SECUENCIAS (Needleman & Wunsch, 1970).

Page 19: SELECCION DE “TEMPLATES” Y ALINEAMIENTO. Energía X Nativa

MATRIZ DE DAYHOFF

log(fij/qi.qj)

PUNTUACION DE LOS AMINOACIDOS ALINEADOS

fij: frecuencia de mutación de residuo i al j

qi, qj: frecuencia de los residuos i, j

Page 20: SELECCION DE “TEMPLATES” Y ALINEAMIENTO. Energía X Nativa

MATRIZ DE DAYHOFF

• REFLEJA LAS PROPIEDADES FISICO-QUIMICAS DE LOS AMINOACIDOS:

propensidades de estructura secundaria

hidrofobicidad

volumen

Page 21: SELECCION DE “TEMPLATES” Y ALINEAMIENTO. Energía X Nativa

MATRICES COMPARACION SECUENCIAS

• BLOSUM62 (Henikoff & Henikoff, 1992): derivada a partir de la comparación bloques de secuencias

• GONNET (Gonnet et al, 1992): alineamiento masivo de secuencias

Page 22: SELECCION DE “TEMPLATES” Y ALINEAMIENTO. Energía X Nativa

ALGORITMO NEEDLEMAN & WUNSCH

R G F QR 1 0 0 0Y 0 0 0 0G 0 1 0 0Q 0 0 0 1

R G F QR 3 1 1 0Y 2 1 1 0G 1 2 1 0Q 0 0 0 1

R_GFQRYG_Q

Page 23: SELECCION DE “TEMPLATES” Y ALINEAMIENTO. Energía X Nativa

GAPS (INSERCIONES/DELECIONES)

• LOCALIZADOS EN LOOPS

Page 24: SELECCION DE “TEMPLATES” Y ALINEAMIENTO. Energía X Nativa

??CandidatoCandidato

Page 25: SELECCION DE “TEMPLATES” Y ALINEAMIENTO. Energía X Nativa

GAPS (INSERCIONES/DELECIONES)

• ESQUEMAS DE PUNTUACION:– DEPENDIENDO DE ESTRUCTURA 2a– VALOR CONSTANTE– FUNCION LINEAL

go + n . gl

Page 26: SELECCION DE “TEMPLATES” Y ALINEAMIENTO. Energía X Nativa

PROGRAMACION DINAMICA

• VENTAJAS: PROPORCIONA UN ALINEAMIENTO REPRODUCIBLE Y OPTIMO

• DESVENTAJAS: ES LENTO

Page 27: SELECCION DE “TEMPLATES” Y ALINEAMIENTO. Energía X Nativa

METODOS SUBOPTIMOS

• 10 – 100 MAS RAPIDOS

• PROPORCIONAN ALINEAMIENTOS SUBOPTIMOS

• BLAST, FASTA

Page 28: SELECCION DE “TEMPLATES” Y ALINEAMIENTO. Energía X Nativa

BLAST

• BLAST (Altschul et al, 1990):

localiza pequeños fragmentos comunes

extenderlos hasta que la puntuación cae

Page 29: SELECCION DE “TEMPLATES” Y ALINEAMIENTO. Energía X Nativa

BLAST

• RAPIDO, segundos EXPLORAR GENBANK, PDB

• FILTROS BAJA COMPLEJIDAD

• INDICES DE FIABILIDAD

Page 30: SELECCION DE “TEMPLATES” Y ALINEAMIENTO. Energía X Nativa

ESTADISTICA

• INDICE DE REFERENCIA:

E: número de falsos positivos esperado

• Búsquedas esporádicas: 0.01 – 0.001

• Búsquedas masivas (anotación genoma) : 10-6

Page 31: SELECCION DE “TEMPLATES” Y ALINEAMIENTO. Energía X Nativa

LIMITES COMPARACION LIMITES COMPARACION SECUENCIASSECUENCIAS

• EXISTENCIA DE PARENTESCOS EXISTENCIA DE PARENTESCOS INDETECTABLESINDETECTABLES

• PREDICCIONES ESTRUCTURALES DE PREDICCIONES ESTRUCTURALES DE BAJA CALIDAD EN MUCHOS CASOSBAJA CALIDAD EN MUCHOS CASOS

Page 32: SELECCION DE “TEMPLATES” Y ALINEAMIENTO. Energía X Nativa

THE TWILIGHT ZONE

• IDENTIDAD INFERIOR AL 25 %

• SIMILITUD ESTRUCTURAL: HOMOLOGIA REMOTA Y ANALOGIA

Page 33: SELECCION DE “TEMPLATES” Y ALINEAMIENTO. Energía X Nativa

THE TWILIGHT ZONE

• HOMOLOGIA REMOTA: ORIGEN EVOLUTIVO COMUN. E.G. HEMOGLOBINAS

• ANALOGIA: CONVERGENCIA ESTRUCTURAL. E.G. HEMOGLOBINA Y COLICINA

Page 34: SELECCION DE “TEMPLATES” Y ALINEAMIENTO. Energía X Nativa
Page 35: SELECCION DE “TEMPLATES” Y ALINEAMIENTO. Energía X Nativa

USO DE ALINEAMIENTOS MULTIPLES

• SIMILITUD BAJA, DOS SECUENCIAS:SIMILITUD BAJA, DOS SECUENCIAS:

AVTTGLNMWTTAKRPGMDDFYTILLPGLMNCIGLFTAIDMHFFGRKPACEEYFTLVVDGLCNCI

• SIMILITUD BAJA, SECUENCIASMULTIPLES:SIMILITUD BAJA, SECUENCIASMULTIPLES:

ALTTGIDMMWTTAKRPPDMDDYYTIIIPGLLMNCIAVTTGLNMMWTTAKRPPGMDDFYTTILLPGLLMNCIGVTTTGLNMMYFTARRPPGLDEFYTTLVLRTLLCMCLGIFTTDIDMMHFYVKKPPGLDEFFTTLVLRTLLCMAA

GIFTTDIDMMHFYVKKPPGLDEFFTTLVLRTLLCMAA

AVTTGLNMMWTTAKRPPGMDDFYTTILLPGLLMNCIGLFTTALNMMHFFGRKPPACEEYFTTLVVDGLLCNCI

Page 36: SELECCION DE “TEMPLATES” Y ALINEAMIENTO. Energía X Nativa
Page 37: SELECCION DE “TEMPLATES” Y ALINEAMIENTO. Energía X Nativa

ALINEAMIENTOS MULTIPLES

• RESIDUOS CONSERVADOS: RELEVANTES PARA FUNCION O ESTRUCTURA

• PUNTUACION PONDERA LA CONSERVACION

Page 38: SELECCION DE “TEMPLATES” Y ALINEAMIENTO. Energía X Nativa

PSI-BLAST

• BUSQUEDA UTILIZANDO ALINEAMIENTOS MULTIPLES:– BUSQUEDA BASE DE DATOS– CONSTRUCCION POSITION-SPECIFIC

SCORE– ITERAR

Page 39: SELECCION DE “TEMPLATES” Y ALINEAMIENTO. Energía X Nativa

PSI-BLAST

• PSI-BLAST NO ENCUENTRA LO QUE NO HAY EN LA PRIMERA BUSQUEDA BLAST

• DEFINIR E PARA LA INCLUSION DE SECUENCIAS (0.01)

Page 40: SELECCION DE “TEMPLATES” Y ALINEAMIENTO. Energía X Nativa

THREADING/FOLD RECOGNITION

• ESTRATEGIA SIMILAR COMPARACION DE SECUENCIAS

• USO BASE DE DATOS ESTRUCTURAL

• DIFERENTE PUNTUACION CANDIDATOS

Page 41: SELECCION DE “TEMPLATES” Y ALINEAMIENTO. Energía X Nativa

ATTWV....PRKSCTATTWV....PRKSCT

..........

10.510.5 5.2>> ..........

CANDIDATO SELECCIONADOCANDIDATO SELECCIONADO

Page 42: SELECCION DE “TEMPLATES” Y ALINEAMIENTO. Energía X Nativa

COMPARACION SECUENCIA-COMPARACION SECUENCIA-ESTRUCTURAESTRUCTURA

• EVALUAR “EL GRADO DE AJUSTE DE LA SECUENCIA A LA ESTRUCTURA”

• UTILIZAR PROPIEDADES DIVERSAS: DISTANCIAS INTERRESIDUO, ESTRUCTURA SECUNDARIA, ETC

Page 43: SELECCION DE “TEMPLATES” Y ALINEAMIENTO. Energía X Nativa

Selección templates: uso Selección templates: uso información adicionalinformación adicional

Proyecto: 2HNQ ....HYTTWPDFGVP...

CANDIDATO: 1YTS ....HVGNWPDQTAV...

Proyecto: 2HNQ .....HCSAGIGRS...

CANDIDATO: 1YTS .....HSRAGVGRT...

................

1YTS, 2HNQ: TIROSINA-FOSFATASA1YTS, 2HNQ: TIROSINA-FOSFATASA

Page 44: SELECCION DE “TEMPLATES” Y ALINEAMIENTO. Energía X Nativa

SELECCION “TEMPLATES”

• Varios candidatos, similitudes bajas (30% - 35 %)

• Bibliografía: sólo SSAO en H.Polymorpha y E.coli con TPQ en orientación correcta (modelos previos erróneos).

Page 45: SELECCION DE “TEMPLATES” Y ALINEAMIENTO. Energía X Nativa

RESTRICCIONES CENTRO ACTIVO

Page 46: SELECCION DE “TEMPLATES” Y ALINEAMIENTO. Energía X Nativa

SELECCION “TEMPLATES”

• Preferible X-ray sobre NMR

• Uso información experimental (e.g. centro activo)

• Preferible sin ligandos unidos, o generar dos modelos

• Vigilar la presencia de contactos en el cristal

• Preferible nativo sobre mutante

Page 47: SELECCION DE “TEMPLATES” Y ALINEAMIENTO. Energía X Nativa

EL ALINEAMIENTO

Page 48: SELECCION DE “TEMPLATES” Y ALINEAMIENTO. Energía X Nativa

ALINEAMIENTOS

• SECUENCIA - CANDIDATO

• Entre candidatos estructurales

Page 49: SELECCION DE “TEMPLATES” Y ALINEAMIENTO. Energía X Nativa

ALINEAMIENTO ENTRE CANDIDATOS

• Alineamientos estructurales, ya disponibles (HOMSTRAD), mediante software (SAP, Taylor & Orengo, 1989).

• Mejor pocos candidatos estructurales, y similares

Page 50: SELECCION DE “TEMPLATES” Y ALINEAMIENTO. Energía X Nativa

ALINEAMIENTO TEMPLATES

Page 51: SELECCION DE “TEMPLATES” Y ALINEAMIENTO. Energía X Nativa

ALINEAMIENTO SECUENCIAS-CANDIDATOS

• Relación entre similitud estructural y % identidad

• Límite inferior del modelado: 30 %

• Porcentaje diseño de fármacos: > 70 %.

Page 52: SELECCION DE “TEMPLATES” Y ALINEAMIENTO. Energía X Nativa

Similitud secuencia - estructura

Rms

% Ident.

Page 53: SELECCION DE “TEMPLATES” Y ALINEAMIENTO. Energía X Nativa
Page 54: SELECCION DE “TEMPLATES” Y ALINEAMIENTO. Energía X Nativa
Page 55: SELECCION DE “TEMPLATES” Y ALINEAMIENTO. Energía X Nativa
Page 56: SELECCION DE “TEMPLATES” Y ALINEAMIENTO. Energía X Nativa
Page 57: SELECCION DE “TEMPLATES” Y ALINEAMIENTO. Energía X Nativa
Page 58: SELECCION DE “TEMPLATES” Y ALINEAMIENTO. Energía X Nativa
Page 59: SELECCION DE “TEMPLATES” Y ALINEAMIENTO. Energía X Nativa
Page 60: SELECCION DE “TEMPLATES” Y ALINEAMIENTO. Energía X Nativa

EL ALINEAMIENTO

• Baja similitud de secuencia => alineamiento baja calidad

• Número de resíduos alineados => limita calidad modelo (NW en GCG vs. BLAST)

Page 61: SELECCION DE “TEMPLATES” Y ALINEAMIENTO. Energía X Nativa

Energía

XNativa

Page 62: SELECCION DE “TEMPLATES” Y ALINEAMIENTO. Energía X Nativa

Energía

XNativa

Page 63: SELECCION DE “TEMPLATES” Y ALINEAMIENTO. Energía X Nativa

Energía

XNativa

Page 64: SELECCION DE “TEMPLATES” Y ALINEAMIENTO. Energía X Nativa

Energía

XNativa

Page 65: SELECCION DE “TEMPLATES” Y ALINEAMIENTO. Energía X Nativa

Energía

X

Nativa

Page 66: SELECCION DE “TEMPLATES” Y ALINEAMIENTO. Energía X Nativa

ALINEAMIENTO Y MODELADO

Nativa

Modelo

Page 67: SELECCION DE “TEMPLATES” Y ALINEAMIENTO. Energía X Nativa

CALIDAD ALINEAMIENTO

• Uso de potenciales fuerza media (PROSA)

• Uso de propiedades composicionales (GCG)

• Análisis de propiedades locales

Page 68: SELECCION DE “TEMPLATES” Y ALINEAMIENTO. Energía X Nativa
Page 69: SELECCION DE “TEMPLATES” Y ALINEAMIENTO. Energía X Nativa
Page 70: SELECCION DE “TEMPLATES” Y ALINEAMIENTO. Energía X Nativa
Page 71: SELECCION DE “TEMPLATES” Y ALINEAMIENTO. Energía X Nativa
Page 72: SELECCION DE “TEMPLATES” Y ALINEAMIENTO. Energía X Nativa

CALIDAD DEL ALINEAMIENTO

• Test globalTest global: comparar la secuencia con N pérmutas (N=1000).

• Calcular el Z-score resultante

• Si (alineamientos 100-200 aas):• Z > 15 Ideal

• 5 < Z <= 15 70 % resíduos core bien alineados

• Z <= 5 Problemáticos

Page 73: SELECCION DE “TEMPLATES” Y ALINEAMIENTO. Energía X Nativa

HHHHH--------HHHHHHHHHH-----HHHHHHHHHHHH-------HH

LYLTIHSDHEGGNVSAHTSHLVGSALSDPYLSFAAAMNGLAGPLHGLAN

LMVKVLDAVRGSPAINVAVHVFRKAADDTWEPFASGKTSESGELHGLTT

EEEEEEE----EE----EEEEEEE-----EEEEEEEE-----EE-----

• Alineamiento: citrate synthase - transthyritin

• Z-score: 7.55

Page 74: SELECCION DE “TEMPLATES” Y ALINEAMIENTO. Energía X Nativa

CALIDAD LOCAL

• Zonas mayor calidad: independientes de pequeños cambios en los parámetros del alineamiento (posible utilizando GCG)

• Zonas de mayor calidad: presentes en los alineamientos subóptimos

Page 75: SELECCION DE “TEMPLATES” Y ALINEAMIENTO. Energía X Nativa

ALINEAMIENTOS SUBOPTIMOS

• Zonas comunes en los alineamientos subóptimos son las más fiables: alinear ALLIM vs. ALLM

Sc. 7 Sc.6

ALLIM ALLIM

ALL-M AL-LM

Page 76: SELECCION DE “TEMPLATES” Y ALINEAMIENTO. Energía X Nativa

Alineamiento localAlineamiento local

Proyecto: 2HNQ ....HYTTWPDFGVP...

CANDIDATO: 1YTS ....HVGNWPDQTAV...

Proyecto: 2HNQ .....HCSAGIGRS...

CANDIDATO: 1YTS .....HSRAGVGRT...

................

1YTS, 2HNQ: TIROSINA-FOSFATASA1YTS, 2HNQ: TIROSINA-FOSFATASA

Page 77: SELECCION DE “TEMPLATES” Y ALINEAMIENTO. Energía X Nativa

ALINEAMIENTO LOCAL

• Presencia de motivos PROSITE

• Adicionalmente: fijar estructura del motivo al construir el modelo.

Page 78: SELECCION DE “TEMPLATES” Y ALINEAMIENTO. Energía X Nativa

ESTRATEGIA

• Utiliar siempre que sea posible:

– Alineamientos estructurales para los templates (vigilar orígen: alineamientos sencillos o múltiples)

– Alineamientos múltiples (e.g. Pfam) para alinear la secuencia a los templates

– Análisis visual

Page 79: SELECCION DE “TEMPLATES” Y ALINEAMIENTO. Energía X Nativa

•Obtener alineamiento Pfam SSAO

•Obtener alineamiento HOMSTRAD 1spu, 1a2v de Pfam

•Eliminar 1spu, 1a2v de Pfam

•Alineamiento Homstrad con Pfam mediante CLUSTALW

ALINEAMIENTO SSAO RATON CON LAS TEMPLATES

Page 80: SELECCION DE “TEMPLATES” Y ALINEAMIENTO. Energía X Nativa

CONCLUSIONES: SENTIDO COMUN !!

• Analizar la calidad de los candidatos: ello decide el límite del modelado y del problema

• Examinar el alineamiento, y eventualmente generar varios modelos (buscar consistencia con datos experimentales)