estructuras de proteinas -...

49
Wikimedia Commons by LadyofHats ESTRUCTURAS de PROTEINAS Paolo Maietta Grupo de Biología Computacional Estructural Centro Nacional de Investigaciónes Oncológicas (CNIO) Summer School 2013 Introducción a la Bioinformática Bioinformática estructural Julio 2013

Upload: vunhan

Post on 05-Nov-2018

218 views

Category:

Documents


1 download

TRANSCRIPT

Wikimedia Commons by LadyofHats

ESTRUCTURAS de PROTEINAS

Paolo MaiettaGrupo de Biología Computacional Estructural

Centro Nacional de Investigaciónes Oncológicas (CNIO)

Summer School 2013Introducción a la Bioinformática

Bioinformática estructuralJulio 2013

Estructura de proteínas

Determinación experimental de la estructuraCristalografía de rayos XResonancia magnética nuclear (NMR)Microscopía electrónica 3D

Estructura de proteínas

Determinación experimental de la estructuraCristalografía de rayos XResonancia magnética nuclear (NMR)Microscopía electrónica 3D

• Polímeros de los 20 aminoácidos naturales en conformación L

• Con un número de resíduos típico entre 100 y 300, aunque pueden llegar a más de 1000 (titina, ~34000). Por debajo de 20-30 se les llama péptidos

• La mayoría de las proteínas tiene poca estructura regular, en forma de hojas o fibrilar, y forman forman grandes agregados con misión estructural. Proteínas estructurales (colágeno), pelo, lana, etc...

• La estructura proteica se mantiene por interacciones entre los resíduos que la componen. Enlaces de H, enlaces disulfuro, puentes salinos. La rotura de estas interacciones por calor, cambios de pH, conduce a la desnaturalización

• Aunque hay proteínas que se pliegan con ayuda de chaperonas, es hipótesis generalizada que la mayoría de la información para su estructura 3D se encuentra en la secuencia.

Proteínas

De los aminoácidos ….

Cada aminoácido tiene unas características físico - químicas distintas; Estas influyen en el plegamiento de la proteína

De los aminoácidos ….

Cada aminoácido tiene unas características físico - químicas distintas; Estas influyen en el plegamiento de la proteína

Y además los aminoácidos están conectados entre si en una cadena ….

>Estructura PrimariaASKGEELFTGVVPILVELDGDVNGHKFSVSGEGEGDATYGKLTLKFICTT GKLPVPWPTLVTTFSYGVQCFSRYPDHMKRHDFFKSAMPEGYVQERTIFF KDDGNYKTRAEVKFEGDTLVNRIELKGIDFKEDGNILGHKLEYNYNSHNV YIMADKQKNGIKVNFKIRHNIEDGSVQLADHYQQNTPIGDGPVLLPDNHY LSTQSALSKDPNEKRDHMVLLEFVTAAGITHGMDELYK

… a la Estructura

Gly

Pro

Diagramas de Ramachandran

Matthews/Van HoldeBiochemistry, 2nd edition

α helices

αα

El esqueleto de la proteína adopta una conformación de hélice y en cada giro entran 3.6 residuos.

Los enlaces de hidrógenos entre los grupos carboxilo del residuo n y el grupo amino del residuo n+4 estabilizan la estructura.

Las hélices son flexibles y las cadenas laterales miran hacia fuera.

β strands

αα

ββppββaa

Los β strands se juntan para generar β sheets gracias a la energía de estabilización de los enlaces de hidrógeno entre las diferentes láminas.

Los β sheets pueden contener láminas paralelas, anti-paralelas o una mezcla de ambas.

Más β strands and turns ...

Los β sheets pueden estar plegados o torcidos pero no son flexibles !!

Los β sheets pueden contener láminas paralelas, anti-paralelas o una mezcla de ambas.

Más β strands and turns ...

Los β sheets pueden estar plegados o torcidos pero no son flexibles !!

• Interacciones entre resíduos.

NHC

O

CH

NC

O

CHH(-)

(+)

Interacciones hidrofóbicasPuentes salinos

Enlaces de HEnlaces disulfuro

Estructura terciaria

+

O

C

O

CH- NH3

Interacciones con el disolvente

HydrophobicHydrophilic

Denatured (unfolded) state

Native (ordered, folded) state

Denaturation

Renaturation

!

!!

H-bond

Estructura terciaria

Estructura terciaria

●Un fold es la unidad básica de plegamiento en las proteínas.

●Formados por varias unidades de estructura secundaria dispuestas de una manera característica.

●Cuando en una proteína se presentan varios folds, se habla de dominios estructurales. Con frecuencia, un dominio representa una parte de una proteína con una función característica.

●Los elementos del fold se juntan por interacciones no covalentes, normalmente entre las cadenas laterales.

●Existen bases de datos para la caracterización estructural de proteínas

● SCOP: Clasificación jerárquica hecha manualmente

● CATH: Clasificación automática y supervisada visualmente. Clase, Arquitectura, Topología, Homología

Estructura terciaria

α

β

α/β. Principalmente láminas B paralelas con motivo β-α-β

α+β. Principalmente láminas β antiparalelas, con zonas α y β separadas

trefoil Sandwich β Barril β 4-propellor 8-propellor

Barril α/αsolenoide αhorseshoeUpdownbundle

Orthogonalbundle

Superroll Tim-barrel horseshoe Sandwich−βαβ inmunoglobulin

Clustering jerárquico

βββαββββββββββββββββββββββββββββββββββββββββββββββββα

βββαααααα

αααααααααααααα

ααααααααααα

αααααααααααααααααα

ααααααααααααααα

αααααααααααααααααααααααααααααααααα

Determinación estructura

Estructura de proteínas

Determinación experimental de la estructuraCristalografía de rayos XResonancia magnética nuclear (NMR)Microscopía electrónica 3D

Cristalografia de Rayos X

● Fuente de Rayos X: Ánodo rotatorio. Mejor un sincrotón● Monocromador o espejos de enfoque● Goniómetro para determinar el ángulo de inclinación del cristal.● Detector de área: Usualmente placas fotográficas o dispositivos CCD

● Un pequeño cristal de proteína es expuesto a rayos X.

● Los rayos difractados son recogidos por un detector.

● El resultado del experimento es un patrón de reflexiones de diferente intensidad

● Deben recogerse muchos patrones para cubrir todo el espacio de orientaciones del cristal.

● Tras el procesado de los datos, se acaba con una lista de intensidades en una red tridimensional de índices.

Patrón de difracción

Los rayos X son dispersados por la nube electrónica de los átomos de la proteína. Cuantos más electrones tiene un átomo, más poder de dispersión.

Lo que mide el detector es la intensidad de los factores de

estructura

Cristalografia de Rayos X

● Es la parte crítica del proceso

Subtilisina Calmodulina

Celulasa Toxina del tetanos

Cómo hacer un cristalRight : The hanging drop technique. Center : 24 such hanging drop experiments are set up in a Linbro plate. Right : A kit of different screening solutions, a set-up Linbro plate, dialysis buttons and a micro batch plate behind a goniometer head.

● Los cristales de proteína son frágiles y contienen alrededor de un 50 % de disolvente.● Se comienza con un solución concentrada (2-50 mg/ml) y se añaden agentes precipitantes.● El proceso debe ser lento y con frecuencia hay que probar muchas condiciones.

● Los cristales deben tener decenas de nm. En todas direcciones para ser útiles en difracción.

Cristalografia de Rayos X

Enhebrado de secuencia de la proteína en el mapa de densidad electrónica

Cristalografia de Rayos X

NMR

Ciertos núcleos (1H, 13C, 15N, 31P) tienen momento angular ≠ 0. Bajocampos magnéticos fuertes se puede separar los niveles de energía de núcleos con distinto número de spin (número cuántico magnético).

el spin se va a alinear en relación alcampo, pero la absorción de radiaciónelectromagnética de frecuencia apropiada(radio) induce una transición.

Cuando los núcleos revierten al estado de equilibrio (relajación) emitenuna radiación que puede ser medida. La frecuencia exacta de esta radiación emitida depende del entorno en el que se encuentra el núcleo.

NMR

NMR

NMR vs Rayos X

ME

ME

● Número limitado de imágenes de proyección

● Resolución limitada

● Hay mucho ruido en las imágenes. Translacional y rotacional

Imágenes de

proyección

Algoritmos de reconstrucción

Reconstrucción tridimensional

Especimen original

ME

ME

Protein Data BankEl repositorio de las estructuras 3D

The Protein Data Bank

El wwPDB es un repositorio para estructuras de proteínas y otras macromoleculas biológicas

El wwPDB está constituido por 4 grupos: RCSB, BRMB, PDBe y PDB-Japan. Cada uno ofrece la misma información básica pero con presentación gráfica personalizada y también enlazando a servicios especificos.

The Protein Data Bank

The RCSB Protein Data Bank

The RCSB Protein Data Bank

The RCSB Protein Data Bank

The RCSB Protein Data Bank

The RCSB Protein Data Bank

The RCSB Protein Data Bank

The RCSB Protein Data BankSequence Tab

Uniprot Sequence Cross-reference

Secondary structure

The RCSB Protein Data Bank

The RCSB Protein Data Bank

Header

Chain ID

Journal

The RCSB Protein Data Bank

Atom

Co-ordinates

Residues

Flexibility

Chain ID

http://www.wwpdb.org/docs.html

Documentación de referencia

Bases de Datos basadas en información estructural

Alineamiento estructuralSe define como la superposición de 2 o más estructuras 3D, intentando que cuantos más átomos coincidan

Normalmente los programas tienen en cuenta principalmente de los carbonos alpha

Los alineamientos de estructuras no son alineamientos de secuencias, pero a partir de ellos se pueden obtener

Los alineamientos estructurales además son importantes para comparaciones evolutivas y estudios funcionales

Existen distintos métodos, cada uno basado en ideas distintas.

For example, DALI (contact maps), Mammoth (secondary structure), SSAP (dynamic programming)LGA (longest segment).

FAMILY: Clear evolutionary relationship. Proteins in families are clearly evolutionarily related. Generally the pairwise residue identities are greater than 30%.

SUPERFAMILY: Probable common evolutionary origin. Proteins often have low sequences identities, but structural and functional features suggest a common evolutionary origin.

SCOP (Structural Classification of Proteins)La base de datos proporciona una detallada descripción de las relaciones estructurales entre proteínas. Está curada manualmente.

FOLD: Major structural similarity. Proteins are defined as having a common fold if they have the same secondary structures arrangement and the same topological connections.

The CATH Database

Class: Secondary structure and packing

Topology (FOLD family): overall shape and connectivities.

Homologous superfamily: proteins are thought to share common ancestor. Similarities by sequence alignment and then by structure comparison using the SSAP structural alignment program.

Es la misma idea de SCOP, pero la clasificación es distinta y hay 4 niveles. La clasificación de CATH se lleva a cabo de forma semi-automática

Architecture: overall shape, domain structure and orientation (no connectivities between the secondary structures)

CATH & SCOP statistics

FIN (xFIN)FIN (xFIN)

==

FINFIN22