1 détermination de la structure 3d d'une protéine à partir de données de rmn b
TRANSCRIPT
1
Détermination de la structure 3D d'une protéine à partir de données de RMN
B.
2
B. Détermination de la structure 3D d'une protéine à partir de données de RMN
I. Contraintes RMN utilisées pour les calculsII. Les méthodes de modélisation moléculaire appliquées aux peptides et
protéinesIII. Evaluation de la qualité des structures
Plan du Cours
A. Principes de la modélisation moléculaireI. GénéralitésII. Représentation empirique de l'énergie moléculaireIII. Les méthodes de calculs empiriques
1. Algorithmes de minimisation d'énergie2. Dynamique moléculaire
3
I.Contraintes RMN utilisées pour les calculs
B.
4
1. Contraintes de distances déduites des NOEs
Intensités des pics NOEs obtenues à partir des spectres NOESY
Intensité NOE (ij)= interactions dipôle-dipôle entre deux protons i et j où d(ij) ≤ 5 Å
ij j
i
ij
ijij= vitesse de relaxation croiséeij= vitesse de relaxation longitudinalei, j = rapports gyromagnétiques des protons i et j
La vitesse de relaxation croisée est reliée à la distance interproton rij par:
ij
0
4
224
10
6c
1 42c2
rij
6
Intensité des pics NOE proportionnelle à
1
rij6
5
1. Contraintes de distances déduites des NOEs
-temps de corrélation (c) moyenné-phénomène de diffusion de spin
Imprécision sur les distances déduites du volume des NOEs
Solutions
2. Contraintes de distances introduites avec une marge d'erreur(20-25%) par rapport aux valeurs déterminées.
d ± d
1. Définition de classes de contraintes
Exemple :
Fort 1.8 -> 2.6 Å Moyen 2.6 -> 3.8 Å Faible 3.8 -> 5.0 Å
Introduction d'intervalles de valeurs possibles [dmin-dmax]
6
2. Contraintes angulaires déduites des constantes de couplage
Différents jeux de coefficients (A, B, C) ont été proposés dans la littérature :
Les coefficients (A = 6.4, B = 1.4 et C = 1.9) proposés par Pardi et al. sont habituellement utilisés pour les peptides et les protéines
7
Imprécision sur la mesure des constantes de couplage
Imprécision sur l'angle de torsion
Solution
Contraintes angulaires introduites sous la forme d'un intervalle d'angles limites déterminés à partir des mesures de constantes de couplage
2. Contraintes angulaires déduites des constantes de couplage
± (°)
J ± J (Hz)
8
Vitesse d'échange 1H/2D des protons amides+ détermination des éléments de structures secondaire
Localisation possible des liaisons H
3. Autres contraintes
a. Liaison Hydrogène
Introduction sous forme de contraintes de distance :
N H O C
dHN-O = 2 Å
dHN-O
dN-O = 3 Å
dN-O
9
Certains programmes ne considèrent pas les ponts disulfure comme une structure covalente
3. Autres contraintes
b. Ponts disulfure
Introduction sous forme de contraintes de distance :
dS-S = 2,1 Å
dS-S
H2C S S CH2
dC1-S2 = dC2-S1 = 3,1 Å
dC1-S2
dC2-S1
10
4. Prise en compte des contraintes RMN
Introduction sous forme de termes énergétiquess'ajoutant à ceux du champ de forces
Lorsque l'intervalle autorisé d'une contrainte n'est pas respecté,augmentation du terme énergétique auquel appartient la contrainte violée
Etotal = Eliés + Enon_liés+ Edistances + EPHI
11
4. Prise en compte des contraintes RMN
a. Termes énergétiques des contraintes de distances
Potentiel carré ("square")
Utilisation d'un intervalle de distances limites [dmin-dmax] :si dmin < d < dmax
si d < dmin alors d0 = dmin
ou d > dmax alors d0 = dmax
dmin,dmax = limites inférieures et supérieures de l'intervalle de distancede la contrainte imposée
Edistancesquare 0
Edistancesquare kdistance d d0 2
Potentiel carré adouci ("soft-square")
Utilisé lorsque la distance risque d'êtrelargement en-dehors de l'intervalle autorisé
a, b = constantes déterminées automatiquementc = pente du potentiel asymptotiqueen général softexp = 1
Edistancesoft a
b
d d0 soft exp
c d d0
12
4. Prise en compte des contraintes RMN
b. Termes énergétiques des contraintes angulaires
• Potentiel carré
si intervalle angulaire respecté
si intervalle angulaire non respecté
EPHIsquare0
EPHI
squarekPHI 0 2
13
II.Les méthodes de modélisation
moléculaireappliquées aux peptides et protéines
B.
14
2 grandes familles :
1. Méthodes dites de "géométrie des distances"
Objectif:déterminer rapidement un jeu de structures qui
satisfassent les données expérimentales
2. Méthodes de dynamique sous contraintesObjectifs: optimiser les structures d'une façon plus efficace
Les méthodes de modélisation appliquées aux peptides et protéines
15
1. Méthodes dites de "géométrie des distances"
Méthodes de géométrie des distances= méthodes permettant de calculer les positions dans l'espace d'un ensemble de pointsà partir d'un jeu de distances mesurées entre ces points
2 types de méthodes :a. Méthode de la matrice métrique (utilisant les coordonnées cartésiennes)b. Méthode de la fonction cible (utilisant les angles dièdres)
16
1. Méthodes dites de "géométrie des distances"
a. Méthode de la matrice métrique
Problématique
Si on connaît les coordonnées cartésiennes des atomesTrouver l'ensemble des distances= problème solvable
Si on n'a qu'un jeu de distances données (souvent incomplet)Remonter aux coordonnées cartésiennes= problème non trivial
Car pour N atomes: 3N coordonnées et N(N-1)/2 distances
Ex. pour 10 atomes: 30 coordonnées et 45 distances
Pour décrire correctement la structure, il faudrait connaître les 45 distances
algorithme mathématique (algorithme "d'embedding")permettant le passage d'un ensemble de distancesà un objet tridimensionnel représenté en coordonnées cartésiennes
17
1. Méthodes dites de "géométrie des distances"
a. Méthode de la matrice métrique
Principe
Calcul des valeurs propres de la matrice de distances (matrice métrique)Gij = ri.rj
où ri, rj : vecteurs position des atomes i et j
Un ensemble de distances correspond à un objet tridimensionnelssi la matrice métrique est de rang 3= elle possède 3 valeurs propres non nulles
Théorème fondamental
18
1. Méthodes dites de "géométrie des distances"
a. Méthode de la matrice métrique
Mise en oeuvre
1ère étape: construction de la matrice de distances
en pratique, on ne dispose pas de toutes les distances entre atomes introduction des informations sur la géométrie covalente:
- longueurs de liaison = distances entre atomes consécutifs- angles de valence = distances entre atomes séparés par 2 liaisons
2ème étape: L'ensemble de ces informations est représenté sous forme de 2 matrices de valeurs possibles :
-Lij : matrice de limites inférieures-Uij : matrice de limites supérieures
pour les distances inconnues, on fixe:- une limite supérieure = 999 Å - une limite inférieure = somme des rayons de van der Waals (1.8 Å)
introduction des distances H…H déduites des NOEs
19
1. Méthodes dites de "géométrie des distances"
a. Méthode de la matrice métrique
Mise en oeuvre
3ème étape: ajustement des valeurs des matrices ("bond smoothing")
application de principes géométriques (inégalités triangulaires)
4ème étape: construction d'une 3ème matrice par tirage aléatoireentre les bornes des intervalles définis par les 2 matrices précédentes
Lij ≤ Dij ≤ Uij
5ème étape: application de l'algorithme d'"embedding"pour construire la structure tridimensionnelle
plus de 3 valeurs propres non nulles
les 3 valeurs propres les plus élevées sont sélectionnéespour obtenir les coordonnées cartésiennes
distances non exactes
les structures obtenues ne ressemblent que de façon très lointaineà des structures de protéines (violations structurales)
20
1. Méthodes dites de "géométrie des distances"
a. Méthode de la matrice métrique
Mise en oeuvre
6ème étape: phase d'optimisation
= minimisation d'une fonction cible
E = O si Lij ≤ Dij ≤ Uij
dans le cas contraire
Remarque
plusieurs tirages aléatoires effectués
obtention d'une famille de structures tridimensionnelles
ajout possible de termes supplémentaires-pour tenir compte des informations sur les angles PHI-pour fixer la chiralité des groupements chiraux
E kij Bij
2 Dij2
2
ij
21
1. Méthodes dites de "géométrie des distances"
a. Méthode de la matrice métrique
Exemples de programmes
DISGEO (Havel, 1984)DSPACE (Nerdal, 1986)EMBED, VEMBED (Kuntz, 1989)DGEOM (Blaney, 1990)DGII (Havel, 1991)XPLOR/DG (Brünger, 1992)
22
1. Méthodes dites de "géométrie des distances"
a. Méthode de la matrice métrique
Avantage
Inconvénients
permet de calculer rapidement un grand nombre de structuresqui satisfont aux données expérimentales
violations observées= données précises (ex. longueurs de liaison)= données incertaines (contraintes issues de la RMN) imperfections au niveau de la géométrie covalente
inversion locale ou globale du repliement possible pour une partie des structures analyse fine des structures acquisition d'un plus grand nombre de donnéespour trancher entre les 2 familles
1ère génération de logiciels (DSPACE, DGEOM)= biais dans le tirage aléatoire des distances espace conformationnel mal exploré2ème génération de logiciels (DGII, XPLOR/DG)= meilleur échantillonnage de l'espace conformationnel
23
1. Méthodes dites de "géométrie des distances"
b. Méthode de la fonction cible
Principe
Faire évoluer la structure 3D d'une moléculed'une conformation aléatoire vers une conformation satisfaisant l'ensemble des données RMN
longueurs de liaison, angles de valence, angles plans peptidiques = fixesseuls degrés de liberté = angles dièdres (, , 1, … n)
Mise en oeuvre
1ère étape: tirage aléatoire d'un jeu d'angles dièdres (, , 1, … n)avec possibilité de restriction dans zones de structure secondaire connues(choix de couples (, ) avec valeurs caractéristiques)
24
1. Méthodes dites de "géométrie des distances"
b. Méthode de la fonction cible
Mise en oeuvre
•Dij : matrice des distances•Lij : matrice de limites inférieures•Uij : matrice de limites supérieures•Rij : matrice de la somme de van der Waals des atomes i et j
où (x) = 0 si x < 0 et (x) = 1 si x > 0
•2ème étape: calcul d'une fonction cible :
T tient compte- des contraintes issues de la RMN- des rayons de van der Waals
T Dij Uij Lij Dij
i j Lij Dij Rij Dij
i j Rij Dij
25
1. Méthodes dites de "géométrie des distances"
b. Méthode de la fonction cible
Mise en oeuvre
•3ème étape: minimisation de la fonction cible
structures respectant à la fois les données de RMN et les contraintes de vdw
= détermination des jeux d'angles dièdres pour avoir des valeurs minimales de T
Lors de la minimisation, contraintes expérimentales introduites progressivement :1. effets intrarésiduels2. effets séquentiels3. effets à longue distance
on construit d'abord les structures locales puis le repliement global
Remarque
ajout possible de termes supplémentairespour tenir compte des informations sur les angles PHI
plusieurs tirages aléatoires effectués
obtention d'une famille de structures tridimensionnelles
26
1. Méthodes dites de "géométrie des distances"
b. Méthode de la fonction cible
Exemples de programmes
DISMAN (Braun, 1985)DIANA (Günter, 1991)
Avantage
Inconvénients
permet de calculer rapidement un grand nombre de structuresqui satisfont aux données expérimentaleset dont la géométrie covalente est respectée
méthodes efficacessi jeu de données = grand nombre de contraintes précises de courte distancesinon diminution du % de structures satisfaisantes (structures avec violations)
utilisation d'une géométrie fixe biais dans l'échantillonnage de l'espace conformationnel
27
1. Méthodes dites de "géométrie des distances"
c. Comparaison des deux méthodes
Avec un même jeu de données, résultats similaires résultat remarquablecar méthodes travaillant dans des directions opposées :
Conclusion
méthodes de matrice métrique= génèrent la structure globalementavec les contraintes prises simultanément
caractéristiques générales des structures obtenuesindépendantes des procédures de calcul
méthodes de fonction cible= construisent la structure localementen intégrant progressivement les effets
28
1. Méthodes dites de "géométrie des distances"
d. Exemple de structures issues du programme DIANA
29
2. Méthodes de dynamique moléculaire sous contraintes
Principe
Introduction de termes supplémentairesdans la fonction d'énergie potentielle du champ de forcespour prendre en compte les données expérimentales
Apport de ces méthodes
contrainte entre deux atomes= force qui les éloigne ou les rapprochepour que distance les séparant dans l'intervalle déterminé expérimentalement
amélioration de la qualité de l'espace conformationnel défini par le champ de forces= meilleur description des interactions interatomiques(liaisons, angles, vdw, …) amélioration de la distribution des angles dièdres
amélioration de la qualité de l'exploration de l'espace conformationnel rectification possible d'un mauvais repliement
30
2. Méthodes de dynamique moléculaire sous contraintes
Mise en oeuvre
application directe de ces techniques à la détermination de la structure de protéines= approche longue et coûteuse en temps de calcul1. génération d'un premier jeu de structures par les méthodes de géométrie des distances2. raffinement des structures par dynamique moléculaire
méthodes se distinguant par-l'utilisation de différentes températures-le poids relatif géométrie covalente/contraintes expérimentales-la nature du champ de forces utilisé
3 types d'approches :a. dynamique moléculaire à basse t°b. dynamique moléculaire à haute t°c. recuit simulé
31
2. Méthodes de dynamique moléculaire sous contraintes
a. Dynamique moléculaire à basse t°
premières dynamiques moléculaires :T = 300 Kpoids faible des contraintes expérimentales (/géométrie covalente)
dynamiques longues (50 à 100 ps) espace conformationnel mal exploré bonne prise en compte des fluctuations des atomes autour de leur position d'équilibre
32
2. Méthodes de dynamique moléculaire sous contraintes
Protocole en 3 phases:1. chauffage2. équilibration à haute t°
= recherche de la conformation la plus favorable3. refroidissement lent
bons résultats si repliement des structures de départ correct !
b. Dynamique moléculaire à haute t°
Augmentation de la température à T = 600 ou 1000 K= augmentation de Ecinétique des atomesmeilleure exploration de l'espace conformationnelnécessité d'augmenter les constantes de force sur la structure covalente(liaison peptidique)
33
2. Méthodes de dynamique moléculaire sous contraintes
c. Recuit simulé
même principe que précédemment+ fonctions des termes d'énergie simplifiées :
- plus de terme électrostatique- terme de vdw simplifié (terme répulsif) :
si r < rmin
dans le cas contraire
= champ de forces ne décrit plus les forces s'exerçant sur les atomesmais maintient juste la géométrie covalente
Evdw
rep krep r rmin 2
Evdwrep 0
34
2. Méthodes de dynamique moléculaire sous contraintes
c. Recuit simuléExemple de protocole:
temps (ps)0
T(°K)
1000
4 8 12 16 20 24 28 32
Minimisation
Exploration conformationnelle
krep = 0.01 kcal
temps (ps)
Chauffage
0
kNOE
E(kcal)
32
4 8 12 16 20 24 28 32
4
E(kcal)
krep
Augmenta° vdwkrep -> 4 kcal Refroidissement Minimisation
35
2. Méthodes de dynamique moléculaire sous contraintes
c. Recuit simulé
exploration de l'espace conformationnel beaucoup plus poussée
rectification possible d'inversions topologiques
= méthode générale pour le raffinement des structures(RMN ou RX)
36
d. Exemple de structures DIANA raffinées avec X-PLOR
2. Méthodes de dynamique moléculaire sous contraintes
37
III.Evaluation de la qualité des
structures
B.
38
1. Energie intramoléculaire
L'énergie intramoléculaire (ETOT) doit être la plus basse possible(négative, en principe)
Vérifier que Ebond, Eangle et Etorsion sont faibles= géométrie covalente correcte
Exemple:
Energies liées à la géométrie (kcal.mol-1) struc. DIANA struc. X-PLOREliaison
359.6 ± 188.8 10.4 ± 0.6Eangles 157.3 ± 36.5 153.8 ± 4.8Edièdres 378.0 ± 20.8 85.4 ± 3.2Eimpropres 6.02 ± 0.04 2.2 ± 0.2Evdw 103 ± 569.7 -332.6 ± 5.3
(-92.3; 2379.4)Eélec. 0.3 ± 0.25 -0.1 ± 0.3
Energies liées aux contraintes expérimentales (kcal.mol-1)ENOE 3841 ± 697 24.7 ± 4.0EPHI 25.9 ± 11.2 2.0 ± 0.6
39
2. Respect des contraintes expérimentales
Les structures doivent respecter au mieux les contraintes expérimentales
Ne sont conservées que les structures présentant- des violations de distances inférieures à 0.5 Å (voire 0.2 Å)- des violations d'angles inférieures à 10°
par rapport aux intervalles fixés
40
3. Diagramme de Ramachandran
La distribution des couples (PHI, PSI) ne doit pas trop s'écarterdes zones stériques permises
en particulier pour les éléments de structure secondaire bien définis
feuillet
hélice d
Conformations les plus observées
Conformations permises
41
4. Convergence des structures
Calcul de l'écart quadratique moyen(RMSD : Root Mean Square Deviation)
de chaque structurepar rapport à une structure moyenne
Valeur globale de RMSD < 1 Å = bonne convergence des structures
Valeurs faibles de RMSD= bonne structuration du squelette= orientation privilégiée des chaînes latérales
Valeurs élevées de RMSD = régions flexibles ou mal définies
RMSD
xi xmoy 2
N
42
4. Convergence des structures
Exemple :
43
5. Calculs en retour
impossible d'obtenir tous les NOEs erreur sur l'intensité de ces NOEs à cause de
- la diffusion de spin- mouvements de la protéine en solution)
programmes de recalcul du spectre NOESYà partir des distances interprotons mesurées sur la structureen tenant compte
- de la diffusion de spin- d'approximations sur les mouvements de la protéine
Exemples de programmes
CORMA (Keepers, 1984)IRMA (Boelens, 1988)MARDIGRAS (Borgias, 1990)X-PLOR (Brünger, 1990)
comparaison cartes expérimentale/simulée amélioration du jeu de données nouvelle modélisation