1 détermination de la structure 3d d'une protéine à partir de données de rmn b

1

Détermination de la structure 3D d'une protéine à partir de données de RMN

B.

2

B. Détermination de la structure 3D d'une protéine à partir de données de RMN

I. Contraintes RMN utilisées pour les calculsII. Les méthodes de modélisation moléculaire appliquées aux peptides et

protéinesIII. Evaluation de la qualité des structures

Plan du Cours

A. Principes de la modélisation moléculaireI. GénéralitésII. Représentation empirique de l'énergie moléculaireIII. Les méthodes de calculs empiriques

1. Algorithmes de minimisation d'énergie2. Dynamique moléculaire

3

I.Contraintes RMN utilisées pour les calculs

B.

4

1. Contraintes de distances déduites des NOEs

Intensités des pics NOEs obtenues à partir des spectres NOESY

Intensité NOE (ij)= interactions dipôle-dipôle entre deux protons i et j où d(ij) ≤ 5 Å

ij j

i

ij

ijij= vitesse de relaxation croiséeij= vitesse de relaxation longitudinalei, j = rapports gyromagnétiques des protons i et j

La vitesse de relaxation croisée est reliée à la distance interproton rij par:

ij

0

4

224

10

6c

1 42c2

rij

6

Intensité des pics NOE proportionnelle à

1

rij6

5

1. Contraintes de distances déduites des NOEs

-temps de corrélation (c) moyenné-phénomène de diffusion de spin

Imprécision sur les distances déduites du volume des NOEs

Solutions

2. Contraintes de distances introduites avec une marge d'erreur(20-25%) par rapport aux valeurs déterminées.

d ± d

1. Définition de classes de contraintes

Exemple :

Fort 1.8 -> 2.6 Å Moyen 2.6 -> 3.8 Å Faible 3.8 -> 5.0 Å

Introduction d'intervalles de valeurs possibles [dmin-dmax]

6

2. Contraintes angulaires déduites des constantes de couplage

Différents jeux de coefficients (A, B, C) ont été proposés dans la littérature :

Les coefficients (A = 6.4, B = 1.4 et C = 1.9) proposés par Pardi et al. sont habituellement utilisés pour les peptides et les protéines

7

Imprécision sur la mesure des constantes de couplage

Imprécision sur l'angle de torsion

Solution

Contraintes angulaires introduites sous la forme d'un intervalle d'angles limites déterminés à partir des mesures de constantes de couplage

2. Contraintes angulaires déduites des constantes de couplage

± (°)

J ± J (Hz)

8

Vitesse d'échange 1H/2D des protons amides+ détermination des éléments de structures secondaire

Localisation possible des liaisons H

3. Autres contraintes

a. Liaison Hydrogène

Introduction sous forme de contraintes de distance :

N H O C

dHN-O = 2 Å

dHN-O

dN-O = 3 Å

dN-O

9

Certains programmes ne considèrent pas les ponts disulfure comme une structure covalente

3. Autres contraintes

b. Ponts disulfure

Introduction sous forme de contraintes de distance :

dS-S = 2,1 Å

dS-S

H2C S S CH2

dC1-S2 = dC2-S1 = 3,1 Å

dC1-S2

dC2-S1

10

4. Prise en compte des contraintes RMN

Introduction sous forme de termes énergétiquess'ajoutant à ceux du champ de forces

Lorsque l'intervalle autorisé d'une contrainte n'est pas respecté,augmentation du terme énergétique auquel appartient la contrainte violée

Etotal = Eliés + Enon_liés+ Edistances + EPHI

11


a. Termes énergétiques des contraintes de distances

Potentiel carré ("square")

Utilisation d'un intervalle de distances limites [dmin-dmax] :si dmin < d < dmax

si d < dmin alors d0 = dmin

ou d > dmax alors d0 = dmax

dmin,dmax = limites inférieures et supérieures de l'intervalle de distancede la contrainte imposée

Edistancesquare 0

Edistancesquare kdistance d d0 2

Potentiel carré adouci ("soft-square")

Utilisé lorsque la distance risque d'êtrelargement en-dehors de l'intervalle autorisé

a, b = constantes déterminées automatiquementc = pente du potentiel asymptotiqueen général softexp = 1

Edistancesoft a

b

d d0 soft exp

c d d0

12


b. Termes énergétiques des contraintes angulaires

• Potentiel carré

si intervalle angulaire respecté

si intervalle angulaire non respecté

EPHIsquare0

EPHI

squarekPHI 0 2

13

II.Les méthodes de modélisation

moléculaireappliquées aux peptides et protéines

B.

14

2 grandes familles :

1. Méthodes dites de "géométrie des distances"

Objectif:déterminer rapidement un jeu de structures qui

satisfassent les données expérimentales

2. Méthodes de dynamique sous contraintesObjectifs: optimiser les structures d'une façon plus efficace

Les méthodes de modélisation appliquées aux peptides et protéines

15


Méthodes de géométrie des distances= méthodes permettant de calculer les positions dans l'espace d'un ensemble de pointsà partir d'un jeu de distances mesurées entre ces points

2 types de méthodes :a. Méthode de la matrice métrique (utilisant les coordonnées cartésiennes)b. Méthode de la fonction cible (utilisant les angles dièdres)

16


a. Méthode de la matrice métrique

Problématique

Si on connaît les coordonnées cartésiennes des atomesTrouver l'ensemble des distances= problème solvable

Si on n'a qu'un jeu de distances données (souvent incomplet)Remonter aux coordonnées cartésiennes= problème non trivial

Car pour N atomes: 3N coordonnées et N(N-1)/2 distances

Ex. pour 10 atomes: 30 coordonnées et 45 distances

Pour décrire correctement la structure, il faudrait connaître les 45 distances

algorithme mathématique (algorithme "d'embedding")permettant le passage d'un ensemble de distancesà un objet tridimensionnel représenté en coordonnées cartésiennes

17



Principe

Calcul des valeurs propres de la matrice de distances (matrice métrique)Gij = ri.rj

où ri, rj : vecteurs position des atomes i et j

Un ensemble de distances correspond à un objet tridimensionnelssi la matrice métrique est de rang 3= elle possède 3 valeurs propres non nulles

Théorème fondamental

18



Mise en oeuvre

1ère étape: construction de la matrice de distances

en pratique, on ne dispose pas de toutes les distances entre atomes introduction des informations sur la géométrie covalente:

- longueurs de liaison = distances entre atomes consécutifs- angles de valence = distances entre atomes séparés par 2 liaisons

2ème étape: L'ensemble de ces informations est représenté sous forme de 2 matrices de valeurs possibles :

-Lij : matrice de limites inférieures-Uij : matrice de limites supérieures

pour les distances inconnues, on fixe:- une limite supérieure = 999 Å - une limite inférieure = somme des rayons de van der Waals (1.8 Å)

introduction des distances H…H déduites des NOEs

19



Mise en oeuvre

3ème étape: ajustement des valeurs des matrices ("bond smoothing")

application de principes géométriques (inégalités triangulaires)

4ème étape: construction d'une 3ème matrice par tirage aléatoireentre les bornes des intervalles définis par les 2 matrices précédentes

Lij ≤ Dij ≤ Uij

5ème étape: application de l'algorithme d'"embedding"pour construire la structure tridimensionnelle

plus de 3 valeurs propres non nulles

les 3 valeurs propres les plus élevées sont sélectionnéespour obtenir les coordonnées cartésiennes

distances non exactes

les structures obtenues ne ressemblent que de façon très lointaineà des structures de protéines (violations structurales)

20



Mise en oeuvre

6ème étape: phase d'optimisation

= minimisation d'une fonction cible

E = O si Lij ≤ Dij ≤ Uij

dans le cas contraire

Remarque

plusieurs tirages aléatoires effectués

obtention d'une famille de structures tridimensionnelles

ajout possible de termes supplémentaires-pour tenir compte des informations sur les angles PHI-pour fixer la chiralité des groupements chiraux

E kij Bij

2 Dij2

2

ij

21



Exemples de programmes

DISGEO (Havel, 1984)DSPACE (Nerdal, 1986)EMBED, VEMBED (Kuntz, 1989)DGEOM (Blaney, 1990)DGII (Havel, 1991)XPLOR/DG (Brünger, 1992)

22



Avantage

Inconvénients

permet de calculer rapidement un grand nombre de structuresqui satisfont aux données expérimentales

violations observées= données précises (ex. longueurs de liaison)= données incertaines (contraintes issues de la RMN) imperfections au niveau de la géométrie covalente

inversion locale ou globale du repliement possible pour une partie des structures analyse fine des structures acquisition d'un plus grand nombre de donnéespour trancher entre les 2 familles

1ère génération de logiciels (DSPACE, DGEOM)= biais dans le tirage aléatoire des distances espace conformationnel mal exploré2ème génération de logiciels (DGII, XPLOR/DG)= meilleur échantillonnage de l'espace conformationnel

23


b. Méthode de la fonction cible

Principe

Faire évoluer la structure 3D d'une moléculed'une conformation aléatoire vers une conformation satisfaisant l'ensemble des données RMN

longueurs de liaison, angles de valence, angles plans peptidiques = fixesseuls degrés de liberté = angles dièdres (, , 1, … n)

Mise en oeuvre

1ère étape: tirage aléatoire d'un jeu d'angles dièdres (, , 1, … n)avec possibilité de restriction dans zones de structure secondaire connues(choix de couples (, ) avec valeurs caractéristiques)

24



Mise en oeuvre

•Dij : matrice des distances•Lij : matrice de limites inférieures•Uij : matrice de limites supérieures•Rij : matrice de la somme de van der Waals des atomes i et j

où (x) = 0 si x < 0 et (x) = 1 si x > 0

•2ème étape: calcul d'une fonction cible :

T tient compte- des contraintes issues de la RMN- des rayons de van der Waals

T Dij Uij Lij Dij

i j Lij Dij Rij Dij

i j Rij Dij

25



Mise en oeuvre

•3ème étape: minimisation de la fonction cible

structures respectant à la fois les données de RMN et les contraintes de vdw

= détermination des jeux d'angles dièdres pour avoir des valeurs minimales de T

Lors de la minimisation, contraintes expérimentales introduites progressivement :1. effets intrarésiduels2. effets séquentiels3. effets à longue distance

on construit d'abord les structures locales puis le repliement global

Remarque

ajout possible de termes supplémentairespour tenir compte des informations sur les angles PHI

plusieurs tirages aléatoires effectués

obtention d'une famille de structures tridimensionnelles

26




DISMAN (Braun, 1985)DIANA (Günter, 1991)

Avantage

Inconvénients

permet de calculer rapidement un grand nombre de structuresqui satisfont aux données expérimentaleset dont la géométrie covalente est respectée

méthodes efficacessi jeu de données = grand nombre de contraintes précises de courte distancesinon diminution du % de structures satisfaisantes (structures avec violations)

utilisation d'une géométrie fixe biais dans l'échantillonnage de l'espace conformationnel

27


c. Comparaison des deux méthodes

Avec un même jeu de données, résultats similaires résultat remarquablecar méthodes travaillant dans des directions opposées :

Conclusion

méthodes de matrice métrique= génèrent la structure globalementavec les contraintes prises simultanément

caractéristiques générales des structures obtenuesindépendantes des procédures de calcul

méthodes de fonction cible= construisent la structure localementen intégrant progressivement les effets

28


d. Exemple de structures issues du programme DIANA

29

2. Méthodes de dynamique moléculaire sous contraintes

Principe

Introduction de termes supplémentairesdans la fonction d'énergie potentielle du champ de forcespour prendre en compte les données expérimentales

Apport de ces méthodes

contrainte entre deux atomes= force qui les éloigne ou les rapprochepour que distance les séparant dans l'intervalle déterminé expérimentalement

amélioration de la qualité de l'espace conformationnel défini par le champ de forces= meilleur description des interactions interatomiques(liaisons, angles, vdw, …) amélioration de la distribution des angles dièdres

amélioration de la qualité de l'exploration de l'espace conformationnel rectification possible d'un mauvais repliement

30


Mise en oeuvre

application directe de ces techniques à la détermination de la structure de protéines= approche longue et coûteuse en temps de calcul1. génération d'un premier jeu de structures par les méthodes de géométrie des distances2. raffinement des structures par dynamique moléculaire

méthodes se distinguant par-l'utilisation de différentes températures-le poids relatif géométrie covalente/contraintes expérimentales-la nature du champ de forces utilisé

3 types d'approches :a. dynamique moléculaire à basse t°b. dynamique moléculaire à haute t°c. recuit simulé

31


a. Dynamique moléculaire à basse t°

premières dynamiques moléculaires :T = 300 Kpoids faible des contraintes expérimentales (/géométrie covalente)

dynamiques longues (50 à 100 ps) espace conformationnel mal exploré bonne prise en compte des fluctuations des atomes autour de leur position d'équilibre

32


Protocole en 3 phases:1. chauffage2. équilibration à haute t°

= recherche de la conformation la plus favorable3. refroidissement lent

bons résultats si repliement des structures de départ correct !

b. Dynamique moléculaire à haute t°

Augmentation de la température à T = 600 ou 1000 K= augmentation de Ecinétique des atomesmeilleure exploration de l'espace conformationnelnécessité d'augmenter les constantes de force sur la structure covalente(liaison peptidique)

33


c. Recuit simulé

même principe que précédemment+ fonctions des termes d'énergie simplifiées :

- plus de terme électrostatique- terme de vdw simplifié (terme répulsif) :

si r < rmin

dans le cas contraire

= champ de forces ne décrit plus les forces s'exerçant sur les atomesmais maintient juste la géométrie covalente

Evdw

rep krep r rmin 2

Evdwrep 0

34


c. Recuit simuléExemple de protocole:

temps (ps)0

T(°K)

1000

4 8 12 16 20 24 28 32

Minimisation

Exploration conformationnelle

krep = 0.01 kcal

temps (ps)

Chauffage

0

kNOE

E(kcal)

32

4 8 12 16 20 24 28 32

4

E(kcal)

krep

Augmenta° vdwkrep -> 4 kcal Refroidissement Minimisation

35


c. Recuit simulé

exploration de l'espace conformationnel beaucoup plus poussée

rectification possible d'inversions topologiques

= méthode générale pour le raffinement des structures(RMN ou RX)

36

d. Exemple de structures DIANA raffinées avec X-PLOR


37

III.Evaluation de la qualité des

structures

B.

38

1. Energie intramoléculaire

L'énergie intramoléculaire (ETOT) doit être la plus basse possible(négative, en principe)

Vérifier que Ebond, Eangle et Etorsion sont faibles= géométrie covalente correcte

Exemple:

Energies liées à la géométrie (kcal.mol-1) struc. DIANA struc. X-PLOREliaison

359.6 ± 188.8 10.4 ± 0.6Eangles 157.3 ± 36.5 153.8 ± 4.8Edièdres 378.0 ± 20.8 85.4 ± 3.2Eimpropres 6.02 ± 0.04 2.2 ± 0.2Evdw 103 ± 569.7 -332.6 ± 5.3

(-92.3; 2379.4)Eélec. 0.3 ± 0.25 -0.1 ± 0.3

Energies liées aux contraintes expérimentales (kcal.mol-1)ENOE 3841 ± 697 24.7 ± 4.0EPHI 25.9 ± 11.2 2.0 ± 0.6

39

2. Respect des contraintes expérimentales

Les structures doivent respecter au mieux les contraintes expérimentales

Ne sont conservées que les structures présentant- des violations de distances inférieures à 0.5 Å (voire 0.2 Å)- des violations d'angles inférieures à 10°

par rapport aux intervalles fixés

40

3. Diagramme de Ramachandran

La distribution des couples (PHI, PSI) ne doit pas trop s'écarterdes zones stériques permises

en particulier pour les éléments de structure secondaire bien définis

feuillet

hélice d

Conformations les plus observées

Conformations permises

41

4. Convergence des structures

Calcul de l'écart quadratique moyen(RMSD : Root Mean Square Deviation)

de chaque structurepar rapport à une structure moyenne

Valeur globale de RMSD < 1 Å = bonne convergence des structures

Valeurs faibles de RMSD= bonne structuration du squelette= orientation privilégiée des chaînes latérales

Valeurs élevées de RMSD = régions flexibles ou mal définies

RMSD

xi xmoy 2

N

42

4. Convergence des structures

Exemple :

43

5. Calculs en retour

impossible d'obtenir tous les NOEs erreur sur l'intensité de ces NOEs à cause de

- la diffusion de spin- mouvements de la protéine en solution)

programmes de recalcul du spectre NOESYà partir des distances interprotons mesurées sur la structureen tenant compte

- de la diffusion de spin- d'approximations sur les mouvements de la protéine


CORMA (Keepers, 1984)IRMA (Boelens, 1988)MARDIGRAS (Borgias, 1990)X-PLOR (Brünger, 1990)

comparaison cartes expérimentale/simulée amélioration du jeu de données nouvelle modélisation

1 détermination de la structure 3d d'une protéine à partir de données de rmn b

Documents