spectrométrie de masse des peptides et protéines...

Post on 16-Sep-2018

214 Views

Category:

Documents

0 Downloads

Preview:

Click to see full reader

TRANSCRIPT

Spectrométrie de Masse

des

Peptides et Protéines

APPLICATIONS

Identification de protéines

Analyse protéomique

Vérification de séquences de protéines

Vérification de séquence de protéine

• Clivage de la protéine par une (ou des)

endoprotéase(s) spécifique(s)

• Analyse des peptides formés par MALDI-MS,

sans séparation chromatographique préalable

Vérification de séquence de protéine

Exemple : correction de la séquence de

l ’isoleucyl-ARNt synthétase du

colibacille (environ 1100 acides aminés)

Il existe 15 zones de désaccord entre les

deux séquences répertoriées dans la base

SwissProt

Vérification de Séquence

IRS1

IRS2

Peptide trouvé dans le

spectre de masse

Masse en accord avec

la séquence

Analyse détaillée des peptides couvrant les 15 zones de désaccord

Vérification de Séquence

• Pb : la cartographie peptidique à l’aide d’une seule

protéase permet d’obtenir un taux de vérification de

séquence qui varie entre 60 et 90 % environ

• Origine du pb : la discrimination spectrale

Dans un mélange complexe de peptides trypsiques, ce

sont les peptides terminés par Arg (cf pKa) qui répondent

mieux que les peptides terminés par Lys

• L’utilisation combinée de plusieurs protéases spécifiques

permet le plus souvent de résoudre ce problème

Correction de la Séquence de l’IleRS

Strech

number

Sequences a Released peptides

b

Calculated

mass (Da) c

Measured

mass(Da)

Correct

sequence

1 157DFKT-E

161

GLQNWK

143LGV...DFK

159 T

157DFK...WCV

188 D

1978.97

3522.92

1978.91

3522.93

IleRS1 157

DFKTE161

2 197AEVEYYDKTSPSIDVAFQ

214

RKLSITT-LLRPSTLLSR

205TSP...ALK

222 T

189DCR...EYY

202 D

1904.95

1618.70

1905.03

1618.74

IleRS1 197

AEVEYYDKTSPSIDVAFQ214

3 242RRGLC--TAQSL-LHQISTMRWW

263

TP-WTLPANRAISIAPDFDYALV

225FAV...ANR

250 T

251AIS...LAK

274 T

2854.52

2531.37

2854.56

2531.43

IleRS2 242

TPWTLPANRAISIAPDFDYALV263

4 289YTILGTVKGADVELLR

304

-SRH-KRC--GAA--A

284IGV...LLR

304 T

275DLV...TVK

296 K

2233.24

2437.29

2233.30

2437.24

IleRS1 289

YTILGTVKGADVELLR304

5 383V

A

352TAN...LQE

388 E

378AND...QEK

389 K

3858.97

1312.75

3859.10

1312.70

IleRS1 383

V

6 586C

R

587QVL...QGR

600 T

583APY...GRK

601 K

1514.76

2130.11

1514.71

2130.08

IleRS2 586

R

7 636Q

E

622DIL...AVS

640 D

626LWV...LKR

646 T

2127.04

2384.17

2127.02

2384.22

IleRS2 636

E

8 650S

T

649DSY...NGF

668 D 2397.28 2397.31 IleRS1

650S

9 677PE

678

RR

673DMV...LDR

685 T

673DMV...VVL

683 D

1560.77

1289.64

1560.81

1289.67

IleRS1 677

PE678

10 689GCAKAAQEDILKAYEAYDFHEVVQ

712

VVR-RHRKTSSRRTKHTISTKWYK

684DRW...AQE

696 D

697DIL...EAY

705 D

1404.66

1085.54

1404.60

1085.48

IleRS1 689

GCAKAAQEDILKAYEAYDFHEVVQ712

11 723V

G

706DFH...IIK

731 D 3204.56 3204.62 IleRS1

723V

12 736TPKRTVW

742

YA-GHSV

734QYTPKR

739 T

792.43 792.44 IleRS1 736

TPKRTVW742

13 786L

F

781REK...WYE

792 E

771DEV...GLA

798 D

1322.5

3310.57

1322.1

3310.65

IleRS2 786

F

14 829N

K

821VIE...ADK

829 K

828DKK...ALG

855 D

1029.56

2831.53

1029.59

2831.57

IleRS2

829K

15 866GAT-

868

DRRY

856DEL...TVA

870 D

860FVL...VLK

870 T

1591.86

2823.40

1591.83

2823.31

IleRS2 866

GAT868

a : top: IleRS1, bottom IleRS2; numbering refers to the correct sequence; b : corresponding proteases are designated by letters T: trypsin; E : EndoGluC;

D : EndoAspN. K : EndoLysC. c : monoisotopic masses, [M + H]+ ion

Résultat de l’analyse

• Les deux séquences

publiées étaient

fausses

• 9 erreurs dans l’une, 6

erreurs dans l ’autre...

Identification de protéines

Identification de protéine

• Une protéine dont l’activité est caractérisée (dosée) est analysée par électrophorèse 1D en conditions dénaturantes

• La bande de gel correspondant à l’activité connue est excisée, puis soumise à l’action d’une protéase

• Les peptides engendrés par ce clivage sont extraits et analysés par MALDI-MS

Identification de Protéines

Une protéine peut être identifiée par la mesure de masse

(avec une grande exactitude) de plusieurs segments peptidiques

Clivage

protéolytique

in silico et

in vitro

Digest in-gel /Endo Lys C - MALDI

m/z1200 1400 1600 1800

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1.0

1.1

1.2

1.3

1.4

[Abs. Int. *10^ 3]

IMP nucléotidase S. cerevisiae

1479.73

1216.58

Commentaires

• Tous les peptides ne sont pas détectés

Deux raisons :

• non-extraction de certains peptides du gel

• Discrimination en mode MALDI pour des mélanges complexes (les peptides contenant Arg prédominent)

Dans cet exemple, deux signaux ne sont pas assignés à la protéine identifiée

Identification de l ’ORF YOR155c

• 8 pics sur 10 sont attribués => réponse unique

ORF YOR155c ( logiciel d’identification par empreinte peptidique PMF (MS-Fit de Protein Prospector)

• 1 pic analysé en MS/MS => séquence confirmée et réponse unique et identique (logiciel d’identification par ions fragments MS-Tag de Protein Prospector))

• 2 pics non attribués : m/z 1216.58 et 1479.73

Identification de l ’ORF YOR155c

• Pic à m/z 1216.58 : EEWLLPRMoxK

1216.63 calc. voisin du pic EEWLLPRMK

Artefact de l’électrophorèse

• Pic à m/z 1479.73

Hypothèse : excision Met initiatrice suivie d’une acétylation ( m/z 1479.76 calc. en accord) AcSSRYRVEYHLK

Confirmation par analyse des ions de séquence en mode MS/MS pour l’ion 1479.73

Analyse

protéomique

Analyse d’expression différentielle

Comparaison des protéomes entre une lignée

cellulaire de référence et une lignée soumise

à un stress

Aspects fondamentaux et appliqués

Application à diverses pathologies telles que

différentes formes de cancers, diabète, …

Evolution vers une protéomique « clinique »

Cas 1 Cas 2 Cas 3 Cas 4

Tissu

non

tumoral

CHC

Diminution de l’expression dans les CHC

Application : cancer du foie - patients infectés/VHC

Blanc J.F. et al. Proteomics, 2005

Excision du fragment de gel

contenant la / les protéine(s)

Digestion par

une endoprotéase

Extraction

des peptides

Analyse MALDI

Peptides en solution

Analyse protéomique

Recherche dans les

bases de données

Identification

de la protéine

m/z1000 1500 2000 2500 3000

50

100

150

200

250

300

350

400

450

500

550

600

650

[Abs. Int.]

Analyse d’une bande de gel d’électrophorèse

SDS-PAGE (1D)

1500 2000 2500 3000 3500 m/z0,0

0,2

0,4

0,6

0,8

1,0

1,2

9x10Intens.

1611,95

2197,24

1402,72

2706,40

2733,47

3452,48

2496,32

2872,48

1833,98

2013,10

2465,20

,

H

H

H

H

H

H

G

G

G

G

G

G G

G

F

FF

F

FH

Protéome de Saccharomyces cerevisiae

Mesure MALDI-MS -PMF Masse mesurée : 1549,76 (étalonnage externe)

Nombre

d’acides

aminés

Masse

(Da)

Delta

masse

(ppm)

Séquence

Identification

13 1549.77 6.5 VAMESEMDQRILK P36066

13 1549.77 6.5 NTINNYEVMPNLK P03881

14 1549.90 90 RKANIALRGQASHK P48233

Protéome de Saccharomyces cerevisiae

Masse mesurée : 1549,85 (étalonnage interne)

Nombre

d’acides

aminés

Masse

(Da)

Delta

masse

(ppm)

Séquence

Identification

13 1549.77 50 VAMESEMDQRILK P36066

13 1549.77 50 NTINNYEVMPNLK P03881

14 1549.90 30 RKANIALRGQASHK P48233

13 1549.83 13 RTNAENEFVTIKK Kératine

Homo sapiens

10050

2010

1560,77 EC

1611,95 SC0

50

100

150

200

250

nb de réponses

ppm

1560,77 EC

1611,95 SC

Analyse protéomique

Nombre de séquences pouvant correspondre à un peptide

en fonction de l’exactitude de la mesure de masse

SC Saccharomyces cerevisiae EC Escherichia coli

Analyse protéomique

Minimum de 3 peptides pour une empreinte

Nombre de séquences pouvant correspondre à un peptide

en fonction de l’exactitude de la mesure de masse

EC Escherichia coli

10050

2010

3 peptides

1560,77 EC0

20

40

60

80

100

120

140

nb de séquences

ppm

3 peptides

1560,77 EC

Actuellement, les identifications de protéines

sont validées uniquement après identification

de plusieurs séquences au moyen de la

MS/MS

Caractérisation des modifications post-traductionnelles des protéines

Caractérisation de Protéines

Une protéine peut être identifiée sans ambiguïté par la séquence (ordre d’enchaînement) des Acides Aminés (AA) de plusieurs segments peptidiques

La caractérisation complète nécessite la connaissance (atome par atome) de toute la structure primaire de la protéine. Ceci implique notamment les modifications post-traductionnelles (PTM)

Modifications post-traductionnelles

Modifications post-traductionnelles

• Environ 300 recensées actuellement

• Presque tous les acides aminés peuvent être affectés

• L’information sur ces modifications ne peut être obtenue qu’à partir des protéines matures

• Ces modifications ont divers rôles, souvent cruciaux : structuration, régulation de l’activité ou de la durée de vie, sélectivité des interactions protéine-protéine

Modifications post-traductionnelles

Acide aminé

modifié

Nature de la

modification

Rôle possible

N-terminal Acétylation,

alkylation,

pyroglutamylation, …

Protection, durée de

vie

Cys Pont disulfure Structuration,

régulation

Ser, Thr Phosphorylation Régulation

Ser,Thr O-glycosylation interactions

Tyr, Phosphorylation,

sulfatation

Régulation,

interactions

Asn N-glycosylation Interactions, durée

de vie

Pro Hydroxylation Stabilisation

Glu Gamma-carboxylation Interactions/Ca

Glu Polyglutamylation,

polyglycylation

Interactions

Lys Méthylation ?

Incréments de masse apportés par quelques

modifications

Nature Delta masse

Acétylation 42.011

Phosphorylation 79.97

Méthylation 14.016

Hydroxylation, Oxydation Met 15.99

Carboxylation Glu, Asp 43.99

Myristoylation 210.20

Maturation du N-terminal

• Excision de la méthionine initiatrice par la méthionyl-aminopeptidase, conditionnée par la taille du second acide aminé

• Excision pour des résidus de faible taille : Gly, Ala, Ser, …

• Absence d’excision pour des résidus de grande taille : Phe, Trp, Arg, … (environ 40%)

• Ce n’est pas un phénomène de « tout ou rien » pour les résidus de taille intermédiaire

Cas de la stathmine

• La stathmine humaine exprimée chez E. coli

ne migre pas comme la protéine de type

« sauvage » en électrophorèse

• Hypothèse d ’excision de la méthionine et

de non-acétylation, selon la séquence

Humaine Acétyl-Ala-Ser-Ser-Asp-…

Recomb. (Met)-Ala-Ser-Ser-Asp-...

Vérification par mesure de masse en mode MALDI

2+

1+

Référence interne

Cytochrome c

Confirmation de l’hypothèse - Différence d’une charge

expliquant la différence de migration électrophorétique

PHOSPHORYLATION

Phosphorylation

• Modification Post-Traductionnelle (MPT) réversible qui forme les bases des voies de signalisation cellulaire

• Plus de 30% des protéines (protéome eukaryote) sont susceptibles d’être phosphorylées à un moment donné de leur existence

• Compréhension de la régulation de processus cellulaires

• Implications importantes pour comprendre des processus patho-physiologiques (cancers, …)

Phosphorylation

N CH C

CH2

R'

O

O

N CH C

CH

R'

O

CH3

O

N CH C

CH2

R'

O

O

P

O

OHHO P

O

OHHO

P

O

OHHO

R R R

H H H

Serine (S) Threonine (T) Tyrosine (Y)

Modification de la chaîne latérale:

MS : + 80 Da par groupe phosphate (HPO3)

Méthodes d’enrichissement de phosphopeptides

• Chromatographie d’affinité pour des ions métalliques immobilisés (IMAC)

– ZipTip MC (Millipore)

– Phos-Select (Sigma)

– POROS 20 MC (Sigma)

• Chromatographie d’affinité sur support de TiO2

– HyperSep Tip TiO2 (Thermo)

– Phos-Trap (Perkin Elmer)

Phos-Select (Sigma)

m/z800 900 1000 1100 1200 1300 1400 1500 1600 1700 1800 1900 2000 2100 2200 2300 2400

%

0

100

%

0

100

%

0

100

071220_beta saceine_1pmu_PhosSelect_Elution2_acyano 5 (0.552) Cm (5:162) 1: TOF MS LD+ 1.46e32062.8779

1964.8926

1946.88701105.5327977.4609

959.4558876.40201233.5957 1361.6489 1688.75511490.7324 1812.9314

1965.8853

1966.9109

2063.8950

2064.8955

2065.8633

071220_beta saceine_1pmu_PhosSelect_Wash2_acyano 145 (3.126) Cm (6:158) 1: TOF MS LD+ 9201383.8196

1270.7483994.5795830.4612 1137.5840 1272.7383

1384.8167

1385.8416

2151.17481386.8257

1769.98411387.8103 2061.92721964.92502282.2642

071220_beta saceine_1pmu_H2O_acyano 117 (2.624) Cm (5:160) 1: TOF MS LD+ 1.93e41383.8333

1270.74831137.5840994.5911830.4718

1384.8303

1385.8416

2151.1748

2062.89451386.8257

1768.93381387.8376 1729.9478 1964.90891885.0222

2152.1797 2282.2114

2281.2471

2154.20652284.2290

Elution

Lavage

Avant

enrichissement

72

2.84 e3

1.46 e3

Perte d’acide phosphorique lors d’un processus de fragmentation en mode CID

Déphosphorylation -80 Da

Perte de neutre (H3PO4) - 98Da

Confirmation d’une phosphorylation : perte de neutre en MS/MS

CID / ECD et ETD - Peptides

Dans le cas des peptides, les ruptures observées en CID concernent les liaisons peptidiques et les liaisons impliquant les modifications post-traductionnelles (PTM).

La rupture de ces dernières empêche souvent leur localisation précise, notamment pour la phosphorylation, la sulfatation, la O-glycosylation.

La dissociation non-ergodique de type ECD et ETD provoque la rupture aléatoire de liaisons N-Ca, et la formation d’ions de type c et z, laissant les chaînes latérales intactes.

CID ETD

Comparaison d’un mode de fragmentation CID et ETD d’un peptide phosphorylé sur une sérine (ion 3+)

ETD et analyse top-down

L’ETD est également utilisable à partir de protéines entières en raison de sa capacité à fournir des séquences contiguës d’acides aminés sur de long segments à partir des ions c et z (approche top down opposée à une approche bottom up)

Stratégie top-down

Identifier une protéine par sa séquence partielle en partant de la protéine intacte

A D Catherman, OS Skinner, NL Kelleher

Top Down proteomics: Facts and perspectives, BBRC 445 (2014) 683–693

Stratégie top-down

Associe la mesure de masse de la protéine avec une grande exactitude à des analyses d’ions fragments sur la protéine entière.

Ceci peut se pratiquer avec des instruments de type FT-ICR (mode de fragmentation : ECD) et Orbitrap (mode de fragmentation : ETD).

Le séquençage n’est que partiel, mais est suffisant pour l’identification, et l’information sur la localisation des modifications post-traductionnelles peut être obtenue pour les zones séquencées en N- et C-terminal

GLYCOSYLATION

N- et O-glycosylation

N - glycosylation

Mise en évidence de peptide glycosylé

Variabilité de l’état de la glycosylation sur un site

Analyse MALDI de N-glycannes après action de la PNGase F

Modifications post-traductionnelles du facteur IX

Domaine d’activation du

Facteur IX

S P

Glyc

Glyc GlycGlyc

Glyc

Analyse MALDI du peptide d’activation du FIX

A146 T148 Y155 S158 R180

S P

A146 A148 Y155 S158 R180

S P A146 A148 Y155 S158 R180

S P ou

A146 T148 Y155 S158 R180

S P ou

6000

4000

3000

2000

1000

5000

4030 4180 4130 4080

Da

m/z

4019.2

4049.2 4129.3

4099.3

S P

S P

A146 A148 Y155 S158 R180

Analyse en MALDI MS du peptide

d’activation du FIX recombinant

m/z

4019.2

3939.2

4099.2

4304.4

Matrice ATT

Ions négatifs

et

ou

80

160

Modifications post-traductionnelles

Méthodologies

• Phosphorylation : MS/MS et pertes de neutres

+ enrichissement /chromatographie

(Analyse quantitative possible : PhIAT)

• Glycosylation : MS/MS et endoglycosidases

POLY-GLYCYLATION

Une modification particulière : la polyglycylation du

domaine C-terminal de la tubuline sur des résidus Glu

top related