génopôle rhône-alpes - plate-forme de protéomique

26
Activités Rhône-Alpes Genopole / bioinformatique Rhône-Alpes Genopole Génopôle Rhône-Alpes - Plate-forme de protéomique Estelle Nugues HELIX – INRIA Christophe Bruley CP – CEA 22 octobre 2003

Upload: gage-bauer

Post on 03-Jan-2016

24 views

Category:

Documents


0 download

DESCRIPTION

Génopôle Rhône-Alpes - Plate-forme de protéomique. Estelle Nugues HELIX – INRIA Christophe Bruley CP – CEA 22 octobre 2003. Plate-forme de protéomique. Composition CP (CEA): Emmanuelle Mouton (01/2002  07/2003) Romain Cahuzac (10/2002  06/2004) Gilles André (03/2003  02/2004) - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: Génopôle Rhône-Alpes - Plate-forme de protéomique

Activités Rhône-Alpes Genopole / bioinformatique

Rhône-Alpes

Genopole

Génopôle Rhône-Alpes-

Plate-forme de protéomique

Estelle NuguesHELIX – INRIA

Christophe BruleyCP – CEA

22 octobre 2003

Page 2: Génopôle Rhône-Alpes - Plate-forme de protéomique

Activités Rhône-Alpes Genopole / bioinformatique

Rhône-Alpes

GenopolePlate-forme de protéomique

• Composition– CP (CEA):

• Emmanuelle Mouton (01/2002 07/2003)• Romain Cahuzac (10/2002 06/2004)• Gilles André (03/2003 02/2004)• Christophe Bruley (05/2003)• Marianne Tardif (10/2002)

– HELIX (INRIA) :• Erwan Reguer (11/2001 11/2003)• Estelle Nugues (04/2002 11/2003)• Walid Dib (12/2002 09/2003)

Page 3: Génopôle Rhône-Alpes - Plate-forme de protéomique

Activités Rhône-Alpes Genopole / bioinformatique

Rhône-Alpes

GenopolePlate-forme de protéomique

• Activité : acquisition et traitement des données de protéomique

échantillon Identificationde protéines

échantillonpréparé

spectrebrut

spectreinterprété

résultatbrut

élec

troph

orès

e

prép

arat

ion

anal

yse

MS

inte

rpré

tatio

n

iden

tific

atio

n

valid

atio

n

Page 4: Génopôle Rhône-Alpes - Plate-forme de protéomique

Activités Rhône-Alpes Genopole / bioinformatique

Rhône-Alpes

Genopole

Identification

• Mise en place d’un serveur MASCOT au sein du laboratoire

• E. Mouton• Janvier 2002

échantillon Identificationde protéines

échantillonpréparé

spectrebrut

spectreinterprété

résultatbrut

élec

troph

orès

e

prép

arat

ion

anal

yse

MS

inte

rpré

tatio

n

iden

tific

atio

n

valid

atio

n

Page 5: Génopôle Rhône-Alpes - Plate-forme de protéomique

Activités Rhône-Alpes Genopole / bioinformatique

Rhône-Alpes

Genopole

Stockage et Archivage

échantillon Identificationde protéines

échantillonpréparé

spectrebrut

spectreinterprété

résultatbrut

élec

troph

orès

e

prép

arat

ion

anal

yse

MS

inte

rpré

tatio

n

iden

tific

atio

n

valid

atio

n

• Volumétrie des données générées :– De 50 à 100 Go par semaine

• E. Mouton• Mai 2002 : rédaction cahier des charges Jan. 2004 : installation du SAN

Réseau de stockage (SAN) ~ 3 To

Page 6: Génopôle Rhône-Alpes - Plate-forme de protéomique

Activités Rhône-Alpes Genopole / bioinformatique

Rhône-Alpes

GenopoleAide à la validation de résultats

• Filtrage des feuilles de résultats MASCOT– Validation automatique de certains résultats– Génération feuilles de résumé d’analyse

• G. André• Mai 2003

échantillon Identificationde protéines

échantillonpréparé

spectrebrut

spectreinterprété

résultatbrut

élec

troph

orès

e

prép

arat

ion

anal

yse

MS

inte

rpré

tatio

n

iden

tific

atio

n

valid

atio

n

Page 7: Génopôle Rhône-Alpes - Plate-forme de protéomique

Activités Rhône-Alpes Genopole / bioinformatique

Rhône-Alpes

Genopole

Qualification des spectres

• Outil de qualification des spectres MS/MS en amont de l’identification

• G. André• Juin 2003

échantillon Identificationde protéines

échantillonpréparé

spectrebrut

spectreinterprété

résultatbrut

élec

troph

orès

e

prép

arat

ion

anal

yse

MS

inte

rpré

tatio

n

iden

tific

atio

n

valid

atio

n

Page 8: Génopôle Rhône-Alpes - Plate-forme de protéomique

Activités Rhône-Alpes Genopole / bioinformatique

Rhône-Alpes

Genopole

Gestion des données

• Gestion de l’ensemble des données relatives aux analyses réalisées sur la plate-forme : – Conception d’un modèle des données relationnel– Évaluation de LIMS commerciaux– Évaluation de technologies pour le développement d’un

système d’information adapté

• E. Mouton, W. Dib, G. André, C. Bruley• Déc. 2002

échantillon Identificationde protéines

échantillonpréparé

spectrebrut

spectreinterprété

résultatbrut

élec

troph

orès

e

prép

arat

ion

anal

yse

MS

inte

rpré

tatio

n

iden

tific

atio

n

valid

atio

n

Page 9: Génopôle Rhône-Alpes - Plate-forme de protéomique

Activités Rhône-Alpes Genopole / bioinformatique

Rhône-Alpes

Genopole

Taggor - PepMap

• Outils pour l’annotation de génome par l’analyse protéomique

• Collaboration INRIA – CEA - Génome express E. Reguer, E. Nugues, R. Cahuzac• Juin 2000

échantillon Identificationde protéines

échantillonpréparé

spectrebrut

spectreinterprété

résultatbrut

élec

troph

orès

e

prép

arat

ion

anal

yse

MS

inte

rpré

tatio

n

iden

tific

atio

n

valid

atio

n

Page 10: Génopôle Rhône-Alpes - Plate-forme de protéomique

Activités Rhône-Alpes Genopole / bioinformatique

Rhône-Alpes

GenopoleSpectrométrie de masse MS/MS

échantillon Identificationde protéines

échantillonpréparé

spectrebrut

spectreinterprété

résultatbrut

élec

troph

orès

e

prép

arat

ion

anal

yse

MS

inte

rpré

tatio

n

iden

tific

atio

n

valid

atio

n

Echantillon à analyser

Préparation + Digestion des protéines

par une enzyme (trypsine)

Fragments trypsiques Spectres de

masse

Analyse spectrométrique

Identification des protéines

Page 11: Génopôle Rhône-Alpes - Plate-forme de protéomique

Activités Rhône-Alpes Genopole / bioinformatique

Rhône-Alpes

Genopole

Spectre MS/MS

GLLG LAP

100 200 300 400 500 600 700 800 900 1000 m/z0

100

%

200.17

86.11

228.17

285.19

301.23372.29398.30

485.39

970.71

800.56687.46

913.65

[M+H]+

HN CH C HN CH C HN CH C

R

O O O

OH

R R

Sens de lecture

Fragmentation au niveau des liaisons peptidiques

[SG]

Page 12: Génopôle Rhône-Alpes - Plate-forme de protéomique

Activités Rhône-Alpes Genopole / bioinformatique

Rhône-Alpes

Genopole« Peptide Sequence Tag » ou étiquette peptidique

Un court fragment peptidique

Deux masses flanquantes de séquence inconnue

PEPTIDESEQUENCETAG

W M P

P M W ? ?

100 200 300 400 500 600 700 800 900 10000

100

%

554.33

685.37

871.46

1000.49

438.2 Da129.1Da

Page 13: Génopôle Rhône-Alpes - Plate-forme de protéomique

Activités Rhône-Alpes Genopole / bioinformatique

Rhône-Alpes

Genopole

Problématique

Séquences protéiques

Spectresthéoriques

MS/MS in silico

Comparaison de spectres

MascotInterprétation partielle

PSTIdentification de protéines

Recherchegénomique

Séquences génomiques

in silico

Page 14: Génopôle Rhône-Alpes - Plate-forme de protéomique

Activités Rhône-Alpes Genopole / bioinformatique

Rhône-Alpes

Genopole

Identification de protéines

« Mapping » d’un PST sur une séquence protéique

675 916ESV

Séquences protéiques

Protéine 1

Protéine 2

Protéine 3

Protéine N…

Identification de protéines

...LSEAKISVTSTAESVTASLTDAEKTVNQTAR...

Page 15: Génopôle Rhône-Alpes - Plate-forme de protéomique

Activités Rhône-Alpes Genopole / bioinformatique

Rhône-Alpes

Genopole

Localisation de gènes

Chromosometraduit EXON EXON

Cluster

EXON EXONIntronGene

(Eucaryotes)Match complet Match partiel

« Mapping » de PSTs sur une séquence génomique traduite

Localisation de gène (« Clustering »)

EXON Intron

Chromosometraduit

Page 16: Génopôle Rhône-Alpes - Plate-forme de protéomique

Activités Rhône-Alpes Genopole / bioinformatique

Rhône-Alpes

Genopole

Validation

• Trouver un jeu de données

• Trouver les banques de données

• Prouver l’efficacité de Taggor-PepMap en le comparant à un logiciel de référence

• Définir les paramètres optimaux des logiciels utilisés

• Tester la localisation génomique

Page 17: Génopôle Rhône-Alpes - Plate-forme de protéomique

Activités Rhône-Alpes Genopole / bioinformatique

Rhône-Alpes

GenopoleJeu de données expérimentales

Enveloppe de chloroplaste d’ Arabidopsis thaliana

(Laboratoire de Chimie des Protéines du CEA Grenoble)

plante cellule chloroplasteProtéines

membranaires

Page 18: Génopôle Rhône-Alpes - Plate-forme de protéomique

Activités Rhône-Alpes Genopole / bioinformatique

Rhône-Alpes

GenopoleDonnées MS/MS:

1300 spectres

A

B

C

D

Qualité A Qualité B

Qualité C Qualité D

Expertise humaine

Page 19: Génopôle Rhône-Alpes - Plate-forme de protéomique

Activités Rhône-Alpes Genopole / bioinformatique

Rhône-Alpes

Genopole

Banques de données

Séquences protéiques

Séquences génomiques

?

Page 20: Génopôle Rhône-Alpes - Plate-forme de protéomique

Activités Rhône-Alpes Genopole / bioinformatique

Rhône-Alpes

Genopole

Séquences protéiques

Spectresthéoriques

Interprétation partielle

PST

Identification protéique

MS/MS in silico

Comparaison de spectres

Evaluation des performances de l’identification de protéines

Protocole

Mascot

Page 21: Génopôle Rhône-Alpes - Plate-forme de protéomique

Activités Rhône-Alpes Genopole / bioinformatique

Rhône-Alpes

Genopole

Evaluation des performances de l’identification de protéines

Résultats

Mascot32 protéines8 33

Qualité A Qualité B

Page 22: Génopôle Rhône-Alpes - Plate-forme de protéomique

Activités Rhône-Alpes Genopole / bioinformatique

Rhône-Alpes

Genopole

Mise en évidence d’une limite intron/exon

Page 23: Génopôle Rhône-Alpes - Plate-forme de protéomique

Activités Rhône-Alpes Genopole / bioinformatique

Rhône-Alpes

Genopole

Mise en évidence d’une limite intron/exon

Page 24: Génopôle Rhône-Alpes - Plate-forme de protéomique

Activités Rhône-Alpes Genopole / bioinformatique

Rhône-Alpes

Genopole

ACTGGAGTTTAACAACCTGCTAGTTTCCTTGAAAAGTCATTCAGAGGCAGATCAATTTGCACGCGGGGTTGGCCCTATTTCTTTGATAGGTGAAGATGCTTTTGACCTTCTCTTTTCTGAAGAAAAATTATTGGCTCTCAACCTTGGATCTATGTGGCTTAGGTGATGAGTCTGATTTTGAGAGGAGAATGGATGATTTAAAGCTCCTTTATAGAGCATATGTTACAGATGCTTTATCTGGTGGGCGCTTAGAAGAAAATAAGGTATACTCAGTTTTGTATAAGATATTATGTACTAAAG

Chromosome I of A.thalianasubsequence from nt 2133100 to nt 21328001 (reverse strand)

intron

Mise en évidence d’une limite intron/exon

Page 25: Génopôle Rhône-Alpes - Plate-forme de protéomique

Activités Rhône-Alpes Genopole / bioinformatique

Rhône-Alpes

Genopole

Conclusions et Perspectives de Taggor-PepMap

Le logiciel est disponible pour les académiques

Le développement d’interfaces graphiques et l’intégration à GenoStar

La validation a permis de montrer que le logiciel est opérationnel

Le logiciel est en cours d’installation à la plate-forme du centre de protéomique de la génopôle Rhônes-Alpes (Grenoble)

La création d’un module de qualification automatique de spectres

Page 26: Génopôle Rhône-Alpes - Plate-forme de protéomique

Activités Rhône-Alpes Genopole / bioinformatique

Rhône-Alpes

Genopole

Conclusion et Perspective de la plate-forme

Une unité « thématique » dans l’ensemble des projets

L’ensemble des projets devra fonctionner de façon intégrée dans la plate-forme