génopôle rhône-alpes - plate-forme de protéomique
DESCRIPTION
Génopôle Rhône-Alpes - Plate-forme de protéomique. Estelle Nugues HELIX – INRIA Christophe Bruley CP – CEA 22 octobre 2003. Plate-forme de protéomique. Composition CP (CEA): Emmanuelle Mouton (01/2002 07/2003) Romain Cahuzac (10/2002 06/2004) Gilles André (03/2003 02/2004) - PowerPoint PPT PresentationTRANSCRIPT
Activités Rhône-Alpes Genopole / bioinformatique
Rhône-Alpes
Genopole
Génopôle Rhône-Alpes-
Plate-forme de protéomique
Estelle NuguesHELIX – INRIA
Christophe BruleyCP – CEA
22 octobre 2003
Activités Rhône-Alpes Genopole / bioinformatique
Rhône-Alpes
GenopolePlate-forme de protéomique
• Composition– CP (CEA):
• Emmanuelle Mouton (01/2002 07/2003)• Romain Cahuzac (10/2002 06/2004)• Gilles André (03/2003 02/2004)• Christophe Bruley (05/2003)• Marianne Tardif (10/2002)
– HELIX (INRIA) :• Erwan Reguer (11/2001 11/2003)• Estelle Nugues (04/2002 11/2003)• Walid Dib (12/2002 09/2003)
Activités Rhône-Alpes Genopole / bioinformatique
Rhône-Alpes
GenopolePlate-forme de protéomique
• Activité : acquisition et traitement des données de protéomique
échantillon Identificationde protéines
échantillonpréparé
spectrebrut
spectreinterprété
résultatbrut
élec
troph
orès
e
prép
arat
ion
anal
yse
MS
inte
rpré
tatio
n
iden
tific
atio
n
valid
atio
n
Activités Rhône-Alpes Genopole / bioinformatique
Rhône-Alpes
Genopole
Identification
• Mise en place d’un serveur MASCOT au sein du laboratoire
• E. Mouton• Janvier 2002
échantillon Identificationde protéines
échantillonpréparé
spectrebrut
spectreinterprété
résultatbrut
élec
troph
orès
e
prép
arat
ion
anal
yse
MS
inte
rpré
tatio
n
iden
tific
atio
n
valid
atio
n
Activités Rhône-Alpes Genopole / bioinformatique
Rhône-Alpes
Genopole
Stockage et Archivage
échantillon Identificationde protéines
échantillonpréparé
spectrebrut
spectreinterprété
résultatbrut
élec
troph
orès
e
prép
arat
ion
anal
yse
MS
inte
rpré
tatio
n
iden
tific
atio
n
valid
atio
n
• Volumétrie des données générées :– De 50 à 100 Go par semaine
• E. Mouton• Mai 2002 : rédaction cahier des charges Jan. 2004 : installation du SAN
Réseau de stockage (SAN) ~ 3 To
Activités Rhône-Alpes Genopole / bioinformatique
Rhône-Alpes
GenopoleAide à la validation de résultats
• Filtrage des feuilles de résultats MASCOT– Validation automatique de certains résultats– Génération feuilles de résumé d’analyse
• G. André• Mai 2003
échantillon Identificationde protéines
échantillonpréparé
spectrebrut
spectreinterprété
résultatbrut
élec
troph
orès
e
prép
arat
ion
anal
yse
MS
inte
rpré
tatio
n
iden
tific
atio
n
valid
atio
n
Activités Rhône-Alpes Genopole / bioinformatique
Rhône-Alpes
Genopole
Qualification des spectres
• Outil de qualification des spectres MS/MS en amont de l’identification
• G. André• Juin 2003
échantillon Identificationde protéines
échantillonpréparé
spectrebrut
spectreinterprété
résultatbrut
élec
troph
orès
e
prép
arat
ion
anal
yse
MS
inte
rpré
tatio
n
iden
tific
atio
n
valid
atio
n
Activités Rhône-Alpes Genopole / bioinformatique
Rhône-Alpes
Genopole
Gestion des données
• Gestion de l’ensemble des données relatives aux analyses réalisées sur la plate-forme : – Conception d’un modèle des données relationnel– Évaluation de LIMS commerciaux– Évaluation de technologies pour le développement d’un
système d’information adapté
• E. Mouton, W. Dib, G. André, C. Bruley• Déc. 2002
échantillon Identificationde protéines
échantillonpréparé
spectrebrut
spectreinterprété
résultatbrut
élec
troph
orès
e
prép
arat
ion
anal
yse
MS
inte
rpré
tatio
n
iden
tific
atio
n
valid
atio
n
Activités Rhône-Alpes Genopole / bioinformatique
Rhône-Alpes
Genopole
Taggor - PepMap
• Outils pour l’annotation de génome par l’analyse protéomique
• Collaboration INRIA – CEA - Génome express E. Reguer, E. Nugues, R. Cahuzac• Juin 2000
échantillon Identificationde protéines
échantillonpréparé
spectrebrut
spectreinterprété
résultatbrut
élec
troph
orès
e
prép
arat
ion
anal
yse
MS
inte
rpré
tatio
n
iden
tific
atio
n
valid
atio
n
Activités Rhône-Alpes Genopole / bioinformatique
Rhône-Alpes
GenopoleSpectrométrie de masse MS/MS
échantillon Identificationde protéines
échantillonpréparé
spectrebrut
spectreinterprété
résultatbrut
élec
troph
orès
e
prép
arat
ion
anal
yse
MS
inte
rpré
tatio
n
iden
tific
atio
n
valid
atio
n
Echantillon à analyser
Préparation + Digestion des protéines
par une enzyme (trypsine)
Fragments trypsiques Spectres de
masse
Analyse spectrométrique
Identification des protéines
Activités Rhône-Alpes Genopole / bioinformatique
Rhône-Alpes
Genopole
Spectre MS/MS
GLLG LAP
100 200 300 400 500 600 700 800 900 1000 m/z0
100
%
200.17
86.11
228.17
285.19
301.23372.29398.30
485.39
970.71
800.56687.46
913.65
[M+H]+
HN CH C HN CH C HN CH C
R
O O O
OH
R R
Sens de lecture
Fragmentation au niveau des liaisons peptidiques
[SG]
Activités Rhône-Alpes Genopole / bioinformatique
Rhône-Alpes
Genopole« Peptide Sequence Tag » ou étiquette peptidique
Un court fragment peptidique
Deux masses flanquantes de séquence inconnue
PEPTIDESEQUENCETAG
W M P
P M W ? ?
100 200 300 400 500 600 700 800 900 10000
100
%
554.33
685.37
871.46
1000.49
438.2 Da129.1Da
Activités Rhône-Alpes Genopole / bioinformatique
Rhône-Alpes
Genopole
Problématique
Séquences protéiques
Spectresthéoriques
MS/MS in silico
Comparaison de spectres
MascotInterprétation partielle
PSTIdentification de protéines
Recherchegénomique
Séquences génomiques
in silico
Activités Rhône-Alpes Genopole / bioinformatique
Rhône-Alpes
Genopole
Identification de protéines
« Mapping » d’un PST sur une séquence protéique
675 916ESV
Séquences protéiques
Protéine 1
Protéine 2
Protéine 3
Protéine N…
Identification de protéines
...LSEAKISVTSTAESVTASLTDAEKTVNQTAR...
Activités Rhône-Alpes Genopole / bioinformatique
Rhône-Alpes
Genopole
Localisation de gènes
Chromosometraduit EXON EXON
Cluster
EXON EXONIntronGene
(Eucaryotes)Match complet Match partiel
« Mapping » de PSTs sur une séquence génomique traduite
Localisation de gène (« Clustering »)
EXON Intron
Chromosometraduit
Activités Rhône-Alpes Genopole / bioinformatique
Rhône-Alpes
Genopole
Validation
• Trouver un jeu de données
• Trouver les banques de données
• Prouver l’efficacité de Taggor-PepMap en le comparant à un logiciel de référence
• Définir les paramètres optimaux des logiciels utilisés
• Tester la localisation génomique
Activités Rhône-Alpes Genopole / bioinformatique
Rhône-Alpes
GenopoleJeu de données expérimentales
Enveloppe de chloroplaste d’ Arabidopsis thaliana
(Laboratoire de Chimie des Protéines du CEA Grenoble)
plante cellule chloroplasteProtéines
membranaires
Activités Rhône-Alpes Genopole / bioinformatique
Rhône-Alpes
GenopoleDonnées MS/MS:
1300 spectres
A
B
C
D
Qualité A Qualité B
Qualité C Qualité D
Expertise humaine
Activités Rhône-Alpes Genopole / bioinformatique
Rhône-Alpes
Genopole
Banques de données
Séquences protéiques
Séquences génomiques
?
Activités Rhône-Alpes Genopole / bioinformatique
Rhône-Alpes
Genopole
Séquences protéiques
Spectresthéoriques
Interprétation partielle
PST
Identification protéique
MS/MS in silico
Comparaison de spectres
Evaluation des performances de l’identification de protéines
Protocole
Mascot
Activités Rhône-Alpes Genopole / bioinformatique
Rhône-Alpes
Genopole
Evaluation des performances de l’identification de protéines
Résultats
Mascot32 protéines8 33
Qualité A Qualité B
Activités Rhône-Alpes Genopole / bioinformatique
Rhône-Alpes
Genopole
Mise en évidence d’une limite intron/exon
Activités Rhône-Alpes Genopole / bioinformatique
Rhône-Alpes
Genopole
Mise en évidence d’une limite intron/exon
Activités Rhône-Alpes Genopole / bioinformatique
Rhône-Alpes
Genopole
ACTGGAGTTTAACAACCTGCTAGTTTCCTTGAAAAGTCATTCAGAGGCAGATCAATTTGCACGCGGGGTTGGCCCTATTTCTTTGATAGGTGAAGATGCTTTTGACCTTCTCTTTTCTGAAGAAAAATTATTGGCTCTCAACCTTGGATCTATGTGGCTTAGGTGATGAGTCTGATTTTGAGAGGAGAATGGATGATTTAAAGCTCCTTTATAGAGCATATGTTACAGATGCTTTATCTGGTGGGCGCTTAGAAGAAAATAAGGTATACTCAGTTTTGTATAAGATATTATGTACTAAAG
Chromosome I of A.thalianasubsequence from nt 2133100 to nt 21328001 (reverse strand)
intron
Mise en évidence d’une limite intron/exon
Activités Rhône-Alpes Genopole / bioinformatique
Rhône-Alpes
Genopole
Conclusions et Perspectives de Taggor-PepMap
Le logiciel est disponible pour les académiques
Le développement d’interfaces graphiques et l’intégration à GenoStar
La validation a permis de montrer que le logiciel est opérationnel
Le logiciel est en cours d’installation à la plate-forme du centre de protéomique de la génopôle Rhônes-Alpes (Grenoble)
La création d’un module de qualification automatique de spectres
Activités Rhône-Alpes Genopole / bioinformatique
Rhône-Alpes
Genopole
Conclusion et Perspective de la plate-forme
Une unité « thématique » dans l’ensemble des projets
L’ensemble des projets devra fonctionner de façon intégrée dans la plate-forme