méthodes et usages de l’analyse de la modularité des protéines 1. le programme mkdom 2. la base...
TRANSCRIPT
![Page 1: Méthodes et usages de l’analyse de la modularité des protéines 1. Le programme MKDOM 2. La base ProDom de familles de domaines protéiques 3. Méthodologie](https://reader035.vdocuments.pub/reader035/viewer/2022070309/551d9dc5497959293b8e23ca/html5/thumbnails/1.jpg)
Méthodes et usages de l’analyse de la modularité
des protéines
1. Le programme MKDOM
2. La base ProDom de familles de domaines protéiques
3. Méthodologie de prédiction du métabolisme (PRIAM)
![Page 2: Méthodes et usages de l’analyse de la modularité des protéines 1. Le programme MKDOM 2. La base ProDom de familles de domaines protéiques 3. Méthodologie](https://reader035.vdocuments.pub/reader035/viewer/2022070309/551d9dc5497959293b8e23ca/html5/thumbnails/2.jpg)
o0359_Synsp
BAT_HALHA
Orf1_Tn1721
TlpA_Ecoli
NIFL_AZOVI
NIFL_KLEPN
NifL_KPASy
NifL_Entag
Elk_Drome
CIKE_DROME
Erg_Human
Eag_mouse
Eag_rat
Plkin_pea
Plkin_ice
Plkin_spinach
PASPAS
PAS
PASPASPASPAS
PAS
PASPAS
PASPASPAS
PASPAS
PAS
sensor kinase
voltage gated K+ channel
S/T kinase
Modularité des protéines à domaine PAS
![Page 3: Méthodes et usages de l’analyse de la modularité des protéines 1. Le programme MKDOM 2. La base ProDom de familles de domaines protéiques 3. Méthodologie](https://reader035.vdocuments.pub/reader035/viewer/2022070309/551d9dc5497959293b8e23ca/html5/thumbnails/3.jpg)
1. Le programme MKDOM
![Page 4: Méthodes et usages de l’analyse de la modularité des protéines 1. Le programme MKDOM 2. La base ProDom de familles de domaines protéiques 3. Méthodologie](https://reader035.vdocuments.pub/reader035/viewer/2022070309/551d9dc5497959293b8e23ca/html5/thumbnails/4.jpg)
Durée d’exécution de MKDOMsur l’ensemble des séquences
Version Date n j n2/j x 1e10
2001.2 Mai 2001 339763 31 2.69
2001.3 Sept 2001 373869 46 3.29
2002.1 Mai 2002 481952 64 2.76
![Page 5: Méthodes et usages de l’analyse de la modularité des protéines 1. Le programme MKDOM 2. La base ProDom de familles de domaines protéiques 3. Méthodologie](https://reader035.vdocuments.pub/reader035/viewer/2022070309/551d9dc5497959293b8e23ca/html5/thumbnails/5.jpg)
Améliorer l’algorithme
• Algorithme quadratique/nb de séquences
• n double tous les 18 mois
• Pcalcul double tous les 18 moisLe temps de calcul double tous les 18 mois
![Page 6: Méthodes et usages de l’analyse de la modularité des protéines 1. Le programme MKDOM 2. La base ProDom de familles de domaines protéiques 3. Méthodologie](https://reader035.vdocuments.pub/reader035/viewer/2022070309/551d9dc5497959293b8e23ca/html5/thumbnails/6.jpg)
Parallélisation ?
• Paralléliser la boucle principale ?– N requêtes simultanées– Vérification a posteriori de leur compatibilité
• Procéder en deux phases ? – PSI-BLAST tout contre tout– Puis mimer MKDOM
• Changer d’algorithme ?
![Page 7: Méthodes et usages de l’analyse de la modularité des protéines 1. Le programme MKDOM 2. La base ProDom de familles de domaines protéiques 3. Méthodologie](https://reader035.vdocuments.pub/reader035/viewer/2022070309/551d9dc5497959293b8e23ca/html5/thumbnails/7.jpg)
Le programme ADDA
Heger & Holm, 2003J. Mol. Biol. 328, 749-767
![Page 8: Méthodes et usages de l’analyse de la modularité des protéines 1. Le programme MKDOM 2. La base ProDom de familles de domaines protéiques 3. Méthodologie](https://reader035.vdocuments.pub/reader035/viewer/2022070309/551d9dc5497959293b8e23ca/html5/thumbnails/8.jpg)
Exemple d’utilisation de MKDOM:
Analyse de la famille des cyclases de Rhizobium
Engendrer une matrice de score position-spécifique (PSSM) pour le domaine catalytique
Recherche exhaustive dans les génomes de S. meliloti et M. loti
Analyse en domaines utilisant MKDOM Visualisation par XDOM Classification des cyclases
![Page 9: Méthodes et usages de l’analyse de la modularité des protéines 1. Le programme MKDOM 2. La base ProDom de familles de domaines protéiques 3. Méthodologie](https://reader035.vdocuments.pub/reader035/viewer/2022070309/551d9dc5497959293b8e23ca/html5/thumbnails/9.jpg)
CyaF : SM:7 ML:4, Cterm-domain = TPR
SM:4 ML:2
CyaG : SM:3 ML:1
CyaD : SM:3 ML:0
CyaH : SM:1 ML:2
CyaE : SM:2 ML:0, Nterm-domain = TM
CyaB, Nterm domain = SignalP and TM
CyaC, Nterm domain = TM
CyaJ, Cterm domain = TM
CyaA
![Page 10: Méthodes et usages de l’analyse de la modularité des protéines 1. Le programme MKDOM 2. La base ProDom de familles de domaines protéiques 3. Méthodologie](https://reader035.vdocuments.pub/reader035/viewer/2022070309/551d9dc5497959293b8e23ca/html5/thumbnails/10.jpg)
LuxR
GerE
FixJ
OmpR
SpoOA
NtrC
NifA
2. La base ProDom de familles de domaines protéiques
www.toulouse.inra.fr/prodom.html
![Page 11: Méthodes et usages de l’analyse de la modularité des protéines 1. Le programme MKDOM 2. La base ProDom de familles de domaines protéiques 3. Méthodologie](https://reader035.vdocuments.pub/reader035/viewer/2022070309/551d9dc5497959293b8e23ca/html5/thumbnails/11.jpg)
Intégration des données protéiques
Base dedomaines protéiques
Séquences Structures de domaines
Données biochimiques
(n,n) (1,n)
(1,n)
Structures de protéines
(1,n)(1,n)
Collaboration européenneProjet InterProcoordonné par l’EBI
![Page 12: Méthodes et usages de l’analyse de la modularité des protéines 1. Le programme MKDOM 2. La base ProDom de familles de domaines protéiques 3. Méthodologie](https://reader035.vdocuments.pub/reader035/viewer/2022070309/551d9dc5497959293b8e23ca/html5/thumbnails/12.jpg)
Domain motif
Links to other representations of the family
Links to other databases
![Page 13: Méthodes et usages de l’analyse de la modularité des protéines 1. Le programme MKDOM 2. La base ProDom de familles de domaines protéiques 3. Méthodologie](https://reader035.vdocuments.pub/reader035/viewer/2022070309/551d9dc5497959293b8e23ca/html5/thumbnails/13.jpg)
![Page 14: Méthodes et usages de l’analyse de la modularité des protéines 1. Le programme MKDOM 2. La base ProDom de familles de domaines protéiques 3. Méthodologie](https://reader035.vdocuments.pub/reader035/viewer/2022070309/551d9dc5497959293b8e23ca/html5/thumbnails/14.jpg)
![Page 15: Méthodes et usages de l’analyse de la modularité des protéines 1. Le programme MKDOM 2. La base ProDom de familles de domaines protéiques 3. Méthodologie](https://reader035.vdocuments.pub/reader035/viewer/2022070309/551d9dc5497959293b8e23ca/html5/thumbnails/15.jpg)
![Page 16: Méthodes et usages de l’analyse de la modularité des protéines 1. Le programme MKDOM 2. La base ProDom de familles de domaines protéiques 3. Méthodologie](https://reader035.vdocuments.pub/reader035/viewer/2022070309/551d9dc5497959293b8e23ca/html5/thumbnails/16.jpg)
3. Prédiction du métabolisme
Le projet PRIAM
Profils pour l’Identification Automatique du Métabolisme
Clotilde RENARD-CLAUDEL
Collaboration Claude CHEVALET
a) Construction d’un ensemble de matrices de profil représentatif à partir de la base ENZYME
b) Prédiction des voies métaboliques
![Page 17: Méthodes et usages de l’analyse de la modularité des protéines 1. Le programme MKDOM 2. La base ProDom de familles de domaines protéiques 3. Méthodologie](https://reader035.vdocuments.pub/reader035/viewer/2022070309/551d9dc5497959293b8e23ca/html5/thumbnails/17.jpg)
Détection de segments homologues dans chaque collection
Sélection d’un ensemble minimum recouvrant
Construction de matrices de profil
Construction des matrices de profilreprésentatives
1502 collections enzymatiques (base ENZYME)
![Page 18: Méthodes et usages de l’analyse de la modularité des protéines 1. Le programme MKDOM 2. La base ProDom de familles de domaines protéiques 3. Méthodologie](https://reader035.vdocuments.pub/reader035/viewer/2022070309/551d9dc5497959293b8e23ca/html5/thumbnails/18.jpg)
Utilisation de MKDOM
![Page 19: Méthodes et usages de l’analyse de la modularité des protéines 1. Le programme MKDOM 2. La base ProDom de familles de domaines protéiques 3. Méthodologie](https://reader035.vdocuments.pub/reader035/viewer/2022070309/551d9dc5497959293b8e23ca/html5/thumbnails/19.jpg)
Collections contenant des multi-enzymes
AKH également aspartokinase
Ex: Homosérine déshydrogénase
![Page 20: Méthodes et usages de l’analyse de la modularité des protéines 1. Le programme MKDOM 2. La base ProDom de familles de domaines protéiques 3. Méthodologie](https://reader035.vdocuments.pub/reader035/viewer/2022070309/551d9dc5497959293b8e23ca/html5/thumbnails/20.jpg)
Collections hétérogènes
- Enzymes non homologuesEx: Glucose déshydrogénase
- Enzymes oligomériquesEx: NO réductase
NORB_PSEAE
NORC_PSEAE
DHGA_ACICA et DHGB_ACICA
Génération automatique de règles
![Page 21: Méthodes et usages de l’analyse de la modularité des protéines 1. Le programme MKDOM 2. La base ProDom de familles de domaines protéiques 3. Méthodologie](https://reader035.vdocuments.pub/reader035/viewer/2022070309/551d9dc5497959293b8e23ca/html5/thumbnails/21.jpg)
Cribler l’ensemble des gènes d’un organisme avec les profils de PRIAM
On obtient pour chaque protéine les meilleurs profils non complètement chevauchants
Application des règles spécifiques à chaque EC Visualisation des résultats sur les cartes de KEGG
Prédiction de voies métaboliques
http://genopole.toulouse.inra.fr/bioinfo/priam/
![Page 22: Méthodes et usages de l’analyse de la modularité des protéines 1. Le programme MKDOM 2. La base ProDom de familles de domaines protéiques 3. Méthodologie](https://reader035.vdocuments.pub/reader035/viewer/2022070309/551d9dc5497959293b8e23ca/html5/thumbnails/22.jpg)
Visualisation des voies métaboliques
![Page 23: Méthodes et usages de l’analyse de la modularité des protéines 1. Le programme MKDOM 2. La base ProDom de familles de domaines protéiques 3. Méthodologie](https://reader035.vdocuments.pub/reader035/viewer/2022070309/551d9dc5497959293b8e23ca/html5/thumbnails/23.jpg)
L’équipe ProDom
Jérome GOUZYEmmanuel COURCELLEFlorence SERVANT Yoann BEAUSSECatherine BRUSébastien CARREREDaniel KAHNFlorence CORPET
Collaborations
INRA ToulouseClotilde CLAUDEL-RENARDClaude CHEVALET
IBCP, Lyon Gilbert DELEAGE
Christophe GEOURJONEBI, Hinxton
Rolf APWEILERIRISA, Rennes
Dominique LAVENIERSoutien financier
- Programme Bio-Informatique Inter-Organismes- Génopole- Union Européenne (InterPro)