synténie bactérienne : aide pour lannotation de cenibacterium arsenoxydans laurent labarre agc -...
Post on 03-Apr-2015
106 Views
Preview:
TRANSCRIPT
Synténie bactérienne : aide pour l’annotation de Cenibacterium arsenoxydans
Laurent Labarre
AGC - UMR 8030 - Génoscope
labarre@genoscope.cns.fr
Plan
• Génomique comparative avec les mains• Détection de groupes de synténie• Détection de régions spécifiques• Les synténies dans MaGe
Régions conservées
Escherichia coli k12
Ba
cil
lus
su
bti
lis
Comparaison de génomes éloignés
Escherichia coli k12
Es
ch
eri
ch
ia c
oli
O1
57
H7
Région spécifique
Comparaison de génomes proches
Génomique comparative : remarques
• Aspect multi-génome– Comparaison toujours par rapport à …
• Présence / absence de gènes– orthologie/paralogie/gènes spécifiques ?– correspondance fonctionnelle ?
• Conservation de l’organisation des gènes– groupes de synténie, groupes de gènes spécifiques ?– couplage fonctionnel ?
La synténie : pourquoi ?
Applications
Opérons
RégulationTranscriptionelle
AttributionFonctionnelleContextuelle
?
Similitude Familles de gènes"Universels"
Voies Métaboliques
Génome A
Génome B
"correspondance"
"co-localisation"
"co-localisation"
Les gènes sont les nœuds du graphe et sont connectés par deux types d’arêtes :Relation de "correspondance" (inter génomes)
principalement résultats de comparaisons de séquences (avec contraintes restrictives sur la similitude)mais aussi classifications fonctionnelles ou conservation de domaines protéiques
Relation de "co-localisation" (intra génome)paramètre de gap qui autorise tous types de réarrangements
=> L’algorithme développé recherche les groupes de gènes (‘syntons’) qui vérifient ces deux relations.
Nous utilisons le formalisme des graphes pour modéliser les groupes de synténie.
Synténie bactérienne : modélisation
Génome A
Génome B
Synton #1
Réarrangement Fusion Duplication Insertion Inversion
Synton #2
gap <= 2
=> Correspondances multiples, réarrangements et insertions autorisés
Synténie bactérienne : modélisation
On détecte aussi ce groupe de gènes chez Y. pseudotuberculosis, S. typhi, S. typhimurium et E. coli O157.
Ce groupe n’a pas d’équivalent chez E coli
Cet exemple montre quels types de groupes de synténie peuvent être détectés.
Le système de sécrétion de type III :
Synténie bactérienne : un exemple
Génome A
Génome B
"co-localisation"
"absence de correspondance"
Comme pour les synténies, nous utilisons les graphes pour modéliser les régions spécifiques avec deux types d’arêtes :
Relation d’ "absence de correspondance" (inter génomes) représentée explicitement
Relation de "co-localisation" (intra génome) paramètre de gap qui autorise les insertions
=> Détecter les régions spécifiques revient à rechercher les gènes qui vérifient ces deux relations (trivial)
Régions spécifiques : modélisation
Région spécifiquegap <= 2
Insertion
Génome A
Génome B
=> Insertions autorisés
Régions spécifiques : modélisation
=> Statuer sur l’absence de correspondance n’est pas simple !
"Orthologue putatif"
"Absence de correspondant"
Critère decorrespondanceinter-génomes
?!
Régions spécifiques : remarque
Algorithme (1/2)
?
c1 c2 c3 c4 c5 c6 c7 c8
1 4
2 2
4
2
c2c1 c3 c4 c5 c6 c7 c8
2
11
2
c2c1 c3 c4 c5 c6 c7 c8
2
4
c2c1 c3 c4 c5 c6 c7 c8
11
ccA1 ccA2
ccB1 ccB2 ccB3
gap <= 1c2c1 c3 c4 c5 c6 c7 c8
ccA1/ccB1 ccA2/ccB2 ccA2/ccB3
Algorithme (2/2)
=> Raffinement de partition de l’ensemble des couples de gènes correspondant suivant leur co-localisation sur les deux génomes
• Représentation cartographique• Détails de syntons• Recoupement de synténies
Les synténies dans Mage
Un outil dédié au calcul et à l’exploration des synténies bactériennes• Calcul dynamique• Différents types de correspondances (Blast, COG, EC, Pfam)
Le Syntonizer
top related