compte-rendu bibliographique sur les réseaux biologiques
DESCRIPTION
Groupe de travail BioPuces, INRA d’Auzeville November 6th, 2009TRANSCRIPT
Compte-rendu bibliographique sur les réseauxbiologiques
Nathalie Villa-Vialaneixhttp ://www.nathalievilla.org
Institut de Mathématiques de ToulouseIUT de Carcassonne (Université de Perpignan)
Groupe de travail BioPuces, INRA de Castanet6 novembre 2009
BioPuces (06/11/09) Nathalie Villa Biblio. réseaux biologiques 1 / 25
Vue d’ensemble des thématiques
⇒ ⇒ CompréhensionInférence de graphes Analyse du graphe
• non supervisée • Recherche de motifs• semi supervisée • Classification de sommets
BioPuces (06/11/09) Nathalie Villa Biblio. réseaux biologiques 2 / 25
Vue d’ensemble des thématiques
⇒ ⇒ CompréhensionInférence de graphes Analyse du graphe
• non supervisée • Recherche de motifs• semi supervisée • Classification de sommets
BioPuces (06/11/09) Nathalie Villa Biblio. réseaux biologiques 2 / 25
Qu’est-ce qu’un graphe ?
Structure naturelle pour modéliser des phénomènes de relations entreindividus, objets ...
35
7 6,15
4,35
2
4
3.4
SommetsArêteséventuellement pondérées
BioPuces (06/11/09) Nathalie Villa Biblio. réseaux biologiques 3 / 25
Qu’est-ce qu’un graphe ?
Structure naturelle pour modéliser des phénomènes de relations entreindividus, objets ...
Sommets (ou nœuds) / en anglais : vertices, nodes
35
7 6,15
4,35
2
4
3.4
SommetsArêteséventuellement pondérées
BioPuces (06/11/09) Nathalie Villa Biblio. réseaux biologiques 3 / 25
Qu’est-ce qu’un graphe ?
Structure naturelle pour modéliser des phénomènes de relations entreindividus, objets ...
SommetsArêtes / en anglais : edges
35
7 6,15
4,35
2
4
3.4
SommetsArêteséventuellement pondérées
BioPuces (06/11/09) Nathalie Villa Biblio. réseaux biologiques 3 / 25
Qu’est-ce qu’un graphe ?
Structure naturelle pour modéliser des phénomènes de relations entreindividus, objets ...
35
7 6,15
4,35
2
4
3.4
SommetsArêteséventuellement pondérées
BioPuces (06/11/09) Nathalie Villa Biblio. réseaux biologiques 3 / 25
Notations
Dans la suite, on notera G un graphe
de sommets V = {x1, . . . , xn} (et de taille n)
dont l’ensemble des arêtes est noté E. E est donc un sous-ensemblede V × V
dont les arêtes sont pondérées par la matrice de poids W telle que
∀ i, j = 1, . . . , n, wii = 0, wij = wji ≥ 0, wij > 0⇔ (xi , xj) ∈ E
Dans un graphe non pondéré, on convient que wij ∈ {0; 1}.
BioPuces (06/11/09) Nathalie Villa Biblio. réseaux biologiques 4 / 25
Notations
Dans la suite, on notera G un graphe
de sommets V = {x1, . . . , xn} (et de taille n)
dont l’ensemble des arêtes est noté E. E est donc un sous-ensemblede V × V
dont les arêtes sont pondérées par la matrice de poids W telle que
∀ i, j = 1, . . . , n, wii = 0, wij = wji ≥ 0, wij > 0⇔ (xi , xj) ∈ E
Dans un graphe non pondéré, on convient que wij ∈ {0; 1}.
BioPuces (06/11/09) Nathalie Villa Biblio. réseaux biologiques 4 / 25
Notations
Dans la suite, on notera G un graphe
de sommets V = {x1, . . . , xn} (et de taille n)
dont l’ensemble des arêtes est noté E. E est donc un sous-ensemblede V × V
dont les arêtes sont pondérées par la matrice de poids W telle que
∀ i, j = 1, . . . , n, wii = 0, wij = wji ≥ 0, wij > 0⇔ (xi , xj) ∈ E
Dans un graphe non pondéré, on convient que wij ∈ {0; 1}.
BioPuces (06/11/09) Nathalie Villa Biblio. réseaux biologiques 4 / 25
Notations
Dans la suite, on notera G un graphe
de sommets V = {x1, . . . , xn} (et de taille n)
dont l’ensemble des arêtes est noté E. E est donc un sous-ensemblede V × V
dont les arêtes sont pondérées par la matrice de poids W telle que
∀ i, j = 1, . . . , n, wii = 0, wij = wji ≥ 0, wij > 0⇔ (xi , xj) ∈ E
Dans un graphe non pondéré, on convient que wij ∈ {0; 1}.
BioPuces (06/11/09) Nathalie Villa Biblio. réseaux biologiques 4 / 25
Sommaire
1 Inférence de graphes
2 Analyse de graphesStructure et recherche de motifsRecherche de modules : classification des sommets
BioPuces (06/11/09) Nathalie Villa Biblio. réseaux biologiques 5 / 25
Sommaire
1 Inférence de graphes
2 Analyse de graphesStructure et recherche de motifsRecherche de modules : classification des sommets
BioPuces (06/11/09) Nathalie Villa Biblio. réseaux biologiques 6 / 25
Références
1 Schäfer, J. and Strimmer, K. (2005) An empirical Bayes approach toinferring large-scale gene association networks. Bioinformatics, 21(6),pp 754-764.
2 Yamanishi, Y. and Vert, J.P. and Kanehisa, M. (2005) Supervisedenzyme network inference from the integration of genomic data andchemical information. Bioinformatics, 21(Supp. 1), i468-i477.
3 Kato, T. and Tsuda, K. and Asai, K. (2005) Selective integration ofmultiple biological data for supervised network inference.Bioinformatics, 21(10), 2488-2495.
4 Geurts, P. and Touleimat, N. and Dutreix, M. and d’Alché-Buc, F.(2007) Inferring biological networks with output kernel trees. BMCBioinformatics, 8(Supp. 2).
BioPuces (06/11/09) Nathalie Villa Biblio. réseaux biologiques 7 / 25
Sommaire
1 Inférence de graphes
2 Analyse de graphesStructure et recherche de motifsRecherche de modules : classification des sommets
BioPuces (06/11/09) Nathalie Villa Biblio. réseaux biologiques 8 / 25
Un élément important de la structure d’un graphe : ladistribution des degrés
DéfinitionOn appelle degré du sommet xi le nombre di =
∑j,i wij .
Dans le cadre non pondéré, c’est le nombre d’arêtes reliées à xi .
Dans de nombreux réseaux réels (sociaux, biologiques ...), la distributiondes degrés suit une loi de puissance (graphes sans échelle typique) :voir [Dorogovtsev and Mendes, 2003].
BioPuces (06/11/09) Nathalie Villa Biblio. réseaux biologiques 9 / 25
Un élément important de la structure d’un graphe : ladistribution des degrés
DéfinitionOn appelle degré du sommet xi le nombre di =
∑j,i wij .
Dans le cadre non pondéré, c’est le nombre d’arêtes reliées à xi .
Dans de nombreux réseaux réels (sociaux, biologiques ...), la distributiondes degrés suit une loi de puissance (graphes sans échelle typique) :voir [Dorogovtsev and Mendes, 2003].
BioPuces (06/11/09) Nathalie Villa Biblio. réseaux biologiques 9 / 25
Un élément important de la structure d’un graphe : ladistribution des degrés
DéfinitionOn appelle degré du sommet xi le nombre di =
∑j,i wij .
Dans le cadre non pondéré, c’est le nombre d’arêtes reliées à xi .
Dans de nombreux réseaux réels (sociaux, biologiques ...), la distributiondes degrés suit une loi de puissance (graphes sans échelle typique) :voir [Dorogovtsev and Mendes, 2003].
BioPuces (06/11/09) Nathalie Villa Biblio. réseaux biologiques 9 / 25
Conséquences concrètes
Les graphes en loi de puissances contiennent quelques sommetsdont le degré est très fort par rapport aux degrés des autressommets : ce sont, par exemple, des protéines qui interagissent avecbeaucoup d’autres protéines (réseaux d’interactions de protéines).
Enbiologie, on les appelle hubs.
Sur les réseaux de taille moyenne (quelques centaines de sommets),on observe plus fréquemment une loi de puissance tronquée (TPL) :c’est un simple effet de taille mais l’interprétation est conservée.
Ces phénomènes sont très loin de graphes dans lesquels les arêtesseraient réparties aléatoirement avec la même probabilité : cecidonne lieu à des lois binomiales pour la distribution des degrés : iln’existe pas de “hubs” dans ces graphes.
BioPuces (06/11/09) Nathalie Villa Biblio. réseaux biologiques 10 / 25
Conséquences concrètes
Les graphes en loi de puissances contiennent quelques sommetsdont le degré est très fort par rapport aux degrés des autressommets : ce sont, par exemple, des protéines qui interagissent avecbeaucoup d’autres protéines (réseaux d’interactions de protéines). Enbiologie, on les appelle hubs.
Sur les réseaux de taille moyenne (quelques centaines de sommets),on observe plus fréquemment une loi de puissance tronquée (TPL) :c’est un simple effet de taille mais l’interprétation est conservée.
Ces phénomènes sont très loin de graphes dans lesquels les arêtesseraient réparties aléatoirement avec la même probabilité : cecidonne lieu à des lois binomiales pour la distribution des degrés : iln’existe pas de “hubs” dans ces graphes.
BioPuces (06/11/09) Nathalie Villa Biblio. réseaux biologiques 10 / 25
Conséquences concrètes
Les graphes en loi de puissances contiennent quelques sommetsdont le degré est très fort par rapport aux degrés des autressommets : ce sont, par exemple, des protéines qui interagissent avecbeaucoup d’autres protéines (réseaux d’interactions de protéines). Enbiologie, on les appelle hubs.
Sur les réseaux de taille moyenne (quelques centaines de sommets),on observe plus fréquemment une loi de puissance tronquée (TPL) :c’est un simple effet de taille mais l’interprétation est conservée.
Ces phénomènes sont très loin de graphes dans lesquels les arêtesseraient réparties aléatoirement avec la même probabilité : cecidonne lieu à des lois binomiales pour la distribution des degrés : iln’existe pas de “hubs” dans ces graphes.
BioPuces (06/11/09) Nathalie Villa Biblio. réseaux biologiques 10 / 25
Conséquences concrètes
Les graphes en loi de puissances contiennent quelques sommetsdont le degré est très fort par rapport aux degrés des autressommets : ce sont, par exemple, des protéines qui interagissent avecbeaucoup d’autres protéines (réseaux d’interactions de protéines). Enbiologie, on les appelle hubs.
Sur les réseaux de taille moyenne (quelques centaines de sommets),on observe plus fréquemment une loi de puissance tronquée (TPL) :c’est un simple effet de taille mais l’interprétation est conservée.
Ces phénomènes sont très loin de graphes dans lesquels les arêtesseraient réparties aléatoirement avec la même probabilité : cecidonne lieu à des lois binomiales pour la distribution des degrés : iln’existe pas de “hubs” dans ces graphes.
BioPuces (06/11/09) Nathalie Villa Biblio. réseaux biologiques 10 / 25
Conséquence de la loi de puissance sur la résistanceaux dommages
[Dorogovtsev and Mendes, 2003]
Les réseaux dont la distribution des degrés est en loi depuissance sont résistants aux dommages qui affectentaléatoirement leurs sommets (la structure macroscopique duréseau est conservée malgré un fort taux de destruction desommets).
À l’inverse, les destructions qui affectent préférentiellement leshubs endommagent rapidement la structure du réseau.
BioPuces (06/11/09) Nathalie Villa Biblio. réseaux biologiques 11 / 25
Conséquence de la loi de puissance sur la résistanceaux dommages
[Dorogovtsev and Mendes, 2003]
Les réseaux dont la distribution des degrés est en loi depuissance sont résistants aux dommages qui affectentaléatoirement leurs sommets (la structure macroscopique duréseau est conservée malgré un fort taux de destruction desommets).
À l’inverse, les destructions qui affectent préférentiellement leshubs endommagent rapidement la structure du réseau.
BioPuces (06/11/09) Nathalie Villa Biblio. réseaux biologiques 11 / 25
Graphes aléatoires
Pour repérer des phénomènes exceptionnels dans les réseaux réelsétudiés (par exemple, la fréquence de certains motifs), il est courant decomparer le graphe réel à des modèles de graphes aléatoires.
Quelques exemples courants de graphes aléatoires :1 [Erdõs and Rényi, 1959] : n sommets (fixés) ; la probabilité d’une
arête entre deux sommets est p pour toutes les paires.
2 [Albert and Barabási, 2002] : Modèle d’attachement préférentiel.Les sommets sont ajoutés un à un et reliés aléatoirement auxsommets préexistants avec une probabilité plus forte pour lessommets à forts degrés.
3 [Molloy and Reed, 1995] : Modèle dans lequel la loi des degrés estchoisie à l’avance : on génère les degrés de chaque sommet seloncette loi puis on apparie les sommets deux à deux aléatoirement enrespectant les degrés générés.
BioPuces (06/11/09) Nathalie Villa Biblio. réseaux biologiques 12 / 25
Graphes aléatoires
Pour repérer des phénomènes exceptionnels dans les réseaux réelsétudiés (par exemple, la fréquence de certains motifs), il est courant decomparer le graphe réel à des modèles de graphes aléatoires.Quelques exemples courants de graphes aléatoires :
1 [Erdõs and Rényi, 1959] : n sommets (fixés) ; la probabilité d’unearête entre deux sommets est p pour toutes les paires.
Loi binomiale pour les degrés ;Modèle simple mais pas réaliste.
●
●
●
●
●
●
●
●
●
●
●
● ●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
2 [Albert and Barabási, 2002] : Modèle d’attachement préférentiel.Les sommets sont ajoutés un à un et reliés aléatoirement auxsommets préexistants avec une probabilité plus forte pour lessommets à forts degrés.
3 [Molloy and Reed, 1995] : Modèle dans lequel la loi des degrés estchoisie à l’avance : on génère les degrés de chaque sommet seloncette loi puis on apparie les sommets deux à deux aléatoirement enrespectant les degrés générés.
BioPuces (06/11/09) Nathalie Villa Biblio. réseaux biologiques 12 / 25
Graphes aléatoires
Pour repérer des phénomènes exceptionnels dans les réseaux réelsétudiés (par exemple, la fréquence de certains motifs), il est courant decomparer le graphe réel à des modèles de graphes aléatoires.Quelques exemples courants de graphes aléatoires :
1 [Erdõs and Rényi, 1959] : n sommets (fixés) ; la probabilité d’unearête entre deux sommets est p pour toutes les paires.
2 [Albert and Barabási, 2002] : Modèle d’attachement préférentiel.Les sommets sont ajoutés un à un et reliés aléatoirement auxsommets préexistants avec une probabilité plus forte pour lessommets à forts degrés.
Loi de puissance : P(D ≥ k) ∼ k−3.
3 [Molloy and Reed, 1995] : Modèle dans lequel la loi des degrés estchoisie à l’avance : on génère les degrés de chaque sommet seloncette loi puis on apparie les sommets deux à deux aléatoirement enrespectant les degrés générés.
BioPuces (06/11/09) Nathalie Villa Biblio. réseaux biologiques 12 / 25
Graphes aléatoires
Pour repérer des phénomènes exceptionnels dans les réseaux réelsétudiés (par exemple, la fréquence de certains motifs), il est courant decomparer le graphe réel à des modèles de graphes aléatoires.Quelques exemples courants de graphes aléatoires :
1 [Erdõs and Rényi, 1959] : n sommets (fixés) ; la probabilité d’unearête entre deux sommets est p pour toutes les paires.
2 [Albert and Barabási, 2002] : Modèle d’attachement préférentiel.Les sommets sont ajoutés un à un et reliés aléatoirement auxsommets préexistants avec une probabilité plus forte pour lessommets à forts degrés.
3 [Molloy and Reed, 1995] : Modèle dans lequel la loi des degrés estchoisie à l’avance : on génère les degrés de chaque sommet seloncette loi puis on apparie les sommets deux à deux aléatoirement enrespectant les degrés générés.
BioPuces (06/11/09) Nathalie Villa Biblio. réseaux biologiques 12 / 25
Recherche de motifs dans le réseau de régulationtranscriptionnelle de Escherichia Coli
Référence : Shen-Orr S.S., Milo R., Mangan S. and Alon U. (2002)Network motifs in the transcriptional regulation network of EscherichiaColi. Nature genetics, 31, 64-68.
Description des données : Réseau de régulation transcriptionnellemodélisé par un graphe orienté dont
les sommets sont des opérons (groupes de gènes contigus qui sonttranscrit en ARNm simple) ;
les arêtes sont des interactions directes dans la transcription :l’opérons i régule l’opérons j est modélisé par une arête du sommet ivers le sommet j.
Le réseau initial est composé de 377 interactions pour 424 opérons avec116 facteurs de transcription. Une recherche bibliographique intensive apermis d’ajouter 35 facteurs d’interactions.
BioPuces (06/11/09) Nathalie Villa Biblio. réseaux biologiques 13 / 25
Recherche de motifs dans le réseau de régulationtranscriptionnelle de Escherichia Coli
Référence : Shen-Orr S.S., Milo R., Mangan S. and Alon U. (2002)Network motifs in the transcriptional regulation network of EscherichiaColi. Nature genetics, 31, 64-68.Description des données : Réseau de régulation transcriptionnellemodélisé par un graphe orienté dont
les sommets sont des opérons (groupes de gènes contigus qui sonttranscrit en ARNm simple) ;
les arêtes sont des interactions directes dans la transcription :l’opérons i régule l’opérons j est modélisé par une arête du sommet ivers le sommet j.
Le réseau initial est composé de 377 interactions pour 424 opérons avec116 facteurs de transcription. Une recherche bibliographique intensive apermis d’ajouter 35 facteurs d’interactions.
BioPuces (06/11/09) Nathalie Villa Biblio. réseaux biologiques 13 / 25
Recherche de motifs dans le réseau de régulationtranscriptionnelle de Escherichia Coli
Référence : Shen-Orr S.S., Milo R., Mangan S. and Alon U. (2002)Network motifs in the transcriptional regulation network of EscherichiaColi. Nature genetics, 31, 64-68.Description des données : Réseau de régulation transcriptionnellemodélisé par un graphe orienté dont
les sommets sont des opérons (groupes de gènes contigus qui sonttranscrit en ARNm simple) ;
les arêtes sont des interactions directes dans la transcription :l’opérons i régule l’opérons j est modélisé par une arête du sommet ivers le sommet j.
Le réseau initial est composé de 377 interactions pour 424 opérons avec116 facteurs de transcription. Une recherche bibliographique intensive apermis d’ajouter 35 facteurs d’interactions.
BioPuces (06/11/09) Nathalie Villa Biblio. réseaux biologiques 13 / 25
Recherche de motifs dans le réseau de régulationtranscriptionnelle de Escherichia Coli
Référence : Shen-Orr S.S., Milo R., Mangan S. and Alon U. (2002)Network motifs in the transcriptional regulation network of EscherichiaColi. Nature genetics, 31, 64-68.Description des données : Réseau de régulation transcriptionnellemodélisé par un graphe orienté dont
les sommets sont des opérons (groupes de gènes contigus qui sonttranscrit en ARNm simple) ;
les arêtes sont des interactions directes dans la transcription :l’opérons i régule l’opérons j est modélisé par une arête du sommet ivers le sommet j.
Le réseau initial est composé de 377 interactions pour 424 opérons avec116 facteurs de transcription. Une recherche bibliographique intensive apermis d’ajouter 35 facteurs d’interactions.
BioPuces (06/11/09) Nathalie Villa Biblio. réseaux biologiques 13 / 25
But et méthodologie
But : Mettre en valeur des motifs exceptionnellement présents dans leréseau.
Méthodologie : On simule 1000 réseaux aléatoires ayant :
même nombre d’opérons (sommets) ;
même nombre d’interactions (arêtes) ;
mêmes degrés (entrant et sortant) des sommets ;
puis on compare la fréquence d’apparition d’un motif donné dans la réalitéet sur les 1000 graphes aléatoires.Si un motif apparaît bien plus souvent dans le graphe réel qu’en moyennesur les 1000 graphes aléatoires, c’est qu’il a une signification biologique(car il n’est pas le simple fait du hasard...).
BioPuces (06/11/09) Nathalie Villa Biblio. réseaux biologiques 14 / 25
But et méthodologie
But : Mettre en valeur des motifs exceptionnellement présents dans leréseau.Méthodologie : On simule 1000 réseaux aléatoires ayant :
même nombre d’opérons (sommets) ;
même nombre d’interactions (arêtes) ;
mêmes degrés (entrant et sortant) des sommets ;
puis on compare la fréquence d’apparition d’un motif donné dans la réalitéet sur les 1000 graphes aléatoires.
Si un motif apparaît bien plus souvent dans le graphe réel qu’en moyennesur les 1000 graphes aléatoires, c’est qu’il a une signification biologique(car il n’est pas le simple fait du hasard...).
BioPuces (06/11/09) Nathalie Villa Biblio. réseaux biologiques 14 / 25
But et méthodologie
But : Mettre en valeur des motifs exceptionnellement présents dans leréseau.Méthodologie : On simule 1000 réseaux aléatoires ayant :
même nombre d’opérons (sommets) ;
même nombre d’interactions (arêtes) ;
mêmes degrés (entrant et sortant) des sommets ;
puis on compare la fréquence d’apparition d’un motif donné dans la réalitéet sur les 1000 graphes aléatoires.Si un motif apparaît bien plus souvent dans le graphe réel qu’en moyennesur les 1000 graphes aléatoires, c’est qu’il a une signification biologique(car il n’est pas le simple fait du hasard...).
BioPuces (06/11/09) Nathalie Villa Biblio. réseaux biologiques 14 / 25
Motifs étudiés
1 Feedforward loop (boucle)
A B C
A régule B qui régule C et A régule directement C.
2 SIM (groupe à entrée unique)3 Paires d’opérons régulés par la même paire d’opérons4 DOR (régulations denses se chevauchant)
X1 X2 Xm
Z1 Z2 Z3 Zn......
Groupes d’opérons régulés par un même groupe d’opérons danslequel le nombre d’arêtes est bien plus grand que dans un graphealéatoire de mêmes caractéristiques.
BioPuces (06/11/09) Nathalie Villa Biblio. réseaux biologiques 15 / 25
Motifs étudiés
1 Feedforward loop (boucle)
A B C
A régule B qui régule C et A régule directement C. La boucle est ditecohérente si l’effet direct de A sur C est dans le même sens quel’effet indirect de A sur C. Sinon, la boucle est dite incohérente.
2 SIM (groupe à entrée unique)3 Paires d’opérons régulés par la même paire d’opérons4 DOR (régulations denses se chevauchant)
X1 X2 Xm
Z1 Z2 Z3 Zn......
Groupes d’opérons régulés par un même groupe d’opérons danslequel le nombre d’arêtes est bien plus grand que dans un graphealéatoire de mêmes caractéristiques.
BioPuces (06/11/09) Nathalie Villa Biblio. réseaux biologiques 15 / 25
Motifs étudiés
1 Feedforward loop (boucle)2 SIM (groupe à entrée unique)
X
Z1 Z2 Z3 Zn...
X régule un groupe de n (grand) opérons qui ne sont régulés que parX ; X est souvent auto-régulé.
3 Paires d’opérons régulés par la même paire d’opérons4 DOR (régulations denses se chevauchant)
X1 X2 Xm
Z1 Z2 Z3 Zn......
Groupes d’opérons régulés par un même groupe d’opérons danslequel le nombre d’arêtes est bien plus grand que dans un graphealéatoire de mêmes caractéristiques.
BioPuces (06/11/09) Nathalie Villa Biblio. réseaux biologiques 15 / 25
Motifs étudiés
1 Feedforward loop (boucle)2 SIM (groupe à entrée unique)3 Paires d’opérons régulés par la même paire d’opérons
4 DOR (régulations denses se chevauchant)
X1 X2 Xm
Z1 Z2 Z3 Zn......
Groupes d’opérons régulés par un même groupe d’opérons danslequel le nombre d’arêtes est bien plus grand que dans un graphealéatoire de mêmes caractéristiques.
BioPuces (06/11/09) Nathalie Villa Biblio. réseaux biologiques 15 / 25
Motifs étudiés
1 Feedforward loop (boucle)2 SIM (groupe à entrée unique)3 Paires d’opérons régulés par la même paire d’opérons4 DOR (régulations denses se chevauchant)
X1 X2 Xm
Z1 Z2 Z3 Zn......
Groupes d’opérons régulés par un même groupe d’opérons danslequel le nombre d’arêtes est bien plus grand que dans un graphealéatoire de mêmes caractéristiques.BioPuces (06/11/09) Nathalie Villa Biblio. réseaux biologiques 15 / 25
Significativité de l’apparition des motifs
Motif Nombre d’apparitions p-valueBoucles cohérentes 34 < 0.001Boucles incohérentes 6 ∼ 0.03SIM (> 13 opérons) 68 < 0.01Paires régulées par des paires 203 < 0.001DOR NC < 0.001
BioPuces (06/11/09) Nathalie Villa Biblio. réseaux biologiques 16 / 25
Représentation schématique
BioPuces (06/11/09) Nathalie Villa Biblio. réseaux biologiques 17 / 25
Synthèse de quelques propriétés de structure desréseaux biologiques
Référence : Proulx S.R., Promislow D.E.L. and Phillips P.C. (2005)Network thinking in ecology and evolution. Trends in Ecology andEvolution, 20(6), 345-353.
BioPuces (06/11/09) Nathalie Villa Biblio. réseaux biologiques 18 / 25
Quelques faits connus sur les réseaux d’interactionsde protéines
Beaucoup des motifs locaux existent depuis très longtemps(persistance).
Les hubs sont plus fréquemment des protéines essentielles pour lasurvie.
Les hubs sont plus fréquemment des protéines pléiotropes (plusieursfonctions ?).
Les hubs ont moins disparu au cours de l’évolution.
Les hubs sont faiblement connectés entre eux.
BioPuces (06/11/09) Nathalie Villa Biblio. réseaux biologiques 19 / 25
Quelques faits connus sur les voies métaboliques
Elles sont très résistantes aux dommages.
BioPuces (06/11/09) Nathalie Villa Biblio. réseaux biologiques 20 / 25
Quelques faits connus sur les réseaux de régulationde gènes
Ils contiennent beaucoup de petits motifs locaux.
Ils sont robustes aux dommages (mutations, par exemples).
Les gènes régulés par beaucoup de gènes sont plus variables dansleurs niveaux d’expression selon les conditions environnementales.
BioPuces (06/11/09) Nathalie Villa Biblio. réseaux biologiques 21 / 25
Remise en cause des conclusions portées sur lesréseaux biologiques
Référence : Siegal M., Promislow D.E.L. and Bergman A. (2007)Functional and evolutionary inference in gene networks : does topologymatter ? Genetica, 129, 83-103.
BioPuces (06/11/09) Nathalie Villa Biblio. réseaux biologiques 22 / 25
Motifs, distribution des degrés
Les motifs n’ont pas la même signification selon qu’on les considèredans leur version orientée ou non orientée. Par exemple :
La distribution des degrés est rarement en loi de puissance mais enloi de puissance tronquée (ndlr : effet de taille car on ne peutobserver une “vraie” loi de puissance sur un petit graphe).
BioPuces (06/11/09) Nathalie Villa Biblio. réseaux biologiques 23 / 25
Motifs, distribution des degrés
Les motifs n’ont pas la même signification selon qu’on les considèredans leur version orientée ou non orientée. Par exemple :
La distribution des degrés est rarement en loi de puissance mais enloi de puissance tronquée (ndlr : effet de taille car on ne peutobserver une “vraie” loi de puissance sur un petit graphe).
BioPuces (06/11/09) Nathalie Villa Biblio. réseaux biologiques 23 / 25
Motifs, distribution des degrés
Les motifs n’ont pas la même signification selon qu’on les considèredans leur version orientée ou non orientée. Par exemple :
La distribution des degrés est rarement en loi de puissance mais enloi de puissance tronquée (ndlr : effet de taille car on ne peutobserver une “vraie” loi de puissance sur un petit graphe).
BioPuces (06/11/09) Nathalie Villa Biblio. réseaux biologiques 23 / 25
Motifs, distribution des degrés
Les motifs n’ont pas la même signification selon qu’on les considèredans leur version orientée ou non orientée. Par exemple :
La distribution des degrés est rarement en loi de puissance mais enloi de puissance tronquée (ndlr : effet de taille car on ne peutobserver une “vraie” loi de puissance sur un petit graphe).
BioPuces (06/11/09) Nathalie Villa Biblio. réseaux biologiques 23 / 25
Hubs
Ce que l’on pense : Les hubs sont mortels si supprimés (laproportion de protéines essentielles est 3 fois plus forte dans les hubset, inversement, les protéines essentielles ont un degré moyen plusgrand que les protéines non essentielles).
Mais : Si on regarde la variabilité de l’expression des gènes lorsqu’ungène est supprimé, la corrélation est très faible entre le degré dugène supprimé et la variabilité.
Et : Le degré explique seulement 1% de la variance dans le tauxd’évolution d’une protéine.
L’article contient aussi des expériences faites sur des modèles de réseauxd’interactions : non rapporté ici car loin de la réalité.
BioPuces (06/11/09) Nathalie Villa Biblio. réseaux biologiques 24 / 25
Hubs
Ce que l’on pense : Les hubs sont mortels si supprimés (laproportion de protéines essentielles est 3 fois plus forte dans les hubset, inversement, les protéines essentielles ont un degré moyen plusgrand que les protéines non essentielles).
Mais : Si on regarde la variabilité de l’expression des gènes lorsqu’ungène est supprimé, la corrélation est très faible entre le degré dugène supprimé et la variabilité.
Et : Le degré explique seulement 1% de la variance dans le tauxd’évolution d’une protéine.
L’article contient aussi des expériences faites sur des modèles de réseauxd’interactions : non rapporté ici car loin de la réalité.
BioPuces (06/11/09) Nathalie Villa Biblio. réseaux biologiques 24 / 25
Hubs
Ce que l’on pense : Les hubs sont mortels si supprimés (laproportion de protéines essentielles est 3 fois plus forte dans les hubset, inversement, les protéines essentielles ont un degré moyen plusgrand que les protéines non essentielles).
Mais : Si on regarde la variabilité de l’expression des gènes lorsqu’ungène est supprimé, la corrélation est très faible entre le degré dugène supprimé et la variabilité.
Et : Le degré explique seulement 1% de la variance dans le tauxd’évolution d’une protéine.
L’article contient aussi des expériences faites sur des modèles de réseauxd’interactions : non rapporté ici car loin de la réalité.
BioPuces (06/11/09) Nathalie Villa Biblio. réseaux biologiques 24 / 25
Recherche de modules, classification de sommets
À SUIVRE...
BioPuces (06/11/09) Nathalie Villa Biblio. réseaux biologiques 25 / 25
Albert, R. and Barabási, A. (2002).Statistical mechanics of complex networks.Reviews of Modern Physics, 74 :47–97.
Dorogovtsev, S. and Mendes, J. (2003).Evolution of Networks. From biological Nets to the Internet and WWW.Oxford University Press.
Erdõs, P. and Rényi, A. (1959).On random graphs. i.Publicationes Mathematicae, 6 :290–297.
Molloy, M. and Reed, B. (1995).A critical point for random graphs with a given degree sequence.Random Structures and Algorithms, 6 :161–180.
BioPuces (06/11/09) Nathalie Villa Biblio. réseaux biologiques 25 / 25