compte-rendu bibliographique sur les réseaux biologiques

56
Compte-rendu bibliographique sur les réseaux biologiques Nathalie Villa-Vialaneix http ://www.nathalievilla.org Institut de Mathématiques de Toulouse IUT de Carcassonne (Université de Perpignan) Groupe de travail BioPuces, INRA de Castanet 6 novembre 2009 BioPuces (06/11/09) Nathalie Villa Biblio. réseaux biologiques 1 / 25

Upload: tuxette

Post on 11-May-2015

63 views

Category:

Science


0 download

DESCRIPTION

Groupe de travail BioPuces, INRA d’Auzeville November 6th, 2009

TRANSCRIPT

Page 1: Compte-rendu bibliographique sur les réseaux biologiques

Compte-rendu bibliographique sur les réseauxbiologiques

Nathalie Villa-Vialaneixhttp ://www.nathalievilla.org

Institut de Mathématiques de ToulouseIUT de Carcassonne (Université de Perpignan)

Groupe de travail BioPuces, INRA de Castanet6 novembre 2009

BioPuces (06/11/09) Nathalie Villa Biblio. réseaux biologiques 1 / 25

Page 2: Compte-rendu bibliographique sur les réseaux biologiques

Vue d’ensemble des thématiques

⇒ ⇒ CompréhensionInférence de graphes Analyse du graphe

• non supervisée • Recherche de motifs• semi supervisée • Classification de sommets

BioPuces (06/11/09) Nathalie Villa Biblio. réseaux biologiques 2 / 25

Page 3: Compte-rendu bibliographique sur les réseaux biologiques

Vue d’ensemble des thématiques

⇒ ⇒ CompréhensionInférence de graphes Analyse du graphe

• non supervisée • Recherche de motifs• semi supervisée • Classification de sommets

BioPuces (06/11/09) Nathalie Villa Biblio. réseaux biologiques 2 / 25

Page 4: Compte-rendu bibliographique sur les réseaux biologiques

Qu’est-ce qu’un graphe ?

Structure naturelle pour modéliser des phénomènes de relations entreindividus, objets ...

35

7 6,15

4,35

2

4

3.4

SommetsArêteséventuellement pondérées

BioPuces (06/11/09) Nathalie Villa Biblio. réseaux biologiques 3 / 25

Page 5: Compte-rendu bibliographique sur les réseaux biologiques

Qu’est-ce qu’un graphe ?

Structure naturelle pour modéliser des phénomènes de relations entreindividus, objets ...

Sommets (ou nœuds) / en anglais : vertices, nodes

35

7 6,15

4,35

2

4

3.4

SommetsArêteséventuellement pondérées

BioPuces (06/11/09) Nathalie Villa Biblio. réseaux biologiques 3 / 25

Page 6: Compte-rendu bibliographique sur les réseaux biologiques

Qu’est-ce qu’un graphe ?

Structure naturelle pour modéliser des phénomènes de relations entreindividus, objets ...

SommetsArêtes / en anglais : edges

35

7 6,15

4,35

2

4

3.4

SommetsArêteséventuellement pondérées

BioPuces (06/11/09) Nathalie Villa Biblio. réseaux biologiques 3 / 25

Page 7: Compte-rendu bibliographique sur les réseaux biologiques

Qu’est-ce qu’un graphe ?

Structure naturelle pour modéliser des phénomènes de relations entreindividus, objets ...

35

7 6,15

4,35

2

4

3.4

SommetsArêteséventuellement pondérées

BioPuces (06/11/09) Nathalie Villa Biblio. réseaux biologiques 3 / 25

Page 8: Compte-rendu bibliographique sur les réseaux biologiques

Notations

Dans la suite, on notera G un graphe

de sommets V = {x1, . . . , xn} (et de taille n)

dont l’ensemble des arêtes est noté E. E est donc un sous-ensemblede V × V

dont les arêtes sont pondérées par la matrice de poids W telle que

∀ i, j = 1, . . . , n, wii = 0, wij = wji ≥ 0, wij > 0⇔ (xi , xj) ∈ E

Dans un graphe non pondéré, on convient que wij ∈ {0; 1}.

BioPuces (06/11/09) Nathalie Villa Biblio. réseaux biologiques 4 / 25

Page 9: Compte-rendu bibliographique sur les réseaux biologiques

Notations

Dans la suite, on notera G un graphe

de sommets V = {x1, . . . , xn} (et de taille n)

dont l’ensemble des arêtes est noté E. E est donc un sous-ensemblede V × V

dont les arêtes sont pondérées par la matrice de poids W telle que

∀ i, j = 1, . . . , n, wii = 0, wij = wji ≥ 0, wij > 0⇔ (xi , xj) ∈ E

Dans un graphe non pondéré, on convient que wij ∈ {0; 1}.

BioPuces (06/11/09) Nathalie Villa Biblio. réseaux biologiques 4 / 25

Page 10: Compte-rendu bibliographique sur les réseaux biologiques

Notations

Dans la suite, on notera G un graphe

de sommets V = {x1, . . . , xn} (et de taille n)

dont l’ensemble des arêtes est noté E. E est donc un sous-ensemblede V × V

dont les arêtes sont pondérées par la matrice de poids W telle que

∀ i, j = 1, . . . , n, wii = 0, wij = wji ≥ 0, wij > 0⇔ (xi , xj) ∈ E

Dans un graphe non pondéré, on convient que wij ∈ {0; 1}.

BioPuces (06/11/09) Nathalie Villa Biblio. réseaux biologiques 4 / 25

Page 11: Compte-rendu bibliographique sur les réseaux biologiques

Notations

Dans la suite, on notera G un graphe

de sommets V = {x1, . . . , xn} (et de taille n)

dont l’ensemble des arêtes est noté E. E est donc un sous-ensemblede V × V

dont les arêtes sont pondérées par la matrice de poids W telle que

∀ i, j = 1, . . . , n, wii = 0, wij = wji ≥ 0, wij > 0⇔ (xi , xj) ∈ E

Dans un graphe non pondéré, on convient que wij ∈ {0; 1}.

BioPuces (06/11/09) Nathalie Villa Biblio. réseaux biologiques 4 / 25

Page 12: Compte-rendu bibliographique sur les réseaux biologiques

Sommaire

1 Inférence de graphes

2 Analyse de graphesStructure et recherche de motifsRecherche de modules : classification des sommets

BioPuces (06/11/09) Nathalie Villa Biblio. réseaux biologiques 5 / 25

Page 13: Compte-rendu bibliographique sur les réseaux biologiques

Sommaire

1 Inférence de graphes

2 Analyse de graphesStructure et recherche de motifsRecherche de modules : classification des sommets

BioPuces (06/11/09) Nathalie Villa Biblio. réseaux biologiques 6 / 25

Page 14: Compte-rendu bibliographique sur les réseaux biologiques

Références

1 Schäfer, J. and Strimmer, K. (2005) An empirical Bayes approach toinferring large-scale gene association networks. Bioinformatics, 21(6),pp 754-764.

2 Yamanishi, Y. and Vert, J.P. and Kanehisa, M. (2005) Supervisedenzyme network inference from the integration of genomic data andchemical information. Bioinformatics, 21(Supp. 1), i468-i477.

3 Kato, T. and Tsuda, K. and Asai, K. (2005) Selective integration ofmultiple biological data for supervised network inference.Bioinformatics, 21(10), 2488-2495.

4 Geurts, P. and Touleimat, N. and Dutreix, M. and d’Alché-Buc, F.(2007) Inferring biological networks with output kernel trees. BMCBioinformatics, 8(Supp. 2).

BioPuces (06/11/09) Nathalie Villa Biblio. réseaux biologiques 7 / 25

Page 15: Compte-rendu bibliographique sur les réseaux biologiques

Sommaire

1 Inférence de graphes

2 Analyse de graphesStructure et recherche de motifsRecherche de modules : classification des sommets

BioPuces (06/11/09) Nathalie Villa Biblio. réseaux biologiques 8 / 25

Page 16: Compte-rendu bibliographique sur les réseaux biologiques

Un élément important de la structure d’un graphe : ladistribution des degrés

DéfinitionOn appelle degré du sommet xi le nombre di =

∑j,i wij .

Dans le cadre non pondéré, c’est le nombre d’arêtes reliées à xi .

Dans de nombreux réseaux réels (sociaux, biologiques ...), la distributiondes degrés suit une loi de puissance (graphes sans échelle typique) :voir [Dorogovtsev and Mendes, 2003].

BioPuces (06/11/09) Nathalie Villa Biblio. réseaux biologiques 9 / 25

Page 17: Compte-rendu bibliographique sur les réseaux biologiques

Un élément important de la structure d’un graphe : ladistribution des degrés

DéfinitionOn appelle degré du sommet xi le nombre di =

∑j,i wij .

Dans le cadre non pondéré, c’est le nombre d’arêtes reliées à xi .

Dans de nombreux réseaux réels (sociaux, biologiques ...), la distributiondes degrés suit une loi de puissance (graphes sans échelle typique) :voir [Dorogovtsev and Mendes, 2003].

BioPuces (06/11/09) Nathalie Villa Biblio. réseaux biologiques 9 / 25

Page 18: Compte-rendu bibliographique sur les réseaux biologiques

Un élément important de la structure d’un graphe : ladistribution des degrés

DéfinitionOn appelle degré du sommet xi le nombre di =

∑j,i wij .

Dans le cadre non pondéré, c’est le nombre d’arêtes reliées à xi .

Dans de nombreux réseaux réels (sociaux, biologiques ...), la distributiondes degrés suit une loi de puissance (graphes sans échelle typique) :voir [Dorogovtsev and Mendes, 2003].

BioPuces (06/11/09) Nathalie Villa Biblio. réseaux biologiques 9 / 25

Page 19: Compte-rendu bibliographique sur les réseaux biologiques

Conséquences concrètes

Les graphes en loi de puissances contiennent quelques sommetsdont le degré est très fort par rapport aux degrés des autressommets : ce sont, par exemple, des protéines qui interagissent avecbeaucoup d’autres protéines (réseaux d’interactions de protéines).

Enbiologie, on les appelle hubs.

Sur les réseaux de taille moyenne (quelques centaines de sommets),on observe plus fréquemment une loi de puissance tronquée (TPL) :c’est un simple effet de taille mais l’interprétation est conservée.

Ces phénomènes sont très loin de graphes dans lesquels les arêtesseraient réparties aléatoirement avec la même probabilité : cecidonne lieu à des lois binomiales pour la distribution des degrés : iln’existe pas de “hubs” dans ces graphes.

BioPuces (06/11/09) Nathalie Villa Biblio. réseaux biologiques 10 / 25

Page 20: Compte-rendu bibliographique sur les réseaux biologiques

Conséquences concrètes

Les graphes en loi de puissances contiennent quelques sommetsdont le degré est très fort par rapport aux degrés des autressommets : ce sont, par exemple, des protéines qui interagissent avecbeaucoup d’autres protéines (réseaux d’interactions de protéines). Enbiologie, on les appelle hubs.

Sur les réseaux de taille moyenne (quelques centaines de sommets),on observe plus fréquemment une loi de puissance tronquée (TPL) :c’est un simple effet de taille mais l’interprétation est conservée.

Ces phénomènes sont très loin de graphes dans lesquels les arêtesseraient réparties aléatoirement avec la même probabilité : cecidonne lieu à des lois binomiales pour la distribution des degrés : iln’existe pas de “hubs” dans ces graphes.

BioPuces (06/11/09) Nathalie Villa Biblio. réseaux biologiques 10 / 25

Page 21: Compte-rendu bibliographique sur les réseaux biologiques

Conséquences concrètes

Les graphes en loi de puissances contiennent quelques sommetsdont le degré est très fort par rapport aux degrés des autressommets : ce sont, par exemple, des protéines qui interagissent avecbeaucoup d’autres protéines (réseaux d’interactions de protéines). Enbiologie, on les appelle hubs.

Sur les réseaux de taille moyenne (quelques centaines de sommets),on observe plus fréquemment une loi de puissance tronquée (TPL) :c’est un simple effet de taille mais l’interprétation est conservée.

Ces phénomènes sont très loin de graphes dans lesquels les arêtesseraient réparties aléatoirement avec la même probabilité : cecidonne lieu à des lois binomiales pour la distribution des degrés : iln’existe pas de “hubs” dans ces graphes.

BioPuces (06/11/09) Nathalie Villa Biblio. réseaux biologiques 10 / 25

Page 22: Compte-rendu bibliographique sur les réseaux biologiques

Conséquences concrètes

Les graphes en loi de puissances contiennent quelques sommetsdont le degré est très fort par rapport aux degrés des autressommets : ce sont, par exemple, des protéines qui interagissent avecbeaucoup d’autres protéines (réseaux d’interactions de protéines). Enbiologie, on les appelle hubs.

Sur les réseaux de taille moyenne (quelques centaines de sommets),on observe plus fréquemment une loi de puissance tronquée (TPL) :c’est un simple effet de taille mais l’interprétation est conservée.

Ces phénomènes sont très loin de graphes dans lesquels les arêtesseraient réparties aléatoirement avec la même probabilité : cecidonne lieu à des lois binomiales pour la distribution des degrés : iln’existe pas de “hubs” dans ces graphes.

BioPuces (06/11/09) Nathalie Villa Biblio. réseaux biologiques 10 / 25

Page 23: Compte-rendu bibliographique sur les réseaux biologiques

Conséquence de la loi de puissance sur la résistanceaux dommages

[Dorogovtsev and Mendes, 2003]

Les réseaux dont la distribution des degrés est en loi depuissance sont résistants aux dommages qui affectentaléatoirement leurs sommets (la structure macroscopique duréseau est conservée malgré un fort taux de destruction desommets).

À l’inverse, les destructions qui affectent préférentiellement leshubs endommagent rapidement la structure du réseau.

BioPuces (06/11/09) Nathalie Villa Biblio. réseaux biologiques 11 / 25

Page 24: Compte-rendu bibliographique sur les réseaux biologiques

Conséquence de la loi de puissance sur la résistanceaux dommages

[Dorogovtsev and Mendes, 2003]

Les réseaux dont la distribution des degrés est en loi depuissance sont résistants aux dommages qui affectentaléatoirement leurs sommets (la structure macroscopique duréseau est conservée malgré un fort taux de destruction desommets).

À l’inverse, les destructions qui affectent préférentiellement leshubs endommagent rapidement la structure du réseau.

BioPuces (06/11/09) Nathalie Villa Biblio. réseaux biologiques 11 / 25

Page 25: Compte-rendu bibliographique sur les réseaux biologiques

Graphes aléatoires

Pour repérer des phénomènes exceptionnels dans les réseaux réelsétudiés (par exemple, la fréquence de certains motifs), il est courant decomparer le graphe réel à des modèles de graphes aléatoires.

Quelques exemples courants de graphes aléatoires :1 [Erdõs and Rényi, 1959] : n sommets (fixés) ; la probabilité d’une

arête entre deux sommets est p pour toutes les paires.

2 [Albert and Barabási, 2002] : Modèle d’attachement préférentiel.Les sommets sont ajoutés un à un et reliés aléatoirement auxsommets préexistants avec une probabilité plus forte pour lessommets à forts degrés.

3 [Molloy and Reed, 1995] : Modèle dans lequel la loi des degrés estchoisie à l’avance : on génère les degrés de chaque sommet seloncette loi puis on apparie les sommets deux à deux aléatoirement enrespectant les degrés générés.

BioPuces (06/11/09) Nathalie Villa Biblio. réseaux biologiques 12 / 25

Page 26: Compte-rendu bibliographique sur les réseaux biologiques

Graphes aléatoires

Pour repérer des phénomènes exceptionnels dans les réseaux réelsétudiés (par exemple, la fréquence de certains motifs), il est courant decomparer le graphe réel à des modèles de graphes aléatoires.Quelques exemples courants de graphes aléatoires :

1 [Erdõs and Rényi, 1959] : n sommets (fixés) ; la probabilité d’unearête entre deux sommets est p pour toutes les paires.

Loi binomiale pour les degrés ;Modèle simple mais pas réaliste.

● ●

●●

2 [Albert and Barabási, 2002] : Modèle d’attachement préférentiel.Les sommets sont ajoutés un à un et reliés aléatoirement auxsommets préexistants avec une probabilité plus forte pour lessommets à forts degrés.

3 [Molloy and Reed, 1995] : Modèle dans lequel la loi des degrés estchoisie à l’avance : on génère les degrés de chaque sommet seloncette loi puis on apparie les sommets deux à deux aléatoirement enrespectant les degrés générés.

BioPuces (06/11/09) Nathalie Villa Biblio. réseaux biologiques 12 / 25

Page 27: Compte-rendu bibliographique sur les réseaux biologiques

Graphes aléatoires

Pour repérer des phénomènes exceptionnels dans les réseaux réelsétudiés (par exemple, la fréquence de certains motifs), il est courant decomparer le graphe réel à des modèles de graphes aléatoires.Quelques exemples courants de graphes aléatoires :

1 [Erdõs and Rényi, 1959] : n sommets (fixés) ; la probabilité d’unearête entre deux sommets est p pour toutes les paires.

2 [Albert and Barabási, 2002] : Modèle d’attachement préférentiel.Les sommets sont ajoutés un à un et reliés aléatoirement auxsommets préexistants avec une probabilité plus forte pour lessommets à forts degrés.

Loi de puissance : P(D ≥ k) ∼ k−3.

3 [Molloy and Reed, 1995] : Modèle dans lequel la loi des degrés estchoisie à l’avance : on génère les degrés de chaque sommet seloncette loi puis on apparie les sommets deux à deux aléatoirement enrespectant les degrés générés.

BioPuces (06/11/09) Nathalie Villa Biblio. réseaux biologiques 12 / 25

Page 28: Compte-rendu bibliographique sur les réseaux biologiques

Graphes aléatoires

Pour repérer des phénomènes exceptionnels dans les réseaux réelsétudiés (par exemple, la fréquence de certains motifs), il est courant decomparer le graphe réel à des modèles de graphes aléatoires.Quelques exemples courants de graphes aléatoires :

1 [Erdõs and Rényi, 1959] : n sommets (fixés) ; la probabilité d’unearête entre deux sommets est p pour toutes les paires.

2 [Albert and Barabási, 2002] : Modèle d’attachement préférentiel.Les sommets sont ajoutés un à un et reliés aléatoirement auxsommets préexistants avec une probabilité plus forte pour lessommets à forts degrés.

3 [Molloy and Reed, 1995] : Modèle dans lequel la loi des degrés estchoisie à l’avance : on génère les degrés de chaque sommet seloncette loi puis on apparie les sommets deux à deux aléatoirement enrespectant les degrés générés.

BioPuces (06/11/09) Nathalie Villa Biblio. réseaux biologiques 12 / 25

Page 29: Compte-rendu bibliographique sur les réseaux biologiques

Recherche de motifs dans le réseau de régulationtranscriptionnelle de Escherichia Coli

Référence : Shen-Orr S.S., Milo R., Mangan S. and Alon U. (2002)Network motifs in the transcriptional regulation network of EscherichiaColi. Nature genetics, 31, 64-68.

Description des données : Réseau de régulation transcriptionnellemodélisé par un graphe orienté dont

les sommets sont des opérons (groupes de gènes contigus qui sonttranscrit en ARNm simple) ;

les arêtes sont des interactions directes dans la transcription :l’opérons i régule l’opérons j est modélisé par une arête du sommet ivers le sommet j.

Le réseau initial est composé de 377 interactions pour 424 opérons avec116 facteurs de transcription. Une recherche bibliographique intensive apermis d’ajouter 35 facteurs d’interactions.

BioPuces (06/11/09) Nathalie Villa Biblio. réseaux biologiques 13 / 25

Page 30: Compte-rendu bibliographique sur les réseaux biologiques

Recherche de motifs dans le réseau de régulationtranscriptionnelle de Escherichia Coli

Référence : Shen-Orr S.S., Milo R., Mangan S. and Alon U. (2002)Network motifs in the transcriptional regulation network of EscherichiaColi. Nature genetics, 31, 64-68.Description des données : Réseau de régulation transcriptionnellemodélisé par un graphe orienté dont

les sommets sont des opérons (groupes de gènes contigus qui sonttranscrit en ARNm simple) ;

les arêtes sont des interactions directes dans la transcription :l’opérons i régule l’opérons j est modélisé par une arête du sommet ivers le sommet j.

Le réseau initial est composé de 377 interactions pour 424 opérons avec116 facteurs de transcription. Une recherche bibliographique intensive apermis d’ajouter 35 facteurs d’interactions.

BioPuces (06/11/09) Nathalie Villa Biblio. réseaux biologiques 13 / 25

Page 31: Compte-rendu bibliographique sur les réseaux biologiques

Recherche de motifs dans le réseau de régulationtranscriptionnelle de Escherichia Coli

Référence : Shen-Orr S.S., Milo R., Mangan S. and Alon U. (2002)Network motifs in the transcriptional regulation network of EscherichiaColi. Nature genetics, 31, 64-68.Description des données : Réseau de régulation transcriptionnellemodélisé par un graphe orienté dont

les sommets sont des opérons (groupes de gènes contigus qui sonttranscrit en ARNm simple) ;

les arêtes sont des interactions directes dans la transcription :l’opérons i régule l’opérons j est modélisé par une arête du sommet ivers le sommet j.

Le réseau initial est composé de 377 interactions pour 424 opérons avec116 facteurs de transcription. Une recherche bibliographique intensive apermis d’ajouter 35 facteurs d’interactions.

BioPuces (06/11/09) Nathalie Villa Biblio. réseaux biologiques 13 / 25

Page 32: Compte-rendu bibliographique sur les réseaux biologiques

Recherche de motifs dans le réseau de régulationtranscriptionnelle de Escherichia Coli

Référence : Shen-Orr S.S., Milo R., Mangan S. and Alon U. (2002)Network motifs in the transcriptional regulation network of EscherichiaColi. Nature genetics, 31, 64-68.Description des données : Réseau de régulation transcriptionnellemodélisé par un graphe orienté dont

les sommets sont des opérons (groupes de gènes contigus qui sonttranscrit en ARNm simple) ;

les arêtes sont des interactions directes dans la transcription :l’opérons i régule l’opérons j est modélisé par une arête du sommet ivers le sommet j.

Le réseau initial est composé de 377 interactions pour 424 opérons avec116 facteurs de transcription. Une recherche bibliographique intensive apermis d’ajouter 35 facteurs d’interactions.

BioPuces (06/11/09) Nathalie Villa Biblio. réseaux biologiques 13 / 25

Page 33: Compte-rendu bibliographique sur les réseaux biologiques

But et méthodologie

But : Mettre en valeur des motifs exceptionnellement présents dans leréseau.

Méthodologie : On simule 1000 réseaux aléatoires ayant :

même nombre d’opérons (sommets) ;

même nombre d’interactions (arêtes) ;

mêmes degrés (entrant et sortant) des sommets ;

puis on compare la fréquence d’apparition d’un motif donné dans la réalitéet sur les 1000 graphes aléatoires.Si un motif apparaît bien plus souvent dans le graphe réel qu’en moyennesur les 1000 graphes aléatoires, c’est qu’il a une signification biologique(car il n’est pas le simple fait du hasard...).

BioPuces (06/11/09) Nathalie Villa Biblio. réseaux biologiques 14 / 25

Page 34: Compte-rendu bibliographique sur les réseaux biologiques

But et méthodologie

But : Mettre en valeur des motifs exceptionnellement présents dans leréseau.Méthodologie : On simule 1000 réseaux aléatoires ayant :

même nombre d’opérons (sommets) ;

même nombre d’interactions (arêtes) ;

mêmes degrés (entrant et sortant) des sommets ;

puis on compare la fréquence d’apparition d’un motif donné dans la réalitéet sur les 1000 graphes aléatoires.

Si un motif apparaît bien plus souvent dans le graphe réel qu’en moyennesur les 1000 graphes aléatoires, c’est qu’il a une signification biologique(car il n’est pas le simple fait du hasard...).

BioPuces (06/11/09) Nathalie Villa Biblio. réseaux biologiques 14 / 25

Page 35: Compte-rendu bibliographique sur les réseaux biologiques

But et méthodologie

But : Mettre en valeur des motifs exceptionnellement présents dans leréseau.Méthodologie : On simule 1000 réseaux aléatoires ayant :

même nombre d’opérons (sommets) ;

même nombre d’interactions (arêtes) ;

mêmes degrés (entrant et sortant) des sommets ;

puis on compare la fréquence d’apparition d’un motif donné dans la réalitéet sur les 1000 graphes aléatoires.Si un motif apparaît bien plus souvent dans le graphe réel qu’en moyennesur les 1000 graphes aléatoires, c’est qu’il a une signification biologique(car il n’est pas le simple fait du hasard...).

BioPuces (06/11/09) Nathalie Villa Biblio. réseaux biologiques 14 / 25

Page 36: Compte-rendu bibliographique sur les réseaux biologiques

Motifs étudiés

1 Feedforward loop (boucle)

A B C

A régule B qui régule C et A régule directement C.

2 SIM (groupe à entrée unique)3 Paires d’opérons régulés par la même paire d’opérons4 DOR (régulations denses se chevauchant)

X1 X2 Xm

Z1 Z2 Z3 Zn......

Groupes d’opérons régulés par un même groupe d’opérons danslequel le nombre d’arêtes est bien plus grand que dans un graphealéatoire de mêmes caractéristiques.

BioPuces (06/11/09) Nathalie Villa Biblio. réseaux biologiques 15 / 25

Page 37: Compte-rendu bibliographique sur les réseaux biologiques

Motifs étudiés

1 Feedforward loop (boucle)

A B C

A régule B qui régule C et A régule directement C. La boucle est ditecohérente si l’effet direct de A sur C est dans le même sens quel’effet indirect de A sur C. Sinon, la boucle est dite incohérente.

2 SIM (groupe à entrée unique)3 Paires d’opérons régulés par la même paire d’opérons4 DOR (régulations denses se chevauchant)

X1 X2 Xm

Z1 Z2 Z3 Zn......

Groupes d’opérons régulés par un même groupe d’opérons danslequel le nombre d’arêtes est bien plus grand que dans un graphealéatoire de mêmes caractéristiques.

BioPuces (06/11/09) Nathalie Villa Biblio. réseaux biologiques 15 / 25

Page 38: Compte-rendu bibliographique sur les réseaux biologiques

Motifs étudiés

1 Feedforward loop (boucle)2 SIM (groupe à entrée unique)

X

Z1 Z2 Z3 Zn...

X régule un groupe de n (grand) opérons qui ne sont régulés que parX ; X est souvent auto-régulé.

3 Paires d’opérons régulés par la même paire d’opérons4 DOR (régulations denses se chevauchant)

X1 X2 Xm

Z1 Z2 Z3 Zn......

Groupes d’opérons régulés par un même groupe d’opérons danslequel le nombre d’arêtes est bien plus grand que dans un graphealéatoire de mêmes caractéristiques.

BioPuces (06/11/09) Nathalie Villa Biblio. réseaux biologiques 15 / 25

Page 39: Compte-rendu bibliographique sur les réseaux biologiques

Motifs étudiés

1 Feedforward loop (boucle)2 SIM (groupe à entrée unique)3 Paires d’opérons régulés par la même paire d’opérons

4 DOR (régulations denses se chevauchant)

X1 X2 Xm

Z1 Z2 Z3 Zn......

Groupes d’opérons régulés par un même groupe d’opérons danslequel le nombre d’arêtes est bien plus grand que dans un graphealéatoire de mêmes caractéristiques.

BioPuces (06/11/09) Nathalie Villa Biblio. réseaux biologiques 15 / 25

Page 40: Compte-rendu bibliographique sur les réseaux biologiques

Motifs étudiés

1 Feedforward loop (boucle)2 SIM (groupe à entrée unique)3 Paires d’opérons régulés par la même paire d’opérons4 DOR (régulations denses se chevauchant)

X1 X2 Xm

Z1 Z2 Z3 Zn......

Groupes d’opérons régulés par un même groupe d’opérons danslequel le nombre d’arêtes est bien plus grand que dans un graphealéatoire de mêmes caractéristiques.BioPuces (06/11/09) Nathalie Villa Biblio. réseaux biologiques 15 / 25

Page 41: Compte-rendu bibliographique sur les réseaux biologiques

Significativité de l’apparition des motifs

Motif Nombre d’apparitions p-valueBoucles cohérentes 34 < 0.001Boucles incohérentes 6 ∼ 0.03SIM (> 13 opérons) 68 < 0.01Paires régulées par des paires 203 < 0.001DOR NC < 0.001

BioPuces (06/11/09) Nathalie Villa Biblio. réseaux biologiques 16 / 25

Page 42: Compte-rendu bibliographique sur les réseaux biologiques

Représentation schématique

BioPuces (06/11/09) Nathalie Villa Biblio. réseaux biologiques 17 / 25

Page 43: Compte-rendu bibliographique sur les réseaux biologiques

Synthèse de quelques propriétés de structure desréseaux biologiques

Référence : Proulx S.R., Promislow D.E.L. and Phillips P.C. (2005)Network thinking in ecology and evolution. Trends in Ecology andEvolution, 20(6), 345-353.

BioPuces (06/11/09) Nathalie Villa Biblio. réseaux biologiques 18 / 25

Page 44: Compte-rendu bibliographique sur les réseaux biologiques

Quelques faits connus sur les réseaux d’interactionsde protéines

Beaucoup des motifs locaux existent depuis très longtemps(persistance).

Les hubs sont plus fréquemment des protéines essentielles pour lasurvie.

Les hubs sont plus fréquemment des protéines pléiotropes (plusieursfonctions ?).

Les hubs ont moins disparu au cours de l’évolution.

Les hubs sont faiblement connectés entre eux.

BioPuces (06/11/09) Nathalie Villa Biblio. réseaux biologiques 19 / 25

Page 45: Compte-rendu bibliographique sur les réseaux biologiques

Quelques faits connus sur les voies métaboliques

Elles sont très résistantes aux dommages.

BioPuces (06/11/09) Nathalie Villa Biblio. réseaux biologiques 20 / 25

Page 46: Compte-rendu bibliographique sur les réseaux biologiques

Quelques faits connus sur les réseaux de régulationde gènes

Ils contiennent beaucoup de petits motifs locaux.

Ils sont robustes aux dommages (mutations, par exemples).

Les gènes régulés par beaucoup de gènes sont plus variables dansleurs niveaux d’expression selon les conditions environnementales.

BioPuces (06/11/09) Nathalie Villa Biblio. réseaux biologiques 21 / 25

Page 47: Compte-rendu bibliographique sur les réseaux biologiques

Remise en cause des conclusions portées sur lesréseaux biologiques

Référence : Siegal M., Promislow D.E.L. and Bergman A. (2007)Functional and evolutionary inference in gene networks : does topologymatter ? Genetica, 129, 83-103.

BioPuces (06/11/09) Nathalie Villa Biblio. réseaux biologiques 22 / 25

Page 48: Compte-rendu bibliographique sur les réseaux biologiques

Motifs, distribution des degrés

Les motifs n’ont pas la même signification selon qu’on les considèredans leur version orientée ou non orientée. Par exemple :

La distribution des degrés est rarement en loi de puissance mais enloi de puissance tronquée (ndlr : effet de taille car on ne peutobserver une “vraie” loi de puissance sur un petit graphe).

BioPuces (06/11/09) Nathalie Villa Biblio. réseaux biologiques 23 / 25

Page 49: Compte-rendu bibliographique sur les réseaux biologiques

Motifs, distribution des degrés

Les motifs n’ont pas la même signification selon qu’on les considèredans leur version orientée ou non orientée. Par exemple :

La distribution des degrés est rarement en loi de puissance mais enloi de puissance tronquée (ndlr : effet de taille car on ne peutobserver une “vraie” loi de puissance sur un petit graphe).

BioPuces (06/11/09) Nathalie Villa Biblio. réseaux biologiques 23 / 25

Page 50: Compte-rendu bibliographique sur les réseaux biologiques

Motifs, distribution des degrés

Les motifs n’ont pas la même signification selon qu’on les considèredans leur version orientée ou non orientée. Par exemple :

La distribution des degrés est rarement en loi de puissance mais enloi de puissance tronquée (ndlr : effet de taille car on ne peutobserver une “vraie” loi de puissance sur un petit graphe).

BioPuces (06/11/09) Nathalie Villa Biblio. réseaux biologiques 23 / 25

Page 51: Compte-rendu bibliographique sur les réseaux biologiques

Motifs, distribution des degrés

Les motifs n’ont pas la même signification selon qu’on les considèredans leur version orientée ou non orientée. Par exemple :

La distribution des degrés est rarement en loi de puissance mais enloi de puissance tronquée (ndlr : effet de taille car on ne peutobserver une “vraie” loi de puissance sur un petit graphe).

BioPuces (06/11/09) Nathalie Villa Biblio. réseaux biologiques 23 / 25

Page 52: Compte-rendu bibliographique sur les réseaux biologiques

Hubs

Ce que l’on pense : Les hubs sont mortels si supprimés (laproportion de protéines essentielles est 3 fois plus forte dans les hubset, inversement, les protéines essentielles ont un degré moyen plusgrand que les protéines non essentielles).

Mais : Si on regarde la variabilité de l’expression des gènes lorsqu’ungène est supprimé, la corrélation est très faible entre le degré dugène supprimé et la variabilité.

Et : Le degré explique seulement 1% de la variance dans le tauxd’évolution d’une protéine.

L’article contient aussi des expériences faites sur des modèles de réseauxd’interactions : non rapporté ici car loin de la réalité.

BioPuces (06/11/09) Nathalie Villa Biblio. réseaux biologiques 24 / 25

Page 53: Compte-rendu bibliographique sur les réseaux biologiques

Hubs

Ce que l’on pense : Les hubs sont mortels si supprimés (laproportion de protéines essentielles est 3 fois plus forte dans les hubset, inversement, les protéines essentielles ont un degré moyen plusgrand que les protéines non essentielles).

Mais : Si on regarde la variabilité de l’expression des gènes lorsqu’ungène est supprimé, la corrélation est très faible entre le degré dugène supprimé et la variabilité.

Et : Le degré explique seulement 1% de la variance dans le tauxd’évolution d’une protéine.

L’article contient aussi des expériences faites sur des modèles de réseauxd’interactions : non rapporté ici car loin de la réalité.

BioPuces (06/11/09) Nathalie Villa Biblio. réseaux biologiques 24 / 25

Page 54: Compte-rendu bibliographique sur les réseaux biologiques

Hubs

Ce que l’on pense : Les hubs sont mortels si supprimés (laproportion de protéines essentielles est 3 fois plus forte dans les hubset, inversement, les protéines essentielles ont un degré moyen plusgrand que les protéines non essentielles).

Mais : Si on regarde la variabilité de l’expression des gènes lorsqu’ungène est supprimé, la corrélation est très faible entre le degré dugène supprimé et la variabilité.

Et : Le degré explique seulement 1% de la variance dans le tauxd’évolution d’une protéine.

L’article contient aussi des expériences faites sur des modèles de réseauxd’interactions : non rapporté ici car loin de la réalité.

BioPuces (06/11/09) Nathalie Villa Biblio. réseaux biologiques 24 / 25

Page 55: Compte-rendu bibliographique sur les réseaux biologiques

Recherche de modules, classification de sommets

À SUIVRE...

BioPuces (06/11/09) Nathalie Villa Biblio. réseaux biologiques 25 / 25

Page 56: Compte-rendu bibliographique sur les réseaux biologiques

Albert, R. and Barabási, A. (2002).Statistical mechanics of complex networks.Reviews of Modern Physics, 74 :47–97.

Dorogovtsev, S. and Mendes, J. (2003).Evolution of Networks. From biological Nets to the Internet and WWW.Oxford University Press.

Erdõs, P. and Rényi, A. (1959).On random graphs. i.Publicationes Mathematicae, 6 :290–297.

Molloy, M. and Reed, B. (1995).A critical point for random graphs with a given degree sequence.Random Structures and Algorithms, 6 :161–180.

BioPuces (06/11/09) Nathalie Villa Biblio. réseaux biologiques 25 / 25