asymétrie dans la division cellulairesaporta/pdf/exposes/cimpa...ecolederecherchecimpa...

113
Ecole de Recherche CIMPA Mathématiques pour la biologie ENIT-LAMSIN, Tunis Octobre 2016 Asymétrie dans la division cellulaire un exemple de traitement statistique de données issues de la biologie Benoîte de Saporta IMAG, Montpellier

Upload: others

Post on 30-Jul-2020

0 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Asymétrie dans la division cellulairesaporta/PDF/EXPOSES/CIMPA...EcoledeRechercheCIMPA Mathématiquespourlabiologie ENIT-LAMSIN,TunisOctobre201612=64 Démarchestatistique I recueildesdonnées

Ecole de Recherche CIMPA Mathématiques pour la biologie ENIT-LAMSIN, Tunis Octobre 2016

Asymétrie dans la division cellulaireun exemple de traitement statistique de données issues

de la biologie

Benoîte de Saporta IMAG, Montpellier

Page 2: Asymétrie dans la division cellulairesaporta/PDF/EXPOSES/CIMPA...EcoledeRechercheCIMPA Mathématiquespourlabiologie ENIT-LAMSIN,TunisOctobre201612=64 Démarchestatistique I recueildesdonnées

PlanIntroduction : deux expériences de biologie

L’expérience de Stewart et al.L’expérience de Wang et al.

Démarche statistiqueEstimationTests

Analyse des données de Stewart et al.Description des donnéesModélisationEstimationTests de symétrie

Analyse des données de Wang et al.Description des donnéesEstimation

ConclusionEcole de Recherche CIMPA Mathématiques pour la biologie ENIT-LAMSIN, Tunis Octobre 2016 2/64

Page 3: Asymétrie dans la division cellulairesaporta/PDF/EXPOSES/CIMPA...EcoledeRechercheCIMPA Mathématiquespourlabiologie ENIT-LAMSIN,TunisOctobre201612=64 Démarchestatistique I recueildesdonnées

Introduction : deux expériences de biologie

Asymétrie de la division cellulaire

Est-ce que les organismes unicellulaires vieillissent ?Est-ce que la division cellulaire est symétrique ?

I pas de signe visible de vieillissement des organismesunicellulaires

I deux cellules filles sont génétiquement identiques à leur mèreI la partage du matériel cellulaire est-il identique entre deux

cellules filles ?

Ecole de Recherche CIMPA Mathématiques pour la biologie ENIT-LAMSIN, Tunis Octobre 2016 3/64

Page 4: Asymétrie dans la division cellulairesaporta/PDF/EXPOSES/CIMPA...EcoledeRechercheCIMPA Mathématiquespourlabiologie ENIT-LAMSIN,TunisOctobre201612=64 Démarchestatistique I recueildesdonnées

Introduction : deux expériences de biologie

Une mesure d’âge pour Escherichia coli[Stewart & al. 2005]

Ecole de Recherche CIMPA Mathématiques pour la biologie ENIT-LAMSIN, Tunis Octobre 2016 4/64

Page 5: Asymétrie dans la division cellulairesaporta/PDF/EXPOSES/CIMPA...EcoledeRechercheCIMPA Mathématiquespourlabiologie ENIT-LAMSIN,TunisOctobre201612=64 Démarchestatistique I recueildesdonnées

Introduction : deux expériences de biologie L’expérience de Stewart et al.

Expériences de Stewart et al.

Ecole de Recherche CIMPA Mathématiques pour la biologie ENIT-LAMSIN, Tunis Octobre 2016 5/64

Page 6: Asymétrie dans la division cellulairesaporta/PDF/EXPOSES/CIMPA...EcoledeRechercheCIMPA Mathématiquespourlabiologie ENIT-LAMSIN,TunisOctobre201612=64 Démarchestatistique I recueildesdonnées

Introduction : deux expériences de biologie L’expérience de Stewart et al.

Expériences de Stewart et al.

Ecole de Recherche CIMPA Mathématiques pour la biologie ENIT-LAMSIN, Tunis Octobre 2016 5/64

Page 7: Asymétrie dans la division cellulairesaporta/PDF/EXPOSES/CIMPA...EcoledeRechercheCIMPA Mathématiquespourlabiologie ENIT-LAMSIN,TunisOctobre201612=64 Démarchestatistique I recueildesdonnées

Introduction : deux expériences de biologie L’expérience de Stewart et al.

Expériences de Stewart et al.

Ecole de Recherche CIMPA Mathématiques pour la biologie ENIT-LAMSIN, Tunis Octobre 2016 5/64

Page 8: Asymétrie dans la division cellulairesaporta/PDF/EXPOSES/CIMPA...EcoledeRechercheCIMPA Mathématiquespourlabiologie ENIT-LAMSIN,TunisOctobre201612=64 Démarchestatistique I recueildesdonnées

Introduction : deux expériences de biologie L’expérience de Stewart et al.

Expériences de Stewart et al.

Ecole de Recherche CIMPA Mathématiques pour la biologie ENIT-LAMSIN, Tunis Octobre 2016 5/64

Page 9: Asymétrie dans la division cellulairesaporta/PDF/EXPOSES/CIMPA...EcoledeRechercheCIMPA Mathématiquespourlabiologie ENIT-LAMSIN,TunisOctobre201612=64 Démarchestatistique I recueildesdonnées

Introduction : deux expériences de biologie L’expérience de Stewart et al.

Expériences de Stewart et al.

Ecole de Recherche CIMPA Mathématiques pour la biologie ENIT-LAMSIN, Tunis Octobre 2016 5/64

Page 10: Asymétrie dans la division cellulairesaporta/PDF/EXPOSES/CIMPA...EcoledeRechercheCIMPA Mathématiquespourlabiologie ENIT-LAMSIN,TunisOctobre201612=64 Démarchestatistique I recueildesdonnées

Introduction : deux expériences de biologie L’expérience de Stewart et al.

Expériences de Stewart et al.

Ecole de Recherche CIMPA Mathématiques pour la biologie ENIT-LAMSIN, Tunis Octobre 2016 5/64

Page 11: Asymétrie dans la division cellulairesaporta/PDF/EXPOSES/CIMPA...EcoledeRechercheCIMPA Mathématiquespourlabiologie ENIT-LAMSIN,TunisOctobre201612=64 Démarchestatistique I recueildesdonnées

Introduction : deux expériences de biologie L’expérience de Stewart et al.

Expériences de Stewart et al.

Ecole de Recherche CIMPA Mathématiques pour la biologie ENIT-LAMSIN, Tunis Octobre 2016 5/64

Page 12: Asymétrie dans la division cellulairesaporta/PDF/EXPOSES/CIMPA...EcoledeRechercheCIMPA Mathématiquespourlabiologie ENIT-LAMSIN,TunisOctobre201612=64 Démarchestatistique I recueildesdonnées

Introduction : deux expériences de biologie L’expérience de Stewart et al.

Expériences de Stewart et al.

Ecole de Recherche CIMPA Mathématiques pour la biologie ENIT-LAMSIN, Tunis Octobre 2016 5/64

Page 13: Asymétrie dans la division cellulairesaporta/PDF/EXPOSES/CIMPA...EcoledeRechercheCIMPA Mathématiquespourlabiologie ENIT-LAMSIN,TunisOctobre201612=64 Démarchestatistique I recueildesdonnées

Introduction : deux expériences de biologie L’expérience de Stewart et al.

Expériences de Stewart et al.

Ecole de Recherche CIMPA Mathématiques pour la biologie ENIT-LAMSIN, Tunis Octobre 2016 5/64

Page 14: Asymétrie dans la division cellulairesaporta/PDF/EXPOSES/CIMPA...EcoledeRechercheCIMPA Mathématiquespourlabiologie ENIT-LAMSIN,TunisOctobre201612=64 Démarchestatistique I recueildesdonnées

Introduction : deux expériences de biologie L’expérience de Stewart et al.

Expériences de Stewart et al.

Ecole de Recherche CIMPA Mathématiques pour la biologie ENIT-LAMSIN, Tunis Octobre 2016 5/64

Page 15: Asymétrie dans la division cellulairesaporta/PDF/EXPOSES/CIMPA...EcoledeRechercheCIMPA Mathématiquespourlabiologie ENIT-LAMSIN,TunisOctobre201612=64 Démarchestatistique I recueildesdonnées

Introduction : deux expériences de biologie L’expérience de Stewart et al.

Conclusions de Stewart et al.[Stewart & al. 2005]

"(...) the cell that inherits the old pole exhibits a diminishedgrowth rate, decreased offspring production, and an increasedincidence of death."Ecole de Recherche CIMPA Mathématiques pour la biologie ENIT-LAMSIN, Tunis Octobre 2016 6/64

Page 16: Asymétrie dans la division cellulairesaporta/PDF/EXPOSES/CIMPA...EcoledeRechercheCIMPA Mathématiquespourlabiologie ENIT-LAMSIN,TunisOctobre201612=64 Démarchestatistique I recueildesdonnées

Introduction : deux expériences de biologie L’expérience de Wang et al.

Taux de croissance avec beaucoup plus de divisions ?

[Wang & al. 2012]

Ecole de Recherche CIMPA Mathématiques pour la biologie ENIT-LAMSIN, Tunis Octobre 2016 7/64

Page 17: Asymétrie dans la division cellulairesaporta/PDF/EXPOSES/CIMPA...EcoledeRechercheCIMPA Mathématiquespourlabiologie ENIT-LAMSIN,TunisOctobre201612=64 Démarchestatistique I recueildesdonnées

Introduction : deux expériences de biologie L’expérience de Wang et al.

Expériences de Wang et al.

[Wang & al. 2012]

Ecole de Recherche CIMPA Mathématiques pour la biologie ENIT-LAMSIN, Tunis Octobre 2016 8/64

Page 18: Asymétrie dans la division cellulairesaporta/PDF/EXPOSES/CIMPA...EcoledeRechercheCIMPA Mathématiquespourlabiologie ENIT-LAMSIN,TunisOctobre201612=64 Démarchestatistique I recueildesdonnées

Introduction : deux expériences de biologie L’expérience de Wang et al.

Expériences de Wang et al.

[Wang & al. 2012]

Ecole de Recherche CIMPA Mathématiques pour la biologie ENIT-LAMSIN, Tunis Octobre 2016 8/64

Page 19: Asymétrie dans la division cellulairesaporta/PDF/EXPOSES/CIMPA...EcoledeRechercheCIMPA Mathématiquespourlabiologie ENIT-LAMSIN,TunisOctobre201612=64 Démarchestatistique I recueildesdonnées

Introduction : deux expériences de biologie L’expérience de Wang et al.

Expériences de Wang et al.

[Wang & al. 2012]

Ecole de Recherche CIMPA Mathématiques pour la biologie ENIT-LAMSIN, Tunis Octobre 2016 8/64

Page 20: Asymétrie dans la division cellulairesaporta/PDF/EXPOSES/CIMPA...EcoledeRechercheCIMPA Mathématiquespourlabiologie ENIT-LAMSIN,TunisOctobre201612=64 Démarchestatistique I recueildesdonnées

Introduction : deux expériences de biologie L’expérience de Wang et al.

Expériences de Wang et al.

[Wang & al. 2012]

Ecole de Recherche CIMPA Mathématiques pour la biologie ENIT-LAMSIN, Tunis Octobre 2016 8/64

Page 21: Asymétrie dans la division cellulairesaporta/PDF/EXPOSES/CIMPA...EcoledeRechercheCIMPA Mathématiquespourlabiologie ENIT-LAMSIN,TunisOctobre201612=64 Démarchestatistique I recueildesdonnées

Introduction : deux expériences de biologie L’expérience de Wang et al.

Expériences de Wang et al.

[Wang & al. 2012]

Ecole de Recherche CIMPA Mathématiques pour la biologie ENIT-LAMSIN, Tunis Octobre 2016 8/64

Page 22: Asymétrie dans la division cellulairesaporta/PDF/EXPOSES/CIMPA...EcoledeRechercheCIMPA Mathématiquespourlabiologie ENIT-LAMSIN,TunisOctobre201612=64 Démarchestatistique I recueildesdonnées

Introduction : deux expériences de biologie L’expérience de Wang et al.

Conclusions de Wang et al.

[Wang & al. 2012]

"Our analysis (...) reveals a remarkable stability of growthwhereby the mother cell inherits the same pole for hundreds ofgenerations."

Ecole de Recherche CIMPA Mathématiques pour la biologie ENIT-LAMSIN, Tunis Octobre 2016 9/64

Page 23: Asymétrie dans la division cellulairesaporta/PDF/EXPOSES/CIMPA...EcoledeRechercheCIMPA Mathématiquespourlabiologie ENIT-LAMSIN,TunisOctobre201612=64 Démarchestatistique I recueildesdonnées

Introduction : deux expériences de biologie L’expérience de Wang et al.

QuestionsI Les deux expériences sont-elles contradictoires ?I La division d’E. coli est-elle asymétrique ?

=⇒ Nouvelle analyse statistique des deux jeux de données

Ecole de Recherche CIMPA Mathématiques pour la biologie ENIT-LAMSIN, Tunis Octobre 2016 10/64

Page 24: Asymétrie dans la division cellulairesaporta/PDF/EXPOSES/CIMPA...EcoledeRechercheCIMPA Mathématiquespourlabiologie ENIT-LAMSIN,TunisOctobre201612=64 Démarchestatistique I recueildesdonnées

Démarche statistique

Plan

Introduction : deux expériences de biologie

Démarche statistiqueEstimationTests

Analyse des données de Stewart et al.

Analyse des données de Wang et al.

Conclusion

Ecole de Recherche CIMPA Mathématiques pour la biologie ENIT-LAMSIN, Tunis Octobre 2016 11/64

Page 25: Asymétrie dans la division cellulairesaporta/PDF/EXPOSES/CIMPA...EcoledeRechercheCIMPA Mathématiquespourlabiologie ENIT-LAMSIN,TunisOctobre201612=64 Démarchestatistique I recueildesdonnées

Démarche statistique

Démarche statistique

I recueil des données [Stewart & al. 2005], [Wang & al. 2012]

⇓ mise en forme des données, prétraitement ⇓I statistique exploratoire ou descriptive : synthétiser

l’information, la représenter graphiquementI statistique inférentielle : estimer des paramètres, valider ou

infirmer des hypothèses au vu des données⇒ modèle probabiliste

I modélisation statistique : chercher des liens (approximatifs)entre les variables

Ecole de Recherche CIMPA Mathématiques pour la biologie ENIT-LAMSIN, Tunis Octobre 2016 12/64

Page 26: Asymétrie dans la division cellulairesaporta/PDF/EXPOSES/CIMPA...EcoledeRechercheCIMPA Mathématiquespourlabiologie ENIT-LAMSIN,TunisOctobre201612=64 Démarchestatistique I recueildesdonnées

Démarche statistique

Démarche statistique

I recueil des données [Stewart & al. 2005], [Wang & al. 2012]

⇓ mise en forme des données, prétraitement ⇓

I statistique exploratoire ou descriptive : synthétiserl’information, la représenter graphiquement

I statistique inférentielle : estimer des paramètres, valider ouinfirmer des hypothèses au vu des données⇒ modèle probabiliste

I modélisation statistique : chercher des liens (approximatifs)entre les variables

Ecole de Recherche CIMPA Mathématiques pour la biologie ENIT-LAMSIN, Tunis Octobre 2016 12/64

Page 27: Asymétrie dans la division cellulairesaporta/PDF/EXPOSES/CIMPA...EcoledeRechercheCIMPA Mathématiquespourlabiologie ENIT-LAMSIN,TunisOctobre201612=64 Démarchestatistique I recueildesdonnées

Démarche statistique

Démarche statistique

I recueil des données [Stewart & al. 2005], [Wang & al. 2012]

⇓ mise en forme des données, prétraitement ⇓I statistique exploratoire ou descriptive : synthétiser

l’information, la représenter graphiquement

I statistique inférentielle : estimer des paramètres, valider ouinfirmer des hypothèses au vu des données⇒ modèle probabiliste

I modélisation statistique : chercher des liens (approximatifs)entre les variables

Ecole de Recherche CIMPA Mathématiques pour la biologie ENIT-LAMSIN, Tunis Octobre 2016 12/64

Page 28: Asymétrie dans la division cellulairesaporta/PDF/EXPOSES/CIMPA...EcoledeRechercheCIMPA Mathématiquespourlabiologie ENIT-LAMSIN,TunisOctobre201612=64 Démarchestatistique I recueildesdonnées

Démarche statistique

Démarche statistique

I recueil des données [Stewart & al. 2005], [Wang & al. 2012]

⇓ mise en forme des données, prétraitement ⇓I statistique exploratoire ou descriptive : synthétiser

l’information, la représenter graphiquementI statistique inférentielle : estimer des paramètres, valider ou

infirmer des hypothèses au vu des données

⇒ modèle probabilisteI modélisation statistique : chercher des liens (approximatifs)

entre les variables

Ecole de Recherche CIMPA Mathématiques pour la biologie ENIT-LAMSIN, Tunis Octobre 2016 12/64

Page 29: Asymétrie dans la division cellulairesaporta/PDF/EXPOSES/CIMPA...EcoledeRechercheCIMPA Mathématiquespourlabiologie ENIT-LAMSIN,TunisOctobre201612=64 Démarchestatistique I recueildesdonnées

Démarche statistique

Démarche statistique

I recueil des données [Stewart & al. 2005], [Wang & al. 2012]

⇓ mise en forme des données, prétraitement ⇓I statistique exploratoire ou descriptive : synthétiser

l’information, la représenter graphiquementI statistique inférentielle : estimer des paramètres, valider ou

infirmer des hypothèses au vu des données⇒ modèle probabiliste

I modélisation statistique : chercher des liens (approximatifs)entre les variables

Ecole de Recherche CIMPA Mathématiques pour la biologie ENIT-LAMSIN, Tunis Octobre 2016 12/64

Page 30: Asymétrie dans la division cellulairesaporta/PDF/EXPOSES/CIMPA...EcoledeRechercheCIMPA Mathématiquespourlabiologie ENIT-LAMSIN,TunisOctobre201612=64 Démarchestatistique I recueildesdonnées

Démarche statistique

Démarche statistique

I recueil des données [Stewart & al. 2005], [Wang & al. 2012]

⇓ mise en forme des données, prétraitement ⇓I statistique exploratoire ou descriptive : synthétiser

l’information, la représenter graphiquementI statistique inférentielle : estimer des paramètres, valider ou

infirmer des hypothèses au vu des données⇒ modèle probabiliste

I modélisation statistique : chercher des liens (approximatifs)entre les variables

Ecole de Recherche CIMPA Mathématiques pour la biologie ENIT-LAMSIN, Tunis Octobre 2016 12/64

Page 31: Asymétrie dans la division cellulairesaporta/PDF/EXPOSES/CIMPA...EcoledeRechercheCIMPA Mathématiquespourlabiologie ENIT-LAMSIN,TunisOctobre201612=64 Démarchestatistique I recueildesdonnées

Démarche statistique Estimation

Statistique inférentielle

But : étant donné un modèle et des réalisations de ce modèle, onveut estimer ses paramètres

ExempleI Modèle : loi normale d’espérance m et de variance σ2

I X1,X2, . . . ,Xn variables iid suivant ce modèleI paramètre d’intérêt θ = (m, σ2)

Un estimateur est une quantité θn calculable à partir des donnéesX1,X2, . . . ,Xn et qui approche θ.

Ecole de Recherche CIMPA Mathématiques pour la biologie ENIT-LAMSIN, Tunis Octobre 2016 13/64

Page 32: Asymétrie dans la division cellulairesaporta/PDF/EXPOSES/CIMPA...EcoledeRechercheCIMPA Mathématiquespourlabiologie ENIT-LAMSIN,TunisOctobre201612=64 Démarchestatistique I recueildesdonnées

Démarche statistique Estimation

Statistique inférentielle

But : étant donné un modèle et des réalisations de ce modèle, onveut estimer ses paramètres

ExempleI Modèle : loi normale d’espérance m et de variance σ2

I X1,X2, . . . ,Xn variables iid suivant ce modèleI paramètre d’intérêt θ = (m, σ2)

Un estimateur est une quantité θn calculable à partir des donnéesX1,X2, . . . ,Xn et qui approche θ.

Ecole de Recherche CIMPA Mathématiques pour la biologie ENIT-LAMSIN, Tunis Octobre 2016 13/64

Page 33: Asymétrie dans la division cellulairesaporta/PDF/EXPOSES/CIMPA...EcoledeRechercheCIMPA Mathématiquespourlabiologie ENIT-LAMSIN,TunisOctobre201612=64 Démarchestatistique I recueildesdonnées

Démarche statistique Estimation

Statistique inférentielle

But : étant donné un modèle et des réalisations de ce modèle, onveut estimer ses paramètres

ExempleI Modèle : loi normale d’espérance m et de variance σ2

I X1,X2, . . . ,Xn variables iid suivant ce modèleI paramètre d’intérêt θ = (m, σ2)

Un estimateur est une quantité θn calculable à partir des donnéesX1,X2, . . . ,Xn et qui approche θ.

Ecole de Recherche CIMPA Mathématiques pour la biologie ENIT-LAMSIN, Tunis Octobre 2016 13/64

Page 34: Asymétrie dans la division cellulairesaporta/PDF/EXPOSES/CIMPA...EcoledeRechercheCIMPA Mathématiquespourlabiologie ENIT-LAMSIN,TunisOctobre201612=64 Démarchestatistique I recueildesdonnées

Démarche statistique Estimation

Comment estimer les paramètres d’un modèle ? (1/2)

I méthode empirique basée sur la loi des grands nombresExemple estimer θ = E[X ] par

θn =1n

n∑k=1

Xk

I méthode des moindres carrés minimise une erreur quadratiqueExemple estimer θ = (a, b) dans un modèle Y = a + bX + εpar

θn = arg min(a,b)

n∑k=1

(Yk − a − bXk)2

Ecole de Recherche CIMPA Mathématiques pour la biologie ENIT-LAMSIN, Tunis Octobre 2016 14/64

Page 35: Asymétrie dans la division cellulairesaporta/PDF/EXPOSES/CIMPA...EcoledeRechercheCIMPA Mathématiquespourlabiologie ENIT-LAMSIN,TunisOctobre201612=64 Démarchestatistique I recueildesdonnées

Démarche statistique Estimation

Comment estimer les paramètres d’un modèle ? (1/2)

I méthode empirique basée sur la loi des grands nombresExemple estimer θ = E[X ] par

θn =1n

n∑k=1

Xk

I méthode des moindres carrés minimise une erreur quadratiqueExemple estimer θ = (a, b) dans un modèle Y = a + bX + εpar

θn = arg min(a,b)

n∑k=1

(Yk − a − bXk)2

Ecole de Recherche CIMPA Mathématiques pour la biologie ENIT-LAMSIN, Tunis Octobre 2016 14/64

Page 36: Asymétrie dans la division cellulairesaporta/PDF/EXPOSES/CIMPA...EcoledeRechercheCIMPA Mathématiquespourlabiologie ENIT-LAMSIN,TunisOctobre201612=64 Démarchestatistique I recueildesdonnées

Démarche statistique Estimation

Comment estimer les paramètres d’un modèle ? (2/2)I méthode des moments basée sur la résolution d’un système

faisant intervenir les momentsExemple estimer θ = (m, σ2) = (E[X ],V(X )) en résolvant

mn = 1n∑n

k=1 Xkσ2n = 1

n∑n

k=1(Xk − mn)2

I méthode du maximum de vraisemblance maximise la fonctionde vraisemblance ou son logarithmeExemple pour X de loi N (m, σ2) et θ = m

θn = argmaxm

log( n∏

k=1

1σ√2π

e−(Xk−m)2

2σ2

)= argmax

m−

n∑k=1

(Xk−m)2

impose de connaître la loi du modèle

Ecole de Recherche CIMPA Mathématiques pour la biologie ENIT-LAMSIN, Tunis Octobre 2016 15/64

Page 37: Asymétrie dans la division cellulairesaporta/PDF/EXPOSES/CIMPA...EcoledeRechercheCIMPA Mathématiquespourlabiologie ENIT-LAMSIN,TunisOctobre201612=64 Démarchestatistique I recueildesdonnées

Démarche statistique Estimation

Comment estimer les paramètres d’un modèle ? (2/2)I méthode des moments basée sur la résolution d’un système

faisant intervenir les momentsExemple estimer θ = (m, σ2) = (E[X ],V(X )) en résolvant

mn = 1n∑n

k=1 Xkσ2n = 1

n∑n

k=1(Xk − mn)2

I méthode du maximum de vraisemblance maximise la fonctionde vraisemblance ou son logarithmeExemple pour X de loi N (m, σ2) et θ = m

θn = argmaxm

log( n∏

k=1

1σ√2π

e−(Xk−m)2

2σ2

)= argmax

m−

n∑k=1

(Xk−m)2

impose de connaître la loi du modèleEcole de Recherche CIMPA Mathématiques pour la biologie ENIT-LAMSIN, Tunis Octobre 2016 15/64

Page 38: Asymétrie dans la division cellulairesaporta/PDF/EXPOSES/CIMPA...EcoledeRechercheCIMPA Mathématiquespourlabiologie ENIT-LAMSIN,TunisOctobre201612=64 Démarchestatistique I recueildesdonnées

Démarche statistique Estimation

Comment mesurer la qualité d’un estimateur ?

I estimateur sans biais si E[θn] = θ

I estimateur asymptotiquement sans biais si E[θn]→ θ

I risque quadratique E[(θn − θ)2] = V(θn) + (E[θn]− θ)2

Propriétés souhaitablesI estimateur convergent θn → θ psI normalité asymptotique

√n(θn − θ)→ N (0, v2) en loi

Connaître la loi limite permet d’obtenir des intervalles de confianceet de faire des tests

Ecole de Recherche CIMPA Mathématiques pour la biologie ENIT-LAMSIN, Tunis Octobre 2016 16/64

Page 39: Asymétrie dans la division cellulairesaporta/PDF/EXPOSES/CIMPA...EcoledeRechercheCIMPA Mathématiquespourlabiologie ENIT-LAMSIN,TunisOctobre201612=64 Démarchestatistique I recueildesdonnées

Démarche statistique Estimation

Intervalles de confiance

Un estimateur θn donne une approximation de la valeur duparamètre θ.

Un intervalle de confiance donne en plus une indication sur laprécision de cette estimation. Si

√n(θn − θ)→ N (0, v2) en loi

alors

P(θn − 1.96√

v2n ≤ θ ≤ θn + 1.96

√v2n )→ 95%

Si la valeur de v2 est inconnue, on la remplace par un estimateur

Ecole de Recherche CIMPA Mathématiques pour la biologie ENIT-LAMSIN, Tunis Octobre 2016 17/64

Page 40: Asymétrie dans la division cellulairesaporta/PDF/EXPOSES/CIMPA...EcoledeRechercheCIMPA Mathématiquespourlabiologie ENIT-LAMSIN,TunisOctobre201612=64 Démarchestatistique I recueildesdonnées

Démarche statistique Tests

Définition d’un test statistique

Test : règle de décision permettant de choisir entre deuxhypothèses au vu d’une statistique de test Tn dépendant desdonnées.

ExempleI Modèle : loi normale d’espérance m et de variance σ2

I X1,X2, . . . ,Xn variables iid suivant ce modèleI Tester si m = 0 ou m 6= 0.

Ecole de Recherche CIMPA Mathématiques pour la biologie ENIT-LAMSIN, Tunis Octobre 2016 18/64

Page 41: Asymétrie dans la division cellulairesaporta/PDF/EXPOSES/CIMPA...EcoledeRechercheCIMPA Mathématiquespourlabiologie ENIT-LAMSIN,TunisOctobre201612=64 Démarchestatistique I recueildesdonnées

Démarche statistique Tests

Hypothèses de test

I Hypothèse nulle H0 : hypothèse de travail qui sera retenue àdéfaut d"information

I Hypothèse alternative H1

DécisionI si Tn > seuil, on rejette H0, le test est significatifI si Tn < seuil, on ne rejette pas H0, le test est non significatif,

les données ne contredisent pas H0

Ecole de Recherche CIMPA Mathématiques pour la biologie ENIT-LAMSIN, Tunis Octobre 2016 19/64

Page 42: Asymétrie dans la division cellulairesaporta/PDF/EXPOSES/CIMPA...EcoledeRechercheCIMPA Mathématiquespourlabiologie ENIT-LAMSIN,TunisOctobre201612=64 Démarchestatistique I recueildesdonnées

Démarche statistique Tests

Risques d’erreur dans un test

Réalité (inconnue) Réalité (inconnue)H0 H1

Décision : H0 bonne décision erreur βDécision : H1 erreur α bonne décision

I risque de première espèce : probabilité de rejeter H0 à tort

α = P(rejet de H0|H0 vraie).

I risque de deuxième espèce : probabilité de accepter H0 à tort

β = P(accepter H0|H0 fausse).

puissance d’un test π = 1− β = P(rejeter H0|H0 fausse).

Ecole de Recherche CIMPA Mathématiques pour la biologie ENIT-LAMSIN, Tunis Octobre 2016 20/64

Page 43: Asymétrie dans la division cellulairesaporta/PDF/EXPOSES/CIMPA...EcoledeRechercheCIMPA Mathématiquespourlabiologie ENIT-LAMSIN,TunisOctobre201612=64 Démarchestatistique I recueildesdonnées

Démarche statistique Tests

Comment construire un test ?

I Choisir le risque de première espèce α par exemple 5%

I Trouver une statistique de test Tn de loi (asymptotique)connue sous H0 avec Tn →∞ sous H1Exemple Si

√n(θn − θ)→ N (0, v2) en loi sous H0, alors

Tn = nv2 (θn − θ)2 suit une loi χ2 à 1 degré de liberté

I Le seuil de la règle de décision correspond au quantile 1− αde la loi sous H0Exemple si Tn > 3.841 rejet, si Tn < 3.841 non rejet

En général il est difficile de calculer la puissance du test

Ecole de Recherche CIMPA Mathématiques pour la biologie ENIT-LAMSIN, Tunis Octobre 2016 21/64

Page 44: Asymétrie dans la division cellulairesaporta/PDF/EXPOSES/CIMPA...EcoledeRechercheCIMPA Mathématiquespourlabiologie ENIT-LAMSIN,TunisOctobre201612=64 Démarchestatistique I recueildesdonnées

Démarche statistique Tests

Division cellulaire

QuestionsI Les deux expériences sont-elles contradictoires ?I La division d’E. coli est-elle asymétrique ?

=⇒ Nouvelle analyse statistique des deux jeux de données

Ecole de Recherche CIMPA Mathématiques pour la biologie ENIT-LAMSIN, Tunis Octobre 2016 22/64

Page 45: Asymétrie dans la division cellulairesaporta/PDF/EXPOSES/CIMPA...EcoledeRechercheCIMPA Mathématiquespourlabiologie ENIT-LAMSIN,TunisOctobre201612=64 Démarchestatistique I recueildesdonnées

Démarche statistique Tests

Démarche statistique

I recueil des données [Stewart & al. 2005], [Wang & al. 2012]

⇓ mise en forme des données, prétraitement ⇓I statistique exploratoire ou descriptive : synthétiser

l’information, la représenter graphiquementI statistique inférentielle : estimer des paramètres, valider ou

infirmer des hypothèses au vu des données⇒ modèle probabiliste

I modélisation statistique : chercher des liens (approximatifs)entre les variables

Ecole de Recherche CIMPA Mathématiques pour la biologie ENIT-LAMSIN, Tunis Octobre 2016 23/64

Page 46: Asymétrie dans la division cellulairesaporta/PDF/EXPOSES/CIMPA...EcoledeRechercheCIMPA Mathématiquespourlabiologie ENIT-LAMSIN,TunisOctobre201612=64 Démarchestatistique I recueildesdonnées

Analyse des données de Stewart et al.

Plan

Introduction : deux expériences de biologie

Démarche statistique

Analyse des données de Stewart et al.Description des donnéesModélisationEstimationTests de symétrie

Analyse des données de Wang et al.

Conclusion

Ecole de Recherche CIMPA Mathématiques pour la biologie ENIT-LAMSIN, Tunis Octobre 2016 24/64

Page 47: Asymétrie dans la division cellulairesaporta/PDF/EXPOSES/CIMPA...EcoledeRechercheCIMPA Mathématiquespourlabiologie ENIT-LAMSIN,TunisOctobre201612=64 Démarchestatistique I recueildesdonnées

Analyse des données de Stewart et al. Description des données

Format original des données

I 94 fichiers .dat correspondant aux 94 films, identifiés par ladate et le numéro de l’expérience

2002-10-02-1.dat

I garder uniquement le taux de croissanceI numéroter les cellules pour reconstruire la généalogie

Ecole de Recherche CIMPA Mathématiques pour la biologie ENIT-LAMSIN, Tunis Octobre 2016 25/64

Page 48: Asymétrie dans la division cellulairesaporta/PDF/EXPOSES/CIMPA...EcoledeRechercheCIMPA Mathématiquespourlabiologie ENIT-LAMSIN,TunisOctobre201612=64 Démarchestatistique I recueildesdonnées

Analyse des données de Stewart et al. Description des données

Numérotation des cellules

0T indéterminé

0H indéterminé0HH vieux pôle0HT nouveau pôle0TH nouveau pôle0TT vieux pôle

nouveau puisnouveau pôlevieux puis

Ecole de Recherche CIMPA Mathématiques pour la biologie ENIT-LAMSIN, Tunis Octobre 2016 26/64

Page 49: Asymétrie dans la division cellulairesaporta/PDF/EXPOSES/CIMPA...EcoledeRechercheCIMPA Mathématiquespourlabiologie ENIT-LAMSIN,TunisOctobre201612=64 Démarchestatistique I recueildesdonnées

Analyse des données de Stewart et al. Description des données

Numérotation des cellules

0T indéterminé0H indéterminé

0HH vieux pôle0HT nouveau pôle0TH nouveau pôle0TT vieux pôle

nouveau puisnouveau pôlevieux puis

Ecole de Recherche CIMPA Mathématiques pour la biologie ENIT-LAMSIN, Tunis Octobre 2016 26/64

Page 50: Asymétrie dans la division cellulairesaporta/PDF/EXPOSES/CIMPA...EcoledeRechercheCIMPA Mathématiquespourlabiologie ENIT-LAMSIN,TunisOctobre201612=64 Démarchestatistique I recueildesdonnées

Analyse des données de Stewart et al. Description des données

Numérotation des cellules

0T indéterminé0H indéterminé0HH vieux pôle

0HT nouveau pôle0TH nouveau pôle0TT vieux pôle

nouveau puisnouveau pôlevieux puis

Ecole de Recherche CIMPA Mathématiques pour la biologie ENIT-LAMSIN, Tunis Octobre 2016 26/64

Page 51: Asymétrie dans la division cellulairesaporta/PDF/EXPOSES/CIMPA...EcoledeRechercheCIMPA Mathématiquespourlabiologie ENIT-LAMSIN,TunisOctobre201612=64 Démarchestatistique I recueildesdonnées

Analyse des données de Stewart et al. Description des données

Numérotation des cellules

0T indéterminé0H indéterminé0HH vieux pôle0HT nouveau pôle

0TH nouveau pôle0TT vieux pôle

nouveau puisnouveau pôlevieux puis

Ecole de Recherche CIMPA Mathématiques pour la biologie ENIT-LAMSIN, Tunis Octobre 2016 26/64

Page 52: Asymétrie dans la division cellulairesaporta/PDF/EXPOSES/CIMPA...EcoledeRechercheCIMPA Mathématiquespourlabiologie ENIT-LAMSIN,TunisOctobre201612=64 Démarchestatistique I recueildesdonnées

Analyse des données de Stewart et al. Description des données

Numérotation des cellules

0T indéterminé0H indéterminé0HH vieux pôle0HT nouveau pôle0TH nouveau pôle

0TT vieux pôlenouveau puisnouveau pôlevieux puis

Ecole de Recherche CIMPA Mathématiques pour la biologie ENIT-LAMSIN, Tunis Octobre 2016 26/64

Page 53: Asymétrie dans la division cellulairesaporta/PDF/EXPOSES/CIMPA...EcoledeRechercheCIMPA Mathématiquespourlabiologie ENIT-LAMSIN,TunisOctobre201612=64 Démarchestatistique I recueildesdonnées

Analyse des données de Stewart et al. Description des données

Numérotation des cellules

0T indéterminé0H indéterminé0HH vieux pôle0HT nouveau pôle0TH nouveau pôle0TT vieux pôle

nouveau puisnouveau pôlevieux puis

Ecole de Recherche CIMPA Mathématiques pour la biologie ENIT-LAMSIN, Tunis Octobre 2016 26/64

Page 54: Asymétrie dans la division cellulairesaporta/PDF/EXPOSES/CIMPA...EcoledeRechercheCIMPA Mathématiquespourlabiologie ENIT-LAMSIN,TunisOctobre201612=64 Démarchestatistique I recueildesdonnées

Analyse des données de Stewart et al. Description des données

Numérotation des cellules

0T indéterminé0H indéterminé0HH vieux pôle0HT nouveau pôle0TH nouveau pôle0TT vieux pôle0HTT nouveau puis

nouveau pôlevieux puis

Ecole de Recherche CIMPA Mathématiques pour la biologie ENIT-LAMSIN, Tunis Octobre 2016 26/64

Page 55: Asymétrie dans la division cellulairesaporta/PDF/EXPOSES/CIMPA...EcoledeRechercheCIMPA Mathématiquespourlabiologie ENIT-LAMSIN,TunisOctobre201612=64 Démarchestatistique I recueildesdonnées

Analyse des données de Stewart et al. Description des données

Numérotation des cellules

0T indéterminé0H indéterminé0HH vieux pôle0HT nouveau pôle0TH nouveau pôle0TT vieux pôle0HTT nouveau puis vieux pôle

nouveau pôlevieux puis

Ecole de Recherche CIMPA Mathématiques pour la biologie ENIT-LAMSIN, Tunis Octobre 2016 26/64

Page 56: Asymétrie dans la division cellulairesaporta/PDF/EXPOSES/CIMPA...EcoledeRechercheCIMPA Mathématiquespourlabiologie ENIT-LAMSIN,TunisOctobre201612=64 Démarchestatistique I recueildesdonnées

Analyse des données de Stewart et al. Description des données

Numérotation des cellules

0T indéterminé0H indéterminé0HH vieux pôle0HT nouveau pôle0TH nouveau pôle0TT vieux pôle0HTT nouveau puis vieux pôle0HTH nouveau pôle

vieux puis

Ecole de Recherche CIMPA Mathématiques pour la biologie ENIT-LAMSIN, Tunis Octobre 2016 26/64

Page 57: Asymétrie dans la division cellulairesaporta/PDF/EXPOSES/CIMPA...EcoledeRechercheCIMPA Mathématiquespourlabiologie ENIT-LAMSIN,TunisOctobre201612=64 Démarchestatistique I recueildesdonnées

Analyse des données de Stewart et al. Description des données

Numérotation des cellules

0T indéterminé0H indéterminé0HH vieux pôle0HT nouveau pôle0TH nouveau pôle0TT vieux pôle0HTT nouveau puis vieux pôle0HTH 2 nouveaux pôles

vieux puis

Ecole de Recherche CIMPA Mathématiques pour la biologie ENIT-LAMSIN, Tunis Octobre 2016 26/64

Page 58: Asymétrie dans la division cellulairesaporta/PDF/EXPOSES/CIMPA...EcoledeRechercheCIMPA Mathématiquespourlabiologie ENIT-LAMSIN,TunisOctobre201612=64 Démarchestatistique I recueildesdonnées

Analyse des données de Stewart et al. Description des données

Numérotation des cellules

0T indéterminé0H indéterminé0HH vieux pôle0HT nouveau pôle0TH nouveau pôle0TT vieux pôle0HTT nouveau puis vieux pôle0HTH 2 nouveaux pôles0HHT vieux puis

Ecole de Recherche CIMPA Mathématiques pour la biologie ENIT-LAMSIN, Tunis Octobre 2016 26/64

Page 59: Asymétrie dans la division cellulairesaporta/PDF/EXPOSES/CIMPA...EcoledeRechercheCIMPA Mathématiquespourlabiologie ENIT-LAMSIN,TunisOctobre201612=64 Démarchestatistique I recueildesdonnées

Analyse des données de Stewart et al. Description des données

Numérotation des cellules

0T indéterminé0H indéterminé0HH vieux pôle0HT nouveau pôle0TH nouveau pôle0TT vieux pôle0HTT nouveau puis vieux pôle0HTH 2 nouveaux pôles0HHT vieux puis nouveau pôle

Ecole de Recherche CIMPA Mathématiques pour la biologie ENIT-LAMSIN, Tunis Octobre 2016 26/64

Page 60: Asymétrie dans la division cellulairesaporta/PDF/EXPOSES/CIMPA...EcoledeRechercheCIMPA Mathématiquespourlabiologie ENIT-LAMSIN,TunisOctobre201612=64 Démarchestatistique I recueildesdonnées

Analyse des données de Stewart et al. Description des données

Codage des cellules

I numérotation correspondant de façon unique à une positiondans l’arbre généalogique

I pair : nouveau pôleI impair : vieux pôle

0T 30H 20HH 50HT 40TH 60TT 70HTT 90HTH 80HHT 10

Ecole de Recherche CIMPA Mathématiques pour la biologie ENIT-LAMSIN, Tunis Octobre 2016 27/64

Page 61: Asymétrie dans la division cellulairesaporta/PDF/EXPOSES/CIMPA...EcoledeRechercheCIMPA Mathématiquespourlabiologie ENIT-LAMSIN,TunisOctobre201612=64 Démarchestatistique I recueildesdonnées

Analyse des données de Stewart et al. Description des données

Résumé des données

I 94 films → 101 arbres généalogiquesI 4 à 9 générations observéesI 22732 cellulesI nombreuses données manquantes

I mesure des taux de croissanceI mesure des types :

ancien / nouveau pôle à partir de la génération 2I lignées connues via la numérotation

Ecole de Recherche CIMPA Mathématiques pour la biologie ENIT-LAMSIN, Tunis Octobre 2016 28/64

Page 62: Asymétrie dans la division cellulairesaporta/PDF/EXPOSES/CIMPA...EcoledeRechercheCIMPA Mathématiquespourlabiologie ENIT-LAMSIN,TunisOctobre201612=64 Démarchestatistique I recueildesdonnées

Analyse des données de Stewart et al. Description des données

Analyse exploratoire

Taux de croissance par génération, tous les arbres

1 2 3 4 5 6 7 8

0.00

0.01

0.02

0.03

0.04

0.05

0.06

0.07

Ecole de Recherche CIMPA Mathématiques pour la biologie ENIT-LAMSIN, Tunis Octobre 2016 29/64

Page 63: Asymétrie dans la division cellulairesaporta/PDF/EXPOSES/CIMPA...EcoledeRechercheCIMPA Mathématiquespourlabiologie ENIT-LAMSIN,TunisOctobre201612=64 Démarchestatistique I recueildesdonnées

Analyse des données de Stewart et al. Description des données

Analyse exploratoireTaux de croissance par génération, arbre 1

2 3 4 5 6 7 8

0.025

0.030

0.035

0.040

tree1[, 4]

tree1

[, 6]

Ecole de Recherche CIMPA Mathématiques pour la biologie ENIT-LAMSIN, Tunis Octobre 2016 29/64

Page 64: Asymétrie dans la division cellulairesaporta/PDF/EXPOSES/CIMPA...EcoledeRechercheCIMPA Mathématiquespourlabiologie ENIT-LAMSIN,TunisOctobre201612=64 Démarchestatistique I recueildesdonnées

Analyse des données de Stewart et al. Description des données

Comparaison des taux de croissance

Reconstitution du graphique de [Stewart & al. 2005]

0 2 4 6 81 3 5 70.5 1.5 2.5 3.5 4.5 5.5 6.5 7.5

1

0.92

0.94

0.96

0.98

1.02

1.04

0.93

0.95

0.97

0.99

1.01

1.03

I normalisation par le taux de croissance moyen par générationpar arbre

I moyenne entre cellules ayant hérité du même nombre de vieux/ nouveaux pôles dans toutes les données

Ecole de Recherche CIMPA Mathématiques pour la biologie ENIT-LAMSIN, Tunis Octobre 2016 30/64

Page 65: Asymétrie dans la division cellulairesaporta/PDF/EXPOSES/CIMPA...EcoledeRechercheCIMPA Mathématiquespourlabiologie ENIT-LAMSIN,TunisOctobre201612=64 Démarchestatistique I recueildesdonnées

Analyse des données de Stewart et al. Description des données

Questions statistiques sur la comparaison

Problèmes liés à la structure en arbre des donnéesI chaque point correspond à un nombre de cellules très différent

Ecole de Recherche CIMPA Mathématiques pour la biologie ENIT-LAMSIN, Tunis Octobre 2016 31/64

Page 66: Asymétrie dans la division cellulairesaporta/PDF/EXPOSES/CIMPA...EcoledeRechercheCIMPA Mathématiquespourlabiologie ENIT-LAMSIN,TunisOctobre201612=64 Démarchestatistique I recueildesdonnées

Analyse des données de Stewart et al. Description des données

Questions statistiques sur la comparaison

Problèmes liés à la structure en arbre des donnéesI chaque point correspond à un nombre de cellules très différentI moyenne entre cellules dans des arbres différents mais aussi

dans des générations différentes du même arbre ⇒ pasd’indépendance

Ecole de Recherche CIMPA Mathématiques pour la biologie ENIT-LAMSIN, Tunis Octobre 2016 31/64

Page 67: Asymétrie dans la division cellulairesaporta/PDF/EXPOSES/CIMPA...EcoledeRechercheCIMPA Mathématiquespourlabiologie ENIT-LAMSIN,TunisOctobre201612=64 Démarchestatistique I recueildesdonnées

Analyse des données de Stewart et al. Description des données

Questions statistiques sur la comparaison

Problèmes liés à la structure en arbre des donnéesI chaque point correspond à un nombre de cellules très différentI moyenne entre cellules dans des arbres différents mais aussi

dans des générations différentes du même arbre ⇒ pasd’indépendance

On ne peut pas tirer de conclusion rigoureuse d’un tel graphique⇒ Nouvelle procédure de statistique inférentielle et de test desymétrie

Ecole de Recherche CIMPA Mathématiques pour la biologie ENIT-LAMSIN, Tunis Octobre 2016 31/64

Page 68: Asymétrie dans la division cellulairesaporta/PDF/EXPOSES/CIMPA...EcoledeRechercheCIMPA Mathématiquespourlabiologie ENIT-LAMSIN,TunisOctobre201612=64 Démarchestatistique I recueildesdonnées

Analyse des données de Stewart et al. Description des données

Objectif

I déterminer si au vu des données il y a une asymétriesignificative dans la division d’E. coli

I statistique inférentielle ⇒ besoin d’un modèle adapté à lastructure d’arbre généalogique des données

I estimer les paramètresI tester la symétrie

Ecole de Recherche CIMPA Mathématiques pour la biologie ENIT-LAMSIN, Tunis Octobre 2016 32/64

Page 69: Asymétrie dans la division cellulairesaporta/PDF/EXPOSES/CIMPA...EcoledeRechercheCIMPA Mathématiquespourlabiologie ENIT-LAMSIN,TunisOctobre201612=64 Démarchestatistique I recueildesdonnées

Analyse des données de Stewart et al. Modélisation

Modélisation

I le taux de croissance d’une cellule fille dépend de celui de samère

I deux cellules soeurs peuvent être corréléesI deux cellules soeurs n’ont pas forcément le même taux de

croissance

⇒ Modèle auto-régressif adapté à la structure d’arbre

Ecole de Recherche CIMPA Mathématiques pour la biologie ENIT-LAMSIN, Tunis Octobre 2016 33/64

Page 70: Asymétrie dans la division cellulairesaporta/PDF/EXPOSES/CIMPA...EcoledeRechercheCIMPA Mathématiquespourlabiologie ENIT-LAMSIN,TunisOctobre201612=64 Démarchestatistique I recueildesdonnées

Analyse des données de Stewart et al. Modélisation

Modèle BAR

Modèle auto-régressif de bifurcation[Cowan & Staudte 1986] [Guyon 2007]

X2k = a + bXk + ε2k

X2k+1 = c + dXk + ε2k+1

Estimer les paramètres pour testerl’asymétrie

I (a, b) = (c, d)

Ecole de Recherche CIMPA Mathématiques pour la biologie ENIT-LAMSIN, Tunis Octobre 2016 34/64

Page 71: Asymétrie dans la division cellulairesaporta/PDF/EXPOSES/CIMPA...EcoledeRechercheCIMPA Mathématiquespourlabiologie ENIT-LAMSIN,TunisOctobre201612=64 Démarchestatistique I recueildesdonnées

Analyse des données de Stewart et al. Modélisation

Modèle BAR

Modèle auto-régressif de bifurcation[Cowan & Staudte 1986] [Guyon 2007]

X2k = a + bXk + ε2k

X2k+1 = c + dXk + ε2k+1

Estimer les paramètres pour testerl’asymétrie

I (a, b) = (c, d)

Ecole de Recherche CIMPA Mathématiques pour la biologie ENIT-LAMSIN, Tunis Octobre 2016 34/64

Page 72: Asymétrie dans la division cellulairesaporta/PDF/EXPOSES/CIMPA...EcoledeRechercheCIMPA Mathématiquespourlabiologie ENIT-LAMSIN,TunisOctobre201612=64 Démarchestatistique I recueildesdonnées

Analyse des données de Stewart et al. Modélisation

Modèle BAR

Modèle auto-régressif de bifurcation[Cowan & Staudte 1986] [Guyon 2007]

X2k = a + bXk + ε2k

X2k+1 = c + dXk + ε2k+1

Estimer les paramètres pour testerl’asymétrie

I (a, b) = (c, d)

Ecole de Recherche CIMPA Mathématiques pour la biologie ENIT-LAMSIN, Tunis Octobre 2016 34/64

Page 73: Asymétrie dans la division cellulairesaporta/PDF/EXPOSES/CIMPA...EcoledeRechercheCIMPA Mathématiquespourlabiologie ENIT-LAMSIN,TunisOctobre201612=64 Démarchestatistique I recueildesdonnées

Analyse des données de Stewart et al. Modélisation

Modèle BAR

Modèle auto-régressif de bifurcation[Cowan & Staudte 1986] [Guyon 2007]

X2k = a + bXk + ε2k

X2k+1 = c + dXk + ε2k+1

Estimer les paramètres pour testerl’asymétrie

I (a, b) = (c, d)

Ecole de Recherche CIMPA Mathématiques pour la biologie ENIT-LAMSIN, Tunis Octobre 2016 34/64

Page 74: Asymétrie dans la division cellulairesaporta/PDF/EXPOSES/CIMPA...EcoledeRechercheCIMPA Mathématiquespourlabiologie ENIT-LAMSIN,TunisOctobre201612=64 Démarchestatistique I recueildesdonnées

Analyse des données de Stewart et al. Modélisation

Modélisation : données manquantes

I la probabilité d’être observé dépend du type de la fille et decelui de sa mère

I une cellule non observée n’a pas de descendance observéeI indépendance des observations des enfants de chaque cellule

mère d’une même générationI indépendance entre le processus d’observation et le processus

BAR

⇒ Modèle de Galton-Watson à deux types

Ecole de Recherche CIMPA Mathématiques pour la biologie ENIT-LAMSIN, Tunis Octobre 2016 35/64

Page 75: Asymétrie dans la division cellulairesaporta/PDF/EXPOSES/CIMPA...EcoledeRechercheCIMPA Mathématiquespourlabiologie ENIT-LAMSIN,TunisOctobre201612=64 Démarchestatistique I recueildesdonnées

Analyse des données de Stewart et al. Modélisation

Modèle d’observation : Galton-Watson à deux types[Delmas & Marsalle 2010] [dS, Gégout-Petit, Marsalle 2011]

I δk = 1 si la cellule k est observée, 0 sinonI probabilité p(i)(j0, j1) pour une cellule mère de type i d’avoir

j0 fille de type 0 et j1 fille de type 1

Matrice de descendance

P =

(p00 p01p10 p11

)pi0 = p(i)(1, 0) + p(i)(1, 1): nombre moyen de filles de type 0pi1 = p(i)(0, 1) + p(i)(1, 1): nombre moyen de filles de type 1

Critère d’extinctionπ rayon spectral de P

I si π ≤ 1, extinction presque sureI si π > 1, extinction avec probabilité < 1

Ecole de Recherche CIMPA Mathématiques pour la biologie ENIT-LAMSIN, Tunis Octobre 2016 36/64

Page 76: Asymétrie dans la division cellulairesaporta/PDF/EXPOSES/CIMPA...EcoledeRechercheCIMPA Mathématiquespourlabiologie ENIT-LAMSIN,TunisOctobre201612=64 Démarchestatistique I recueildesdonnées

Analyse des données de Stewart et al. Modélisation

Modèle d’observation : Galton-Watson à deux types[Delmas & Marsalle 2010] [dS, Gégout-Petit, Marsalle 2011]

I δk = 1 si la cellule k est observée, 0 sinonI probabilité p(i)(j0, j1) pour une cellule mère de type i d’avoir

j0 fille de type 0 et j1 fille de type 1Matrice de descendance

P =

(p00 p01p10 p11

)pi0 = p(i)(1, 0) + p(i)(1, 1): nombre moyen de filles de type 0pi1 = p(i)(0, 1) + p(i)(1, 1): nombre moyen de filles de type 1

Critère d’extinctionπ rayon spectral de P

I si π ≤ 1, extinction presque sureI si π > 1, extinction avec probabilité < 1

Ecole de Recherche CIMPA Mathématiques pour la biologie ENIT-LAMSIN, Tunis Octobre 2016 36/64

Page 77: Asymétrie dans la division cellulairesaporta/PDF/EXPOSES/CIMPA...EcoledeRechercheCIMPA Mathématiquespourlabiologie ENIT-LAMSIN,TunisOctobre201612=64 Démarchestatistique I recueildesdonnées

Analyse des données de Stewart et al. Modélisation

Modèle d’observation : Galton-Watson à deux types[Delmas & Marsalle 2010] [dS, Gégout-Petit, Marsalle 2011]

I δk = 1 si la cellule k est observée, 0 sinonI probabilité p(i)(j0, j1) pour une cellule mère de type i d’avoir

j0 fille de type 0 et j1 fille de type 1Matrice de descendance

P =

(p00 p01p10 p11

)pi0 = p(i)(1, 0) + p(i)(1, 1): nombre moyen de filles de type 0pi1 = p(i)(0, 1) + p(i)(1, 1): nombre moyen de filles de type 1

Critère d’extinctionπ rayon spectral de P

I si π ≤ 1, extinction presque sureI si π > 1, extinction avec probabilité < 1

Ecole de Recherche CIMPA Mathématiques pour la biologie ENIT-LAMSIN, Tunis Octobre 2016 36/64

Page 78: Asymétrie dans la division cellulairesaporta/PDF/EXPOSES/CIMPA...EcoledeRechercheCIMPA Mathématiquespourlabiologie ENIT-LAMSIN,TunisOctobre201612=64 Démarchestatistique I recueildesdonnées

Analyse des données de Stewart et al. Estimation

Paramètres à estimer

Paramètres d’intérêtI coefficients de l’auto-régression θ = (a, b, c, d) pour tester la

symétrie

Paramètres annexes nécessairesI variance σ2 et covariance ρ du bruit BAR, nécessaires pour

construire la statistique du test de symétrie

Paramètres annexes non nécessairesI moments d’ordre supérieur du bruit BARI coefficients du processus d’observation

Ecole de Recherche CIMPA Mathématiques pour la biologie ENIT-LAMSIN, Tunis Octobre 2016 37/64

Page 79: Asymétrie dans la division cellulairesaporta/PDF/EXPOSES/CIMPA...EcoledeRechercheCIMPA Mathématiquespourlabiologie ENIT-LAMSIN,TunisOctobre201612=64 Démarchestatistique I recueildesdonnées

Analyse des données de Stewart et al. Estimation

Paramètres à estimer

Paramètres d’intérêtI coefficients de l’auto-régression θ = (a, b, c, d) pour tester la

symétrie

Paramètres annexes nécessairesI variance σ2 et covariance ρ du bruit BAR, nécessaires pour

construire la statistique du test de symétrie

Paramètres annexes non nécessairesI moments d’ordre supérieur du bruit BARI coefficients du processus d’observation

Ecole de Recherche CIMPA Mathématiques pour la biologie ENIT-LAMSIN, Tunis Octobre 2016 37/64

Page 80: Asymétrie dans la division cellulairesaporta/PDF/EXPOSES/CIMPA...EcoledeRechercheCIMPA Mathématiquespourlabiologie ENIT-LAMSIN,TunisOctobre201612=64 Démarchestatistique I recueildesdonnées

Analyse des données de Stewart et al. Estimation

Paramètres à estimer

Paramètres d’intérêtI coefficients de l’auto-régression θ = (a, b, c, d) pour tester la

symétrie

Paramètres annexes nécessairesI variance σ2 et covariance ρ du bruit BAR, nécessaires pour

construire la statistique du test de symétrie

Paramètres annexes non nécessairesI moments d’ordre supérieur du bruit BARI coefficients du processus d’observation

Ecole de Recherche CIMPA Mathématiques pour la biologie ENIT-LAMSIN, Tunis Octobre 2016 37/64

Page 81: Asymétrie dans la division cellulairesaporta/PDF/EXPOSES/CIMPA...EcoledeRechercheCIMPA Mathématiquespourlabiologie ENIT-LAMSIN,TunisOctobre201612=64 Démarchestatistique I recueildesdonnées

Analyse des données de Stewart et al. Estimation

Méthodes d’estimation

I méthode des moindres carrés pour θ : minimiser

∆n(θ) =12∑

k∈Tn−1

δ2k(X2k−a−bXk)2+δ2k+1(X2k+1−c−dXk)2.

I méthode empirique pour tous les autres paramètres

Génération n

Gn = 2n, 2n + 1, . . . , 2n+1 − 1

Arbre jusqu’à la génération n

Tn = 1, 2, . . . , 2n+1 − 1 = ∪n`=0G`

Ecole de Recherche CIMPA Mathématiques pour la biologie ENIT-LAMSIN, Tunis Octobre 2016 38/64

Page 82: Asymétrie dans la division cellulairesaporta/PDF/EXPOSES/CIMPA...EcoledeRechercheCIMPA Mathématiquespourlabiologie ENIT-LAMSIN,TunisOctobre201612=64 Démarchestatistique I recueildesdonnées

Analyse des données de Stewart et al. Estimation

Méthodes d’estimation

I méthode des moindres carrés pour θ : minimiser

∆n(θ) =12∑

k∈Tn−1

δ2k(X2k−a−bXk)2+δ2k+1(X2k+1−c−dXk)2.

I méthode empirique pour tous les autres paramètres

Génération n observée

G∗n = k ∈ Gn ; δk = 1

Arbre observé jusqu’à la génération n

T∗n = k ∈ Tn ; δk = 1 = ∪n`=0G∗`

Ecole de Recherche CIMPA Mathématiques pour la biologie ENIT-LAMSIN, Tunis Octobre 2016 38/64

Page 83: Asymétrie dans la division cellulairesaporta/PDF/EXPOSES/CIMPA...EcoledeRechercheCIMPA Mathématiquespourlabiologie ENIT-LAMSIN,TunisOctobre201612=64 Démarchestatistique I recueildesdonnées

Analyse des données de Stewart et al. Estimation

Estimateur de θ

[dS, Gégout-Petit, Marsalle 2011]

Estimateur des moindres carrés pour θ

θn =

anbncndn

= S−1n−1∑

k∈Tn−1

δ2kX2kδ2kXkX2kδ2k+1X2k+1δ2k+1XkX2k+1

avec

Sn =

(S0

n 00 S1

n

)S0

n =∑k∈Tn

δ2k

(1 XkXk X 2

k

)S1

n =∑k∈Tn

δ2k+1

(1 XkXk X 2

k

)

Ecole de Recherche CIMPA Mathématiques pour la biologie ENIT-LAMSIN, Tunis Octobre 2016 39/64

Page 84: Asymétrie dans la division cellulairesaporta/PDF/EXPOSES/CIMPA...EcoledeRechercheCIMPA Mathématiquespourlabiologie ENIT-LAMSIN,TunisOctobre201612=64 Démarchestatistique I recueildesdonnées

Analyse des données de Stewart et al. Estimation

Convergence de l’estimateur

Théorème

1|G∗n |>0 ‖ θn − θ ‖2= 1|G∗

n |>0O( log |T∗n−1||T∗n−1|

)

ThéorèmeConditionnellement à la non extinction√

|T∗n−1|(θn − θ)L−→ N (0,Ω)

Ω : matrices dont on sait estimer empiriquement les coefficients

Ecole de Recherche CIMPA Mathématiques pour la biologie ENIT-LAMSIN, Tunis Octobre 2016 40/64

Page 85: Asymétrie dans la division cellulairesaporta/PDF/EXPOSES/CIMPA...EcoledeRechercheCIMPA Mathématiquespourlabiologie ENIT-LAMSIN,TunisOctobre201612=64 Démarchestatistique I recueildesdonnées

Analyse des données de Stewart et al. Estimation

Estimation sur un arbre

Plus grand arbre 2002-10-04-4663 cellules jusqu’à la génération 9

a 0.03627 [0.03276; 0.03979]b 0.02662 [-0.06866; 0.12191]c 0.03058 [0.02696; 0.03420]d 0.17055 [0.07247; 0.26863]

Ecole de Recherche CIMPA Mathématiques pour la biologie ENIT-LAMSIN, Tunis Octobre 2016 41/64

Page 86: Asymétrie dans la division cellulairesaporta/PDF/EXPOSES/CIMPA...EcoledeRechercheCIMPA Mathématiquespourlabiologie ENIT-LAMSIN,TunisOctobre201612=64 Démarchestatistique I recueildesdonnées

Analyse des données de Stewart et al. Tests de symétrie

Statistiques de test[dS, Gégout-Petit, Marsalle 2012]

I H0 : (a, b) = (c, d)

I H1 : (a, b) 6= (c, d)

Statistique de test

Tn = (an − cn, bn − dn)∆−1n (an − cn, bn − dn)′

avec

∆n =

(1 0 −1 00 1 0 −1

)Ωn

1 00 1−1 00 −1

ThéorèmeSous H0 Tn

L−→ χ2(2), sous H1 ‖Tn‖2 → +∞

Ecole de Recherche CIMPA Mathématiques pour la biologie ENIT-LAMSIN, Tunis Octobre 2016 42/64

Page 87: Asymétrie dans la division cellulairesaporta/PDF/EXPOSES/CIMPA...EcoledeRechercheCIMPA Mathématiquespourlabiologie ENIT-LAMSIN,TunisOctobre201612=64 Démarchestatistique I recueildesdonnées

Analyse des données de Stewart et al. Tests de symétrie

Test sur un arbre

Plus grand arbre 2002-10-04-4663 cellules jusqu’à la génération 9α = 5%

T9 > 5.591⇒ H0 rejetée

Ecole de Recherche CIMPA Mathématiques pour la biologie ENIT-LAMSIN, Tunis Octobre 2016 43/64

Page 88: Asymétrie dans la division cellulairesaporta/PDF/EXPOSES/CIMPA...EcoledeRechercheCIMPA Mathématiquespourlabiologie ENIT-LAMSIN,TunisOctobre201612=64 Démarchestatistique I recueildesdonnées

Analyse des données de Stewart et al. Tests de symétrie

Test sur plusieurs arbres

p-valeur d’un test : plus petit niveau de risque α pour lequel H0est rejetée

p-valeur < 5% ⇔ H0 est rejetée au niveau de risque 5%

Sous H0, la statistique de test suit une loi connue, on peut obtenirtoutes les valeurs entre 0 et 1 comme p-valeur

Sous H1, on ne devrait avoir que des p-valeurs petites

Ecole de Recherche CIMPA Mathématiques pour la biologie ENIT-LAMSIN, Tunis Octobre 2016 44/64

Page 89: Asymétrie dans la division cellulairesaporta/PDF/EXPOSES/CIMPA...EcoledeRechercheCIMPA Mathématiquespourlabiologie ENIT-LAMSIN,TunisOctobre201612=64 Démarchestatistique I recueildesdonnées

Analyse des données de Stewart et al. Tests de symétrie

Test de symétriep-valeurs pour les 51 arbres comportant 8 ou 9 générations

0.0

0.5

1.0

1.5

2.0

2.5

3.0

3.5

4.0

4.5

0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0

Test (a, b) = (c, d)

On ne peut pas rejeter H0

Ecole de Recherche CIMPA Mathématiques pour la biologie ENIT-LAMSIN, Tunis Octobre 2016 45/64

Page 90: Asymétrie dans la division cellulairesaporta/PDF/EXPOSES/CIMPA...EcoledeRechercheCIMPA Mathématiquespourlabiologie ENIT-LAMSIN,TunisOctobre201612=64 Démarchestatistique I recueildesdonnées

Analyse des données de Stewart et al. Tests de symétrie

Test de symétriep-valeurs pour les 51 arbres comportant 8 ou 9 générations

0.0

0.5

1.0

1.5

2.0

2.5

3.0

3.5

4.0

4.5

0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0

Test (a, b) = (c, d)On ne peut pas rejeter H0

Ecole de Recherche CIMPA Mathématiques pour la biologie ENIT-LAMSIN, Tunis Octobre 2016 45/64

Page 91: Asymétrie dans la division cellulairesaporta/PDF/EXPOSES/CIMPA...EcoledeRechercheCIMPA Mathématiquespourlabiologie ENIT-LAMSIN,TunisOctobre201612=64 Démarchestatistique I recueildesdonnées

Analyse des données de Stewart et al. Tests de symétrie

Etude empirique de la puissance du test

[dS, Gégout-Petit, Marsalle 2012]

Gen sous H0 sous H1p < 0.05 p < 0.05

7 6.6 37.48 5.5 53.69 5.5 71.110 6.3 86.811 5.9 95.7

Proportions de p-valeurs sous le seuils 0.05 pour le test de symétrie(1000 replications) a = b = 0.5 (sous H1, c = 0.5; d = 0.4)

Faible puissance du test pour les petits nombres de générations

Ecole de Recherche CIMPA Mathématiques pour la biologie ENIT-LAMSIN, Tunis Octobre 2016 46/64

Page 92: Asymétrie dans la division cellulairesaporta/PDF/EXPOSES/CIMPA...EcoledeRechercheCIMPA Mathématiquespourlabiologie ENIT-LAMSIN,TunisOctobre201612=64 Démarchestatistique I recueildesdonnées

Analyse des données de Stewart et al. Tests de symétrie

Estimateur multi-arbres

[dS, Gégout-Petit, Marsalle 2014]

Estimateur des moindres carrés pour θ

θn = S−1n−1

m∑j=1

∑k∈Tn−1

δj,2kXj,2k

δj,2kXj,kXj,2kδj,2k+1Xj,2k+1

δj,2k+1Xj,kXj,2k+1

avec

Sn =

(S0

n 00 S1

n

)

S in =

m∑j=1

∑k∈Tn

δj,2k+i

(1 Xj,k

Xj,k X 2j,k

)

Ecole de Recherche CIMPA Mathématiques pour la biologie ENIT-LAMSIN, Tunis Octobre 2016 47/64

Page 93: Asymétrie dans la division cellulairesaporta/PDF/EXPOSES/CIMPA...EcoledeRechercheCIMPA Mathématiquespourlabiologie ENIT-LAMSIN,TunisOctobre201612=64 Démarchestatistique I recueildesdonnées

Analyse des données de Stewart et al. Tests de symétrie

Analyse multi-arbres

Estimation de θ =⇒ hypothèse max|b|, |d | < 1 vraie

a 0.0203 [0.0197; 0.0210] c 0.0195 [0.0188; 0.0201]

b 0.4615 [0.4437; 0.4792] d 0.4782 [0.4605; 0.4959]

Estimation des moments du bruit

σ2 1.81 · 10−5 [1.12 · 10−5; 2.50 · 10−5]

ρ 0.48 · 10−5 [0.44 · 10−5; 0.52 · 10−5]

Tests : hypothèse (a, b) = (c, d) rejetée (p-valeur= 10−5)

Ecole de Recherche CIMPA Mathématiques pour la biologie ENIT-LAMSIN, Tunis Octobre 2016 48/64

Page 94: Asymétrie dans la division cellulairesaporta/PDF/EXPOSES/CIMPA...EcoledeRechercheCIMPA Mathématiquespourlabiologie ENIT-LAMSIN,TunisOctobre201612=64 Démarchestatistique I recueildesdonnées

Analyse des données de Stewart et al. Tests de symétrie

Analyse multi-arbres des données E. coli : Galton-Watson

Estimation des lois de reproduction

p(0)(0, 0) 0.35579 [0.35574; 0.35583] p(1)(0, 0) 0.35611 [0.35606; 0.35616]p(0)(1, 0) 0.03621 [0.03620; 0.03622] p(1)(1, 0) 0.04707 [0.04706; 0.04708]p(0)(0, 1) 0.04740 [0.04739; 0.04741] p(1)(0, 1) 0.03755 [0.03754; 0.03756]p(0)(1, 1) 0.56060 [0.56055; 0.56065] p(1)(1, 1) 0.55928 [0.55923; 0.55933]

Estimation de π : 1.204 [1.191; 1.217] =⇒ hypothèse π > 1 vraie

Tests : hypothèse d’égalité des moyennes des deux lois non rejetée(p-valeur= 0.9), hypothèse d’égalité des deux vecteurs rejetée(p-valeur= 2 · 10−5)

Ecole de Recherche CIMPA Mathématiques pour la biologie ENIT-LAMSIN, Tunis Octobre 2016 49/64

Page 95: Asymétrie dans la division cellulairesaporta/PDF/EXPOSES/CIMPA...EcoledeRechercheCIMPA Mathématiquespourlabiologie ENIT-LAMSIN,TunisOctobre201612=64 Démarchestatistique I recueildesdonnées

Analyse des données de Wang et al.

Plan

Introduction : deux expériences de biologie

Démarche statistique

Analyse des données de Stewart et al.

Analyse des données de Wang et al.Description des donnéesEstimation

Conclusion

Ecole de Recherche CIMPA Mathématiques pour la biologie ENIT-LAMSIN, Tunis Octobre 2016 50/64

Page 96: Asymétrie dans la division cellulairesaporta/PDF/EXPOSES/CIMPA...EcoledeRechercheCIMPA Mathématiquespourlabiologie ENIT-LAMSIN,TunisOctobre201612=64 Démarchestatistique I recueildesdonnées

Analyse des données de Wang et al. Description des données

Format original des données

I 448 fichiers .dat correspondant à 224 canaux, un ficheri pourles cellules vieux pôle et une pour les nouveaux pôles

xy01c1/ch0_cell0.dat

I calculer les taux de croissanceI numéroter les cellules pour reconstruire la généalogie

Ecole de Recherche CIMPA Mathématiques pour la biologie ENIT-LAMSIN, Tunis Octobre 2016 51/64

Page 97: Asymétrie dans la division cellulairesaporta/PDF/EXPOSES/CIMPA...EcoledeRechercheCIMPA Mathématiquespourlabiologie ENIT-LAMSIN,TunisOctobre201612=64 Démarchestatistique I recueildesdonnées

Analyse des données de Wang et al. Description des données

Calcul des taux de croissance

Régression de la forme length = exp(τ t)

I pas de calcul pour les cellules dont toute la vie n’est pasobservée

I données aberrantes (longueurs / taux négatifs)

⇒ Eliminer les arbresI de moins de 20 générationsI dont les taux de croissance moyens sont trop éloignés de la

moyenne globaleDans les arbres restants

I éliminer les taux de croissances trop éloignés de la médiane

Ecole de Recherche CIMPA Mathématiques pour la biologie ENIT-LAMSIN, Tunis Octobre 2016 52/64

Page 98: Asymétrie dans la division cellulairesaporta/PDF/EXPOSES/CIMPA...EcoledeRechercheCIMPA Mathématiquespourlabiologie ENIT-LAMSIN,TunisOctobre201612=64 Démarchestatistique I recueildesdonnées

Analyse des données de Wang et al. Description des données

Données aberrantes

0 50 100 150 200 250

−0.

20−

0.10

0.00

0.10

0 50 100 150 200 250

−0.

3−

0.1

0.1

0.3

0 50 100 150 200

0.00

0.05

0.10

0 50 100 150 200

−0.

10.

00.

10.

20.

30.

4

Ecole de Recherche CIMPA Mathématiques pour la biologie ENIT-LAMSIN, Tunis Octobre 2016 53/64

Page 99: Asymétrie dans la division cellulairesaporta/PDF/EXPOSES/CIMPA...EcoledeRechercheCIMPA Mathématiquespourlabiologie ENIT-LAMSIN,TunisOctobre201612=64 Démarchestatistique I recueildesdonnées

Analyse des données de Wang et al. Description des données

Reconstitution des généalogies

Correspondance entre les dates de naissance des cellules

Ecole de Recherche CIMPA Mathématiques pour la biologie ENIT-LAMSIN, Tunis Octobre 2016 54/64

Page 100: Asymétrie dans la division cellulairesaporta/PDF/EXPOSES/CIMPA...EcoledeRechercheCIMPA Mathématiquespourlabiologie ENIT-LAMSIN,TunisOctobre201612=64 Démarchestatistique I recueildesdonnées

Analyse des données de Wang et al. Description des données

Résumé des données

I 224 canauxI 6 à 302 générations observéesI 45255 cellulesI quelques données manquantes, quelques données aberrantes

I calcul des taux de croissance des cellulesI types connus entre les deux fillesI lignées connues via la numérotation par génération

Ecole de Recherche CIMPA Mathématiques pour la biologie ENIT-LAMSIN, Tunis Octobre 2016 55/64

Page 101: Asymétrie dans la division cellulairesaporta/PDF/EXPOSES/CIMPA...EcoledeRechercheCIMPA Mathématiquespourlabiologie ENIT-LAMSIN,TunisOctobre201612=64 Démarchestatistique I recueildesdonnées

Analyse des données de Wang et al. Description des données

Analyse exploratoireTaux de croissance par génération, tous les arbres

2 3 4 5 10 20 30 40 50 100 200

0.00

0.01

0.02

0.03

0.04

0.05

0.06

Ecole de Recherche CIMPA Mathématiques pour la biologie ENIT-LAMSIN, Tunis Octobre 2016 56/64

Page 102: Asymétrie dans la division cellulairesaporta/PDF/EXPOSES/CIMPA...EcoledeRechercheCIMPA Mathématiquespourlabiologie ENIT-LAMSIN,TunisOctobre201612=64 Démarchestatistique I recueildesdonnées

Analyse des données de Wang et al. Estimation

Modèle BAR

[Delyon, dS, Krell, 2016]Estimation des paramètres

a 0.0304 [0.0200; 0.0410]b 0.0664 [−0.4652; 0.5980]c 0.0281 [0.0178; 0.0385]d 0.0994 [−0.3194; 0.5182]

I les intervalles de confiance pour b et d contiennent 0I résultats non significatifs, données trop bruitées, impossible de

valider le modèle

Ecole de Recherche CIMPA Mathématiques pour la biologie ENIT-LAMSIN, Tunis Octobre 2016 57/64

Page 103: Asymétrie dans la division cellulairesaporta/PDF/EXPOSES/CIMPA...EcoledeRechercheCIMPA Mathématiquespourlabiologie ENIT-LAMSIN,TunisOctobre201612=64 Démarchestatistique I recueildesdonnées

Analyse des données de Wang et al. Estimation

Modèle de régression

[Delyon, dS, Krell, 2016]

Xn+1 = βmXn + βgXn−1 + β0 + en

I Xn+1 taux de croissance d’une cellule de la génération n + 1I Xn taux de croissance de sa mèreI Xn−1 taux de croissance de sa grand-mère

Ecole de Recherche CIMPA Mathématiques pour la biologie ENIT-LAMSIN, Tunis Octobre 2016 58/64

Page 104: Asymétrie dans la division cellulairesaporta/PDF/EXPOSES/CIMPA...EcoledeRechercheCIMPA Mathématiquespourlabiologie ENIT-LAMSIN,TunisOctobre201612=64 Démarchestatistique I recueildesdonnées

Analyse des données de Wang et al. Estimation

Modèle de régression

[Delyon, dS, Krell, 2016]

Xn+1 = βmXn + βgXn−1 + β0 + en

Histogramme des p-valeurs pour le test de significativité de la mère

0.0 0.2 0.4 0.6 0.8 1.0

020

4060

80100

Ecole de Recherche CIMPA Mathématiques pour la biologie ENIT-LAMSIN, Tunis Octobre 2016 58/64

Page 105: Asymétrie dans la division cellulairesaporta/PDF/EXPOSES/CIMPA...EcoledeRechercheCIMPA Mathématiquespourlabiologie ENIT-LAMSIN,TunisOctobre201612=64 Démarchestatistique I recueildesdonnées

Analyse des données de Wang et al. Estimation

Modèle de régression

[Delyon, dS, Krell, 2016]

Xn+1 = βmXn + βgXn−1 + β0 + en

Histogramme des p-valeurs pour le test de significativité de lagrand-mère

0.0 0.2 0.4 0.6 0.8 1.0

02

46

8

Ecole de Recherche CIMPA Mathématiques pour la biologie ENIT-LAMSIN, Tunis Octobre 2016 58/64

Page 106: Asymétrie dans la division cellulairesaporta/PDF/EXPOSES/CIMPA...EcoledeRechercheCIMPA Mathématiquespourlabiologie ENIT-LAMSIN,TunisOctobre201612=64 Démarchestatistique I recueildesdonnées

Analyse des données de Wang et al. Estimation

Modèle de régression

[Delyon, dS, Krell, Robert 2016]

Xn+1 = βmXn + β0 + en

Histogramme des βm pour les cellules vieux pôle

−0.2 0.0 0.2 0.4 0.6

02

46

810

14

Différence significative des taux de croissance moyens, descoefficients de corrélation mère-fille.

Ecole de Recherche CIMPA Mathématiques pour la biologie ENIT-LAMSIN, Tunis Octobre 2016 59/64

Page 107: Asymétrie dans la division cellulairesaporta/PDF/EXPOSES/CIMPA...EcoledeRechercheCIMPA Mathématiquespourlabiologie ENIT-LAMSIN,TunisOctobre201612=64 Démarchestatistique I recueildesdonnées

Analyse des données de Wang et al. Estimation

Modèle de régression

[Delyon, dS, Krell, Robert 2016]

Xn+1 = βmXn + β0 + en

Histogramme des βm pour les cellules nouveau pôle

−0.2 0.0 0.2 0.4 0.6

02

46

810

Différence significative des taux de croissance moyens, descoefficients de corrélation mère-fille.

Ecole de Recherche CIMPA Mathématiques pour la biologie ENIT-LAMSIN, Tunis Octobre 2016 59/64

Page 108: Asymétrie dans la division cellulairesaporta/PDF/EXPOSES/CIMPA...EcoledeRechercheCIMPA Mathématiquespourlabiologie ENIT-LAMSIN,TunisOctobre201612=64 Démarchestatistique I recueildesdonnées

Conclusion

Plan de l’exposé

Introduction : deux expériences de biologie

Démarche statistique

Analyse des données de Stewart et al.

Analyse des données de Wang et al.

Conclusion

Ecole de Recherche CIMPA Mathématiques pour la biologie ENIT-LAMSIN, Tunis Octobre 2016 60/64

Page 109: Asymétrie dans la division cellulairesaporta/PDF/EXPOSES/CIMPA...EcoledeRechercheCIMPA Mathématiquespourlabiologie ENIT-LAMSIN,TunisOctobre201612=64 Démarchestatistique I recueildesdonnées

Conclusion

Problèmes rencontrés

I structure complexe des données en arbreI données manquantesI données aberrantesI données trop bruitées

Ecole de Recherche CIMPA Mathématiques pour la biologie ENIT-LAMSIN, Tunis Octobre 2016 61/64

Page 110: Asymétrie dans la division cellulairesaporta/PDF/EXPOSES/CIMPA...EcoledeRechercheCIMPA Mathématiquespourlabiologie ENIT-LAMSIN,TunisOctobre201612=64 Démarchestatistique I recueildesdonnées

Conclusion

Réponses

I Les deux expériences sont-elles contradictoires ?I La division d’E. coli est-elle asymétrique ?

I La taux de croissance d’une cellule fille dépend de celui de samère et pas de sa grand-mère et ancêtres d’ordre plus élévé

I Les deux jeux de données font apparaître une asymétriesignificative entre les cellules nouveau / vieux pôle

I Les données de [Stewart & al. 2005] sont en régime transitoireI Les données de [Wang & al. 2012] sont en régime stationnaire

Ecole de Recherche CIMPA Mathématiques pour la biologie ENIT-LAMSIN, Tunis Octobre 2016 62/64

Page 111: Asymétrie dans la division cellulairesaporta/PDF/EXPOSES/CIMPA...EcoledeRechercheCIMPA Mathématiquespourlabiologie ENIT-LAMSIN,TunisOctobre201612=64 Démarchestatistique I recueildesdonnées

Conclusion

Réponses

I Les deux expériences sont-elles contradictoires ?I La division d’E. coli est-elle asymétrique ?

I La taux de croissance d’une cellule fille dépend de celui de samère et pas de sa grand-mère et ancêtres d’ordre plus élévé

I Les deux jeux de données font apparaître une asymétriesignificative entre les cellules nouveau / vieux pôle

I Les données de [Stewart & al. 2005] sont en régime transitoireI Les données de [Wang & al. 2012] sont en régime stationnaire

Ecole de Recherche CIMPA Mathématiques pour la biologie ENIT-LAMSIN, Tunis Octobre 2016 62/64

Page 112: Asymétrie dans la division cellulairesaporta/PDF/EXPOSES/CIMPA...EcoledeRechercheCIMPA Mathématiquespourlabiologie ENIT-LAMSIN,TunisOctobre201612=64 Démarchestatistique I recueildesdonnées

Conclusion

Perspectives

I Encore peu de données disponibles à l’échelle de la celluleI Concevoir de nouveaux modèles pour expliquer l’origine du

bruit : mémoire ?I prendre en compte la dynamique individuelleI prendre en compte le temps continuI prendre en compte la fabrication de protéines marquées, les

marqueurs de fluorescenceI Concevoir de nouveaux outils statistiques

I utilisables sur des données de populationI permettant de discriminer les modèles

Ecole de Recherche CIMPA Mathématiques pour la biologie ENIT-LAMSIN, Tunis Octobre 2016 63/64

Page 113: Asymétrie dans la division cellulairesaporta/PDF/EXPOSES/CIMPA...EcoledeRechercheCIMPA Mathématiquespourlabiologie ENIT-LAMSIN,TunisOctobre201612=64 Démarchestatistique I recueildesdonnées

Conclusion

Rérérences[Cowan & Staudte 1986] Cowan and Staudte The bifurcating autoregressive model in cell lineage studies.

Biometrics (1986).[Stewart & al. 2005] Stewart, Madden, Paul, and Taddei Aging and death in an organism that reproduces

by morphologically symmetric division. PLoS Biol. (2005)[Guyon 2007] Guyon Limit theorems for bifurcating Markov chains. Application to the detection of

cellular aging. Ann. Appl. Probab. (2007)[Bercu, dS, Gégout-Petit 2009] Bercu, de Saporta and Gégout-Petit Asymptotic analysis for bifurcating

autoregressive processes via a martingale approach. Electron. J. Probab. (2009)[Delmas & Marsalle 2010] Delmas and Marsalle Detection of cellular aging in a Galton-Watson process.

Stoch. Process. and Appl. (2010)[dS, Gégout-Petit, Marsalle 2011] de Saporta, Gégout-Petit and Marsalle Parameters estimation for

asymmetric bifurcating autoregressive processes with missing data. Electron. J. Statist.(2011)

[Wang & al. 2012] Wang, Robertn Pelletier, Dang, Taggei, Wright and Jun Robust growth ofescherichia coli. Current Biology (2012)

[dS, Gégout-Petit, Marsalle 2012] de Saporta, Gégout-Petit and Marsalle Symmetry tests for bifurcatingautoregressive processes with missing data. Statistics & Probability Letters (2012)

[dS, Gégout-Petit, Marsalle 2014] de Saporta, Gégout-Petit and Marsalle Random coefficients bifurcatingautoregressive processes. ESAIM proba. stat. (2014)

[dS, Gégout-Petit, Marsalle 2014] de Saporta, Gégout-Petit and Marsalle Statistical study of asymmetryin cell lineage data. Comp. Stat. Data Anal. (2014)

[Delyon, dS, Krell, Robert 2016] Delyon, de Saporta, Krell and Robert Investigation of asymmetry in E.coli growth rate CSBIGS (to appear)

Ecole de Recherche CIMPA Mathématiques pour la biologie ENIT-LAMSIN, Tunis Octobre 2016 64/64