mes histoires d'amour avec les travaux de maxime ... - lifl.fr · computer science, lecture...

59
Mes histoires d’amour avec les travaux de Maxime Crochemore Gregory Kucherov LIFL/CNRS/INRIA, Lille, France Marne-la-Vall´ ee, 26 octobre 2007

Upload: vanxuyen

Post on 30-Apr-2018

214 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Mes histoires d'amour avec les travaux de Maxime ... - lifl.fr · Computer Science, Lecture Notes in Computer Science, Vol. 324 (Springer, Berlin, 1988) ... LNCS. 1999. pp. 291-306

Mes histoires d’amour avec les travaux de MaximeCrochemore

Gregory KucherovLIFL/CNRS/INRIA, Lille, France

Marne-la-Vallee, 26 octobre 2007

Page 2: Mes histoires d'amour avec les travaux de Maxime ... - lifl.fr · Computer Science, Lecture Notes in Computer Science, Vol. 324 (Springer, Berlin, 1988) ... LNCS. 1999. pp. 291-306

Histoire 1 : Automate des suffixes Histoire 2 : Morphismes sans carre Histoire 3 : Recherche de repetitions Epilogue

travaux de Maxime (donnees du 2/11/2006)

59 articles de revue

53 communications a des colloques

34 livres, chapitres de livres et de recueils

2 theses et 13 rapports de recherche

Page 3: Mes histoires d'amour avec les travaux de Maxime ... - lifl.fr · Computer Science, Lecture Notes in Computer Science, Vol. 324 (Springer, Berlin, 1988) ... LNCS. 1999. pp. 291-306

Histoire 1 : Automate des suffixes Histoire 2 : Morphismes sans carre Histoire 3 : Recherche de repetitions Epilogue

Histoire 1 (vers 1993)

Automate des suffixes

Page 4: Mes histoires d'amour avec les travaux de Maxime ... - lifl.fr · Computer Science, Lecture Notes in Computer Science, Vol. 324 (Springer, Berlin, 1988) ... LNCS. 1999. pp. 291-306

Histoire 1 : Automate des suffixes Histoire 2 : Morphismes sans carre Histoire 3 : Recherche de repetitions Epilogue

Recherche de motifs multiples avec jokers non-bornes

Page 5: Mes histoires d'amour avec les travaux de Maxime ... - lifl.fr · Computer Science, Lecture Notes in Computer Science, Vol. 324 (Springer, Berlin, 1988) ... LNCS. 1999. pp. 291-306

Histoire 1 : Automate des suffixes Histoire 2 : Morphismes sans carre Histoire 3 : Recherche de repetitions Epilogue

Recherche de motifs multiples avec jokers non-bornes

recherche d’expressions regulieres⋃k

i=1 A∗wi1A∗ · · ·A∗wi`i

Page 6: Mes histoires d'amour avec les travaux de Maxime ... - lifl.fr · Computer Science, Lecture Notes in Computer Science, Vol. 324 (Springer, Berlin, 1988) ... LNCS. 1999. pp. 291-306

Histoire 1 : Automate des suffixes Histoire 2 : Morphismes sans carre Histoire 3 : Recherche de repetitions Epilogue

Recherche de motifs multiples avec jokers non-bornes

Page 7: Mes histoires d'amour avec les travaux de Maxime ... - lifl.fr · Computer Science, Lecture Notes in Computer Science, Vol. 324 (Springer, Berlin, 1988) ... LNCS. 1999. pp. 291-306

Histoire 1 : Automate des suffixes Histoire 2 : Morphismes sans carre Histoire 3 : Recherche de repetitions Epilogue

Recherche de motifs multiples avec jokers non-bornes

Page 8: Mes histoires d'amour avec les travaux de Maxime ... - lifl.fr · Computer Science, Lecture Notes in Computer Science, Vol. 324 (Springer, Berlin, 1988) ... LNCS. 1999. pp. 291-306

Histoire 1 : Automate des suffixes Histoire 2 : Morphismes sans carre Histoire 3 : Recherche de repetitions Epilogue

Recherche de motifs multiples avec jokers non-bornes

Page 9: Mes histoires d'amour avec les travaux de Maxime ... - lifl.fr · Computer Science, Lecture Notes in Computer Science, Vol. 324 (Springer, Berlin, 1988) ... LNCS. 1999. pp. 291-306

Histoire 1 : Automate des suffixes Histoire 2 : Morphismes sans carre Histoire 3 : Recherche de repetitions Epilogue

Recherche de motifs multiples avec jokers non-bornes

Page 10: Mes histoires d'amour avec les travaux de Maxime ... - lifl.fr · Computer Science, Lecture Notes in Computer Science, Vol. 324 (Springer, Berlin, 1988) ... LNCS. 1999. pp. 291-306

Histoire 1 : Automate des suffixes Histoire 2 : Morphismes sans carre Histoire 3 : Recherche de repetitions Epilogue

Premieres amours

Maxime Crochemore, Transducers and repetitions, TheoreticalComputer Science 45, 63-86, 1986

Maxime Crochemore, String matching with constraints, InProc. Internat. Symp. on Mathematical Foundations ofComputer Science, Lecture Notes in Computer Science, Vol.324 (Springer, Berlin, 1988) p. 44-58

Page 11: Mes histoires d'amour avec les travaux de Maxime ... - lifl.fr · Computer Science, Lecture Notes in Computer Science, Vol. 324 (Springer, Berlin, 1988) ... LNCS. 1999. pp. 291-306

Histoire 1 : Automate des suffixes Histoire 2 : Morphismes sans carre Histoire 3 : Recherche de repetitions Epilogue

Automate des suffixes

u, v facteurs de w

u ≡w v ssi les positions de fin de u et de v coincident

V = {[u]≡w |u facteur de w}E = {[u]≡w

a→ [ua]≡w |u, ua facteurs de w , a ∈ A}

. (V ,E ) est l’automate minimal qui reconnait tous les suffixes dew. (V ,E ) est un automate (generalement non-minimal) quireconnait tous les facteurs de w. (V ,E ) est de taille bornee par 2|w | et peux etre construit entemps O(|w |) !

Page 12: Mes histoires d'amour avec les travaux de Maxime ... - lifl.fr · Computer Science, Lecture Notes in Computer Science, Vol. 324 (Springer, Berlin, 1988) ... LNCS. 1999. pp. 291-306

Histoire 1 : Automate des suffixes Histoire 2 : Morphismes sans carre Histoire 3 : Recherche de repetitions Epilogue

Automate des suffixes

u, v facteurs de w

u ≡w v ssi les positions de fin de u et de v coincident

V = {[u]≡w |u facteur de w}E = {[u]≡w

a→ [ua]≡w |u, ua facteurs de w , a ∈ A}

. (V ,E ) est l’automate minimal qui reconnait tous les suffixes dew. (V ,E ) est un automate (generalement non-minimal) quireconnait tous les facteurs de w. (V ,E ) est de taille bornee par 2|w | et peux etre construit entemps O(|w |) !

Page 13: Mes histoires d'amour avec les travaux de Maxime ... - lifl.fr · Computer Science, Lecture Notes in Computer Science, Vol. 324 (Springer, Berlin, 1988) ... LNCS. 1999. pp. 291-306

Histoire 1 : Automate des suffixes Histoire 2 : Morphismes sans carre Histoire 3 : Recherche de repetitions Epilogue

Automate des suffixes

u, v facteurs de w

u ≡w v ssi les positions de fin de u et de v coincident

V = {[u]≡w |u facteur de w}E = {[u]≡w

a→ [ua]≡w |u, ua facteurs de w , a ∈ A}

. (V ,E ) est l’automate minimal qui reconnait tous les suffixes dew

. (V ,E ) est un automate (generalement non-minimal) quireconnait tous les facteurs de w. (V ,E ) est de taille bornee par 2|w | et peux etre construit entemps O(|w |) !

Page 14: Mes histoires d'amour avec les travaux de Maxime ... - lifl.fr · Computer Science, Lecture Notes in Computer Science, Vol. 324 (Springer, Berlin, 1988) ... LNCS. 1999. pp. 291-306

Histoire 1 : Automate des suffixes Histoire 2 : Morphismes sans carre Histoire 3 : Recherche de repetitions Epilogue

Automate des suffixes

u, v facteurs de w

u ≡w v ssi les positions de fin de u et de v coincident

V = {[u]≡w |u facteur de w}E = {[u]≡w

a→ [ua]≡w |u, ua facteurs de w , a ∈ A}

. (V ,E ) est l’automate minimal qui reconnait tous les suffixes dew. (V ,E ) est un automate (generalement non-minimal) quireconnait tous les facteurs de w

. (V ,E ) est de taille bornee par 2|w | et peux etre construit entemps O(|w |) !

Page 15: Mes histoires d'amour avec les travaux de Maxime ... - lifl.fr · Computer Science, Lecture Notes in Computer Science, Vol. 324 (Springer, Berlin, 1988) ... LNCS. 1999. pp. 291-306

Histoire 1 : Automate des suffixes Histoire 2 : Morphismes sans carre Histoire 3 : Recherche de repetitions Epilogue

Automate des suffixes

u, v facteurs de w

u ≡w v ssi les positions de fin de u et de v coincident

V = {[u]≡w |u facteur de w}E = {[u]≡w

a→ [ua]≡w |u, ua facteurs de w , a ∈ A}

. (V ,E ) est l’automate minimal qui reconnait tous les suffixes dew. (V ,E ) est un automate (generalement non-minimal) quireconnait tous les facteurs de w. (V ,E ) est de taille bornee par 2|w | et peux etre construit entemps O(|w |) !

Page 16: Mes histoires d'amour avec les travaux de Maxime ... - lifl.fr · Computer Science, Lecture Notes in Computer Science, Vol. 324 (Springer, Berlin, 1988) ... LNCS. 1999. pp. 291-306

Histoire 1 : Automate des suffixes Histoire 2 : Morphismes sans carre Histoire 3 : Recherche de repetitions Epilogue

DAWG : Directed Acyclic Word Graph

A.Blumer, J.Blumer, D.Haussler,A.Ehrenfeucht, M.T.Chen,J.Seiferas, The smallest automatonrecognizing the subwords of a text,Theoretical Computer Science 40,31-55, 1985

A.Blumer, J.Blumer, D.Haussler,R.McConnell, A.Ehrenfeucht,Complete inverted files for efficienttext retieval and analysis, Journalof the ACM 34, 578-595, 1987

a

a

aa

a

a

b

b

DAWG pour l’ensembleD = {ba, bbaa}

Page 17: Mes histoires d'amour avec les travaux de Maxime ... - lifl.fr · Computer Science, Lecture Notes in Computer Science, Vol. 324 (Springer, Berlin, 1988) ... LNCS. 1999. pp. 291-306

Histoire 1 : Automate des suffixes Histoire 2 : Morphismes sans carre Histoire 3 : Recherche de repetitions Epilogue

Les vertus du DAWG

Le DAWG se prete bien a l’ajout/suppression de mots de sonsupport

Recherche de motifs multiples avec jokers non-bornes :O((|T |+ |P|) log |P|) [Kucherov&Rusinowitch 95]

Dynamic Dictionary Matching [Amir&Farach 91, Amir et al94, Idury&Schaffer 94] ajout/suppression d’un mot p dedictionnaire en O(|p| log |D|), recherche enO((|T |+ occ) log |D|)

Page 18: Mes histoires d'amour avec les travaux de Maxime ... - lifl.fr · Computer Science, Lecture Notes in Computer Science, Vol. 324 (Springer, Berlin, 1988) ... LNCS. 1999. pp. 291-306

Histoire 1 : Automate des suffixes Histoire 2 : Morphismes sans carre Histoire 3 : Recherche de repetitions Epilogue

Les vertus du DAWG

Le DAWG se prete bien a l’ajout/suppression de mots de sonsupport

Recherche de motifs multiples avec jokers non-bornes :O((|T |+ |P|) log |P|) [Kucherov&Rusinowitch 95]

Dynamic Dictionary Matching [Amir&Farach 91, Amir et al94, Idury&Schaffer 94] ajout/suppression d’un mot p dedictionnaire en O(|p| log |D|), recherche enO((|T |+ occ) log |D|)

Page 19: Mes histoires d'amour avec les travaux de Maxime ... - lifl.fr · Computer Science, Lecture Notes in Computer Science, Vol. 324 (Springer, Berlin, 1988) ... LNCS. 1999. pp. 291-306

Histoire 1 : Automate des suffixes Histoire 2 : Morphismes sans carre Histoire 3 : Recherche de repetitions Epilogue

Les vertus du DAWG

Le DAWG se prete bien a l’ajout/suppression de mots de sonsupport

Recherche de motifs multiples avec jokers non-bornes :O((|T |+ |P|) log |P|) [Kucherov&Rusinowitch 95]

Dynamic Dictionary Matching [Amir&Farach 91, Amir et al94, Idury&Schaffer 94] ajout/suppression d’un mot p dedictionnaire en O(|p| log |D|), recherche enO((|T |+ occ) log |D|)

Page 20: Mes histoires d'amour avec les travaux de Maxime ... - lifl.fr · Computer Science, Lecture Notes in Computer Science, Vol. 324 (Springer, Berlin, 1988) ... LNCS. 1999. pp. 291-306

Histoire 1 : Automate des suffixes Histoire 2 : Morphismes sans carre Histoire 3 : Recherche de repetitions Epilogue

Halte au monopole de l’arbre des suffixes ! Vive lepluralisme des structures !

google scholar sort 3230 articles en reponse de la requete "suffixtree" et de l’ordre de 200 en reponse de "acyclic word graph"ou "suffix automaton"

Page 21: Mes histoires d'amour avec les travaux de Maxime ... - lifl.fr · Computer Science, Lecture Notes in Computer Science, Vol. 324 (Springer, Berlin, 1988) ... LNCS. 1999. pp. 291-306

Histoire 1 : Automate des suffixes Histoire 2 : Morphismes sans carre Histoire 3 : Recherche de repetitions Epilogue

D’autres structures d’index

Compact Directed Acyclic Word Graph

M.Crochemore, R.Verin. On Compact Directed Acyclic

Word Graphs. Structures in Logic and Computer Science.

Springer. 1997. pp. 192-211

Factor oracleC.Allauzen, M.Crochemore, M.Raffinot. Factor oracle : anew structure for pattern matching. In : SOFSEM’99, vol.1725. LNCS. 1999. pp. 291-306. Springer-Verlag

M. Crochemore, L. Ilie, and E. Seid-Hilmi, Factor Oracles,

Proc. of CIAA’06, LNCS 4094, Springer, 2006, 78 – 89

Subsequence automaton

J.-J.Hebrard, M.Crochemore. Calcul de la distance par les

sous-mots. Informatique Theorique et Applications. 20

(4). 1986. pp. 441-456

Page 22: Mes histoires d'amour avec les travaux de Maxime ... - lifl.fr · Computer Science, Lecture Notes in Computer Science, Vol. 324 (Springer, Berlin, 1988) ... LNCS. 1999. pp. 291-306

Histoire 1 : Automate des suffixes Histoire 2 : Morphismes sans carre Histoire 3 : Recherche de repetitions Epilogue

Histoire 2 (vers 1996)

Morphismes sans carre

Page 23: Mes histoires d'amour avec les travaux de Maxime ... - lifl.fr · Computer Science, Lecture Notes in Computer Science, Vol. 324 (Springer, Berlin, 1988) ... LNCS. 1999. pp. 291-306

Histoire 1 : Automate des suffixes Histoire 2 : Morphismes sans carre Histoire 3 : Recherche de repetitions Epilogue

Repetitions

p(w) : periode minimale de w (min{p|∀i w [i + p] = w [i ]})e(w) = |w |

p(w) : exposant de w

acaaca = (aca)2 : carre ; acacac = (ac)3 : cube ;

accacca = (acc)73 , accaac = (acca)

32

w sans puissance α ∈ R si w n’a pas de facteur u tel quee(u) ≥ α

il existe un mot infini sans carre sur un alphabet de 3 lettres(abacabcacb . . .) [Thue ≈1905]

[Dejean 1972] : sur un alphabet de 3 lettres, il existe un mot

infini sans puissance 74

+

sur un alphabet de 2 lettres, il existe un mot infini sanspuissance 2+ (overlap-free) ; Thue-Morse morphismµ(a) = ab, µ(b) = ba

Page 24: Mes histoires d'amour avec les travaux de Maxime ... - lifl.fr · Computer Science, Lecture Notes in Computer Science, Vol. 324 (Springer, Berlin, 1988) ... LNCS. 1999. pp. 291-306

Histoire 1 : Automate des suffixes Histoire 2 : Morphismes sans carre Histoire 3 : Recherche de repetitions Epilogue

Repetitions

p(w) : periode minimale de w (min{p|∀i w [i + p] = w [i ]})e(w) = |w |

p(w) : exposant de w

acaaca = (aca)2 : carre ; acacac = (ac)3 : cube ;

accacca = (acc)73 , accaac = (acca)

32

w sans puissance α ∈ R si w n’a pas de facteur u tel quee(u) ≥ α

il existe un mot infini sans carre sur un alphabet de 3 lettres(abacabcacb . . .) [Thue ≈1905]

[Dejean 1972] : sur un alphabet de 3 lettres, il existe un mot

infini sans puissance 74

+

sur un alphabet de 2 lettres, il existe un mot infini sanspuissance 2+ (overlap-free) ; Thue-Morse morphismµ(a) = ab, µ(b) = ba

Page 25: Mes histoires d'amour avec les travaux de Maxime ... - lifl.fr · Computer Science, Lecture Notes in Computer Science, Vol. 324 (Springer, Berlin, 1988) ... LNCS. 1999. pp. 291-306

Histoire 1 : Automate des suffixes Histoire 2 : Morphismes sans carre Histoire 3 : Recherche de repetitions Epilogue

Repetitions

p(w) : periode minimale de w (min{p|∀i w [i + p] = w [i ]})e(w) = |w |

p(w) : exposant de w

acaaca = (aca)2 : carre ; acacac = (ac)3 : cube ;

accacca = (acc)73 , accaac = (acca)

32

w sans puissance α ∈ R si w n’a pas de facteur u tel quee(u) ≥ α

il existe un mot infini sans carre sur un alphabet de 3 lettres(abacabcacb . . .) [Thue ≈1905]

[Dejean 1972] : sur un alphabet de 3 lettres, il existe un mot

infini sans puissance 74

+

sur un alphabet de 2 lettres, il existe un mot infini sanspuissance 2+ (overlap-free) ; Thue-Morse morphismµ(a) = ab, µ(b) = ba

Page 26: Mes histoires d'amour avec les travaux de Maxime ... - lifl.fr · Computer Science, Lecture Notes in Computer Science, Vol. 324 (Springer, Berlin, 1988) ... LNCS. 1999. pp. 291-306

Histoire 1 : Automate des suffixes Histoire 2 : Morphismes sans carre Histoire 3 : Recherche de repetitions Epilogue

Repetitions

p(w) : periode minimale de w (min{p|∀i w [i + p] = w [i ]})e(w) = |w |

p(w) : exposant de w

acaaca = (aca)2 : carre ; acacac = (ac)3 : cube ;

accacca = (acc)73 , accaac = (acca)

32

w sans puissance α ∈ R si w n’a pas de facteur u tel quee(u) ≥ α

il existe un mot infini sans carre sur un alphabet de 3 lettres(abacabcacb . . .) [Thue ≈1905]

[Dejean 1972] : sur un alphabet de 3 lettres, il existe un mot

infini sans puissance 74

+

sur un alphabet de 2 lettres, il existe un mot infini sanspuissance 2+ (overlap-free) ; Thue-Morse morphismµ(a) = ab, µ(b) = ba

Page 27: Mes histoires d'amour avec les travaux de Maxime ... - lifl.fr · Computer Science, Lecture Notes in Computer Science, Vol. 324 (Springer, Berlin, 1988) ... LNCS. 1999. pp. 291-306

Histoire 1 : Automate des suffixes Histoire 2 : Morphismes sans carre Histoire 3 : Recherche de repetitions Epilogue

Morphismes sans puissance

morphisme µ sans puissance α : w est sans puissance α ⇒µ(w) est sans puissance α

il est tres difficile de decider si un morphisme donne est sanspuissance α

Des conditions necessaires et suffisantes (etendant celles de JeanBerstel de 1979) qu’un morphisme soit sans carre ont ete etabliesdans

Maxime Crochemore. Sharp characterization ofsquare-free morphisms. Theoretical Computer Science. 18(2). 1982. pp. 221-226

Corollary 5

Un morphisme µ : {a, b, c} → {a, b, c} est sans carre si etseulement si pour tout mot w ∈ {a, b, c}∗ de longueur ≤ 5, µ(w)est sans carre

Page 28: Mes histoires d'amour avec les travaux de Maxime ... - lifl.fr · Computer Science, Lecture Notes in Computer Science, Vol. 324 (Springer, Berlin, 1988) ... LNCS. 1999. pp. 291-306

Histoire 1 : Automate des suffixes Histoire 2 : Morphismes sans carre Histoire 3 : Recherche de repetitions Epilogue

Morphismes sans puissance

morphisme µ sans puissance α : w est sans puissance α ⇒µ(w) est sans puissance α

il est tres difficile de decider si un morphisme donne est sanspuissance α

Des conditions necessaires et suffisantes (etendant celles de JeanBerstel de 1979) qu’un morphisme soit sans carre ont ete etabliesdans

Maxime Crochemore. Sharp characterization ofsquare-free morphisms. Theoretical Computer Science. 18(2). 1982. pp. 221-226

Corollary 5

Un morphisme µ : {a, b, c} → {a, b, c} est sans carre si etseulement si pour tout mot w ∈ {a, b, c}∗ de longueur ≤ 5, µ(w)est sans carre

Page 29: Mes histoires d'amour avec les travaux de Maxime ... - lifl.fr · Computer Science, Lecture Notes in Computer Science, Vol. 324 (Springer, Berlin, 1988) ... LNCS. 1999. pp. 291-306

Histoire 1 : Automate des suffixes Histoire 2 : Morphismes sans carre Histoire 3 : Recherche de repetitions Epilogue

Morphismes sans puissance

morphisme µ sans puissance α : w est sans puissance α ⇒µ(w) est sans puissance α

il est tres difficile de decider si un morphisme donne est sanspuissance α

Des conditions necessaires et suffisantes (etendant celles de JeanBerstel de 1979) qu’un morphisme soit sans carre ont ete etabliesdans

Maxime Crochemore. Sharp characterization ofsquare-free morphisms. Theoretical Computer Science. 18(2). 1982. pp. 221-226

Corollary 5

Un morphisme µ : {a, b, c} → {a, b, c} est sans carre si etseulement si pour tout mot w ∈ {a, b, c}∗ de longueur ≤ 5, µ(w)est sans carre

Page 30: Mes histoires d'amour avec les travaux de Maxime ... - lifl.fr · Computer Science, Lecture Notes in Computer Science, Vol. 324 (Springer, Berlin, 1988) ... LNCS. 1999. pp. 291-306

Histoire 1 : Automate des suffixes Histoire 2 : Morphismes sans carre Histoire 3 : Recherche de repetitions Epilogue

Frequence limite d’une lettre dans les mots binaires sanspuissance α

Question : que peut-on dire de ρmin(α), la proportion minimalelimite d’une lettre dans un mot sans puissance α ?

Cas d’alphabet binaire, α > 2 [Kolpakov&Kucherov 97,K&K&Tarannikov 98, Ochem 05]

ρmin(α) = 12 for α ∈ (2, 7

3 ] et ρmin(73

+) < 1

2

infinite de points de discontinuite :73 , 17

7 , 52 , . . . , 41

16 , 187 , . . . , 3, 4, . . . et tous α ∈ N

un autre intervalle constant : (4116 , 18

7 ]

estimations pour ρmin(α) et ρmin(α+) pour tous les points de

discontinuite α (mais aucune valeur exacte n’est connue !)

Page 31: Mes histoires d'amour avec les travaux de Maxime ... - lifl.fr · Computer Science, Lecture Notes in Computer Science, Vol. 324 (Springer, Berlin, 1988) ... LNCS. 1999. pp. 291-306

Histoire 1 : Automate des suffixes Histoire 2 : Morphismes sans carre Histoire 3 : Recherche de repetitions Epilogue

Frequence limite d’une lettre dans les mots binaires sanspuissance α

Question : que peut-on dire de ρmin(α), la proportion minimalelimite d’une lettre dans un mot sans puissance α ?

Cas d’alphabet binaire, α > 2 [Kolpakov&Kucherov 97,K&K&Tarannikov 98, Ochem 05]

ρmin(α) = 12 for α ∈ (2, 7

3 ] et ρmin(73

+) < 1

2

infinite de points de discontinuite :73 , 17

7 , 52 , . . . , 41

16 , 187 , . . . , 3, 4, . . . et tous α ∈ N

un autre intervalle constant : (4116 , 18

7 ]

estimations pour ρmin(α) et ρmin(α+) pour tous les points de

discontinuite α (mais aucune valeur exacte n’est connue !)

Page 32: Mes histoires d'amour avec les travaux de Maxime ... - lifl.fr · Computer Science, Lecture Notes in Computer Science, Vol. 324 (Springer, Berlin, 1988) ... LNCS. 1999. pp. 291-306

Histoire 1 : Automate des suffixes Histoire 2 : Morphismes sans carre Histoire 3 : Recherche de repetitions Epilogue

Frequence limite d’une lettre dans les mots binaires sanspuissance α

Question : que peut-on dire de ρmin(α), la proportion minimalelimite d’une lettre dans un mot sans puissance α ?

Cas d’alphabet binaire, α > 2 [Kolpakov&Kucherov 97,K&K&Tarannikov 98, Ochem 05]

ρmin(α) = 12 for α ∈ (2, 7

3 ] et ρmin(73

+) < 1

2

infinite de points de discontinuite :73 , 17

7 , 52 , . . . , 41

16 , 187 , . . . , 3, 4, . . . et tous α ∈ N

un autre intervalle constant : (4116 , 18

7 ]

estimations pour ρmin(α) et ρmin(α+) pour tous les points de

discontinuite α (mais aucune valeur exacte n’est connue !)

Page 33: Mes histoires d'amour avec les travaux de Maxime ... - lifl.fr · Computer Science, Lecture Notes in Computer Science, Vol. 324 (Springer, Berlin, 1988) ... LNCS. 1999. pp. 291-306

Histoire 1 : Automate des suffixes Histoire 2 : Morphismes sans carre Histoire 3 : Recherche de repetitions Epilogue

Frequence limite d’une lettre dans les mots binaires sanspuissance α

Question : que peut-on dire de ρmin(α), la proportion minimalelimite d’une lettre dans un mot sans puissance α ?

Cas d’alphabet binaire, α > 2 [Kolpakov&Kucherov 97,K&K&Tarannikov 98, Ochem 05]

ρmin(α) = 12 for α ∈ (2, 7

3 ] et ρmin(73

+) < 1

2

infinite de points de discontinuite :73 , 17

7 , 52 , . . . , 41

16 , 187 , . . . , 3, 4, . . . et tous α ∈ N

un autre intervalle constant : (4116 , 18

7 ]

estimations pour ρmin(α) et ρmin(α+) pour tous les points de

discontinuite α (mais aucune valeur exacte n’est connue !)

Page 34: Mes histoires d'amour avec les travaux de Maxime ... - lifl.fr · Computer Science, Lecture Notes in Computer Science, Vol. 324 (Springer, Berlin, 1988) ... LNCS. 1999. pp. 291-306

Histoire 1 : Automate des suffixes Histoire 2 : Morphismes sans carre Histoire 3 : Recherche de repetitions Epilogue

Frequence limite d’une lettre dans les mots binaires sanspuissance α

Question : que peut-on dire de ρmin(α), la proportion minimalelimite d’une lettre dans un mot sans puissance α ?

Cas d’alphabet binaire, α > 2 [Kolpakov&Kucherov 97,K&K&Tarannikov 98, Ochem 05]

ρmin(α) = 12 for α ∈ (2, 7

3 ] et ρmin(73

+) < 1

2

infinite de points de discontinuite :73 , 17

7 , 52 , . . . , 41

16 , 187 , . . . , 3, 4, . . . et tous α ∈ N

un autre intervalle constant : (4116 , 18

7 ]

estimations pour ρmin(α) et ρmin(α+) pour tous les points de

discontinuite α (mais aucune valeur exacte n’est connue !)

Page 35: Mes histoires d'amour avec les travaux de Maxime ... - lifl.fr · Computer Science, Lecture Notes in Computer Science, Vol. 324 (Springer, Berlin, 1988) ... LNCS. 1999. pp. 291-306

Histoire 1 : Automate des suffixes Histoire 2 : Morphismes sans carre Histoire 3 : Recherche de repetitions Epilogue

Frequence limite d’une lettre dans les mots de 3 lettressans carre

Cas d’alphabet de 3 lettres, α = 2

[Tarannikov 02] :0, 274648... = 1780

6481 ≤ ρmin ≤ 64233 = 0, 274678...

[Ochem 05] :0, 27464897... = 1000

3641 ≤ ρmin ≤ 8833215 = 0, 27465007...,

ρmax = 255653 = 0.3905...

(en utilisant les criteres de Crochemore !)

[Khalyavin 07] : ρmin = 8833215 ! !

Page 36: Mes histoires d'amour avec les travaux de Maxime ... - lifl.fr · Computer Science, Lecture Notes in Computer Science, Vol. 324 (Springer, Berlin, 1988) ... LNCS. 1999. pp. 291-306

Histoire 1 : Automate des suffixes Histoire 2 : Morphismes sans carre Histoire 3 : Recherche de repetitions Epilogue

Frequence limite d’une lettre dans les mots de 3 lettressans carre

Cas d’alphabet de 3 lettres, α = 2

[Tarannikov 02] :0, 274648... = 1780

6481 ≤ ρmin ≤ 64233 = 0, 274678...

[Ochem 05] :0, 27464897... = 1000

3641 ≤ ρmin ≤ 8833215 = 0, 27465007...,

ρmax = 255653 = 0.3905...

(en utilisant les criteres de Crochemore !)

[Khalyavin 07] : ρmin = 8833215 ! !

Page 37: Mes histoires d'amour avec les travaux de Maxime ... - lifl.fr · Computer Science, Lecture Notes in Computer Science, Vol. 324 (Springer, Berlin, 1988) ... LNCS. 1999. pp. 291-306

Histoire 1 : Automate des suffixes Histoire 2 : Morphismes sans carre Histoire 3 : Recherche de repetitions Epilogue

Frequence limite d’une lettre dans les mots de 3 lettressans carre

Cas d’alphabet de 3 lettres, α = 2

[Tarannikov 02] :0, 274648... = 1780

6481 ≤ ρmin ≤ 64233 = 0, 274678...

[Ochem 05] :0, 27464897... = 1000

3641 ≤ ρmin ≤ 8833215 = 0, 27465007...,

ρmax = 255653 = 0.3905...

(en utilisant les criteres de Crochemore !)

[Khalyavin 07] : ρmin = 8833215 ! !

Page 38: Mes histoires d'amour avec les travaux de Maxime ... - lifl.fr · Computer Science, Lecture Notes in Computer Science, Vol. 324 (Springer, Berlin, 1988) ... LNCS. 1999. pp. 291-306

Histoire 1 : Automate des suffixes Histoire 2 : Morphismes sans carre Histoire 3 : Recherche de repetitions Epilogue

Frequence limite d’une lettre dans les mots de 3 lettressans carre

Cas d’alphabet de 3 lettres, α = 2

[Tarannikov 02] :0, 274648... = 1780

6481 ≤ ρmin ≤ 64233 = 0, 274678...

[Ochem 05] :0, 27464897... = 1000

3641 ≤ ρmin ≤ 8833215 = 0, 27465007...,

ρmax = 255653 = 0.3905...

(en utilisant les criteres de Crochemore !)

[Khalyavin 07] : ρmin = 8833215 ! !

Page 39: Mes histoires d'amour avec les travaux de Maxime ... - lifl.fr · Computer Science, Lecture Notes in Computer Science, Vol. 324 (Springer, Berlin, 1988) ... LNCS. 1999. pp. 291-306

Histoire 1 : Automate des suffixes Histoire 2 : Morphismes sans carre Histoire 3 : Recherche de repetitions Epilogue

Histoire 3 (vers 1998)

Recherche de repetitions

Page 40: Mes histoires d'amour avec les travaux de Maxime ... - lifl.fr · Computer Science, Lecture Notes in Computer Science, Vol. 324 (Springer, Berlin, 1988) ... LNCS. 1999. pp. 291-306

Histoire 1 : Automate des suffixes Histoire 2 : Morphismes sans carre Histoire 3 : Recherche de repetitions Epilogue

Genese

Maxime Crochemore. An optimal algorithm for computing therepetitions in a word. Information Processing Letters. 12 (5).1981. pp. 244-250

recherche de tous les puissances entieres non-extensibles enO(n log n)optimalite de la borne (mots de Fibonacci)

Maxime Crochemore. Recherche lineaire d’un carre dans unmot. C. R. Acad. Sci. Paris Ser. I Math. 296 (18). 1983. pp.781-784

utilisation des techniques de factorisation a la Lempel-Ziv et defonctions d’extension

Page 41: Mes histoires d'amour avec les travaux de Maxime ... - lifl.fr · Computer Science, Lecture Notes in Computer Science, Vol. 324 (Springer, Berlin, 1988) ... LNCS. 1999. pp. 291-306

Histoire 1 : Automate des suffixes Histoire 2 : Morphismes sans carre Histoire 3 : Recherche de repetitions Epilogue

Genese

Maxime Crochemore. An optimal algorithm for computing therepetitions in a word. Information Processing Letters. 12 (5).1981. pp. 244-250

recherche de tous les puissances entieres non-extensibles enO(n log n)optimalite de la borne (mots de Fibonacci)

Maxime Crochemore. Recherche lineaire d’un carre dans unmot. C. R. Acad. Sci. Paris Ser. I Math. 296 (18). 1983. pp.781-784

utilisation des techniques de factorisation a la Lempel-Ziv et defonctions d’extension

Page 42: Mes histoires d'amour avec les travaux de Maxime ... - lifl.fr · Computer Science, Lecture Notes in Computer Science, Vol. 324 (Springer, Berlin, 1988) ... LNCS. 1999. pp. 291-306

Histoire 1 : Automate des suffixes Histoire 2 : Morphismes sans carre Histoire 3 : Recherche de repetitions Epilogue

Genese

Maxime Crochemore. An optimal algorithm for computing therepetitions in a word. Information Processing Letters. 12 (5).1981. pp. 244-250

recherche de tous les puissances entieres non-extensibles enO(n log n)optimalite de la borne (mots de Fibonacci)

Maxime Crochemore. Recherche lineaire d’un carre dans unmot. C. R. Acad. Sci. Paris Ser. I Math. 296 (18). 1983. pp.781-784

utilisation des techniques de factorisation a la Lempel-Ziv et defonctions d’extension

Page 43: Mes histoires d'amour avec les travaux de Maxime ... - lifl.fr · Computer Science, Lecture Notes in Computer Science, Vol. 324 (Springer, Berlin, 1988) ... LNCS. 1999. pp. 291-306

Histoire 1 : Automate des suffixes Histoire 2 : Morphismes sans carre Histoire 3 : Recherche de repetitions Epilogue

Nombre de repetitions dans un mot

il y a O(n2) de carres dans an

il peut y avoir Θ(n log n) de carres primitifs

Maxime Crochemore and Wojciech Rytter. Squares,cubes and time-space efficient string-searching.Algorithmica. 13 (5). 1995. pp. 405-425

Page 44: Mes histoires d'amour avec les travaux de Maxime ... - lifl.fr · Computer Science, Lecture Notes in Computer Science, Vol. 324 (Springer, Berlin, 1988) ... LNCS. 1999. pp. 291-306

Histoire 1 : Automate des suffixes Histoire 2 : Morphismes sans carre Histoire 3 : Recherche de repetitions Epilogue

Repetitions maximales (runs)

Repetitions maximale dans w = facteur de w d’exposant ≥ 2 (pasnecessairement entier) et non-extensible a droite/a gauche

aabaababaaaabaababaa a2 a2 a2

aabaababaa (aab)7/3

aabaababaa (ab)5/2

L’ensemble des repetitions maximales codent toutes les repetitionsdans le mot

Page 45: Mes histoires d'amour avec les travaux de Maxime ... - lifl.fr · Computer Science, Lecture Notes in Computer Science, Vol. 324 (Springer, Berlin, 1988) ... LNCS. 1999. pp. 291-306

Histoire 1 : Automate des suffixes Histoire 2 : Morphismes sans carre Histoire 3 : Recherche de repetitions Epilogue

Repetitions maximales (runs)

Repetitions maximale dans w = facteur de w d’exposant ≥ 2 (pasnecessairement entier) et non-extensible a droite/a gauche

aabaababaa

aabaababaa a2 a2 a2

aabaababaa (aab)7/3

aabaababaa (ab)5/2

L’ensemble des repetitions maximales codent toutes les repetitionsdans le mot

Page 46: Mes histoires d'amour avec les travaux de Maxime ... - lifl.fr · Computer Science, Lecture Notes in Computer Science, Vol. 324 (Springer, Berlin, 1988) ... LNCS. 1999. pp. 291-306

Histoire 1 : Automate des suffixes Histoire 2 : Morphismes sans carre Histoire 3 : Recherche de repetitions Epilogue

Repetitions maximales (runs)

Repetitions maximale dans w = facteur de w d’exposant ≥ 2 (pasnecessairement entier) et non-extensible a droite/a gauche

aabaababaaaabaababaa a2 a2 a2

aabaababaa (aab)7/3

aabaababaa (ab)5/2

L’ensemble des repetitions maximales codent toutes les repetitionsdans le mot

Page 47: Mes histoires d'amour avec les travaux de Maxime ... - lifl.fr · Computer Science, Lecture Notes in Computer Science, Vol. 324 (Springer, Berlin, 1988) ... LNCS. 1999. pp. 291-306

Histoire 1 : Automate des suffixes Histoire 2 : Morphismes sans carre Histoire 3 : Recherche de repetitions Epilogue

Repetitions maximales (runs)

Repetitions maximale dans w = facteur de w d’exposant ≥ 2 (pasnecessairement entier) et non-extensible a droite/a gauche

aabaababaaaabaababaa a2 a2 a2

aabaababaa (aab)7/3

aabaababaa (ab)5/2

L’ensemble des repetitions maximales codent toutes les repetitionsdans le mot

Page 48: Mes histoires d'amour avec les travaux de Maxime ... - lifl.fr · Computer Science, Lecture Notes in Computer Science, Vol. 324 (Springer, Berlin, 1988) ... LNCS. 1999. pp. 291-306

Histoire 1 : Automate des suffixes Histoire 2 : Morphismes sans carre Histoire 3 : Recherche de repetitions Epilogue

Repetitions maximales (runs)

Repetitions maximale dans w = facteur de w d’exposant ≥ 2 (pasnecessairement entier) et non-extensible a droite/a gauche

aabaababaaaabaababaa a2 a2 a2

aabaababaa (aab)7/3

aabaababaa (ab)5/2

L’ensemble des repetitions maximales codent toutes les repetitionsdans le mot

Page 49: Mes histoires d'amour avec les travaux de Maxime ... - lifl.fr · Computer Science, Lecture Notes in Computer Science, Vol. 324 (Springer, Berlin, 1988) ... LNCS. 1999. pp. 291-306

Histoire 1 : Automate des suffixes Histoire 2 : Morphismes sans carre Histoire 3 : Recherche de repetitions Epilogue

Repetitions maximales (runs)

Repetitions maximale dans w = facteur de w d’exposant ≥ 2 (pasnecessairement entier) et non-extensible a droite/a gauche

aabaababaaaabaababaa a2 a2 a2

aabaababaa (aab)7/3

aabaababaa (ab)5/2

L’ensemble des repetitions maximales codent toutes les repetitionsdans le mot

Page 50: Mes histoires d'amour avec les travaux de Maxime ... - lifl.fr · Computer Science, Lecture Notes in Computer Science, Vol. 324 (Springer, Berlin, 1988) ... LNCS. 1999. pp. 291-306

Histoire 1 : Automate des suffixes Histoire 2 : Morphismes sans carre Histoire 3 : Recherche de repetitions Epilogue

Recherche des repetitions maximales

[ Apostoloco&Preparata 83 ] recherche des repetitionsmaximales a droite en O(n log n)

[ Main&Lorentz 84 ] recherche de toutes les repetitionsmaximales en O(n log n)

[ Main 89 ] recherche de toutes les repetitions maximalesdistinctes en O(n)

[ Iliopoulos, Moore, Smyth 97 ] toutes les repetitionsmaximales dans les mots de Fibonacci en O(n)

[ Kolpakov, Kucherov 99 ] il y a O(n) de repetitionsmaximales et on peut les calculer en O(n)

Page 51: Mes histoires d'amour avec les travaux de Maxime ... - lifl.fr · Computer Science, Lecture Notes in Computer Science, Vol. 324 (Springer, Berlin, 1988) ... LNCS. 1999. pp. 291-306

Histoire 1 : Automate des suffixes Histoire 2 : Morphismes sans carre Histoire 3 : Recherche de repetitions Epilogue

Recherche des repetitions maximales

[ Apostoloco&Preparata 83 ] recherche des repetitionsmaximales a droite en O(n log n)

[ Main&Lorentz 84 ] recherche de toutes les repetitionsmaximales en O(n log n)

[ Main 89 ] recherche de toutes les repetitions maximalesdistinctes en O(n)

[ Iliopoulos, Moore, Smyth 97 ] toutes les repetitionsmaximales dans les mots de Fibonacci en O(n)

[ Kolpakov, Kucherov 99 ] il y a O(n) de repetitionsmaximales et on peut les calculer en O(n)

Page 52: Mes histoires d'amour avec les travaux de Maxime ... - lifl.fr · Computer Science, Lecture Notes in Computer Science, Vol. 324 (Springer, Berlin, 1988) ... LNCS. 1999. pp. 291-306

Histoire 1 : Automate des suffixes Histoire 2 : Morphismes sans carre Histoire 3 : Recherche de repetitions Epilogue

Borne sur le nombre des repetitions maximales

la preuve de [K&K 99] est tres technique et ne permet pasd’extraire une constante multiplicative

or, la conjecture de [K&K 99] est que le nb des repetitionsmaximales est au plus n

la borne inferieure de 32φn a ete prouvee dans

[Franek,Simpson,Smyth 03] et conjecturee etre la borne exacte

objectif : meilleure borne sup et une preuve plus simple

[ Rytter STACS 06 ] ≤ 5n[ Puglisi,Simpson,Smyth 06 ] ≤ 3, 48n[ Rytter 06 ] ≤ 3, 44n[ Crochemore&Ilie 06, MFCS 07] ≤ 1, 6n

Page 53: Mes histoires d'amour avec les travaux de Maxime ... - lifl.fr · Computer Science, Lecture Notes in Computer Science, Vol. 324 (Springer, Berlin, 1988) ... LNCS. 1999. pp. 291-306

Histoire 1 : Automate des suffixes Histoire 2 : Morphismes sans carre Histoire 3 : Recherche de repetitions Epilogue

Borne sur le nombre des repetitions maximales

la preuve de [K&K 99] est tres technique et ne permet pasd’extraire une constante multiplicative

or, la conjecture de [K&K 99] est que le nb des repetitionsmaximales est au plus n

la borne inferieure de 32φn a ete prouvee dans

[Franek,Simpson,Smyth 03] et conjecturee etre la borne exacte

objectif : meilleure borne sup et une preuve plus simple

[ Rytter STACS 06 ] ≤ 5n

[ Puglisi,Simpson,Smyth 06 ] ≤ 3, 48n[ Rytter 06 ] ≤ 3, 44n[ Crochemore&Ilie 06, MFCS 07] ≤ 1, 6n

Page 54: Mes histoires d'amour avec les travaux de Maxime ... - lifl.fr · Computer Science, Lecture Notes in Computer Science, Vol. 324 (Springer, Berlin, 1988) ... LNCS. 1999. pp. 291-306

Histoire 1 : Automate des suffixes Histoire 2 : Morphismes sans carre Histoire 3 : Recherche de repetitions Epilogue

Borne sur le nombre des repetitions maximales

la preuve de [K&K 99] est tres technique et ne permet pasd’extraire une constante multiplicative

or, la conjecture de [K&K 99] est que le nb des repetitionsmaximales est au plus n

la borne inferieure de 32φn a ete prouvee dans

[Franek,Simpson,Smyth 03] et conjecturee etre la borne exacte

objectif : meilleure borne sup et une preuve plus simple

[ Rytter STACS 06 ] ≤ 5n[ Puglisi,Simpson,Smyth 06 ] ≤ 3, 48n

[ Rytter 06 ] ≤ 3, 44n[ Crochemore&Ilie 06, MFCS 07] ≤ 1, 6n

Page 55: Mes histoires d'amour avec les travaux de Maxime ... - lifl.fr · Computer Science, Lecture Notes in Computer Science, Vol. 324 (Springer, Berlin, 1988) ... LNCS. 1999. pp. 291-306

Histoire 1 : Automate des suffixes Histoire 2 : Morphismes sans carre Histoire 3 : Recherche de repetitions Epilogue

Borne sur le nombre des repetitions maximales

la preuve de [K&K 99] est tres technique et ne permet pasd’extraire une constante multiplicative

or, la conjecture de [K&K 99] est que le nb des repetitionsmaximales est au plus n

la borne inferieure de 32φn a ete prouvee dans

[Franek,Simpson,Smyth 03] et conjecturee etre la borne exacte

objectif : meilleure borne sup et une preuve plus simple

[ Rytter STACS 06 ] ≤ 5n[ Puglisi,Simpson,Smyth 06 ] ≤ 3, 48n[ Rytter 06 ] ≤ 3, 44n

[ Crochemore&Ilie 06, MFCS 07] ≤ 1, 6n

Page 56: Mes histoires d'amour avec les travaux de Maxime ... - lifl.fr · Computer Science, Lecture Notes in Computer Science, Vol. 324 (Springer, Berlin, 1988) ... LNCS. 1999. pp. 291-306

Histoire 1 : Automate des suffixes Histoire 2 : Morphismes sans carre Histoire 3 : Recherche de repetitions Epilogue

Borne sur le nombre des repetitions maximales

la preuve de [K&K 99] est tres technique et ne permet pasd’extraire une constante multiplicative

or, la conjecture de [K&K 99] est que le nb des repetitionsmaximales est au plus n

la borne inferieure de 32φn a ete prouvee dans

[Franek,Simpson,Smyth 03] et conjecturee etre la borne exacte

objectif : meilleure borne sup et une preuve plus simple

[ Rytter STACS 06 ] ≤ 5n[ Puglisi,Simpson,Smyth 06 ] ≤ 3, 48n[ Rytter 06 ] ≤ 3, 44n[ Crochemore&Ilie 06, MFCS 07] ≤ 1, 6n

Page 57: Mes histoires d'amour avec les travaux de Maxime ... - lifl.fr · Computer Science, Lecture Notes in Computer Science, Vol. 324 (Springer, Berlin, 1988) ... LNCS. 1999. pp. 291-306

Histoire 1 : Automate des suffixes Histoire 2 : Morphismes sans carre Histoire 3 : Recherche de repetitions Epilogue

Epilogue

Qui est Maxime Crochemore ?

Page 58: Mes histoires d'amour avec les travaux de Maxime ... - lifl.fr · Computer Science, Lecture Notes in Computer Science, Vol. 324 (Springer, Berlin, 1988) ... LNCS. 1999. pp. 291-306

Histoire 1 : Automate des suffixes Histoire 2 : Morphismes sans carre Histoire 3 : Recherche de repetitions Epilogue

Page 59: Mes histoires d'amour avec les travaux de Maxime ... - lifl.fr · Computer Science, Lecture Notes in Computer Science, Vol. 324 (Springer, Berlin, 1988) ... LNCS. 1999. pp. 291-306

Histoire 1 : Automate des suffixes Histoire 2 : Morphismes sans carre Histoire 3 : Recherche de repetitions Epilogue