outils pour le traitement des textes levée d'ambiguïtés morpho-syntaxiques Éric laporte...
TRANSCRIPT
![Page 1: Outils pour le traitement des textes Levée d'ambiguïtés morpho-syntaxiques Éric Laporte Université Paris-Est Marne-la- Vallée](https://reader036.vdocuments.pub/reader036/viewer/2022082918/551d9db6497959293b8dafd5/html5/thumbnails/1.jpg)
Outils pour le traitement des textes
Levée d'ambiguïtésmorpho-syntaxiques
Éric LaporteUniversité Paris-Est Marne-la-
Vallée
![Page 2: Outils pour le traitement des textes Levée d'ambiguïtés morpho-syntaxiques Éric Laporte Université Paris-Est Marne-la- Vallée](https://reader036.vdocuments.pub/reader036/viewer/2022082918/551d9db6497959293b8dafd5/html5/thumbnails/2.jpg)
Sommaire
Règles de priorité entre analysesDépendances entre analysesRègles-exceptionsDépendances entre règlesChevauchementsIndépendance double : le système Elag
![Page 3: Outils pour le traitement des textes Levée d'ambiguïtés morpho-syntaxiques Éric Laporte Université Paris-Est Marne-la- Vallée](https://reader036.vdocuments.pub/reader036/viewer/2022082918/551d9db6497959293b8dafd5/html5/thumbnails/3.jpg)
Rappel : indépendance double
Comment assurer que la construction de la grammaire peut être monotone ?
Indépendance des analyses et des règles
LAL ((ai)1 i m, (rj)1 j n) = 1 j n 1 i m LAL (ai, rj)
a LAL ((ai)1 i m, (rj)1 j n) j [1, n] a LAL (a,
rj)
![Page 4: Outils pour le traitement des textes Levée d'ambiguïtés morpho-syntaxiques Éric Laporte Université Paris-Est Marne-la- Vallée](https://reader036.vdocuments.pub/reader036/viewer/2022082918/551d9db6497959293b8dafd5/html5/thumbnails/4.jpg)
Indépendance double
Réalisation par le système Elag :- chaque règle = un automate qui représente l'ensemble des séquences conformes à la règle- grammaire = intersection des règles- LAL(T, G) = T G
Interface utilisateur :- format utilisateur lisible- format compilé prêt pour intersection
![Page 5: Outils pour le traitement des textes Levée d'ambiguïtés morpho-syntaxiques Éric Laporte Université Paris-Est Marne-la- Vallée](https://reader036.vdocuments.pub/reader036/viewer/2022082918/551d9db6497959293b8dafd5/html5/thumbnails/5.jpg)
Format utilisateur de grammaires Elag (1/6)
Pour chaque règle
Format utilisateurLisible pour la construction et la maintenance manuelles
Format compiléUn automate qui représente l'ensemble des séquences conformes à la règle, prêt pour intersection
![Page 6: Outils pour le traitement des textes Levée d'ambiguïtés morpho-syntaxiques Éric Laporte Université Paris-Est Marne-la- Vallée](https://reader036.vdocuments.pub/reader036/viewer/2022082918/551d9db6497959293b8dafd5/html5/thumbnails/6.jpg)
Format utilisateur de grammaires Elag (2/6)
l'un comme maître, l'autre comme domestiqueun,.A:ms La République est uneSupprimer l'analyse <un.A> après <le.DET>
![Page 7: Outils pour le traitement des textes Levée d'ambiguïtés morpho-syntaxiques Éric Laporte Université Paris-Est Marne-la- Vallée](https://reader036.vdocuments.pub/reader036/viewer/2022082918/551d9db6497959293b8dafd5/html5/thumbnails/7.jpg)
Format utilisateur de grammaires Elag (3/6)
Supprimer toutes les analyses qui comportent une partie s1 suivie d'une partie s2
s1
s2
![Page 8: Outils pour le traitement des textes Levée d'ambiguïtés morpho-syntaxiques Éric Laporte Université Paris-Est Marne-la- Vallée](https://reader036.vdocuments.pub/reader036/viewer/2022082918/551d9db6497959293b8dafd5/html5/thumbnails/8.jpg)
Format utilisateur de grammaires Elag (4/6)
Dans les règles de ce type,- les parties s1 et s2 peuvent être aussi complexes que nécessaire- peu importe où on place la séparation entre s1 et s2
- les marqueurs <!> ne servent à rien
s1
s2
![Page 9: Outils pour le traitement des textes Levée d'ambiguïtés morpho-syntaxiques Éric Laporte Université Paris-Est Marne-la- Vallée](https://reader036.vdocuments.pub/reader036/viewer/2022082918/551d9db6497959293b8dafd5/html5/thumbnails/9.jpg)
Format utilisateur de grammaires Elag (5/6)
le Reform club de Londresde,.DET+Dind:mp:fp De grands arbres entourent le parcCette analyse seulement devant <A:p>
s1s2
a1 a2
![Page 10: Outils pour le traitement des textes Levée d'ambiguïtés morpho-syntaxiques Éric Laporte Université Paris-Est Marne-la- Vallée](https://reader036.vdocuments.pub/reader036/viewer/2022082918/551d9db6497959293b8dafd5/html5/thumbnails/10.jpg)
Format utilisateur de grammaires Elag (6/6)
Supprimer les analyses dans lesquelles un s1 n'est pas suivi d'un a2
Les marqueurs <!> et <=> servent à identifier et délimiter s1 et a2
s1 s2
a1 a2
![Page 11: Outils pour le traitement des textes Levée d'ambiguïtés morpho-syntaxiques Éric Laporte Université Paris-Est Marne-la- Vallée](https://reader036.vdocuments.pub/reader036/viewer/2022082918/551d9db6497959293b8dafd5/html5/thumbnails/11.jpg)
Format général (1/2)Les marqueurs <!> et <=> servent à identifier et délimiter s1, s2, a1 et a2
Si une analyse contient un s1 immédiatement suivi d'un s2, le point de séparation entre s1 et s2 doit aussi être précédé d'un a1 et suivi d'un a2, sinon elle est supprimée
s1 s2
a1 a2
![Page 12: Outils pour le traitement des textes Levée d'ambiguïtés morpho-syntaxiques Éric Laporte Université Paris-Est Marne-la- Vallée](https://reader036.vdocuments.pub/reader036/viewer/2022082918/551d9db6497959293b8dafd5/html5/thumbnails/12.jpg)
Format général (2/2)Les marqueurs <!> et <=> servent à identifier et délimiter s1, s2, a1 et a2, etc.Si une analyse contient un s1 immédiatement suivi d'un s2, le point de séparation entre s1 et s2 doit aussi être précédé d'un a1 et suivi d'un a2 (ou précédé d'un b1 et suivi d'un b2, etc.), sinon elle est supprimée
s1 s2
a1 a2
![Page 13: Outils pour le traitement des textes Levée d'ambiguïtés morpho-syntaxiques Éric Laporte Université Paris-Est Marne-la- Vallée](https://reader036.vdocuments.pub/reader036/viewer/2022082918/551d9db6497959293b8dafd5/html5/thumbnails/13.jpg)
Exemple avec 3 parties non vides
l'un des membres les plus singuliersplus,plaire.V:J1s:J2sJe lui plus dès le premier regardSupprimer l'analyse <plaire.V> après <le.PRO>, sauf...
s1 s2
a1
a2
![Page 14: Outils pour le traitement des textes Levée d'ambiguïtés morpho-syntaxiques Éric Laporte Université Paris-Est Marne-la- Vallée](https://reader036.vdocuments.pub/reader036/viewer/2022082918/551d9db6497959293b8dafd5/html5/thumbnails/14.jpg)
Quelques précautions (1/3)le Reform club de Londresde,.DET+Dind:mp:fp De grands arbres entourent le parcCette analyse seulement devant <A:p>
s1 s2
![Page 15: Outils pour le traitement des textes Levée d'ambiguïtés morpho-syntaxiques Éric Laporte Université Paris-Est Marne-la- Vallée](https://reader036.vdocuments.pub/reader036/viewer/2022082918/551d9db6497959293b8dafd5/html5/thumbnails/15.jpg)
Quelques précautions (2/3)
Attention au positionnement de la séparation entre s1 et s2 : si plusieurs variantes, la règle peut s'appliquer plusieurs fois au même endroit
s1 s2
![Page 16: Outils pour le traitement des textes Levée d'ambiguïtés morpho-syntaxiques Éric Laporte Université Paris-Est Marne-la- Vallée](https://reader036.vdocuments.pub/reader036/viewer/2022082918/551d9db6497959293b8dafd5/html5/thumbnails/16.jpg)
Quelques précautions (3/3)Ajouter des variantes de s1 et s2 augmente le nombre d'applications de la règle (donc la précision)Ajouter des variantes de a1 et a2 augmente le nombre d'analyses acceptées (la règle devient moins stricte)