cours 7 grammaires algébriques constituants syntaxiques

32
Cours 7 Grammaires algébriques Constituants syntaxiques

Upload: lotte-launay

Post on 04-Apr-2015

116 views

Category:

Documents


1 download

TRANSCRIPT

Page 1: Cours 7 Grammaires algébriques Constituants syntaxiques

Cours 7

Grammaires algébriques

Constituants syntaxiques

Page 2: Cours 7 Grammaires algébriques Constituants syntaxiques

Syntaxe

Je vais fermer l'autre porte

* autre fermer je l'porte vais

Comment les mots se combinent-ils en phrases qui ont un sens ?

Dans quel ordre ?

Quelles combinaisons sont possibles ?

Page 3: Cours 7 Grammaires algébriques Constituants syntaxiques

Constituants syntaxiques

Certaines suites de mots dans une phrase forment des constituants

Exemple : groupes nominauxvingt autres journauxl'Indel'offreune seconde section d'équilibristesl'un des meilleurs bâtiments à voile de la compagnie

Exemple de propriété commune à ces groupesPeuvent être suivis d'un verbe dans une phrase

Page 4: Cours 7 Grammaires algébriques Constituants syntaxiques

Constituants syntaxiques

vingt autres journaux titrent...

l'Inde est...

l'offre parvient à...

une seconde section d'équilibristes arriva

l'un des meilleurs bâtiments à voile de la compagnie peut...

ce n'est pas vrai de n'importe quelle séquence de mots

* journaux titrent...

* l'parvient à...

* seconde d'équilibristes arriva

On doit donc pouvoir spécifier "un groupe nominal peut être suivi d'un verbe"

Page 5: Cours 7 Grammaires algébriques Constituants syntaxiques

Constituants syntaxiques

Exemple : groupes nominaux prépositionnelsdepuis quelques mois

Déplacement de ce groupeDepuis quelques mois la situation évolueLa situation depuis quelques mois évolueLa situation évolue depuis quelques mois

ce n'est pas vrai de n'importe quelle séquence de mots* Depuis mois la situation quelques évolue* La depuis situation quelques mois évolue* La situation mois évolue depuis quelques

Page 6: Cours 7 Grammaires algébriques Constituants syntaxiques

Grammaires algébriques

Context-free grammarsOutil de manipulation des constituants syntaxiquesRègles indiquent la combinaison et l'ordre des éléments

GN --> Det N GAdjGN --> NprGAdj --> GAdv AdjGAdv --> GAdv AdvGAdv --> Adv

Lexique Liste des mots (symboles terminaux)Liste des symboles non terminaux GN GAdj GAdv Det...

Page 7: Cours 7 Grammaires algébriques Constituants syntaxiques

Grammaires algébriques

Les règles peuvent comporter des mots dans le membre droitNpr --> LucDet --> unN --> bâtiment à voileAdj --> réputéAdv --> assezGN --> Det offre de GN

Membre gauche : obligatoirement un non-terminalMembre droit : séquence de symboles terminaux ou non

terminaux

Page 8: Cours 7 Grammaires algébriques Constituants syntaxiques

Dérivation

Réécriture utilisant les règles

GN --> Det N GAdj (règle)

--> Det N GAdv Adj (règle GAdj --> GAdv Adj )

--> Det N Adv Adj (règle GAdv --> Adv )

--> un N Adv Adj (règle Det --> un )

--> un bâtiment à voile Adv Adj (règle N --> bâtiment à voile )

--> un bâtiment à voile assez Adj (règle Adv --> assez )

--> un bâtiment à voile assez réputé (règle Adj --> réputé )

On peut dériver un bâtiment à voile assez réputé de GN

Page 9: Cours 7 Grammaires algébriques Constituants syntaxiques

Arbre de dérivation

GN

Det

N

GAdj

AdjGAdv

Adv

un bâtiment à voile assez réputé

Page 10: Cours 7 Grammaires algébriques Constituants syntaxiques

Axiome

Le langage formel engendré par la grammaire est l'ensemble des séquences de terminaux dérivables à partir de l'axiome

Axiomeun des non-terminauxSi la grammaire engendre des phrases, l'axiome correspond au

symbole "phrase"Phrase grammaticalephrase engendrée par la grammaireAnalyse syntaxiqueassocier à une phrase son (ou ses) arbres de dérivation

Page 11: Cours 7 Grammaires algébriques Constituants syntaxiques

Règles pour les phrases

P --> GN préfère GN Luc préfère cette compagnie

P --> GN quitte GN Prép GN

Luc quitte Paris vers 10 h

P --> GN part Prép GN

Luc part après la réunionP

GN

préfère

GN

NDet

cetteLuc compagnie

Page 12: Cours 7 Grammaires algébriques Constituants syntaxiques

Règles pour les phrases

P --> montrez-PRO GN Montrez-moi tous les vols

P --> est-ce que il y a GN Prép GN ?

Est-ce qu'il y a un dîner sur le vol 312 ?

P --> GN proposent GN ?

Quels vols proposent un dîner ?

Notation parenthésée

(P (GN (Det Quels) (N vols)) proposent (GN (Det un) (N dîner)) ?)

Page 13: Cours 7 Grammaires algébriques Constituants syntaxiques

Constituants non récursifsou chunks

Constituants qui ne contiennent pas un constituant de la même catégorie

Exemple

(GN l'un des meilleurs bâtiments à voile de (GN la compagnie))

Un GN inclus dans un autre

Le petit est un chunk, le grand non

(GN (GN l'un des meilleurs bâtiments à voile) de (GN la compagnie))

Une suite de deux chunks

Si le GN est précédé d'une préposition, on l'inclut dans le chunk

Page 14: Cours 7 Grammaires algébriques Constituants syntaxiques

Constituants non récursifsou chunks

[Parmi ces passagers] [du Mongolia], [on comptait] [divers fonctionnaires civils] et [des officiers] [de tout grade]

Une phrase est presque une séquence de chunks, surtout nominaux

[on comptait] chunk verbal

[M. Fogg] [quitta] [l'hôtel], [seul], [après avoir] [recommandé] [à son domestique] [de l'attendre]

[seul] chunk adjectival

[Oui] ! [oui] ! [répétait] [machinalement] [le pauvre garçon][machinalement] chunk adverbial

Page 15: Cours 7 Grammaires algébriques Constituants syntaxiques

Règles pour les groupes nominaux

GN --> Det N un arrêt

GN --> Det Adj N une petite attente

GN --> Det GAdj N la plus longue attente

GN --> Det N GAdj un coût trop élevé

GN --> Det de N beaucoup d'attente

GN --> Det N Prép GN les vols pour Toulouse

GN --> Det N Rel

les vols qui arrivent à Toulouse avant midi

GN --> Det N Prép GN Prép GN

les vols de la soirée pour Toulouse

Page 16: Cours 7 Grammaires algébriques Constituants syntaxiques

Ambiguïté

La tempête n'a pas eu l'ampleur redoutée en raison de la concomitance d'une forte marée

(Le Monde 12 novembre 2007)

A paper in this week's Science purports to identify an impact crater as big as the famous "dinosaur killer" at Chicxulub, in Mexico

(The Economist 15 mai 2004)

Page 17: Cours 7 Grammaires algébriques Constituants syntaxiques

Ambiguïté

les vols de (la soirée de lundi) pour Toulouse

les réponses de Luc à (plusieurs questions de Marie)

GN

Det N

les vols de

Prép

pour

Prép

Det N GN

GN

lundi Toulousela

Npr

soirée de

Prép

GN

Page 18: Cours 7 Grammaires algébriques Constituants syntaxiques

Ambiguïté

les vols de (la soirée de lundi) pour Toulouse

les réponses de Luc à (plusieurs questions de Marie)

GN

Det N

les réponses de

Prép

à

Prép

Det N GN

GN

Marie

Luc plusieurs

Npr

questions de

Prép

GN

Npr

Page 19: Cours 7 Grammaires algébriques Constituants syntaxiques

Ambiguïtéle livre de (la fille sur la photo) dans le sac

le livre de la fille sur (la photo dans le sac)

GN

Det N

le livre de

Prép

sur

Prép

Det N GN

GN

la photo dans

Prép

GN

Det N

la fille Det N

le sac

Page 20: Cours 7 Grammaires algébriques Constituants syntaxiques

Règles pour la coordination

GN --> GN Conj GN un arrêt et une attente

P --> P Conj P On s'arrête et on attend

GAdj --> GAdj Conj GAdj tentant mais dangereux

etc.

GN --> Det N Prép GN les vols pour Toulouse

GN --> Det N Prép GN Conj Prép GN

les vols pour Toulouse ou depuis Toulouse

Page 21: Cours 7 Grammaires algébriques Constituants syntaxiques

Accord grammatical

P --> GN attend Le public attendLe GN est obligatoirement au singulier :

* Les spectateurs attend

P --> GN attendent Les spectateurs attendentLe GN est obligatoirement au pluriel :

* Le public attendent

On considère les traits du GN et de attendre comme des paramètres

On ajoute des équations aux règles

Page 22: Cours 7 Grammaires algébriques Constituants syntaxiques

Accord grammatical

P --> GN <attendre> {

GN.nombre = <attendre>.nombre ;

GN.personne = <attendre>.personne ; }

Le public attend

Les spectateurs attendent

Vous attendez

Les équations peuvent être vérifiées par unification

Page 23: Cours 7 Grammaires algébriques Constituants syntaxiques

Têtes des constituants

Le mot le plus important de chaque constituant est appelé sa tête P

(préfère)

GN(Luc)

préfère

GN(compagnie)

N(compagnie)

Det(cette)

cetteLuc compagnie

Page 24: Cours 7 Grammaires algébriques Constituants syntaxiques

Grammaires de dépendanceOn remplace chaque symbole non terminal par la tête

correspondante, et on supprime le noeud redondant

Arbre de dépendance

préfère

Luccompagnie

cette

préfère

Luc

préfère

compagnie

compagniecette

cetteLuc

compagnie

Page 25: Cours 7 Grammaires algébriques Constituants syntaxiques

Grammaires de dépendanceInformations perdues

- étiquettes des constituants (on compense en ajoutant des étiquettes aux arêtes)

- ordre des mots (on compense si nécessaire en ajoutant des contraintes sur l'ordre des mots)

préfère

Luccompagnie

cette

sujetobjet

déterminant

Page 26: Cours 7 Grammaires algébriques Constituants syntaxiques

LexicalisationLorsqu'un mot a des compléments, la forme des compléments

dépend du motP --> GN <préférer> GN à GN

Luc préfère cette compagnie à la concurrenceP --> GN <quitter> GN Luc quitte ParisP --> GN <partir> Prép GN Luc part pour Toulouse

Nombre de complémentsPrépositions devant les complémentsGrammaire lexicaliséeChaque règle comporte au moins un mot du lexique (la tête en

général)Nombre de règles = nombre de mots x nombre de constructions

Page 27: Cours 7 Grammaires algébriques Constituants syntaxiques

Grammaires non lexicaliséesOn regroupe tous les mots qui entrent dans une même

construction

On fait une règle commune

P --> GN V GN à GN { V.N1àN2 = "+" ; }

Luc préfère cette compagnie à la concurrence

P --> GN V GN { V.N1 = "+" ; }

Luc quitte Paris

Luc préfère cette compagnie

P --> GN V Prép GN {

V.PrépN1 = "+" ; V.Prép = Prép ; }

Luc part pour Toulouse

Page 28: Cours 7 Grammaires algébriques Constituants syntaxiques

Analyse syntaxiqueParsing

Entrées : une phrase étiquetée et une grammaire algébrique

Sorties : le ou les arbres de dérivation de la phrase

Algorithmes

Ascendants

Descendants

Programmation dynamique

Cascade de transducteurs

Page 29: Cours 7 Grammaires algébriques Constituants syntaxiques

TransducteursUn transducteur fini est un automate fini dont les transitions

sont étiquetées par des couples de séquences : une séquence d'entrée, une séquence de sortie

Entrée : brrr ! Sortie : pfff !Etats : 0 1 2 3 4Transitions : 0b/p1 1r/f2 2r/f3 3/2 3!/!4Etats initiaux : 0Etats finaux : 4

0 1 2 3 4b/p r/f r/f !/!

/

Page 30: Cours 7 Grammaires algébriques Constituants syntaxiques

TransducteursLes règles d'une grammaire algébrique peuvent être

représentées par des transducteurs

Exemple :GN --> Det N

@/@ : l'ensemble des couples a/a pour tout symbole a

Entrée : Det N V GN à GN

Sortie : GN V GN à GN

0 1 2 3

@/@Det/ N/ /GN

@/@

@/@

Page 31: Cours 7 Grammaires algébriques Constituants syntaxiques

Cascade de transducteursMode d'application d'un ensemble de transducteurs à un ensemble de

séquences S0

Entrée : S0 i = 0 ;tant que (condition)

appliquer un ou plusieurs transducteurs aux séquences de Si, obtenir Si+1

i = i+1

Sortie : Si

Variantes

- on a n transducteurs T1, T2... Tn et on les applique dans l'ordre

- on a un transducteur et on l'applique itérativement jusqu'à ce que Si+1 = Si

Page 32: Cours 7 Grammaires algébriques Constituants syntaxiques

Analyse syntaxique par cascade de transducteurs

Entrées : une phrase étiquetée S0 et les transducteurs des règlesi = 0 ;faire

appliquer les transducteurs aux séquences de Si, obtenir Si+1

i = i+1

jusqu'à Si-1 = Si

Sortie : Si

Si Si contient l'axiome, S0 est conforme à la grammairePour construire l'arbre de dérivation, il faut marquer les relations

entre les séquences de Si et celles de Si+1