lenguaje natural procesamiento del análisis semántico · – eliminación de algunos significados...
TRANSCRIPT
Procesam
iento del Lenguaje Natural –
José María G
ómez H
idalgo –U
. Europea de M
adrid
Análisis S
emántico
Procesam
iento delLenguaje N
aturalJosé M
aría Góm
ez Hidalgo
http://www.esp.uem.es/jmgomez/
Procesam
iento del Lenguaje Natural –
José María G
ómez H
idalgo –U
. Europea de M
adrid
Índice
1. Ám
bito de la semántica
2. El lenguaje de representación del significado
3. Marcos de casos
4. Restricciones selectivas y redes sem
ánticas5. G
ramáticas sem
ánticas
6. Sem
ántica composicional
7. Lógica y semántica procedim
ental
8. Resolución de la am
bigüedad léxica
Procesam
iento del Lenguaje Natural –
José María G
ómez H
idalgo –U
. Europea de M
adrid
Análisis S
emántico
1. Ám
bito de la semántica
Procesam
iento del Lenguaje Natural –
José María G
ómez H
idalgo –U
. Europea de M
adrid
1. Ám
bito de la semántica
•La tarea de determ
inar el significado de una oración en LN
se puede descomponer en dos
fases–
Calcular una expresión del significado
independiente del contexto (típicamente una
fórmula lógica) =
> sem
ántica–
Interpretar la expresión anterior en su contexto para obtener una representación final del significado =
> pragm
ática
Procesam
iento del Lenguaje Natural –
José María G
ómez H
idalgo –U
. Europea de M
adrid
1. Ám
bito de la semántica
•La sem
ántica cubre, por ejemplo
–E
liminación de algunos significados de palabras
explotando restricciones estructurales–
Identificación de los papeles semánticos que cada
palabra y sintagma juega en la representación
(lógica)–
Identificación de la restricciones de correferenciaderivadas de la estructura de la oración
Procesam
iento del Lenguaje Natural –
José María G
ómez H
idalgo –U
. Europea de M
adrid
1. Ám
bito de la semántica
•La sem
ántica no cubre, por ejemplo
–D
eterminación de las entidades referidas por
medio de sintagm
as nominales y otros sintagm
as–
Selección de una única representación del
significado de entre las posibles–
Determ
inación de la intención del uso de cada expresión en LN
Procesam
iento del Lenguaje Natural –
José María G
ómez H
idalgo –U
. Europea de M
adrid
1. Ám
bito de la semántica
•D
os elementos fundam
entales–
El lenguaje elegido para representar el significado
(Meaning
Representation
Language, MR
L)–
Algoritm
o de análisis semántico
•S
emántica
–P
roceso de traducción de una expresión en LN o
una representación sintáctica suya al MR
L
Procesam
iento del Lenguaje Natural –
José María G
ómez H
idalgo –U
. Europea de M
adrid
1. Ám
bito de la semántica
•Integración con el análisis sintáctico–
Modularización
= acoplam
iento débil•
La entrada del análisis semántico es un árbol de análisis
sintáctico•
Modular
–A
coplamiento fuerte
•La entrada del análisis sem
ántico es la expresión en lenguaje natural
•S
e construye la representación del significado al tiempo
que se realiza el análisis sintáctico•
Eficiente
Procesam
iento del Lenguaje Natural –
José María G
ómez H
idalgo –U
. Europea de M
adrid
1. Ám
bito de la semántica
•S
emántica com
o apoyo al análisis sintáctico–
Uso de restricciones selectivas para filtrar análisis
sintácticos incorrectos–
Aparición de categorías sintácticas en la
gramática =
> gram
áticas semánticas
Procesam
iento del Lenguaje Natural –
José María G
ómez H
idalgo –U
. Europea de M
adrid
Análisis S
emántico
2. El lenguaje de representación del
significado
Procesam
iento del Lenguaje Natural –
José María G
ómez H
idalgo –U
. Europea de M
adrid
2. El lenguaje de representación del
significado
•H
ipótesis del MR
L–
Encontrar un M
RL óptim
o (que permita una
perfecta compresnión
del LN) es equivalente a
comprender al ser hum
ano y/o lograr una perfecta inteligencia artificial
–P
olémica: existe un tal M
RL?
–E
nfoque práctico: buscar/usar un MR
L que perm
ita desarrollar aplicaciones prácticas
Procesam
iento del Lenguaje Natural –
José María G
ómez H
idalgo –U
. Europea de M
adrid
2. El lenguaje de representación del
significado
•C
aracterísticas del MR
L–
Mientras que el LN
puede ser am
big
uo
, el MR
L no debe serlo
–M
ientras que es complejo especificar reglas para
determinar que una afirm
ación en LN es c
ierta
o
fals
a, el MR
L debe ir acompañado de un conjunto
de reglas que permitan especificar que
condiciones deben cumplirse en el m
undo para que una expresión en el M
RL sea cierta
Procesam
iento del Lenguaje Natural –
José María G
ómez H
idalgo –U
. Europea de M
adrid
2. El lenguaje de representación del
significado
•C
aracterísticas del MR
L–
Mientras que es difícil establecer que
conclusiones se pueden extraer de una afirmación
en LN, el M
RL debe ir acom
pañado de reg
las d
e
infe
ren
cia
que permitan derivar otras expresiones
en el MR
L a partir de una expresión concreta (m
anteniéndose las condiciones de veracidad)
Procesam
iento del Lenguaje Natural –
José María G
ómez H
idalgo –U
. Europea de M
adrid
2. El lenguaje de representación del
significado
•C
lasificación de MR
Lspropuestos
–B
asados en la lógica•
Lógica de primer orden con am
pliaciones (lógicas m
odales, etc.)
–B
asados en estructuras con soporte a métodos de
inferencia específicos•
Redes sem
ánticas•
Marcos (de casos)
Procesam
iento del Lenguaje Natural –
José María G
ómez H
idalgo –U
. Europea de M
adrid
Análisis S
emántico
3. Marcos de casos
Procesam
iento del Lenguaje Natural –
José María G
ómez H
idalgo –U
. Europea de M
adrid
3. Marcos de casos
•S
e basa en las gramáticas de casos de
Fillm
ore•
¿Q
ué son los casos?–
Tradicionalm
ente•
Clasificación de los nom
bres con respecto a la función sintáctica que desem
peñan en la oración•
Típicam
ente determinado por el sufijo
•P
ropios de lenguajes como el latín, ruso o finés
•"C
asos su
perfic
iale
so sintácticos"
Procesam
iento del Lenguaje Natural –
José María G
ómez H
idalgo –U
. Europea de M
adrid
3. Marcos de casos
•¿
Qué son los casos?
–A
lternativamente
•C
lasificación de los sintagmas nom
inales de acuerdo a la función conceptual que desem
peñan en la acción representada por una oración
•R
epresentación de una oración = acción (verbo) +
características (sintagm
as nominales)
•"C
asos pro
fun
do
so sem
ánticos"
Procesam
iento del Lenguaje Natural –
José María G
ómez H
idalgo –U
. Europea de M
adrid
3. Marcos de casos
•D
iversos sistemas de casos sem
ánticos–
Sistem
a de Fillm
ore•
Agente (agent)
•C
ontra-agente (counter-agent)•
Objeto (object)
•R
esultado (result)•
Instrumento (instrum
ent)•
Fuente (source)
•O
bjetivo (goal)•
Paciente (experience)
Procesam
iento del Lenguaje Natural –
José María G
ómez H
idalgo –U
. Europea de M
adrid
3. Marcos de casos
Agente -
Instigador de la acciónC
ontra-agente -F
uerza o resistencia contra la que se realiza la acción
Objeto -
Entidad acerca de cuya existencia,
movim
iento o cambio se refiere la acción
Resultado -
Entidad que com
ienza a existir como
consecuencia de la acción
Procesam
iento del Lenguaje Natural –
José María G
ómez H
idalgo –U
. Europea de M
adrid
3. Marcos de casos
Instrumento -
Estím
ulo o causa física inmediata de
la acciónF
uente -Lugar desde el que algo se m
ueveO
bjetivo -Lugar hacia el que algo se m
ueveP
aciente -E
ntidad que recibe, acepta, experimenta
o sufre los efectos de una acción
Procesam
iento del Lenguaje Natural –
José María G
ómez H
idalgo –U
. Europea de M
adrid
3. Marcos de casos
•Los casos se alm
acenan en un marco
(frame)
–C
onjunto de pares atributo-valor•
Atributos =
casos•
Valores =
sintagmas nom
inales
Procesam
iento del Lenguaje Natural –
José María G
ómez H
idalgo –U
. Europea de M
adrid
3. Marcos de casos
•E
jemplo
–O
ración•
"In Elm
Street, John
brokea w
indoww
itha ham
mer"
–M
arco[action=
breakagent=
john
object= w
indow
instrument=
hamm
ersource
= elm
street...]
Procesam
iento del Lenguaje Natural –
José María G
ómez H
idalgo –U
. Europea de M
adrid
Análisis S
emántico
4. Restricciones selectivas y redes
semánticas
Procesam
iento del Lenguaje Natural –
José María G
ómez H
idalgo –U
. Europea de M
adrid
4. Restricciones selectivas y redes
semánticas
•R
estricciones selectivas–
Propuestas por W
ilks–
Indican los posibles tipos de los elementos de una
oración (por ejemplo, los tipos de los casos)
–S
irven para filtrar análisis sintácticos incorrectos sem
ánticamente =
> eficiencia
Procesam
iento del Lenguaje Natural –
José María G
ómez H
idalgo –U
. Europea de M
adrid
4. Restricciones selectivas y redes
semánticas
•E
jemplo
–O
ración•
"El perro com
e la salchicha"
–E
l agente de la acción de comer debe ser una
entidad an
imad
a
–E
l objeto de la acción de comer debe ser una
entidad co
mestib
le
Procesam
iento del Lenguaje Natural –
José María G
ómez H
idalgo –U
. Europea de M
adrid
4. Restricciones selectivas y redes
semánticas
•Las restricciones selectivas se suelen basar en je
rarq
uía
s d
e tip
os
•R
elación "es un" entre tipos–
Una entidad viva debe ser una entidad física
•S
e obtiene una jerarquía o cuasijerarquía
Procesam
iento del Lenguaje Natural –
José María G
ómez H
idalgo –U
. Europea de M
adrid
4. Restricciones selectivas y redes
semánticas
Entid
ad
Tiem
po
Indiv
idu
oL
ugar
Situ
ación
Con
jun
to
Suceso
abstracto S
uceso
Su
ceso
fisico
Ob
jeto
abstracto
Objeto
físico
Ser v
ivo
Ob
jeto
no
viv
o
Anim
ado
Veg
etativo
Perso
na
Anim
al
Procesam
iento del Lenguaje Natural –
José María G
ómez H
idalgo –U
. Europea de M
adrid
4. Restricciones selectivas y redes
semánticas
•S
e heredan propiedades entre los tipos
•S
e buscan las propiedades desde el tipo más
específico al más general
•Las jerarquías facilitan el desarrollo del léxico–
No es preciso describir todas las propiedades de
un objeto
Procesam
iento del Lenguaje Natural –
José María G
ómez H
idalgo –U
. Europea de M
adrid
4. Restricciones selectivas y redes
semánticas
•Las jerarquías de tipos se generalizan a redes sem
ánticas•
Una re
d s
em
án
tica
es estructuralmente un
grafo con nodos y arcos anotados–
Los nodos suelen representar co
ncep
tos
–Los arcos suelen representar re
lacio
nes
entre conceptos
Procesam
iento del Lenguaje Natural –
José María G
ómez H
idalgo –U
. Europea de M
adrid
4. Restricciones selectivas y redes
semánticas
•S
e suelen incluir más relaciones entre
conceptos además de la relación "es un"
•"es parte de"–
Los objetos se relacionan con sus partes–
Ejem
plo: La cabeza es una parte del hombre
Procesam
iento del Lenguaje Natural –
José María G
ómez H
idalgo –U
. Europea de M
adrid
4. Restricciones selectivas y redes
semánticas
•S
e pasa del concepto de jerarquía de tipos al de base de conocim
iento•
CY
C
–Iniciativa para desarrollar una base de conocim
iento que incluya todo lo que sabe un adulto m
edio o una enciclopedia de sobremesa
–M
icroelectronics&
Com
puterT
echnologyC
orporation–
Muy am
bicioso y poco fructífero
Procesam
iento del Lenguaje Natural –
José María G
ómez H
idalgo –U
. Europea de M
adrid
4. Restricciones selectivas y redes
semánticas
•W
ordNet
–Iniciativa para organizar un diccionario desde el punto de vista conceptual
–M
iller(C
ognitiveS
cienceLaboratory) en P
rinceton–
Base de conocim
iento con información léxica
extraída semiautom
áticamente
de diccionarios•
Para el idiom
a inglés•
Información sobre nom
bres, adjetivos, verbos y adverbios
Procesam
iento del Lenguaje Natural –
José María G
ómez H
idalgo –U
. Europea de M
adrid
4. Restricciones selectivas y redes
semánticas
•C
oncepto = conjunto de sinónim
os (synset)–
"board" tiene dos significados (entre otros){board, gam
eboard} -tablero de juego
{diningtable, board} -
mesa donde se sirven com
idas
Procesam
iento del Lenguaje Natural –
José María G
ómez H
idalgo –U
. Europea de M
adrid
4. Restricciones selectivas y redes
semánticas
•R
elaciones entre conceptos–
Hiponim
ia•
Relación "es un" entre conceptos
•{am
bulance} es una clase especial de {car, auto, autom
obile, machine, m
otorcar}
–M
eronimia
•R
elación "es parte de" entre conceptos•
{airbag} es una parte de {car, auto, autom
obile, m
achine, motorcar}
Procesam
iento del Lenguaje Natural –
José María G
ómez H
idalgo –U
. Europea de M
adrid
4. Restricciones selectivas y redes
semánticas
•R
elaciones entre conceptos–
Antonim
ia•
Relación "es lo contrario de" entre conceptos
•{bad} es lo contrario de {good}
Procesam
iento del Lenguaje Natural –
José María G
ómez H
idalgo –U
. Europea de M
adrid
4. Restricciones selectivas y redes
semánticas
•C
onsulta interactiva–
"wn
disguise"
The
noundisguise
has 3 senses(first1 from
taggedtexts)
1. disguise, camouflage
--(an
outward
semblance
thatm
isrepresentsthe
truenature
ofsomething; "the
theatricalnotion
ofdisguiseis
always
associatedw
ithcatastrophe
in his
stories")2. disguise
--(any
attirethatm
odifiesthe
appearancein
orderto
concealthew
earer'sidentity)
...
Procesam
iento del Lenguaje Natural –
José María G
ómez H
idalgo –U
. Europea de M
adrid
4. Restricciones selectivas y redes
semánticas
...3. disguise, camouflage
--(the
actofconcealingthe
identityofsom
ethingby m
odifyingits
appearance; "he isa m
aster ofdisguise")
The
verbdisguise
has 1 sense(first1 from
taggedtexts)
1. disguise--
(make
unrecognizable; "The
herbdisguises
thegarlic
taste"; "We
disguisedour
facesbefore
robbingthe
bank")
Procesam
iento del Lenguaje Natural –
José María G
ómez H
idalgo –U
. Europea de M
adrid
4. Restricciones selectivas y redes
semánticas
•R
efinamiento (hipónim
osde "disguise")
–"w
ndisguise
-hynsn"1 of3 senses
ofdisguiseS
ense2
disguise--
(anyattire
thatmodifies
theappearance
in orderto
concealthew
earer'sidentity)
=>
fancydress, m
asquerade, masquerade
costume
--(a
costume
worn
as a disguiseata m
asqueradeparty)
...=>
hairpiece, falsehair, postiche
--(a covering
orbunch
ofhum
an orartificial hair
usedfor
disguiseor
adornment)
=>
mask
--(a covering
todisguise
orconcealthe
face)
Procesam
iento del Lenguaje Natural –
José María G
ómez H
idalgo –U
. Europea de M
adrid
4. Restricciones selectivas y redes
semánticas
•S
e puede integrar con un sistema de LN
–C
onsultas en Java ó C–
BD
en Prolog
•T
amaño de W
ordNet1.6
–32 M
b–
más de 90000 palabras y expresiones
–m
ás de 70000 conceptos
Procesam
iento del Lenguaje Natural –
José María G
ómez H
idalgo –U
. Europea de M
adrid
4. Restricciones selectivas y redes
semánticas
•E
uroWordN
et–
Proyecto europeo liderado por la U
niversidad de A
msterdam
–C
ubre los idiomas
–H
olandés (44015 synsets), Inglés (16361 synsets), E
spañol (30485 synsets), Italiano, A
lemán, F
rancés, Checo y E
stonio–
Versión reciente (A
gosto 99)–
Uso para recuperación de inform
ación multilingüe
(Novell Linguistic
Developm
ent)
Procesam
iento del Lenguaje Natural –
José María G
ómez H
idalgo –U
. Europea de M
adrid
Análisis S
emántico
5. Gram
áticas semánticas
Procesam
iento del Lenguaje Natural –
José María G
ómez H
idalgo –U
. Europea de M
adrid
5. Gram
áticas semánticas
•S
urgieron con el fin de caracterizar un subconjunto del lenguaje natural de m
anera suficiente para perm
itir la interecciónde usuarios casuales
–S
e han aplicado sobre todo a interfaces a BD
y sistemas de
respuesta a preguntas–
Son gram
áticas en las que las categorías se refieren a conceptos sem
ánticos y no sólo sintácticos–
=>
el formalism
o subyacente es independiente (CF
-PS
Gs,
DC
Gs, A
TN
s, etc.)
Procesam
iento del Lenguaje Natural –
José María G
ómez H
idalgo –U
. Europea de M
adrid
5. Gram
áticas semánticas
•E
jemplo: S
OP
HIE
, 1976 = R
espuesta a preguntas sobre circuitos electrónicos–
De reglas tipoN
P ->
DetN
Prep
NP
–S
e pasa a reglas como
Measurem
ent-> D
etMeasurable-Q
uantityP
repP
art
–Q
ue permite sintagm
as nominales com
o"T
hevoltage
acrossR
9""T
hecurrentthrough
thevoltage
referencecapacitor"
"The
power
dissipationofthe
current-limiting
transistor"
Procesam
iento del Lenguaje Natural –
José María G
ómez H
idalgo –U
. Europea de M
adrid
5. Gram
áticas semánticas
•V
entajas–
Eficiencia•
Se reduce el núm
ero de análisis posibles•
No se precisa com
ponente semántica
Query
-> Q
uery-IntroM
easurement
–H
abitabilidad•
Los usuarios pueden expresarse libremente en un
subconjunto del lenguaje natural sin perderse en las lim
itaciones del subconjunto aceptado•
Se perm
iten pequeñas variaciones como "Is
something
wrong?" =
"Isthere
anythingw
rong?"
Procesam
iento del Lenguaje Natural –
José María G
ómez H
idalgo –U
. Europea de M
adrid
5. Gram
áticas semánticas
•M
ás ventajas–
Fenóm
enos del discurso•
Elipsis y referencia pronom
inal fácilmente resolubles
•E
jemplo
"Whatis
thepopulation
ofLos Angeles?"
"WhataboutS
an Diego?"
•P
or su posición, San D
iego es de la categoría Ciudad
Procesam
iento del Lenguaje Natural –
José María G
ómez H
idalgo –U
. Europea de M
adrid
5. Gram
áticas semánticas
•M
ás ventajas–
Entradas erróneas•
Se reconocen fragm
entos y se devuelve al usuario la regla para que sepa aplicarla
•E
jemplo
–A
nte una expresión como
"voltageacross
R9"
–D
evolver la regla
Measurem
ent-> D
etMeasurable-Q
uantityP
repP
art
Procesam
iento del Lenguaje Natural –
José María G
ómez H
idalgo –U
. Europea de M
adrid
5. Gram
áticas semánticas
•M
ás ventajas–
Auto explicación•
Ante solicitudes de ayuda com
o"W
hatisthe
voltage<
help>"
•E
l sistema puede devolver
Inputsthatw
ouldcom
plete theM
easurementrule
are
acrossP
art
between
Node
andN
odeatN
ode
Procesam
iento del Lenguaje Natural –
José María G
ómez H
idalgo –U
. Europea de M
adrid
5. Gram
áticas semánticas
•D
esventajas–
Dificultad para cubrir fenóm
enos lingüísticos com
plejos"W
hichships
doesthe
admiralthink
thefourth
fleetcan spare?"
–D
ependencia del dominio
•D
ebe recodificarsela gram
ática para cada nueva aplicación
–T
amaño
•C
iertas regularidades sintácticas como la coordinación o
la pasiva deben recodificarsepara cada regla sem
ántica
Procesam
iento del Lenguaje Natural –
José María G
ómez H
idalgo –U
. Europea de M
adrid
Análisis S
emántico
6. Sem
ántica composicional
Procesam
iento del Lenguaje Natural –
José María G
ómez H
idalgo –U
. Europea de M
adrid
6. Sem
ántica composicional
•¿
Cóm
o organizar el proceso de análisis sem
ántico?•
Principio de com
posicionalidad(F
rege, s. X
IX)El s
ign
ifica
do
de
l tod
o e
s u
na
fun
ció
n
de
l sig
nific
ad
o d
e la
s p
arte
s
Procesam
iento del Lenguaje Natural –
José María G
ómez H
idalgo –U
. Europea de M
adrid
6. Sem
ántica composicional
•C
onclusión–
El significado de una oración se pone en función
del significado de sus sintagmas
–E
l significado de los sintagmas se pone en función
del significado de los subsintagmas
y palabras–
...–
Se llega al significado de las palabras o incluso de
los morfem
as (lexemas)
Procesam
iento del Lenguaje Natural –
José María G
ómez H
idalgo –U
. Europea de M
adrid
6. Sem
ántica composicional
•O
rganización = hipótesis regla-a-regla
–P
ara cada regla sintáctica que descompone un
elemento en sus partes, se incluye una regla
semántica que construye el significado del
elemento en térm
inos de los significados de las partes
–E
ste enfoque no fuerza ningún grado de acoplam
iento sintáctico-semántico
Procesam
iento del Lenguaje Natural –
José María G
ómez H
idalgo –U
. Europea de M
adrid
6. Sem
ántica composicional
•S
e deben resolver los puntos siguientes–
¿C
uáles son las partes adecuadas a considerar para obtener el significado de una oración?
•S
e supone que el análisis sintáctico produce estructuras sem
ánticamente adecuadas
–¿
Cóm
o depende el significado de una estructura del significado de sus subsestructuras?
•C
onstrucción de las reglas semánticas
–¿
Cuál es el significado de los elem
entos más
básicos (palabras, lexemas)?
Procesam
iento del Lenguaje Natural –
José María G
ómez H
idalgo –U
. Europea de M
adrid
Análisis S
emántico
7. Lógica y semántica procedim
ental
Procesam
iento del Lenguaje Natural –
José María G
ómez H
idalgo –U
. Europea de M
adrid
7. Lógica y semántica procedim
ental
•S
emántica procedim
ental•
Introducción a la lógica•
Lógica de primer orden (LP
O)
•R
epresentación del LN en térm
inos de la LPO
•Interpretación de fórm
ulas lógicas•
Principios de diseño de un sistem
a de respuesta a preguntas
•E
jemplo
Procesam
iento del Lenguaje Natural –
José María G
ómez H
idalgo –U
. Europea de M
adrid
7. Lógica y semántica procedim
ental
•S
emántica procedim
ental
•E
n general–
El significado de una orden es un procedim
iento para realizar la acción requerida
–E
l significado de una pregunta es un procedim
iento para averiguar la respuesta–
El significado de una afirm
ación es un procedim
iento para agregar la nueva información
al modelo del m
undo o dominio
Procesam
iento del Lenguaje Natural –
José María G
ómez H
idalgo –U
. Europea de M
adrid
7. Lógica y semántica procedim
ental
•S
emántica procedim
ental
•S
istema de respuesta a preguntas
–B
ase de conocimiento =
base de datos–
Objetivo: interpretar una form
a lógica como una
consulta a la base de datos
Procesam
iento del Lenguaje Natural –
José María G
ómez H
idalgo –U
. Europea de M
adrid
7. Lógica y semántica procedim
ental
•E
jemplo
–C
onsulta"D
oesevery
flighttoC
hicago servebreakfast?"
–R
epresentación semántica (fórm
ula lógica)∀
F1 ((flight(F
1) & (dest(F
1,name(chicago))) →
(serve-breakfast(F
1)))todo(F
1,implies(and(flight(F
1),dest(F1,nam
e(chicago))),serve-breakfast(F
1)))
Procesam
iento del Lenguaje Natural –
José María G
ómez H
idalgo –U
. Europea de M
adrid
7. Lógica y semántica procedim
ental
•E
jemplo
–Interpretación
1. Localizar todos los vuelos de la BD
con destino Chicago
2. Para cada vuelo encontrado, verificar si sirve desayuno.
Si así es, devolver "Y
es". Devolver "N
o" en caso contrario.
Procesam
iento del Lenguaje Natural –
José María G
ómez H
idalgo –U
. Europea de M
adrid
7. Lógica y semántica procedim
ental
•Introducción a la lógica
•Lógica =
intento de formalizar el
razonamiento hum
ano
•N
umerosos sistem
as prácticos de PLN
con com
ponente semántica basada en la lógica
Procesam
iento del Lenguaje Natural –
José María G
ómez H
idalgo –U
. Europea de M
adrid
7. Lógica y semántica procedim
ental
•Idea central de la lógica–
Dada una situación descrita por un conjunto de
afirmaciones ciertas (o asum
idas como tales),
determinar que otras afirm
aciones son ciertas en la situación
–Las afirm
aciones iniciales son "premisas", las
nuevas "conclusiones" y el proceso de obtenerlas "inferencia"
Procesam
iento del Lenguaje Natural –
José María G
ómez H
idalgo –U
. Europea de M
adrid
7. Lógica y semántica procedim
ental
•S
intaxis de la lógica–
Conjunto de reglas que establecen que una
afirmación está correctam
ente formada
•S
emántica de la lógica
–C
onjunto de reglas que permiten deducir el valor
de verdad de una fórmula
Procesam
iento del Lenguaje Natural –
José María G
ómez H
idalgo –U
. Europea de M
adrid
7. Lógica y semántica procedim
ental
•Inferencia–
¿D
e un conjunto de premisas P
, se puede deducir una conclusión Q
? (P ⇒
Q)
–D
os opciones•
Se construye la fórm
ula P →
Q y se dem
uestra que para todos los valores de verdad de las fórm
ulas de P, es
cierta (es decir, es una tautología)•
Se construye la fórm
ula P ∧
¬Q
y se demuestra que
para todos los valores de verdad de las fórmulas de P
y Q
, es falsa (es decir, es una contradicción -reducción al
absurdo)
Procesam
iento del Lenguaje Natural –
José María G
ómez H
idalgo –U
. Europea de M
adrid
7. Lógica y semántica procedim
ental
•T
ípicamente se desarrolla un conjunto de
reglas que permiten operar sintácticam
entesobre las fórm
ulas para efectuar deducciones–
Cálculo lógico (P
→Q
)–
Debe ser correcto y com
pleto•
Correcto–
Si P
es cierto y P →
Q, entonces Q
es cierto
•C
ompleto
–S
i siempre que P
es cierto se cumple que Q
es cierto (es decir P
⇒Q
), entonces P →
Q
Procesam
iento del Lenguaje Natural –
José María G
ómez H
idalgo –U
. Europea de M
adrid
7. Lógica y semántica procedim
ental
•E
jemplo: Lógica proposicional
–S
intaxis•
Una fórm
ula es una constante (P, Q
, R, ...); o bien, si P
y Q
son fórmulas, entonces ¬
P, (P
∧Q
), (P ∨
Q), (P
→Q
), (P
↔Q
) son fórmulas
Procesam
iento del Lenguaje Natural –
José María G
ómez H
idalgo –U
. Europea de M
adrid
7. Lógica y semántica procedim
ental
•E
jemplo: Lógica proposicional
–S
emántica
•U
na fórmula lleva asociado un valor de verdad (T
, F) =
>
I(P) es T
o F•
Interpretación de las conectivas–
I(¬P
) = T
si y sólo si I(P) =
F–
I(P∧
Q) =
T si y sólo si I(P
) = T
y I(Q) =
T
–I(P
→Q
) = T
si y sólo si I(P) =
F ó I(Q
) = T
ó se dan ambas
cosas
–etc.
Procesam
iento del Lenguaje Natural –
José María G
ómez H
idalgo –U
. Europea de M
adrid
7. Lógica y semántica procedim
ental
•E
jemplo: Lógica proposicional
–Inferencia (basada en la sem
ántica)•
De P
se deduce Q (P
⇒Q
) si siempre que I(P
) = T
entonces I(Q
) = T
•F
ácil con tablas de verdad
Procesam
iento del Lenguaje Natural –
José María G
ómez H
idalgo –U
. Europea de M
adrid
7. Lógica y semántica procedim
ental
•E
jemplo: Lógica proposicional
–C
álculo lógico•
Es un conjunto de reglas que perm
iten obtener a partir de un conjunto de fórm
ulas otra fórmula por m
edio de operaciones puram
ente sintácticas•
Consta de 3 axiom
as y 1 regla
Procesam
iento del Lenguaje Natural –
José María G
ómez H
idalgo –U
. Europea de M
adrid
7. Lógica y semántica procedim
ental
•E
jemplo: Lógica proposicional
–A
xiomas
•(P
→(Q
→P
)) (confirmación del consecuente)
•((P
→(Q
→R
)) →((P
→Q
) →(P
→R
))) (distributividad)•
((¬P
→¬
Q) →
(Q →
P)) (contraposición)
–R
egla•
De P
y (P →
Q), se infiere Q
(modus ponens)
Procesam
iento del Lenguaje Natural –
José María G
ómez H
idalgo –U
. Europea de M
adrid
7. Lógica y semántica procedim
ental
•E
jemplo: Lógica proposicional
–E
ste cálculo es correcto y completo
•C
orrecto–
Si de P
se deduce Q, entonces P
⇒Q
–E
s decir, si se puede operar P hasta llegar a Q
, entonces Q
se deduce semánticam
ente de P»
Si I(P
) = T
entonces I(Q) =
T
•C
ompleto
–S
i de P se deduce Q
semánticam
ente, se puede operar con P
hasta llegar a Q–
Si siem
pre que I(P) =
T entonces I(Q
) = T
, entonces hay una form
a de obtener Q a partir de P
sintácticamente
Procesam
iento del Lenguaje Natural –
José María G
ómez H
idalgo –U
. Europea de M
adrid
7. Lógica y semántica procedim
ental
•N
umerosos sistem
as lógicos–
Lógica proposicional–
Lógica de primer orden o lógica de predicados
–Lógica m
odal -conceptos de necesidad y
posibilidad–
Lógica epistémica
-concepto de conocim
iento–
Lógica doxástica-
concepto de creencia–
Lógica deóntica-
conceptos morales com
o obligación y perm
iso–
etc.
Procesam
iento del Lenguaje Natural –
José María G
ómez H
idalgo –U
. Europea de M
adrid
7. Lógica y semántica procedim
ental
•E
nfoque práctico–
Restringirse a la lógica proposicionalo a la de
predicados (primer orden) con am
pliaciones dependientes del problem
a–
Inferencia•
Cálculo lógico com
pleto y correcto (cálculo de predicados de prim
er orden)•
Indecidible...
Procesam
iento del Lenguaje Natural –
José María G
ómez H
idalgo –U
. Europea de M
adrid
7. Lógica y semántica procedim
ental
•E
l cálculo de predicados de primer orden es
indecidible–
No es posible, dado un conjunto de prem
isas y una potencial conclusión, construir un program
a que•
Responda "sí" si la conclusión se deduce de las
permisas
•R
esponda "no" si la conclusión no se deduce de las prem
isas•
Y siem
pre termine devolviendo "sí" o "no" según lo
anterior
Procesam
iento del Lenguaje Natural –
José María G
ómez H
idalgo –U
. Europea de M
adrid
7. Lógica y semántica procedim
ental
•Lógica de prim
er orden (LPO
)–
Un térm
ino es una variable, o una constante, o un sím
bolo de función aplicado a otros términos
–E
jemplos
X, a
juanm
adre-de(pedro)hijo-de(pedro,H
ijo)
Procesam
iento del Lenguaje Natural –
José María G
ómez H
idalgo –U
. Europea de M
adrid
7. Lógica y semántica procedim
ental
–U
na fórmula es un sím
bolo de predicado aplicado a una serie de térm
inos; o si P y Q
son fórmulas, entonces es de la
forma ¬
P, (P
∧Q
), (P &
Q), (P
∨Q
), (P →
Q), (P
↔Q
); o si V
es una variable, y P(V
*) es una fórmula con cero o m
ás apariciones de V
, entonces es de la forma ∀
V [P
(V*)] y ∃V
[P
(V*)]
–E
jemplosa(X
,Y)
en(torre-eiffel, paris), ¬sobrio(yeltsin)
(capital(españa,madrid) ∧
ciudad(X))
∃X [hum
ano(X) →
mortal(X
)]
Procesam
iento del Lenguaje Natural –
José María G
ómez H
idalgo –U
. Europea de M
adrid
7. Lógica y semántica procedim
ental
•R
epresentación de LN en térm
inos de LPO
–R
epresentación de nombres, adjetivos, verbos y
determinantes
–A
mbigüedad en los cuantificadores
–P
rimitivas versus representación léxica
–R
epresentación de la intención
Procesam
iento del Lenguaje Natural –
José María G
ómez H
idalgo –U
. Europea de M
adrid
7. Lógica y semántica procedim
ental
•R
epresentación de nombres, adjetivos,
verbos y determinantes
–N
ombres propios
•C
omo sím
bolos de la base de conocimiento
Chicago =
chió chicago
•C
on un predicado nombre y una variable
Chicago =
nombre(X
,'Chicago')
–N
ombres com
unes y adjetivos•
Con un predicado y una variableperro =
perro(X), alto =
alto(X)
Procesam
iento del Lenguaje Natural –
José María G
ómez H
idalgo –U
. Europea de M
adrid
7. Lógica y semántica procedim
ental
–V
erbos•
Con un predicado de aridad
posiblemente m
ayor que 1com
e = com
er(X,Y
)
–D
eterminantes
•C
on cuantificadores aplicados sobre variables y fórmulas
todo = ∀
X [P
(X) →
Q(X
)] = todo(X
,P(X
),Q(X
))un =
∃X [P
(X) ∧
Q(X
)] = existe(X
,P(X
),Q(X
))
Procesam
iento del Lenguaje Natural –
José María G
ómez H
idalgo –U
. Europea de M
adrid
7. Lógica y semántica procedim
ental
•N
ecesitamos cuantificadores extendidos
–el, m
uchos, pocos, algunos–
most(la m
ayoría)•
No sirven ni el cuantificador universal ni el existencial
•S
upongamos que existe un cunatificador
M definido de
modo que M
X [P
(X)] sea cierto si m
ás de la mitad de los
objetos del dominio cum
plen P(X
)
Procesam
iento del Lenguaje Natural –
José María G
ómez H
idalgo –U
. Europea de M
adrid
7. Lógica y semántica procedim
ental
–¿
Cóm
o representamos "M
ostdogsbark"?
M X
[dog(X) ∧
bark(X)]
–N
o sirve porque exige que la mayoría de los
objetos del dominio sean perros
M X
[dog(X) →
bark(X)]
–N
o sirve porque la implicación es cierta si la
mayoría de objetos ladra aunque no sean perros
=>
M X
[dog(X), bark(X
)] = m
(X,dog(X
),bark(X))
–A
nálogamente
el = elX
[P(X
), Q(X
)] = el(X
,P(X
),Q(X
))
Procesam
iento del Lenguaje Natural –
José María G
ómez H
idalgo –U
. Europea de M
adrid
7. Lógica y semántica procedim
ental
•Los cuantificadores presentan al m
enos dos tipos de am
bigüedad–
Ám
bito del cuantificador"T
odo chico ama a un perro"
∀X
(perro(X) &
∃Y (chico(Y
) →am
a(X,Y
)))
∃Y (chico(Y
) →∀
X (perro(X
) →am
a(X,Y
)))
–Lectura colectiva vs. distributiva
"Dos hom
bres compraron un estéreo"
Distributiva =
Cada hom
bre compró su propio estéreo
Colectiva =
Los dos hombres com
praron el mism
o estéreo
Procesam
iento del Lenguaje Natural –
José María G
ómez H
idalgo –U
. Europea de M
adrid
7. Lógica y semántica procedim
ental
•P
rimitivas vs. representación léxica
–E
xisten dos opciones•
Para cada significado de una palabra, incluir un
predicado (amar1, am
ar2, ...)•
Poner las palabras en térm
inos de un conjunto de prim
itivas del dominio (com
er, tragar, devorar = ingerir
(primitivo))
–Llevado al extrem
o, se podrían diseñar primitivas para
todos los conceptos de la mente hum
ana (Conceptual
Dependencies, S
hank)
Procesam
iento del Lenguaje Natural –
José María G
ómez H
idalgo –U
. Europea de M
adrid
7. Lógica y semántica procedim
ental
•R
epresentación de la intención–
Tras cada interacción en LN
hay una intención–
Se pueden usar predicados para representarlas•
assert/afirmar =
la fórmula es una afirm
ación sobre el m
undo•
yn-query/pregunta-sino = se está preguntando por el
valor de certeza de la fórmula
•com
mand/orden =
la fórmula es una acción que el
sistema debe realizar
•w
h-query/pregunta-cq=
la fórmula describe un objeto
que se quiere identificar
Procesam
iento del Lenguaje Natural –
José María G
ómez H
idalgo –U
. Europea de M
adrid
7. Lógica y semántica procedim
ental
–E
jemplo
"El hom
bre come un m
elocotón"
•S
in intenciónel X
[hombre(X
), (∃Y
[melocoton(Y
) & com
e(X,Y
)])]
•C
on intenciónafirm
ar(elX [hom
bre(X), (∃
Y [m
elocoton(Y) &
come(X
,Y)])])
Procesam
iento del Lenguaje Natural –
José María G
ómez H
idalgo –U
. Europea de M
adrid
7. Lógica y semántica procedim
ental
•¿
Qué falta por representar?
–operadores m
odales para verbos como "creer" o
"querer"–
tiempo y aspecto de los verbos
–núm
ero de los nombres
–...
Procesam
iento del Lenguaje Natural –
José María G
ómez H
idalgo –U
. Europea de M
adrid
7. Lógica y semántica procedim
ental
•Interpretación de las fórm
ulas lógicas–
Interpretación genérica de cuantificadores•
Los cuantificadores se pueden interpretar en términos de
conjuntos•
algunos X [P
(X), Q
(X)] =
existe un subconjunto de los objetos que cum
plen P(X
), que también cum
plen Q(X
)•
mayoria
X [P
(X), Q
(X)] =
existe un subconjunto de los objetos que cum
plen P(X
) cuyo cardinal es mayor que la
mitad de los elem
entos que cumplen P
(X), y que
cumplen Q
(X)
Procesam
iento del Lenguaje Natural –
José María G
ómez H
idalgo –U
. Europea de M
adrid
7. Lógica y semántica procedim
ental
•S
emántica procedim
entalpara un sistema de
respuesta a preguntas–
Problem
a de ejemplo
•Interfaz a una base de datos sobre horarios de vuelos con la siguiente inform
aciónvuelo(ibe1).
aeropuerto(mad).
aeropuerto(bar).salida(ibe1,m
ad,1600).
llegada(ibe1,bar,1730).
Procesam
iento del Lenguaje Natural –
José María G
ómez H
idalgo –U
. Europea de M
adrid
7. Lógica y semántica procedim
ental
•F
ases de la interpretación de la fórmula
lógica–
1. Traducción de la fórm
ula lógica a un procedim
iento de acceso de la BD
–2. E
jecución del procedimiento obtenido
•Interpretación de la fórm
ula lógica–
Función I: M
RL ->
Procedim
ientos•
Definida recursivam
entesobre la estructura de las
fórmulas
Procesam
iento del Lenguaje Natural –
José María G
ómez H
idalgo –U
. Europea de M
adrid
7. Lógica y semántica procedim
ental
•Interpretación de nom
bre(X,'M
adrid')–
Se dispone de una "tabla de sím
bolos" similar a la
de un compilador
–S
e recupera la constante de la base de datos (m
ad) y se actualiza la tabla de modo que toda
referencia posterior a X sea interpretada com
o esa constante =
> I(nom
bre(X,'M
adrid')) = m
ad
Procesam
iento del Lenguaje Natural –
José María G
ómez H
idalgo –U
. Europea de M
adrid
7. Lógica y semántica procedim
ental
•Interpretación de P
(predicado)–
Dos posibilidades(a) E
l predicado P corresponde a un concepto de la B
D =
>
se devuelve el predicado directamente
I(P) =
P
(b) El predicado P
no está en la BD
(luego no hemos
expresado los significados en términos de la B
D sino en
función de algo más general, com
o los significados de un diccionario) =
>I(destino(X
,nombre(Y
,'Madrid'))) =
llegada(X,m
ad,Z)
Procesam
iento del Lenguaje Natural –
José María G
ómez H
idalgo –U
. Europea de M
adrid
7. Lógica y semántica procedim
ental
•Interpretación de conectivas–
Interpretación de y(P,Q
)•
I(y(P,Q
)) = verificar-am
bos(I(P),I(Q
))
•E
jecuta I(P) e I(Q
), y si ambas son ciertas, devuelve cierto
–Interpretación de o(P
,Q)
•I(o(P
,Q)) =
verificar-alguno(I(P),I(Q
))
•E
jecuta I(P) e I(Q
), y si alguna es cierta, devuelve cierto
–Interpretación de no(P
)•
I(no(P)) =
no(I(P))
•E
jecuta I(P) y si es falso, devuelve cierto
Procesam
iento del Lenguaje Natural –
José María G
ómez H
idalgo –U
. Europea de M
adrid
7. Lógica y semántica procedim
ental
•Interpretación de cuantificadores–
Cuantificador "el"•
I(el(X(P
(X),Q
(X))) =
encontrar-el(X,I(P
(X)),I(Q
(X)))
•S
e ejecuta I(P(X
)) y se hallan el conjunto de todos los objetos que lo cum
plen•
Si el conjunto tiene un sólo elem
ento, se sustituye en T
(Q(X
)) y se devuelve si la cumple
Procesam
iento del Lenguaje Natural –
José María G
ómez H
idalgo –U
. Europea de M
adrid
7. Lógica y semántica procedim
ental
•S
i el conjunto es vacío, hay una "vio
lac
ión
de
p
res
up
os
ició
n"
–S
e supone que hay un elemento que cum
ple I(P(X
)) y no lo hay
–S
e devuelve error
•S
i el conjunto tiene 2 ó más elem
entos, hay una "v
iola
ció
n d
e p
res
up
os
ició
n"
–S
e supone que sólo hay un elemento que cum
ple I(PX
)) y resulta haber m
ás
–S
e devuelve error o
–S
e devuelven aquellos que cumplen I(Q
(X))
Procesam
iento del Lenguaje Natural –
José María G
ómez H
idalgo –U
. Europea de M
adrid
7. Lógica y semántica procedim
ental
–C
uantificador universal•
I(todo(X,P
(X),Q
(X)) =
iterar(X,I(P
(X)),I(Q
(X)))
•S
e buscan todos los elementos que cum
plen I(P(X
)), y si todos ellos cum
plen I(Q(X
)), se devuelve cierto
–P
reguntas tipo "pregunta-cq"•
I(pregunta-cq(X,P
(X),Q
(X))) =
mostrar(X
,I(P(X
),I(Q(X
)))•
Muestra (devuelve) todos los objetos que cum
plen I(P
(X)) e I(Q
(X))
Procesam
iento del Lenguaje Natural –
José María G
ómez H
idalgo –U
. Europea de M
adrid
7. Lógica y semántica procedim
ental
•E
jemplo
–O
ración"¿
Que vuelo a M
adrid sale a las 1600?"
–F
órmula (M
RL)
pregunta-cq(X,y(vuelo(X
), destino(X,nom
bre(Y,'M
adrid'))), salida(X
,Z,1600))
–Interpretación (procedim
iento)m
ostrar(X,verificar-am
bos(vuelo(X),
llegada(X,m
ad,K)),salida(X
,Z,1600))
Procesam
iento del Lenguaje Natural –
José María G
ómez H
idalgo –U
. Europea de M
adrid
7. Lógica y semántica procedim
ental
•P
rincipios de diseño de un sistema de
respuesta a preguntas–
Se pretende desarrollar un sistem
a de respuesta a preguntas
•basado en P
rology D
CG
s•
con semántica procedim
ental–
con conceptos próximos a los de la base de datos o
conocimiento
–fácil de interpretar
Procesam
iento del Lenguaje Natural –
José María G
ómez H
idalgo –U
. Europea de M
adrid
7. Lógica y semántica procedim
ental
•P
asos de desarrollo–
Diseño de la base de datos o conocim
iento en P
rolog–
Determ
inación del subconjunto del LN a procesar
S–
Construcción de una D
CG
que represente S–
Determ
inación del MR
L–
Agregación de las reglas sem
ánticas a la DC
G–
Construcción de un intérprete de las fórm
ulas lógicas
Procesam
iento del Lenguaje Natural –
José María G
ómez H
idalgo –U
. Europea de M
adrid
7. Lógica y semántica procedim
ental
•E
jemplo
–B
ase de datos (db41.pl)•
Analizador sintáctico (dcg41.pl)
•A
nalizador con representación del significado (dcg41.pl)•
Intérprete de fórmulas (sem
41.pl)•
(Interfaz (interfaz41.pl))
Procesam
iento del Lenguaje Natural –
José María G
ómez H
idalgo –U
. Europea de M
adrid
Análisis S
emántico
8. Resolución de la am
bigüedad léxica
(Word S
enseD
isambiguation, W
SD
)
Procesam
iento del Lenguaje Natural –
José María G
ómez H
idalgo –U
. Europea de M
adrid
8. WS
D
•D
efinición
•A
plicaciones•
Evaluación
•E
squema general
•M
étodos basados en aprendizaje
•M
étodos basados en diccionarios•
Integración de técnicas y recursos
Procesam
iento del Lenguaje Natural –
José María G
ómez H
idalgo –U
. Europea de M
adrid
8. WS
D –
Definición
•D
esambiguación del significado
–R
esolución de la ambigüedad léxica
–W
ord Sense
Disam
biguation(W
SD
)
•D
efinición–
Múltiples palabras con varios significados
(polisemia)
–P
ero en un contexto de uso, sólo se activa uno•
Esta es una hipótesis para la aproxim
ación com
putacional
Procesam
iento del Lenguaje Natural –
José María G
ómez H
idalgo –U
. Europea de M
adrid
8. WS
D –
Definición
•R
eferencia–
Significados en un diccionario
–C
lases de un thesaurus–
Entradas en diccionario de transferencia para traducción
•O
bjetivo = identificar el significado activado
en un contexto
•P
roblema difícil (T
uringo IA
–com
pleto)–
Com
parativamente con otras tareas (etiquetado sintáctico =
P
OS
-Tagging)
–Influyó notablem
ente en el informe A
LPA
C (60’s)
Procesam
iento del Lenguaje Natural –
José María G
ómez H
idalgo –U
. Europea de M
adrid
8. WS
D –
Aplicaciones
•T
area de clasificación intermedia
–base para
otros procesos o aplicaciones finales•
Aplicación estrella =
Traducción autom
ática
“car”{autom
obile, car, wagon}
automóvil
{trainw
agon, wagon}
vagón
desambiguación
traducción
Procesam
iento del Lenguaje Natural –
José María G
ómez H
idalgo –U
. Europea de M
adrid
8. WS
D –
Aplicaciones
•C
lasificación de documentos
–D
e gran importancia actual =
R. Inform
ación–
Polisem
ia•
Recuperar docum
entos con “jaguar” como anim
alo com
o automóvil
–S
inonimia
•R
ecuperar documentos con “cosm
onauta” si la consulta es “astronauta”
•A
nálogamente, categorización,
agrupamiento, etc.
Procesam
iento del Lenguaje Natural –
José María G
ómez H
idalgo –U
. Europea de M
adrid
8. WS
D –
Aplicaciones
•E
specialmente, R
I cros-lingüe–
El usuario lee varios idiom
as pero escribe en uno–
Plantea consultas en un idiom
a y recibe docum
entos en varios–
Técnica•
Si los significados están unidos en distintos idiom
as (e.g. E
uroWordN
et) = “car” –
car/auto ~ coche/auto –
“coche”•
Y los docum
entos y consultas desambiguados
•S
e obtiene alta precisión en las consultas
Procesam
iento del Lenguaje Natural –
José María G
ómez H
idalgo –U
. Europea de M
adrid
8. WS
D –
Aplicaciones
•O
tras tareas–
Etiquetado sintáctico (P
OS
-tagging)–
Desam
biguación referencial de preposiciones (P
P-attachm
ent)–
Dism
inución de análisis sintácticos (restricciones selectivas)
–R
estauración de acentos (libro vs. libró)–
Conversión a m
inúsculas (HE
RE
AD
TH
E T
IME
S)
–R
econocimiento del habla, etc.
Procesam
iento del Lenguaje Natural –
José María G
ómez H
idalgo –U
. Europea de M
adrid
8. WS
D –
Aplicaciones
•N
o está claro si es ÚT
IL•
SE
NS
EV
AL 3 (http://senseval.org )
–P
anel en aplicaciones de WS
D–
Personal de G
oogle, Sharp, U
PC
, Microsoft, etc.
–D
ebate centrado en aplicaciones que demuestren
que la WS
D explícita es útil para otras tareas
–C
onsiderables dudas y escasas evidencias prácticas
–M
ucho interés porque está bien definida y es fácil (?) de evaluar
Procesam
iento del Lenguaje Natural –
José María G
ómez H
idalgo –U
. Europea de M
adrid
8. WS
D –
Evaluación
•(C
omo siem
pre) centrada en la efectividad
•O
tros factores–
Eficiencia
–C
oste de producción•
Implem
entación•
Disponibilidad de recursos
•N
os centramos en la efectividad
Procesam
iento del Lenguaje Natural –
José María G
ómez H
idalgo –U
. Europea de M
adrid
8. WS
D –
Evaluación
•E
valuación directa vs. indirecta [Ide98]–
Directa (in vitro) –
Medición del grado de éxito en
la tarea aislada (caja de cristal)•
Imprescindible para apreciar las dificultades de la tarea
–Indirecta (in vivo) –
Medición del im
pacto de su éxito en la tarea superior (caja negra)
•E
.g. ¿M
ejora la recuperación de información?
•Im
prescindible porque aun con eficacia limitada, posibles
mejoras en la tarea superior
Procesam
iento del Lenguaje Natural –
José María G
ómez H
idalgo –U
. Europea de M
adrid
8. WS
D –
Evaluación
•E
valuación directa (in vitro)•
Índice de éxito = núm
ero de aciertos / núm
ero de intentos (accuracy, error)–
Sólo palabras am
biguas–
Si no es capaz de desam
biguar, recall-precision–
Relativo a•
La frecuencia de los significados (95/5 vs. 50/50)•
La dificultad para los humanos (consistencia entre
anotadores en torno al 70-75%)
•La granularidad (abstracción) de los significados
Procesam
iento del Lenguaje Natural –
José María G
ómez H
idalgo –U
. Europea de M
adrid
8. WS
D –
Evaluación
•E
valuación directa (in vitro)
•R
ecursos = textos con palabras etiquetadas
con significados de un diccionario = colección
de evaluación
•R
eferente = S
emC
or–
Subconjunto del B
rown
Corpus
–S
ignificados de la BD
L WordN
et
Procesam
iento del Lenguaje Natural –
José María G
ómez H
idalgo –U
. Europea de M
adrid
8. WS
D –
Evaluación
•E
valuación directa (in vitro)
•Línea base =
resultados mínim
os–
Un sistem
a que no los supera, debe descartarse–
La más usual =
el significado más frecuente dada
la etiqueta sintáctica•
Los etiquetadores sintácticos aciertan > 95%
•Los diccionarios, etc. listan los significados por frecuencia (en corpus de referencia)
Procesam
iento del Lenguaje Natural –
José María G
ómez H
idalgo –U
. Europea de M
adrid
8. WS
D –
Evaluación
•E
valuación directa (in vitro)•
Objeto de S
EN
SE
VA
L–
“The purpose of S
enseval is to evaluate the strengths and w
eaknesses of such (WS
D)
programs w
ith respect to different words, different
varieties of language, and different languages.”–
SE
NS
EV
AL 1 (1998) –
Inglés, francés, italiano–
SE
NS
EV
AL 2 (2001) –
Euskera, chino, checo,
danés, holandés, inglés, estonio, italiano, japonés, coreano, español, sueco
Procesam
iento del Lenguaje Natural –
José María G
ómez H
idalgo –U
. Europea de M
adrid
8. WS
D –
Evaluación
•S
EN
SE
VA
L 3 (2004) –14 tareas
–W
SD
masiva –
inglés, italiano–
WS
D m
uestra –euskera, catalán, chino, inglés,
italiano, rumano, español
–A
dquisición automática de sub-categorización
–W
SD
muestra m
ultilingüe–
WS
D de descripciones de significados en
WordN
et–
Roles sem
ánticos–
Form
as lógicas
Procesam
iento del Lenguaje Natural –
José María G
ómez H
idalgo –U
. Europea de M
adrid
8. WS
D –
Evaluación
•S
EN
SE
VA
L 3 –W
SD
masiva –
inglés–
26 sistemas de 16 equipos
–5000 palabras –
WS
J y Brow
n Corpus
–Línea base (m
ás frecuente) ~ .61
–C
onsistencia entre anotadores ~ .725
–M
ejor sistema (B
élgica) = .652
–M
ejor sistema E
spaña (UA
l,UJa,U
PoV
) = .626 (4º)
–14 sistem
as sobre la línea base–
OB
S: m
uestra léxica -m
ás fácil
Procesam
iento del Lenguaje Natural –
José María G
ómez H
idalgo –U
. Europea de M
adrid
8. WS
D –
Evaluación
•E
valuación indirecta (in vivo)–
E.g. [G
onzalo98]–
Integración de WordN
eten RI
•C
onsultas y documentos =
(WS
D)=
>significados de
WordN
et=>
vectores de conceptos =>
ME
V•
Resultados em
píricos sobre colección artificial
Procesam
iento del Lenguaje Natural –
José María G
ómez H
idalgo –U
. Europea de M
adrid
8. WS
D –
Evaluación
•E
valuación indirecta (in vivo)–
E.g. [U
reña01]–
Integración de WordN
eten categorización•
Nom
bres de categorías =(W
SD
)=>
significados de W
ordNet=
> expansión con sinónim
os =>
enriquecim
iento del vocabulario =>
aprendizaje•
Resultados em
píricos
F1
NoW
NN
oWS
DA
utoWS
DM
anWS
DM
0.464
0.5380.571
0.576m
0.661
0.6640.674
0.678
Procesam
iento del Lenguaje Natural –
José María G
ómez H
idalgo –U
. Europea de M
adrid
8. WS
D –
Esquem
a general
•C
lasificación de técnicas–
Atendiendo al recurso em
pleado•
Colección de datos etiquetados =
colección de entrenam
iento (e.g. Sem
Cor) =
> basado en aprendizaje,
supervisado•
Recurso léxico (diccionario, B
ase de Datos Léxica =
W
ordNet) =
> basado en diccionarios, no supervisado
–T
endencia a la integración
Procesam
iento del Lenguaje Natural –
José María G
ómez H
idalgo –U
. Europea de M
adrid
8. WS
D –
Esquem
a general
•V
entajas y desventajas–
Basado en aprendizaje•
Dependiente del dom
inio–
Datos objetivo sim
ilares a los de entrenamiento
•P
roblemas usuales de aprendizaje
–C
arencia de datos, distribuciones desequilibradas, etc.
•M
ás efectivo si lo anterior no ocurre•
Coste de creación de recursos (?) –
colecciones de entrenam
iento
Procesam
iento del Lenguaje Natural –
José María G
ómez H
idalgo –U
. Europea de M
adrid
8. WS
D –
Métodos basados en
aprendizaje
•Idea general–
Com
parar los contextos de aparición de cada significado con el contexto actual
(Basado en W
ordNet)
CA
R -
{automobile, car, w
agon}“T
he car is running out of fuel ”“I sold m
y car and purchased a brand new B
MW
”“M
y car’s rearviewm
irroris being fixed”
CA
R -
{trainw
agon, wagon}
“I left the dog in the baggagecar of the train”
“I boarded the wrong car, so I changed at V
ictoriaS
tation”¿
“VW
and BM
W are im
proving their car
technologies”?
Procesam
iento del Lenguaje Natural –
José María G
ómez H
idalgo –U
. Europea de M
adrid
8. WS
D –
Métodos basados en
aprendizaje
•P
roceso simplificado
1.P
ara cada significado, se recolectan contextos de aparición y las palabras en ellos
2.P
ara la palabra objetivo, se compara el
solapamiento / sim
ilitud entre su contexto y los de cada significado
–S
e puede usar el ME
V (representación com
o vectores de pesos, sim
ilitud del coseno)–
Mayoría de relaciones léxicas =
entornos de 5 palabras
Procesam
iento del Lenguaje Natural –
José María G
ómez H
idalgo –U
. Europea de M
adrid
8. WS
D –
Métodos basados en
aprendizaje
•D
etalles–
Tam
año del contexto (evidencias lejanas)–
Falta de datos de entrenam
iento–
Em
pate entre varios significados–
Técnicas de aprendizaje
•D
efinición de atributos (lingüísticos, léxicos)•
Selección de atributos
•A
lgoritmos de aprendizaje
Procesam
iento del Lenguaje Natural –
José María G
ómez H
idalgo –U
. Europea de M
adrid
8. WS
D –
Métodos basados en
aprendizaje
•G
AM
BL (T
op1, S
EN
SE
VA
L 3 English-A
W)
–C
ontexto = 7 palabras, centro en objetivo
–A
tributos (e.g.) = palabras, P
OS
, grupos +
relaciones (nominal/verbal/preposicional +
sujeto/objeto) (<
= analizador superficial)
–S
elección de atributos = algoritm
os genéticos–
Algoritm
os = kN
N(T
IMB
L)–
Proceso en cascada sobre varias colecciones de
datos (Sem
Cor, S
EN
SE
VA
Lsprevios, etc.)
Procesam
iento del Lenguaje Natural –
José María G
ómez H
idalgo –U
. Europea de M
adrid
8. WS
D –
Métodos basados en
aprendizaje
•E
nriquecimiento sucesivo [Y
arowsky95]
–E
squema algorítm
ico1.
Seleccionar algunas apariciones y etiquetarlas
2.E
ntrenar en las apariciones etiquetadas3.
Aplicar sobre las no etiquetadas y aceptar las m
ás probables
4.V
olver a 2 hasta que el algoritmo converja
–A
prendizaje auromático
= bootstrapping
–A
demás: “O
ne Sense P
er Collocation”, “O
ne S
ense Per D
iscourse”
Procesam
iento del Lenguaje Natural –
José María G
ómez H
idalgo –U
. Europea de M
adrid
8. WS
D –
Métodos basados en
diccionarios
•Idea general–
Com
parar el contexto de uso con las definiciones de un diccionario, asignando la m
ás similar
(WordN
et2.0)1. C
ar-
4-wheeled
motor
vehicle; usuallypropelled
by aninternalcom
bustionengine; “he needs a car to get to
work”
2. Car
-a w
heeledvehicle
adaptedto
therails
ofrailroad; “three cars had jum
ped the rails ”¿
“The train derailed and som
e ca
rs
were very dam
aged”?
Procesam
iento del Lenguaje Natural –
José María G
ómez H
idalgo –U
. Europea de M
adrid
8. WS
D –
Métodos basados en
diccionarios
•P
roceso simplificado
1.Para la palabra objetivo, se com
para el solapam
iento / similitud entre su contexto y las
definiciones–
Se puede usar el M
EV
(representación como
vectores de pesos, similitud del coseno)
Procesam
iento del Lenguaje Natural –
José María G
ómez H
idalgo –U
. Europea de M
adrid
8. WS
D –
Métodos basados en
diccionarios
•A
lgoritmo clásico de Lesk
[Lesk86]–
Se com
paran las definiciones potenciales con las definiciones posibles de cada palabra del contexto
–S
e asigna la combinación de m
ayor solapamiento
Pine
(1) Kinds
ofevergreentree
with
needle-shapedleaves(2) W
asteaw
aythrough
sorrowor
illnessC
one(1) S
olidbody
which
narrows
toa point
(2) Som
ethingofthis
shapew
hethersolid
orhollow
(3) Fruitofcertain
evergreentree
¿“... pine cone ...”?
–S
i |contexto|> 2, num
erosas comparaciones
Procesam
iento del Lenguaje Natural –
José María G
ómez H
idalgo –U
. Europea de M
adrid
8. WS
D –
Métodos basados en
diccionarios
•D
ensidad Conceptual, W
ordNet[A
girre96]–
Conjuntos de nom
bres contiguos =>
seleccionar los significados que m
aximizan la D
C–
DC
tiene en cuenta•
La longitud del camino m
ás corto entre conceptos•
La profundidad de la jerarquía (+profunda
=>
>relación)
•La densidad de conceptos en la jerarquía (+
densa=
> >
relación)•
Independencia del número de conceptos m
edidos
Procesam
iento del Lenguaje Natural –
José María G
ómez H
idalgo –U
. Europea de M
adrid
8. WS
D –
Integración
•Idea general–
Tom
ar lo mejor de am
bos métodos, integrando a
•N
ivel de recurso–
E.g. E
xtraer sinónimos, hipérnim
os, etc. para las palabras en los contextos de entrenam
iento
•N
ivel de clasificación–
E.g. D
os clasificadores, votos por confianza sobre un conjunto de validación
–“C
uanto más inform
ado esté un sistema, m
ás efectivo será”
Procesam
iento del Lenguaje Natural –
José María G
ómez H
idalgo –U
. Europea de M
adrid
8. WS
D –
Integración
•R
2D2 (T
op4, S
EN
SE
VA
L 3 English-A
W)
–S
istemas
•M
aximum
Entropy
(apr.)•
UP
V-S
HM
M-A
W (apr., M
odelos Ocultos de M
arkov)•
RelevantD
omains
(dic., WordN
etDom
ains)•
LVQ
-JAE
N-E
LS (apr., Learning
Vector Q
uantization)•
CIA
OS
EN
SO
(dic., densidad conceptual, WordN
et)
–C
ombinación
•V
oto•
En cascada
Procesam
iento del Lenguaje Natural –
José María G
ómez H
idalgo –U
. Europea de M
adrid
8. WS
D –
Resum
en
•W
SD
–P
roblema im
portante en LN
•A
plicaciones importantes, pero con dudas
•E
valuación basada en efectividad
•M
étodos clasificados por recursos–
Aprendizaje, diccionarios, integrados
•E
stado de la tarea–
Efectividad lim
itada, lejos de otras tareas–
Aplicabilidad potencial en clasificación de texto