l ingÜÍstica computacional unidad 2. anÁlisis semÁntico ana maría tangarife patiño
TRANSCRIPT
LINGÜÍSTICA COMPUTACIONALUNIDAD 2. ANÁLISIS SEMÁNTICO
Ana María Tangarife Patiño
ANÁLISIS SEMÁNTICO El análisis semántico está encaminado a la resolución de
problemas con respecto a los sentidos de las palabras o las expresiones usadas de manera automática
Dentro de la LC la semántica pretender estructurar representaciones automáticas del lenguaje natural en máquinas a partir de plantillas de sentido para ejecutar inferencias.
Permite expresar significados lingüísticos, enlazar información gramatical con otras clases, procesar significados, validar equivalencias.
A partir de clasificaciones y categorizaciones de distintos elementos de la lengua, se generan esquemas conceptuales para realizar inferencias Traducción automática Recuperación de información
RELACIONES SEMÁNTICAS
Se definen a partir de roles temáticos en donde se representan cada uno de los componentes de la oración.
Son graficadas a partir de un marco de casos partiendo de la premisa de que un grupo de estos casos es suficiente para modelar el lenguaje.
Estos marcos se han hecho principalmente para los verbos.
CLASIFICACIONES VERBALES
Determinar verbos que corresponden al mismo prototipo.
LPPO: Lógica de Predicados de Primer Orden Parte de la lógica matemática estableciendo una
lógica preposicional empleando variables, predicados y cuantificadores.
Se establecen reglas de formación de oraciones y de inferencia que siguen axiomas lógicos.
Gramática de casos de Fillmore Relaciones entre el verbo y demás elementos de
la oración a partir de las cuales se establecen roles semánticos.
MODELOS DE ANÁLISIS SEMÁNTICOLÓGICA DE PREDICADOS DE PRIMER ORDEN
Sirve para representar el lenguaje de manera formal Hace uso de:
Reglas de formación o fórmulas Reglas de inferencia Axiomas lógicos
Emplea variables, predicados y cuantificadores (lógica proposicional o lógica simbólica), usando los siguientes símbolos:
Negación ( ) Conjunción ( ) Disyunción ( ) Implicación ( ) Coimplicación ( )
MODELOS DE ANÁLISIS SEMÁNTICOLÓGICA DE PREDICADOS DE PRIMER ORDEN
MODELOS DE ANÁLISIS SEMÁNTICOCÁLCULO DE LAMBA
Formalismo matemático, base de la computación.
Permite construir fórmulas semánticas a partir de representaciones sintácticas.
Unas expresiones X representan un algoritmo y su entrada, la expresión Y está sujeta a una serie de reglas de reescritura.
MODELOS DE ANÁLISIS SEMÁNTICOGRAMÁTICA SINTAGMÁTICA NUCLEAR
Representación gráfica matemática de información sintáctica y semántica.
Usa grafos para representar información lingüística como secuencia de características.
Incluye principales reglas gramaticales basados en entradas léxicas (palabras o frases) que son marcadas en forma jerárquica.
Cada entrada léxica contiene información fonética (PHON) y sintáctico-semántica (SYNSEM).
MODELOS DE ANÁLISIS SEMÁNTICOGRAMÁTICA SINTAGMÁTICA NUCLEAR. EJEMPLO
MODELOS DE ANÁLISIS SEMÁNTICOGRAMÁTICA SINTAGMÁTICA NUCLEAR. EJEMPLO
MODELOS DE ANÁLISIS SEMÁNTICOMRS MINIMAL RECURSION SEMANTICS
Usa para representaciones en las cuales se presenten problemas de ambigüedades.
Este modelo parte del enfoque de que una estructura mínima del lenguaje representa y describe léxica y semánticamente la lengua general.
MODELOS DE ANÁLISIS SEMÁNTICOMTT MEANING TEXT THEORY
Representa reglas lingüísticas de acuerdo a significados específicos en un texto.
Usa patrones de manejo para combinar un lexema con otros objetos.
Permite representar equivalentes gráficos que son legibles por computador puesto que se basan en redes semánticas..
Este modelo establece una correspondencia entre posibles significados y un conjunto de posibles textos.
AMBIGUACIÓN Y DESAMBIGUACIÓN
Ambigüedad: Que puede entenderse de varios modos o admitir distintas interpretaciones y dar, por consiguiente, motivo a dudas, incertidumbre o confusión.
Este es un problema mayor puesto que es difícil representar todas las variables que pueden presentarse en el lenguaje natural.
Se presenta cuando ocurren diferentes fenómenos, que podrían resolverse en contexto, pero que es necesario prever en la implementación de herramientas computacionales.
FENÓMENOS DE AMBIGÜEDAD
Significados o sentidos de palabras o expresiones de acuerdo a contextos particulares de conocimiento.
Puede presentarse por las siguientes situaciones: Palabra que tiene más de un significado de acuerdo a
la categoría o al tiempo gramatical Sinonimia
Dos o más palabras que representan el mismo concepto Homonimia
Dos o más palabras con la misma forma gráfica y distinto significado según el contexto
Polisemia Una palabra cuyo sentido varía según el contexto
PROBLEMAS EN EL TRATAMIENTO AUTOMÁTICO QUE TIENEN QUE VER CON LA AMBIGÜEDAD
Dudas, incertidumbre o confusión.
En sistemas automáticos de representación de conocimiento es necesario minimizar estos problemas representando los casos más comunes en el lenguaje natural para proveerle a la máquina métodos que le permitan inferir sobre posibles sentidos y decidir las respuestas más adecuadas
Otra clasificación de tipos de ambigüedad: Léxica Sintáctica Semántica Textual Pragmática Referencial.
La desambigüación se realiza principalmente en tareas de: Traducción automática Recuperación de información
Solución: determinar automáticamente los sentidos de una palabra de acuerdo a contextos específicos.
Para lograr esto se llevan a cabo diferentes métodos que están basados bien sea en el conocimiento, en el corpus o métodos híbridos.
MÉTODOS BASADOS EN CONOCIMIENTO
Los métodos basados en conocimiento utilizan herramientas como diccionarios, tesauros, ontologías.
Ayudan a especificar los sentidos de acuerdo a usos particulares de las palabras en contextos específicos (lenguaje natural o lenguaje especializado).
El propósito de estas herramientas es proveer de significados, definiciones y ejemplos típicos de uso de las palabras.
Ejemplo: Wordnet
MÉTODOS BASADOS EN CORPUS Usan conjuntos de datos que proveen ejemplos de
oraciones y de usos de las palabras de tal forma que puedan utilizarse en algoritmos de aprendizaje automático.
Estos métodos están divididos en dos tipos: corpus etiquetado y corpus no etiquetado.
Corpus etiquetado: Clasificadores para darle sentido apropiado a una palabra
dentro de un contexto determinado. Se encuentran automáticamente relaciones o patrones entre
las palabras y luego evalúan y comparan los sentidos para realizar la desambiguación correcta
Tiene en cuenta: Co-ocurrencia, N-gramas, Colocaciones. Corpus no etiquetado:
Patrones que se definen para armar grupos de palabras con características comunes que se relacionan de alguna manera.
MÉTODOS COMBINADOSGENERACIÓN AUTOMÁTICA DE ESQUEMAS CONCEPTUALES
Permiten la interacción en lenguaje natural entre el usuario y el computador.
Facilitan tareas de recuperación y extracción automática de textos en corpus específicos, así como otros modelos o sistemas de etiquetaje, análisis y desambiguación
Algunas herramientas: Extracción automática de contextos definitorios: http://
swesum.nada.kth.se/index-eng.html Anotaciones semánticas Ayuda en la escritura (corrección) Extracción automática de terminología Indexación automática Data mining textual Patrones y tendencias del discurso
ESQUEMAS PRECONCEPTUALES
Representaciones gráficas y textuales que permiten una interpretación cercana a la realidad conceptual de un dominio.
Identifica las características estructurales y dinámicas de una lengua, ofreciendo a cada elemento una única categoría gramatical, lo que permitiría una mayor precisión de sentidos.
ESQUEMAS PRECONCEPTUALES
Identificación Nombre
ObjetoAgente 1
Predicado
Agente 2
tiene tiene
Verbo Verbo
UN-LECEP
Lenguaje controlado en español para la especificación de esquemas preconceptuales, generación de plantillas para la escritura de dichos esquemas.
RETOS…
Implementación y desarrollo de esquemas o categorías conceptuales en dominios específicos
Aplicaciones que no queden restringidas a la aplicación en otras lenguas. Hace falta más desarrollo y divulgación de aplicaciones en lengua castellana.
Construcción de ontologías que faciliten la estructuración y haga una marcación semántica de los documentos en la web a través del uso de términos específicos y la representación de las relaciones conceptuales entre ellos.
Utilización de métodos de análisis combinados (estadísticos y cualitativos)
REFERENCIAS
http://www3.unileon.es/dp/dfh/Milka/LCII/Intro_LCA.pdf
http://rua.ua.es/dspace/bitstream/10045/3346/1/PLN_37_44.pdf
http://www.sepln.org/revistaSEPLN/revista/27/27-articulo33.pdf
http://ccc.inaoep.mx/~mmontesg/tesis%20estudiantes/TesisMaestria-AaronPancardo.pdf
http://www.revista.unal.edu.co/index.php/formayfuncion/article/viewFile/17290/18129
http://tecnolengua.uma.es/doc2/resla98.pdf