2009 proz conference barcelona: overview of machine translation
DESCRIPTION
Presentation by Diego Bartolome, tauyou language technology CEO at the annual conference. It presents an overview of machine translation for freelance translators.TRANSCRIPT
www.tauyou.com
Enjoy the world!
Communication is not a problem anymore
Human quality machine translation solutions© 2009 Ta with you
Conferencia ProZ
Octubre 2009
© 2009 Ta with you Conferencia ProZ, Octubre 2009 2
Introducción
¿De dónde vengo?
¿Dónde estoy?
¿Adónde voy?
© 2009 Ta with you Conferencia ProZ, Octubre 2009 3
¿Para qué traducción automática?
Usuario final
Información web
Cliente corporativo
Documentación corporativa interna
Traductores
Herramienta de productividad (?)
© 2009 Ta with you Conferencia ProZ, Octubre 2009 4
Provocación
© 2009 Ta with you Conferencia ProZ, Octubre 2009 5
Pregunta
¿Cuántos quieren a la traducción automática?
¿Cuántos la odian?
Otras respuestas ...
© 2009 Ta with you Conferencia ProZ, Octubre 2009 6
Objetivos de la charla
Dar una perspectiva histórica de la TA
Explicar brevemente los sistemas más habituales
Generar discusión / ideas para mejorar
... aprender todos de todos ...
© 2009 Ta with you Conferencia ProZ, Octubre 2009 7
El problema esencial
Comprender el texto
(a veces también por causa del creador)
© 2009 Ta with you Conferencia ProZ, Octubre 2009 8
Con modestia
La traducción automática es complicada
Las máquinas no son personas
No es lucha persona contra máquina
Ayudarse y avanzar
Escuchemos a ...
© 2009 Ta with you Conferencia ProZ, Octubre 2009 9
Los inicios
Años 30: primeras patentes sistemas de reglas
1949: Informe de Warren Weaver
Años 50: Experimento Georgetown – IBM
Traducción 60 frases Ruso – Inglés
6 reglas + 250 unidades en vocabulario
En 5 años, problema resuelto ...
Reglas manuales + diccionarios bilingües
© 2009 Ta with you Conferencia ProZ, Octubre 2009 10
La realidad
Sistemas instalados
Objetivo: rapidez
Mejoras basadas en Chomsky
Lingüística generativa
Gramática transformacional
Pero las conclusiones es que nunca sería posible
Por la ambigüedad
Lo que lleva al ALPAC ...
© 2009 Ta with you Conferencia ProZ, Octubre 2009 11
Los años 60
Automatic Lang. Processing Advisory Committee
Creado en 1964, liderado por John R. Pierce
Informe en 1966
Conclusión básica
Investigar más en lingüística computacional
Dominios e idiomas limitados – herramientas
Consecuencia
Reducción de la inversión en TA
© 2009 Ta with you Conferencia ProZ, Octubre 2009 12
Un pequeño lapso
¡De sólo 10 años!
Con alguna excepción
1968: Systran para los EEUU y la UE
1970: Logos
1977: Méteo en Canada
Sistemas low cost
Para documentos técnicos y comerciales
Interlingua y transferencia
© 2009 Ta with you Conferencia ProZ, Octubre 2009 13
Finales de los 80 / principios de los 90
3 sistemas principales: Systran, Logos, Metal
Interés renovado por 3 motivos principales
Aumento de la capacidad computacional
Reducción del coste de hardware y software
Aparición de los modelos estadísticos (IBM)
Métodos basados en ejemplos
Principalmente en Japón
Proyecto de S2S: Verbmobil
© 2009 Ta with you Conferencia ProZ, Octubre 2009 14
Detalle proyecto Verbmobil
Traducción voz a voz en dominios controlados
8 años de investigación – década de los 90
86 millones de Euros invertidos
31 partners
Varias spin-offs lanzadas – casos de éxito
... pero Mariño os explicará más
© 2009 Ta with you Conferencia ProZ, Octubre 2009 15
¿Qué está pasando en 2009?
Plena efervescencia de sistemas
Reglas
Basados en ejemplos
Estadísticos
Basados en contexto
Alternativas: crowdsourcing
Importantes compañías involucradas
IBM, SAP, Google, Microsoft ...
© 2009 Ta with you Conferencia ProZ, Octubre 2009 16
Detalle de sistemas
Directa
Transferencia
Interlingua
Basados en ejemplos
En contexto
Estadísticos
© 2009 Ta with you Conferencia ProZ, Octubre 2009 17
Pregunta
¿Cuál es el objetivo de la traducción?
¿Cuál es el objetivo de la traducción automática?
© 2009 Ta with you Conferencia ProZ, Octubre 2009 18
El proceso es sencillo ...
Elegir las palabras adecuadas
Ordenarlas correctamente
Problemas
Gramática/sintaxis
Traducción literal
Terminología / palabras desconocidas
Adiciones / omisiones
Ortografía / puntuación / may. / min.
© 2009 Ta with you Conferencia ProZ, Octubre 2009 19
Traducción directa
De origen a destino
Mediante diccionarios y gramáticas
Proceso
Traducción palabra a palabra
Reglas de reordenación
Conclusión
Frases sin sentido
Puede ser útil en lenguaje controlado
© 2009 Ta with you Conferencia ProZ, Octubre 2009 20
Por transferencia (I)
Análisis morfológico
Categorización léxica
Transferencia léxica = traducción
Transferencia estructural
Generación morfológica
Exactitud cercana al 90% o superior ...
© 2009 Ta with you Conferencia ProZ, Octubre 2009 21
Por transferencia (II)
Fuente: Linguatec
© 2009 Ta with you Conferencia ProZ, Octubre 2009 22
Sistema basado en interlingua (I)
Análisis de los idiomas
Se crea una entidad común abstracta
Idioma pivote
A partir de ella, se genera la salida
Ventaja: No reglas uno a uno
Inconveniente: Creación interlingua (semántica)
DLT en Utrecht, Fujitsu ..
Antes METAL, Stanford ...
© 2009 Ta with you Conferencia ProZ, Octubre 2009 23
Sistema basado en interlingua (II)
Diccionarios, léxicos, reglas, gramáticas, ...
Sólo para lenguaje controlado o muy complicado
© 2009 Ta with you Conferencia ProZ, Octubre 2009 24
Traducción basada en ejemplos
Objetivo: obtener la traducción en base a previas
P.ej. memorias de traducción
Nació a mediados de los 80 en Japón
La clave
Combinación de segmentos
Técnicas optimizadas
Uso de patrones - reglas
© 2009 Ta with you Conferencia ProZ, Octubre 2009 25
Traducción basada en el contexto
Fuente: Meaningful Machines
© 2009 Ta with you Conferencia ProZ, Octubre 2009 26
Traducción estadística
Modelo más realista
Fuente: POSTECH, Intelligent Software Lab.
© 2009 Ta with you Conferencia ProZ, Octubre 2009 27
Más sobre la SMT
Ventajas
Rapidez de desarrollo de idiomas y dominios
Superioridad en aplicaciones acotadas
Alto volumen de texto multilingüe disponible
No necesita intervención lingüística
Inconvenientes
Metodología estadística
Cómo particularizar
© 2009 Ta with you Conferencia ProZ, Octubre 2009 28
Comparativa de métodos
tesaurusrepresentación
universal
otros
XXdatos
paralelos
Xanalizador
semántico
XXXparser
Xreglas de
transferencia
XXXdiccionarios
SMTEBMTInterlinguaTransferencia
© 2009 Ta with you Conferencia ProZ, Octubre 2009 29
¿Qué hacen bien las máquinas?
Ayudar al traductor
Corrección en dominios limitados
Amplitud de textos traducidos
Velocidad de traducción
Aprendizaje continuo
© 2009 Ta with you Conferencia ProZ, Octubre 2009 30
Pregunta
Dudas
Preguntas
Comentarios
¿Es útil combinar tecnología y lenguaje?
© 2009 Ta with you Conferencia ProZ, Octubre 2009 31
Y el futuro ...
Traducción clásica
Traducción automática
Traducción automática + postedición
Crowdsourcing
© 2009 Ta with you Conferencia ProZ, Octubre 2009 32
Retos de la traducción automática
Disponibilidad de corpus – lenguas minoritarias
Combinación sistemas estadísticos y por reglas
Unir de forma eficiente traductor y máquina
Evaluación de la calidad
© 2009 Ta with you Conferencia ProZ, Octubre 2009 33
Conclusiones
La TA es una herramienta útil para los traductores
Incremento productividad
Disminución costes y tiempos de entrega
También tiene inconvenientes
No sirve para todo
El futuro es híbrido y amplio
© 2009 Ta with you Conferencia ProZ, Octubre 2009 34
Crisis ... ¡pues innovemos!
© 2009 Ta with you Conferencia ProZ, Octubre 2009 35
¡ Gracias !
Diego Bartolomé, PhD
Director Ejecutivo, Ta with you
C/Ferrer de Blanes 25
08203 Sabadell
Tel. +34 937 11 29 96
Móvil +34 670 33 12 25