transcripción, etiquetado y codificación de corpus orales

26
LLISTERRI, J. (1999) “Transcripción, etiquetado y codificación de corpus orales", in GÓMEZ GUINOVART, J.- LORENZO SUÁREZ, A.- PÉREZ GUERRA, J.- ÁLVAREZ LUGRÍS, A. (Eds.) Panorama de la investigación en lingüística informática. RESLA, Revista Española de Lingüística Aplicada, Volumen monográfico. pp. 53-82. http://liceu.uab.es/~joaquim/publicacions/RESLA_99.pdf Transcripción, etiquetado y codificación de corpus orales JOAQUIM LLISTERRI Observatorio Español de Industrias de la Lengua, Instituto Cervantes Departament de Filologia Espanyola Universitat Autònoma de Barcelona Resumen En este trabajo se abordan tres niveles de representación propios de los corpus orales - transcripción ortográfica, representación fonética y etiquetado - así como cuestiones específicamente centradas en la transcripción y codificación de este tipo de corpus. En cada caso se presentan algunas de las convenciones desarrolladas como un primer paso hacia la estandarización, insistiéndose en la noción de compatibilidad entre sistemas para promover el intercambio y la reutilización de recursos. Abstract This work discusses three levels of representation in spoken corpora - orthographic transcription, phonetic representation and labelling - as well as some approaches to the transcription and encoding of spoken texts. Some proposals which have been put forward as a first attempt to standardization are presented, emphasizing the need of compatibility between different systems in order to promote exchange and reusability of resources Palabras clave: corpus orales, transcripción, etiquetado, codificación, estándares Kewords: spoken corpora, transcription, labelling, encoding, standards 1.- INTRODUCCIÓN La constitución de recursos lingüísticos requiere una reflexión sobre diversos aspectos que inciden de forma directa en el resultado final obtenido y en su posterior utilización. Uno de ellos, especialmente importante en el caso de los corpus orales, es el que se refiere a las cuestiones relacionadas con la propia representación de los datos, tratadas generalmente bajo las denominaciones de “transcripción”, “etiquetado” y “codificación”. En el presente trabajo pretendemos poner de relieve que las decisiones relativas a estos tres aspectos deben basarse en un cuidadoso análisis lingüístico acompañado de unos planteamientos más globales sobre las futuras posibilidades de explotación del corpus. Para ello, se parte de una concepción del corpus como conjunto de niveles de representación de los datos, en cada uno de los cuales se incorporan descripciones de los mismos que posteriormente deben ser recogidas mediante algún procedimiento formal.

Upload: phamtram

Post on 10-Feb-2017

215 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Transcripción, etiquetado y codificación de corpus orales

LLISTERRI J (1999) ldquoTranscripcioacuten etiquetado y codificacioacuten de corpus orales inGOacuteMEZ GUINOVART J- LORENZO SUAacuteREZ A- PEacuteREZ GUERRA J- AacuteLVAREZLUGRIacuteS A (Eds) Panorama de la investigacioacuten en linguumliacutestica informaacutetica RESLA RevistaEspantildeola de Linguumliacutestica Aplicada Volumen monograacutefico pp 53-82httpliceuuabes~joaquimpublicacionsRESLA_99pdf

Transcripcioacuten etiquetado y codificacioacuten de corpus orales

JOAQUIM LLISTERRI

Observatorio Espantildeol de Industrias dela Lengua Instituto Cervantes

Departament de Filologia EspanyolaUniversitat Autogravenoma de Barcelona

ResumenEn este trabajo se abordan tres niveles de representacioacuten propios de los corpus orales - transcripcioacutenortograacutefica representacioacuten foneacutetica y etiquetado - asiacute como cuestiones especiacuteficamente centradas en latranscripcioacuten y codificacioacuten de este tipo de corpus En cada caso se presentan algunas de las convencionesdesarrolladas como un primer paso hacia la estandarizacioacuten insistieacutendose en la nocioacuten de compatibilidadentre sistemas para promover el intercambio y la reutilizacioacuten de recursos

AbstractThis work discusses three levels of representation in spoken corpora - orthographic transcription phoneticrepresentation and labelling - as well as some approaches to the transcription and encoding of spokentexts Some proposals which have been put forward as a first attempt to standardization are presentedemphasizing the need of compatibility between different systems in order to promote exchange andreusability of resources

Palabras clave corpus orales transcripcioacuten etiquetado codificacioacuten estaacutendares

Kewords spoken corpora transcription labelling encoding standards

1- INTRODUCCIOacuteN

La constitucioacuten de recursos linguumliacutesticos requiere una reflexioacuten sobre diversos aspectos queinciden de forma directa en el resultado final obtenido y en su posterior utilizacioacuten Uno de ellosespecialmente importante en el caso de los corpus orales es el que se refiere a las cuestionesrelacionadas con la propia representacioacuten de los datos tratadas generalmente bajo lasdenominaciones de ldquotranscripcioacutenrdquo ldquoetiquetadordquo y ldquocodificacioacutenrdquo En el presente trabajopretendemos poner de relieve que las decisiones relativas a estos tres aspectos deben basarse enun cuidadoso anaacutelisis linguumliacutestico acompantildeado de unos planteamientos maacutes globales sobre lasfuturas posibilidades de explotacioacuten del corpus Para ello se parte de una concepcioacuten del corpuscomo conjunto de niveles de representacioacuten de los datos en cada uno de los cuales se incorporandescripciones de los mismos que posteriormente deben ser recogidas mediante alguacutenprocedimiento formal

2- NIVELES DE REPRESENTACIOacuteN ETIQUETADO Y CODIFICACIOacuteN

Tanto si es oral como escrito un corpus puede concebirse como un conjunto estructuradode materiales linguumliacutesticos en el que se distinguen diversos niveles de representacioacutencorrespondientes a diferentes grados de elaboracioacuten de los datos que lo constituyen Elestablecimiento de estos niveles es una de las tareas que se llevan a cabo en la fase de definicioacutendel corpus y responde loacutegicamente a los objetivos del mismo

Para cada nivel de representacioacuten suele establecerse un conjunto de ldquoetiquetasrdquo que seasocian a un determinado fragmento del corpus - un segmento sonoro una unidad prosoacutedica unapalabra etc - y definen sus propiedades El etiquetado conlleva un enriquecimiento del corpusmediante informacioacuten adicional introducida por el investigador en funcioacuten de sus objetivos y loque es maacutes importante de su interpretacioacuten linguumliacutestica de los materiales recogidos Elestablecimiento del inventario de etiquetas - estrechamente relacionado con los fenoacutemenos quedesean anotarse en un corpus - y las caracteriacutesticas que se sentildealan con cada una de ellas no es enabsoluto una tarea trivial especialmente en el marco de proyectos multilinguumles que deben cubrirsimultaacuteneamente las necesidades de varias lenguas

Finalmente es preciso definir en el proceso de creacioacuten de recursos linguumliacutesticos un sistemao esquema de codificacioacuten tanto de los fenoacutemenos representados en los diferentes niveles delcorpus como de sus correspondientes etiquetas La codificacioacuten constituye pues tal como seconcibe en la actualidad una herramienta que dota al corpus de una estructura Un esquema decodificacioacuten adecuado permite entre otras cosas mantener una distincioacuten entre los datos y suforma de representacioacuten que es uacutetil cuando se requiere el intercambio de corpus o su reutilizacioacutenen otros proyectos Por ello es esencial a la hora de disentildear tal esquema considerar sistemas quecumplan este requisito entre los cuales destaca el SGML (Standard Generalized MarkupLanguage) un lenguaje jeraacuterquico de codificacioacuten plenamente estandarizado (ISO 8879 Burnard1995)

En el caso de un corpus oral el primer nivel de representacioacuten necesario es el de latranscripcioacuten Esto responde a la exigencia de materializar o fijar la informacioacuten linguumliacutestica ycomunicativa presente en una sentildeal sonora esencialmente transitoria Tal como la caracterizaPayratoacute (199545) la transcripcioacuten es ldquoun procedimiento de traslado o transposicioacuten a una formagraacutefica (escrita) de una produccioacuten (linguumliacutestica discursiva) originariamente oralrdquo Atendiendo aesta definicioacuten podemos referirnos tanto a la transcripcioacuten ortograacutefica como a la transcripcioacutenfoneacutetica que se lleva a cabo mediante un conjunto de siacutembolos especialmente disentildeados para talfin En los apartados que siguen centraremos nuestra atencioacuten en estos dos niveles derepresentacioacuten el ortograacutefico y el foneacutetico considerando tambieacuten algunos aspectos relativos aletiquetado en el nivel foneacutetico

3- REPRESENTACIOacuteN ORTOGRAacuteFICA DE CORPUS ORALES

Uno de los primeros problemas a los que se enfrenta un investigador en el momento deconstituir un corpus oral es evidentemente el de la representacioacuten ortograacutefica Estarepresentacioacuten constituye una transcripcioacuten de los enunciados producidos por los hablantesutilizando la ortografiacutea convencional o dicho en otras palabras una transliteracioacuten Puesto que se

trata de un nivel de representacioacuten comuacuten a todo tipo de corpus orales sea cual sea su aplicacioacutense han realizado una notable cantidad de propuestas en lo que concierne a la forma escrita de loscorpus orales En el informe del Grupo de Trabajo sobre Textos Orales de EAGLES - cuyosprincipales elementos se retoman a continuacioacuten - se revisan algunas de ellas incluyendo las queproceden del proyecto NERC en la tradicioacuten de la linguumliacutestica de corpus y las que se derivan deproyectos en el aacutembito de las tecnologiacuteas del habla como SpeechDat o las desarrolladas en elpropio aacutembito de EAGLES

31- Propuestas para la representacioacuten ortograacutefica de corpus orales en el aacutembito de lalinguumliacutestica de corpus

En el marco del proyecto NERC - Network of European Reference Corpora (NERC 1994) seadoptaron para la representacioacuten ortograacutefica de corpus orales las convenciones desarrolladas porFrench (1991 1992) esencialmente concebidas para ser utilizadas en la constitucioacuten de la parteoral del corpus COBUILD (Payne 1995) En ellas se detalla el uso de los signos de puntuacioacuten -por ejemplo no se utilizan comas entre frases y se emplean puntos para delimitar frases - de lasmayuacutesculas - uacutenicamente al inicio de frase - o de los apoacutestrofes y las contracciones

Por su parte en el informe del Grupo de Trabajo sobre Textos Orales de EAGLES - ExpertAdvisory Group on Language Engineering Standards (EAGLES 1996) se proponen unasrecomendaciones baacutesicas para la transcripcioacuten ortograacutefica de corpus orales recogiendo tanto lassugerencias de NERC como algunas de las ideas desarrolladas en el aacutembito de las tecnologiacuteas delhabla que se discuten en el proacuteximo apartado Las recomendaciones pueden resumirse en trespuntos

bull Se recomienda utilizar siempre que sea posible las formas ortograacuteficas queaparecen en los diccionarios normativos o estaacutendares para cada lengua convencioacuten que seaplica tambieacuten a contracciones formas reducidas apoacutestrofes formas dialectalesinterjecciones y formas semi-leacutexicas

bull Si puede darse maacutes de una forma ortograacutefica de la misma palabra o si se introducenrepresentaciones ortograacuteficas que no aparecen en los diccionarios es recomendablemantener una base de datos con las formas utilizadas en la transcripcioacuten

bull Los nuacutemeros las abreviaturas los acroacutenimos y las palabras deletreadas debenrepresentarse ortograacuteficamente tal como son pronunciadas por el hablante utilizando laforma ortograacutefica completa

Como puede observarse eacutestas son recomendaciones generales que constituyen principiosbaacutesicos Un aspecto que requiere una discusioacuten maacutes detallada es el empleo de los signos depuntuacioacuten en la transcripcioacuten ortograacutefica de corpus tema sobre el que existen diversas posturasdesde las que propugnan su completa eliminacioacuten - lo que disminuye notablemente la legibilidaddel texto - hasta las que abogan por su uso seguacuten las normas habituales de cada lengua Taldiversidad de opiniones es obviamente debida a las dificultades que plantea la introduccioacuten depuntuacioacuten en transcripciones de habla espontaacutenea ya que implica necesariamente unasegmentacioacuten del enunciado que en algunos casos puede estar sujeta a la interpretacioacuten deltranscriptor

32- Propuestas para la representacioacuten ortograacutefica de corpus orales en el aacutembito de lastecnologiacuteas del habla

En el campo de las tecnologiacuteas del habla existen diversas propuestas para la representacioacutenortograacutefica dos de las cuales se presentan a continuacioacuten Pueden verse otros ejemplos en lasGuiacuteas de Transcripcioacuten del Center for Spoken Language Understanding (CSLU OregonGraduate Institute ) (Lander 1997) y en las convenciones desarrolladas para corpus como elHCRC Map Task (Anderson et al 1991) o en el proyecto Verbmobil (Hess et al 1995)

Los sucesivos proyectos LRE-63314 SpeechDat - Infrastructure for Spoken LanguageResources y LE2-4001 SpeechDat II - Speech Databases for the Creation of Voice DrivenTeleservices tienen entre sus objetivos desarrollar estaacutendares para la creacioacuten de recursoslinguumliacutesticos especialmente adecuados al entrenamiento y evaluacioacuten de sistemas dereconocimiento automaacutetico del habla Para llevar a cabo la transcripcioacuten ortograacutefica se handefinido una serie de convenciones - resumidas en dos recomendaciones ldquoKeep it simplerdquo yldquoDocument everything adequatelyrdquo - entre las cuales se contempla el uso de mayuacutesculas yminuacutesculas la transcripcioacuten de secuencias de nuacutemeros de letras y el empleo de los signos depuntuacioacuten se establecen tambieacuten procedimientos para la transcripcioacuten de errores depronunciacioacuten de palabras ininteligibles fragmentos de palabras elisiones y acontecimientosacuacutesticos no verbales como las denominadas pausas llenas ruidos producidos por el hablantesruidos estacionarios en la grabacioacuten o ruidos intermitentes respondiendo estas uacuteltimas categoriacuteasa las necesidades de transcripcioacuten de una base de datos recogida a traveacutes del teleacutefono (Senia y vanVelden 1997)

Los documentos del Grupo de Trabajo sobre Lengua Oral de EAGLES (Winski et al 1995Gibbon Moore y Winski eds 1997) ofrecen las siguientes recomendaciones para transcripcioacutenortograacutefica de corpus orales

bull Las formas reducidas de las palabras se transcriben tal como aparecen en losdiccionarios normativos

bull Si es necesario y si se documentan adecuadamente pueden utilizarse formas queno aparezcan en los diccionarios

bull Se recomienda el uso de formas reducidas si aparecen frecuentemente y si implicanelisiones de siacutelabas

bull Las formas dialectales se marcan en la transcripcioacutenbull Los nuacutemeros se transliteran como palabrasbull En la transcripcioacuten ortograacutefica se utilizan las formas completas de las abreviaturasbull Las abreviaturas que los hablantes pronuncian como palabras se transcriben de

este mismo modobull En las transcripciones se indica la aparicioacuten de palabras deletreadasbull Las interjecciones se transcriben con la representacioacuten ortograacutefica que aparece en

los diccionarios

Como puede deducirse faacutecilmente la filosofiacutea general de esta propuesta consiste en utilizarsiempre las formas que aparecen en los diccionarios normativos y documentar adecuadamente lasformas no estaacutendares que se encuentren durante el proceso de transcripcioacuten

4- REPRESENTACIOacuteN FONEacuteTICA DE CORPUS ORALES

A la hora de plantearse la eleccioacuten de un sistema de transcripcioacuten foneacutetica para un corpusoral son uacutetiles los planteamientos que Johansson (199593) realiza en el marco de la TEI (TextEncoding Initiative)1 ldquoThe degree of phonetic detail given in speech transcription varies fromnone to a very precise phonetic or phonemic transcription [] Where there is a great deal ofphonetic or phonemic detail it will be more convenient to design a specialized writing systemrdquo

Evidentemente hay casos en los que el objeto de la investigacioacuten no requiere la utilizacioacutende un sistema de transcripcioacuten foneacutetica pero cuando es necesario disponer de un ldquosistemaespecializado de escriturardquo el AFI (Alfabeto Foneacutetico Internacional) aparece como el primercandidato para cubrir las necesidades de la investigacioacuten siendo igualmente el sistemarecomendado tanto por la TEI como por el Grupo de Trabajo sobre Textos Orales de EAGLESSin embargo cuando se requiere el intercambio electroacutenico de textos SAMPA (SAM PhoneticAlphabet) - considerado como una versioacuten informaacutetica de parte del AFI (Gibbon Moore yWinski eds 1997) - se presenta como una opcioacuten vaacutelida especialmente en lo que se refiere a laslengua europeas cuando se requiere una transcripcioacuten de caraacutecter fonoloacutegico Existe una extensioacutende SAMPA (X-SAMPA) que ofrece los elementos del AFI inexistentes en SAMPA y que por lotanto puede considerarse como un sistema adecuado para la transcripcioacuten de corpus orales(EAGLES 1996) Por otra parte cabe considerar tambieacuten Wordlbet como una alternativa cuandola naturaleza del corpus aconseje disponer de un sistema maacutes detallado Estos procedimientoscomuacutenmente utilizados en la transcripcioacuten de corpus orales desarrollados en el aacutembito de lafoneacutetica y las tecnologiacuteas del habla se presentan someramente a continuacioacuten Dada la diversidadde meacutetodos existentes parece clara la conveniencia de desarrollar mecanismos que permitan lacompatibilidad asegurando la faacutecil traduccioacuten de una representacioacuten a otra de modo quediferentes investigadores puedan hacer uso de corpus ya transcritos foneacuteticamenteincorporaacutendolos a su propio entorno de trabajo

41- La representacioacuten foneacutetica de los elementos segmentales

El Alfabeto Foneacutetico Internacional (AFI IPA International Phonetic Alphabet)2 es elsistema maacutes ampliamente utilizado para la transcripcioacuten foneacutetica Es bien sabido que se basa en

1 Ademaacutes de las Guidelines for Electronic Text Encoding and Interchange (Sperberg-McQueen y Burnard eds1994) puede verse tambieacuten sobre la TEI la recopilacioacuten de Ide y Veacuteronis eds 1995 Para una introduccioacuten generalson uacutetiles Burnard (1995a b) Se encuentra maacutes informacioacuten en URL httpwww-teiuiceduorgsteiy en URL httpetextvirginiaeduTEIhtml2 La versioacuten maacutes reciente del AFI data de 1993 (IPA 1993) y puede encontrarse en URLhttpwwwartsglaacukIPAipacharthtml El Summer Institute of Linguistics (URLhttpwwwsilorgcomputingfonts) distribuye tipos de letra (fonts) que permiten trabajar con los sistemasoperativos maacutes corrientes utilizando los siacutembolos del AFI Tambieacuten pueden obtenerse en University CollegeLondon (URL httpwwwphonuclacuk) a partir de la paacutegina de Linguist (URL httplinguistlistorg) del

un principio fonoloacutegico seguacuten el cual se transcriben aquellos segmentos con valor diferencialutilizaacutendose los diacriacuteticos para introducir aspectos de tipo foneacutetico (IPA 1995) Sin embargo apesar del uso extendido del AFI existen tambieacuten diversas tradiciones nacionales resultantes engeneral de las necesidades derivadas de la transcripcioacuten estrecha de una determinada lengua o de laorientacioacuten de la investigacioacuten hacia un determinada aacuterea linguumliacutestica (Pullum y Ladusaw 1986)

La necesidad de intercambiar electroacutenicamente textos que contienen transcripcionesfoneacuteticas llevoacute a finales de los antildeos 80 a plantearse la codificacioacuten de los siacutembolos del AFI demodo que para cada uno de los siacutembolos del alfabeto se ha definido un nuacutemero (denominadoldquonuacutemero AFIrdquo) que puede relacionarse tambieacuten con los coacutedigos ASCII (Esling 1988 1990 IPA1989 Esling y Gaylord 1993) Las equivalencias entre siacutembolos nuacutemeros AFI y coacutedigos ASCIIforman parte de las convenciones conocidas como CRIL (Computer Representation of IndividualLanguages) surgidas del congreso de la Asociacioacuten Foneacutetica Internacional celebrado en Kiel en1991

SAMPA (SAM Phonetic Alphabet) constituye seguramente el esfuerzo maacutes significativo yextendido por desarrollar un sistema de transcripcioacuten foneacutetica informatizado SAMPA tiene suorigen en el proyecto ESPRIT 1541 SAM - Speech Assessment Methods (Fourcin et al 1989Fourcin y Dolmazon 1991) llevado a cabo entre 1987 y 1989 Al final del proyecto existiacuteanversiones de SAMPA en daneacutes neerlandeacutes ingleacutes franceacutes alemaacuten e italiano incorporaacutendose en1992 el noruego y el sueco y el espantildeol el griego y el portugueacutes en 1993 Durante 1996 seextendioacute a una serie de lenguas de los paiacuteses de la Europa del Este en el marco del proyectoBABEL (URL httpmidwichreadingacukresearchspeechlabbabel) y en principio no hayninguacuten obstaacuteculo para su adaptacioacuten a otros idiomas En cuanto a su utilizacioacuten praacutectica puedesentildealarse que es el sistema desarrollado para la transcripcioacuten del corpus multilinguumle EUROM(Chan et al 1995) y tambieacuten el adoptado en el proyecto ONOMASTICA centrado en latranscripcioacuten de nombres propios en diversas lenguas europeas (Schmidt 1993 Trancoso 1995)

SAMPA (Wells 1987 1989) se basa en un conjunto de equivalencias entre siacutembolos delAFI y coacutedigos ASCII restringieacutendose al uso de caracteres de 7 bits (coacutedigos 32 a 127) Elprincipio que rige las transcripciones en SAMPA al igual que en el caso del AFI esesencialmente fonoloacutegico empleaacutendose uacutenicamente siacutembolos distintos en el caso de segmentoscon valor diferencial Esta filosofiacutea viene motivada por tres razones simplicidad de latranscripcioacuten sin incorporar ambiguumledades ya que determinadas alofoacutenicas son predictibles apartir del contexto facilidad de utilizacioacuten por parte personas con poca formacioacuten en foneacutetica yfalta de coacutedigos ASCII para la transcripcioacuten alofoacutenica de todas las lenguas Sin embargo enalgunos casos se introducen siacutembolos para la representacioacuten de aloacutefonos cuando losinvestigadores que han desarrollado las adaptaciones para cada lengua lo han consideradonecesario

Una de las limitaciones de SAMPA es que no establece una codificacioacuten para todos lossiacutembolos del AFI Por este motivo Wells (1994) propone un sistema denominado X-SAMPA en

Yamada Language Center (URL httpbabeluoregoneduyamadafontsphonetichtml) o de la paacutegina de la propiaAsociacioacuten Foneacutetica Internacional (URL httpwwwartsglaacukIPAipafontshtml)

el que se preveacuten equivalencias en coacutedigos ASCII para la totalidad de siacutembolos del AFI en surevisioacuten de 1993 incluyendo diacriacuteticos y marcas tonales Una de las aplicaciones propuestaspara este sistema es el enviacuteo de textos en transcripcioacuten foneacutetica a traveacutes del correo electroacutenico

Por otra parte Worldbet constituye una propuesta maacutes ambiciosa que SAMPA y que suextensioacuten X-SAMPA pues parte de la base de que ldquoany spectrally and temporally distinct speechsound (not including pitch) which is phonemic in some language should have a separate basesymbolrdquo (Hieronymus 1994 ) los siacutembolos de base consisten normalmente en la concatenacioacuten deun siacutembolo del AFI con una serie de diacriacuteticos de modo que puede representarse una granvariedad de aloacutefonos hallados en las lenguas del mundo incluyendo siacutembolos inexistentes en elAFI Uno de los objetivos de Wordlbet - que en su versioacuten actual usa 299 siacutembolos compuestosde dos caracteres ASCII - es facilitar la transcripcioacuten de bases de datos multilinguumles que incluyanlenguas indias asiaacuteticas y africanas ademaacutes de las europeas Este sistema se ha utilizado porejemplo en la transcripcioacuten de los corpus distribuidos por el CSLU (Center for Spoken LanguageUnderstanding Oregon Graduate Institute) (Lander 1997)

Existen otros sistemas de transcripcioacuten foneacutetica concebidos para el intercambio electroacutenicode textos tanto desarrollados desde la perspectiva de las tecnologiacuteas del habla - por ejemplo elCPA (Computer Phonetic Alphabet) surgido en el marco del proyecto ESPRIT Linguistic Analysisof European Languages (Kluger-Kruse 1987) - como disentildeados para otros fines En el aacutembito delestudio del lenguaje infantil el proyecto CHILDES - Child Language Data Exchange System(MacWhinney 1991utiliza el sistema conocido como PHONASCII (Allen 1988) consistente enun conjunto de siacutembolos fonoloacutegicos - UNIBET - y un alfabeto foneacutetico que permite latranscripcioacuten estrecha

42- La representacioacuten foneacutetica de los elementos suprasegmentales

La incorporacioacuten de informacioacuten sobre los elementos suprasegmentales - informacioacutenprosoacutedica - en un corpus oral plantea diversos problemas derivados precisamente de la propianaturaleza de estos elementos que se manifiestan en variaciones continuas en los dominios de lafrecuencia la intensidad y el tiempo Por tanto es preciso llevar a cabo una abstraccioacuten paradeterminar en primer lugar cuaacuteles de estas variaciones son linguumliacutesticamente significativas y ensegundo lugar coacutemo se relacionan con categoriacuteas discretas Finalmente estas categoriacuteas debenrepresentarse en un sistema de notacioacuten No es pues extrantildeo que se hayan desarrollado diversasconvenciones para la simbolizacioacuten de los elementos suprasegmentales (Groslashnnum-Thorsen 1987Llisterri 1994) algunas de las cuales se presentan en los apartados siguientes

En el momento de plantearse la seleccioacuten de un sistema de transcripcioacuten prosoacutedicaadecuado a un corpus oral el investigador se enfrenta nuevamente a la diversidad de sistemas aligual que sucede en el caso de la transcripcioacuten segmental Aunque como veremos maacutes adelanteToBI parece que se estaacute convirtiendo raacutepidamente en un estaacutendar a pesar de su orientacioacuten haciala transcripcioacuten del ingleacutes y al modelo fonoloacutegico subyacente SAMPROSA ofrece la ventaja dehaberse desarrollado teniendo en cuenta las necesidades de las tecnologiacuteas del habla ademaacutesSAMPROSA se enmarca en el contexto de estaacutendares extendidos en Europa como los delproyecto SAM recomendados por ejemplo por NERC (Teubert 1993 Sinclair 1994) Enconjunto el sistema ideal de transcripcioacuten prosoacutedica deberiacutea permitir una representacioacuten en varios

niveles ser compatible con el intercambio electroacutenico de datos y cubrir las necesidades del mayornuacutemero de lenguas posible pudiendo aplicarse automaacuteticamente en lugar de basarse en lasimpresiones intuitivas del transcriptor con vistas a la transcripcioacuten de grandes corpus Enausencia de un sistema que reuacutena tales caracteriacutesticas parece adecuado establecer mecanismos decompatibilidad entre los existentes a fin de facilitar la reutilizacioacuten de los datos

El AFI ofrece ademaacutes de la posibilidades de transcripcioacuten segmental un conjunto desiacutembolos para la representacioacuten de los elementos suprasegmentales Con motivo del congresopara la revisioacuten del AFI celebrado en Kiel en 1989 se creoacute un grupo de trabajo sobre categoriacuteassuprasegmentales (Bruce 1988 1989) concluyeacutendose la necesidad de representar las categoriacuteassuprasegmentales de un modo maacutes adecuado especialmente en lo que se refiere la entonacioacuten Elconjunto actual de siacutembolos del AFI para los elementos suprasegmentales permite transcribir eltono asiacute como la duracioacuten y el acento

Las necesidades derivadas de una descripcioacuten detallada de la entonacioacuten tanto en el campode la foneacutetica como en el de las tecnologiacuteas del habla han propiciado la creacioacuten de diversossistemas de transcripcioacuten prosoacutedica algunos de los cuales se presentan a continuacioacuten

En el marco del proyecto ESPRIT SAM anteriormente mencionado se llevoacute tambieacuten a caboel desarrollo de sistemas de transcripcioacuten prosoacutedica compatibles con las necesidades de anotacioacutende bases de datos en soporte electroacutenico resultando de ello propuestas como PROSPASAMSINT o SAMPROSA (Gibbon 1989 Wells et al 1992) PROSPA fue originalmenteconcebido por Selting y Gibbon (Selting 1987 1988) para el anaacutelisis de la conversacioacuten y deldiscurso y por tal motivo se basa en criterios auditivos recogiendo uacutenicamente los elementosnecesarios para este fin Por su parte SAMSINT (SAM System for Intonation Transcription) seplantea como objetivo la transcripcioacuten de contornos meloacutedicos en el interior de unidadesentonativas basaacutendose en INTSINT - presentado maacutes adelante - con algunas modificacionesadicionales

A pesar de la coexistencia de los sistemas anteriormente mencionados en el proyecto SAMprobablemente el conjunto de siacutembolos maacutes extendido actualmente para la transcripcioacutenprosoacutedica sea SAMPROSA (SAM Prosodic Alphabet) propuesto inicialmente por Gibbon(1989) y desarrollado por Wells et al (1992) hasta llegar a su forma actual (Wells 1995)SAMPROSA ofrece al igual que SAMPA un conjunto de caracteres correspondientes a coacutedigosASCII mediante los cuales es posible transcribir tonos globales locales terminales y nucleares laduracioacuten el acento la pausas y las fronteras entre unidades prosoacutedicas Aunque presenta rasgoscaracteriacutesticos de la tradicioacuten britaacutenica de anaacutelisis de la entonacioacuten como por ejemplo lacodificacioacuten de tonos nucleares es un sistema que se plantea como adecuado para la transcripcioacutende diversas lenguas

En el aacutembito americano ToBI (Tone and Break Index) se desarrolloacute para cubrir al mismotiempo las necesidades de la descripcioacuten foneacutetica y de la anotacioacuten de corpus adecuados aldesarrollo de sistemas de tecnologiacuteas del habla (Silverman et al 1992 Beckman y Hirschberg1994 Beckman y Ayers 1994) Basado en el ingleacutes americano ToBI permite principalmente latranscripcioacuten de patrones entonativos partiendo de un anaacutelisis de la curva meloacutedica representadacomo evolucioacuten temporal de la frecuencia fundamental mediante herramientas de anaacutelisis y

etiquetado como el programa Wavestrade Sin embargo se han definido tambieacuten convenciones parala anotacioacuten de textos representados ortograacuteficamente Una transcripcioacuten utilizando ToBI constade cuatro niveles

bull Representacioacuten ortograacutefica del enunciadobull Nivel de iacutendices de ruptura (break index) en el que se introducen los indicadores

de liacutemite que marcan las fronteras entre las unidades meloacutedicas estableciendo cuatro gradosde cohesioacuten entre las mismas

bull Nivel tonal en el que se marcan los denominados ldquoeventos tonalesrdquo (pitch events)divididos en tonos de frase al principio y al final de las unidades meloacutedicas y en acentostonales (pitch accent) en las siacutelabas en las que se produce un movimiento de la frecuenciafundamental

bull Nivel miscelaacuteneo que facilita por ejemplo introducir los comentarios deltranscriptor

Para cada uno de los niveles se define un conjunto de siacutembolos alineados temporalmentecon los fenoacutemenos entonativos transcritos si se dispone de una herramienta adecuada comoWavestrade

Las criacuteticas que se realizan maacutes frecuentemente a ToBI son por una parte su dependenciadel modelo fonoloacutegico desarrollado por Pierrehumbert (1980) y por otra su mejor adaptacioacuten alingleacutes que a otras lenguas lo que explicariacutea su amplia utilizacioacuten en Estados Unidos Sin embargose han realizado trabajos en italiano alemaacuten huacutengaro y espantildeol entre otras lenguas usando ToBIcomo sistema de representacioacuten Un inconveniente maacutes importante es que la anotacioacuten medianteToBI requiere un cierto conocimiento previo de los patrones entonativos de la lengua Aun asiacute esun sistema que ofrece indudables ventajas como pueden ser su estructura jeraacuterquica que permiteseleccionar entre subconjuntos o conjuntos mayores de siacutembolos la posibilidad de representarproblemas que aparecen en la transcripcioacuten y el hecho de que existan experimentos demostrandoun alto grado de acuerdo entre transcriptores diferentes (Pitrelli et al 1994)

En el Institute for Perception Research (IPO Eindhoven) se ha desarrollado una teoriacutea sobrela entonacioacuten basada en el modelado de contornos entonativos consistentes en representacionesestilizadas perceptivamente equivalentes al contorno original (lsquot Hart et al 1990) Esta teoriacutea hallevado tambieacuten a la formalizacioacuten de un sistema de representacioacuten de la curva meloacutedica definidacomo un conjunto de movimientos tonales que se agrupan en secuencias de configuracionestonales la agrupacioacuten de estas configuraciones da lugar a su vez a contornos meloacutedicosdefinieacutendose los patrones entonativos en funcioacuten de agrupaciones similares de contornosmeloacutedicos Un sistema jerarquizado de esta naturaleza permite una representacioacuten de la curvameloacutedica adecuada para la transcripcioacuten prosoacutedica aunque que inicialmente no haya sido disentildeadopara tales fines

El objetivo de INTSINT (International Transcription System for Intonation) en cambio esproporcionar un sistema para la comparacioacuten interlinguumliacutestica de sistemas prosoacutedicosDesarrollado por Hirst (1991 Hirst y Di Cristo en prensa Hirst Di Cristo y Espesser enprensa) en el marco de un proyecto de anaacutelisis automaacutetico de la entonacioacuten INTSINT se basa en

la estilizacioacuten de la curva meloacutedica realizada a partir de una interpolacioacuten entre puntos en los quese da un cambio significativo en el valor de la frecuencia fundamental (target points) Estospuntos que podriacuteamos denominar ldquode inflexioacutenrdquo - definidos como la combinacioacuten de un valortemporal y un valor frecuencial - son susceptibles de codificarse automaacuteticamente mediante lossiacutembolos de INTSINT previa introduccioacuten de marcas de frontera entre las unidades entonativasCon ello se obtiene una representacioacuten fonoloacutegica del contorno meloacutedico simbolizando losdiferentes niveles tonales de la curva original El sistema se basa en la representacioacuten desecuencias tonales consideradas tanto desde una perspectiva global en funcioacuten del rango devariacioacuten tonal del hablante como desde un punto de vista local en relacioacuten con la altura de puntosde inflexioacuten anteriores En el primer caso se definen tres niveles T (Top) M (Mid) y B (Bottom)mientras que en el segundo se marcan cinco posibilidades H (Higher) L (Lower) S (Same) U(Upstep) o D (Downstep) El proceso de modelizacioacuten necesario para transcribir medianteINTSINT ha sido aplicado a varias lenguas (Hirst et al 1993) y se emplea tambieacuten para laanotacioacuten prosoacutedica de parte del corpus EUROM en franceacutes ingleacutes alemaacuten sueco y espantildeol(Hirst et al 1994 Llisterri ed 1996) llevada a cabo en el marco del proyecto LRE 62-050MULTEXT - Multilingual Text Tools and Corpora Es posible tambieacuten aplicar INTSINT aniveles maacutes altos como el paacuterrafo tal como se muestra en Nicolas y Hirst (1995)

5- ETIQUETADO FONEacuteTICO DE CORPUS ORALES

Al igual que en el caso de los corpus textuales una vez recogidos los materiales de base deun corpus oral debe llevarse a cabo un tratamiento de los mismos que permita su utilizacioacutenposterior El primer paso suele ser la transcripcioacuten ortograacutefica que en determinado tipo de corpusse acompantildea de una transcripcioacuten foneacutetica o fonoloacutegica A continuacioacuten a cada segmento de laonda sonora se le asocia una etiqueta (labelling) que lo define en teacuterminos foneacuteticos o fonoloacutegicosy se lleva a cabo la alineacioacuten (alignment) entre la sentildeal sonora y las etiquetas obteniendo unarepresentacioacuten que puede compararse a la partitura musical de una obra para voz y orquesta Elproceso de etiquetado segmental puede llevarse a cabo a varios niveles como veremos en esteapartado y completarse con una anotacioacuten de las caracteriacutesticas suprasegmentales codificadasseguacuten los diversos sistemas que hemos expuesto anteriormente Si se cumplen las etapasmencionadas se llega a disponer de un corpus que contiene la sentildeal sonora sincronizada con latranscripcioacuten ortograacutefica y con la transcripcioacuten foneacutetica o fonoloacutegica de modo que una vezdefinida una estructura de base de datos es posible consultar el corpus partiendo de etiquetasfoneacuteticas de marcas prosoacutedicas o de la transcripcioacuten ortograacutefica al tiempo que se accede a lagrabacioacuten correspondiente

Los corpus de lengua oral que consisten uacutenicamente en transcripciones ortograacuteficas - ya queno suele ser factible realizar una transcripcioacuten foneacutetica completa de un nuacutemero elevado de horasde grabacioacuten - conllevan un procesamiento menos complejo aunque en algunos casos contienenmarcas prosoacutedicas uacutetiles para el anaacutelisis del discurso o de la conversacioacuten como veremos en elapartado 6

51- Niveles de etiquetado foneacutetico de corpus orales

Una cuestioacuten que se plantea inevitablemente a la hora de introducir informacioacuten adicionalsobre los datos recogidos es el nivel de etiquetado del corpus Se han realizado varias propuestassobre los distintos niveles en los que se puede realizar el etiquetado foneacutetico de un corpusalgunas de ellas ligadas al proyecto SAM como la de Barry y Fourcin (1992) en la que seplantean cinco niveles posibles de etiquetado foneacutetico de un corpus

bull Nivel fiacutesico en el que se etiquetan las propiedades acuacutesticas presentes en la sentildealsonora

bull Nivel acuacutestico-foneacutetico en el que se marcan las propiedades de los segmentos enteacuterminos de categoriacuteas foneacuteticas como oclusioacuten friccioacuten sonoridad nasalizacioacuten etc

bull Nivel de transcripcioacuten estrecha en el que se caracterizan los segmentos utilizandolos siacutembolos del AFI o de sus equivalentes computacionales

bull Nivel de transcripcioacuten fonoloacutegica (o foneacutemica) sentildealando uacutenicamente aquelloselementos funcionalmente distintivos que se encuentran en la palabra pronunciadaaisladamente en un estilo cuidado (citation form)

bull Nivel de transcripcioacuten ancha en el que se utilizan los siacutembolos correspondientes alos elementos fonoloacutegicos en una lengua dada para transcribir realizaciones alofoacutenicascondicionadas por el contexto3

A estos cinco niveles debe antildeadirse auacuten la anotacioacuten prosoacutedica considerada de formaindependiente por los autores de la propuesta

Una propuesta similar de etiquetado tambieacuten en cinco niveles - caracteriacutesticas acuacutesticas denaturaleza subfoneacutemica caracteriacutesticas segmentales realizaciones foneacuteticas forma canoacutenica de laspalabras y transcripcioacuten ortograacutefica - se presenta en Tillmann y Pompino-Marschall (1993) y hasido utilizada con eacutexito en el proyecto alemaacuten PhonDat Igualmente pueden verse las propuestasde Autesserre et al (1989) enmarcadas en el contexto del proyecto SAM y los trabajos deMarchal et al (1995) o Roach et al (1990)

La transcripcioacuten y el etiquetado de corpus orales se ha abordado en el marco del proyectoEAGLES desde una doble perspectiva la de la foneacutetica y las tecnologiacuteas del habla en el Grupo deTrabajo sobre Lengua Oral y desde la de la linguumliacutestica de corpus en el marco de las actividades delGrupo de Trabajo sobre Corpus Textuales El trabajo llevado a cabo en el grupo dedicado a lalengua hablada en EAGLES recoge esencialmente las propuestas desarrolladas en el marco deSAM y de PhonDat Los niveles de etiquetado propuesto son los siguientes (Gibbon Moore yWinski eds 1997)

bull Nivel ortograacutefico en el que se utiliza la representacioacuten ortograacutefica convencional

3 La distincioacuten entre los dos uacuteltimos niveles puede ejemplificarse con el caso de las asimilaciones mientras que enla transcripcioacuten ancha encontrariacuteamos [um poko] (un poco) en el caso de una transcripcioacuten fonoloacutegica apareceriacutea [unpoko] si se opta por no simbolizar archifonemas en la transcripcioacuten En cambio [mismo] se representariacutea de lamisma forma en ambos niveles encontraacutendose la transcripioacuten [mizmo] en el nivel de transcripcioacuten estrecha

bull Nivel de formas canoacutenicas (citation form) representando la forma depronunciacioacuten aislada de las palabra en estilo cuidado

bull Nivel de transcripcioacuten ancha o fonotiacutepica en este nivel se utilizan los siacutembolosque representan elementos fonoloacutegicos en una lengua dada pero al igual que en lapropuesta de Barry y Fourcin se transcriben aquellos fenoacutemenos predictibles propios dela foneacutetica sintaacutectica SAMPA seriacutea pues un alfabeto foneacutetico adecuado para este nivelde transcripcioacuten

bull Nivel de transcripcioacuten estrecha basado en una representacioacuten alofoacutenica de lasrealizaciones foneacuteticas de los hablantes para el cual puede utilizarse un alfabeto foneacuteticocomo X-SAMPA

bull Nivel acuacutestico-foneacutetico en el que se distinguen caracteriacutesticas acuacutesticas de lossegmentos observables en una representacioacuten de la onda sonora

bull Nivel fiacutesico representado en teacuterminos de paraacutemetros acuacutesticos o articulatoriosbull Fenoacutemenos no linguumliacutesticos la inclusioacuten de este nivel permite representar sonidos

de naturaleza comunicativa o no introducidos por el hablante asiacute como toda aquellainformacioacuten paralinguumliacutestica que se considere de intereacutes tambieacuten permite sentildealas los ruidosexternos en la grabacioacuten

Vale la pena detenerse brevemente en el nivel de las formas canoacutenicas y en el concepto deldquotranscripcioacuten fonotiacutepicardquo que como puede verse aparecen de forma recurrente en diversaspropuestas La inclusioacuten de forma canoacutenicas en el etiquetado de un corpus responde a un doblemotivo especialmente ligado a necesidades tecnoloacutegicas en primer lugar estas formas permitenderivar automaacuteticamente mediante un conjunto de reglas una transcripcioacuten ancha o fonotiacutepica enla que se incluyen los elementos alofoacutenicos cuya aparicioacuten esta condicionada por el contextofoneacutetico en segundo lugar a partir de las formas canoacutenicas puede crearse de forma automaacutetica undiccionario foneacutetico partiendo de un corpus transcrito (Wesenick y Schiel 1995 Senia y vanVelden 1997) lo que tiene utilidad para el desarrollo de sistemas de siacutentesis y reconocimiento delhabla y tambieacuten para la descripcioacuten linguumliacutestica La transcripcioacuten denominada ldquofonotiacutepicardquo en lostrabajos de SAM constituye un nivel intermedio entre la realizacioacuten foneacutetica y la transcripcioacutenpuramente fonoloacutegica Por otra parte el nivel de transcripcioacuten de formas canoacutenicas estaacutedirectamente relacionado con la representacioacuten ortograacutefica facilitando asiacute la transcripcioacuten foneacuteticaautomaacutetica de corpus en este nivel mediante el desarrollo de los correspondientes sistemas dereglas

En el informe del Grupo de Trabajo de Corpus Textuales de EAGLES (EAGLES 1996) seintenta realizar una siacutentesis entre las necesidades de diversos campos de estudio Se sugieren porello tres niveles de representacioacuten

bull S1 representacioacuten ortograacutefica del textobull S2 representacioacuten fonoloacutegica de las palabras en su forma canoacutenicabull S3 transcripcioacuten foneacutetica consistente en una representacioacuten simboacutelica discreta de

la realizacioacuten del enunciado tal como es percibido por el transcriptor

Como puede observarse estos tres niveles encuentran su equivalente en los nivelespropuesto por Barry y Fourcin (1992) y en los definidos por el Grupo de Trabajo de Lengua

Oral Para la transcripcioacuten del nivel S2 puede utilizarse SAMPA mientras que la del nivel S3requiere el uso de un alfabeto foneacutetico como X-SAMPA

52- La transcripcioacuten y el etiquetado automaacutetico de corpus orales

La tarea de transcribir y etiquetar foneacuteticamente un corpus oral representa un considerableesfuerzo tanto en teacuterminos de tiempo como de los recursos econoacutemicos necesarios para llevar acabo esta labor El etiquetado manual requiere por otro lado el desarrollo de convencionesdetalladas para asegurar la consistencia entre diversos transcriptores (Keating et al 1994 Krot yTaylor 1995 Lander 1997) ademaacutes del establecimiento de un proceso de validacioacutencomprobando la fiabilidad de los resultados obtenidos (Eisen 1993 Cole et al 1994 Strangert yHeldener 1995) Por estos motivos uno de los intereses principales de los investigadores en elcampo de las tecnologiacuteas del habla ha sido llevar a cabo el etiquetado de forma semi-automaacutetica oidealmente automaacutetica Un primer nivel de transcripcioacuten - tanto de formas canoacutenicas comofonotiacutepica - puede obtenerse automaacuteticamente como acabamos de mencionar a partir de larepresentacioacuten ortograacutefica si se dispone de un conjunto de reglas que establezcan lascorrespondencias entre la representacioacuten ortograacutefica y la foneacutetica

Sin embargo un etiquetado foneacutetico en los niveles de transcripcioacuten maacutes detallada requiere laposibilidad de acceder a la onda sonora y un procedimiento de anaacutelisis de la sentildeal La primeraoperacioacuten que debe realizar un sistema de etiquetado automaacutetico es la segmentacioacuten del continuumsonoro en unidades menores - segmentos o caracteriacutesticas acuacutesticas en funcioacuten del nivel detranscripcioacuten deseado - para pasar despueacutes a la asignacioacuten de etiquetas - siacutembolos detranscripcioacuten - que describan sus caracteriacutesticas Este es el proceso conocido propiamente comoetiquetado (labelling) que cuando se realiza de forma automaacutetica debe superar los obstaacuteculosderivados de la naturaleza no discreta de la sentildeal sonora - resultado de mecanismos como lacoarticulacioacuten - y de la variabilidad de realizaciones foneacuteticas entre hablantes o incluso en unmismo hablante

Para que el corpus sea uacutetil el etiquetado foneacutetico debe estar temporalmente sincronizadocon la sentildeal sonora y con la representacioacuten ortograacutefica operacioacuten que se realiza en el procesoconocido como alineacioacuten temporal (time alignment) llevado a cabo tambieacuten de forma automaacuteticaEsta alineacioacuten puede hacerse de un modo global sentildealando en la onda sonora las fronteras entrepalabras ortograacuteficas - para facilitar el acceso a la grabacioacuten a partir de este nivel de representacioacuten(Lander 1997) - o los puntos en los que se encuentran siacutelabas acentuadas tal como sucede porejemplo en el proyecto MULTEXT

En el campo de las tecnologiacuteas del habla se han llevado a cabo numerosiacutesimos trabajosencaminados al disentildeo de sistemas de segmentacioacuten etiquetado y alineacioacuten temporal automaacuteticasde corpus orales utilizando las teacutecnicas propias del reconocimiento del habla como los Modelosde Markov o las redes neuronales Cabe destacar que tales teacutecnicas no soacutelo son uacutetiles en eldesarrollo de corpus en este aacutembito sino que constituyen una herramienta importante en otrostipos de corpus sin embargo es preciso reconocer que el habla espontaacutenea - especialmente si seha recogido mediante grabaciones realizadas en un entorno natural - plantea auacuten problemas en lo

que se refiere a su transcripcioacuten y etiquetado automaacuteticos pese a los notabiliacutesimos avances quetienen lugar en este campo

6- TRANSCRIPCIOacuteN Y CODIFICACIOacuteN DE CORPUS PARA EL ANAacuteLISIS DE LA LENGUA ORAL

En este uacuteltimo apartado incidiremos en las cuestiones relacionadas con la transcripcioacuten ycodificacioacuten de corpus orales que pueden presentar un mayor intereacutes para aacutembitos como elanaacutelisis de discurso o de la conversacioacuten y para el estudio de la lengua oral en todos los niveles dela descripcioacuten linguumliacutestica Como indicaacutebamos al principio la transcripcioacuten y la codificacioacuten de loselementos transcritos son en principio dos operaciones conceptualmente diferentes Sinembargo en la praacutectica habitual en las disciplinas a las que se refiere este apartado suelen ser dosoperaciones que se realizan simultaacuteneamente ya que al mismo tiempo que se realiza latransliteracioacuten se introducen las marcas necesarias para la codificacioacuten de los elementos que se hadecidido introducir en el corpus Por ello en muchos casos la discusioacuten sobre la transcripcioacuten y lacodificacioacuten se realiza conjuntamente en la bibliografiacutea sobre el tema

61- Los requisitos de una transcripcioacuten

El investigador que decide constituir un corpus de lengua oral se encuentra en estosmomentos con una gran variedad de criterios en lo que se refiere a la transcripcioacuten y a la seleccioacutende los elementos que apareceraacuten codificados en el corpus Hemos hecho ya referencia en elapartado 3 a las diversas convenciones para la representacioacuten ortograacutefica y cintildeeacutendonos al aacutembitodel anaacutelisis del discurso y la conversacioacuten constatamos igualmente la existencia una grandiversidad de propuestas En una revisioacuten de las mismas Payratoacute (1995) hace por ejemploreferencia a los sistemas de transcripcioacuten y codificacioacuten procedentes de la etnometodologiacuteainteresados en reflejar la interaccioacuten verbal a los meacutetodos desarrollados en el marco de laetnografiacutea de la comunicacioacuten y de la sociolinguumliacutestica interaccional4 o a propuestas utilizadas en elestudio del lenguaje infantil Ante tal situacioacuten parece conveniente plantearse cuaacuteles son losrequisitos que debe cumplir una transcripcioacuten de la lengua oral tema que ha sido abordado pordiversos autores (DuBois 1991 Elich 1993 Edwards 1993 OrsquoConnell y Kowal 1994) Trasrevisar aportaciones anteriores Payratoacute (1995) resume los requisitos que teoacutericamente deberiacuteanexigirse a toda transcripcioacuten

bull Neutralidad o fidelidad de modo que la transcripcioacuten no sea interpretativabull Globalidad o complejidad recogiendo la totalidad de los fenoacutemenos que aparecen

en el discurso oralbull Omnifuncionalidad permitiendo diversos usos y aplicacionesbull Claridad tanto desde el punto de vista del aprendizaje del sistema como de la

legibilidad de la representacioacutenbull Universalidad y compatibilidad entre sistemas informaacuteticos

4 Estos sistemas se comparan en OrsquoConnell y Kowal (1994) Pueden encontrarse consideraciones generales sobre latranscripcioacuten y codificacioacuten de la lengua oral en el anaacutelisis del discurso y la conversacioacuten en 1995Ochs (1979) DuBois (1991) Edwards (1992 1993 1995) Du Bois et al (1993) Gumperz y Berenz (1993) Cook (1995) Chafe(1995) y en Sinclair (1995)

Sin embargo puesto que en la praacutectica se transcribe en funcioacuten de los objetivos para losque se ha definido el corpus Payratoacute (1995) considera que un sistema de transcripcioacuten debe serante todo interpretativo de los datos selectivo en cuanto a los fenoacutemenos que se transcribenpertinente para el objeto de investigacioacuten coherente con la base teoacuterica adoptada por elinvestigador fiel en cuanto a la representacioacuten de los datos y flexible para que sea posible suutilizacioacuten en diversos estudios Por otra parte en opinioacuten de este autor la simbologiacutea utilizadadebe ser clara econoacutemica sencilla exenta de ambiguumledad y compatible con sistemas internacionesestandarizados Este uacuteltimo aspecto nos parece especialmente importante ya que como sentildeala elmismo Payratoacute (1995 58)

[] en ninguacuten caso puede olvidarse que los datos de una investigacioacuten no deberiacutean sertratados nunca de forma tan parcial o idiosincraacutesica que se impidiera o dificultara el uso por partede otros investigadores La transcripcioacuten del discurso oral es una actividad suficientementecostosa y conflictiva para tomar precauciones en este sentido y ninguna comunidad cientiacuteficapuede permitirse el lujo de particularismos (en aspectos tan elementales) que obstruyan el debateo conviertan en inaprovechables una fuente de informacioacuten

62- Propuestas de estandarizacioacuten para la transcripcioacuten y codificacioacuten de corpus orales

Ante la diversidad de propuestas para la transcripcioacuten y codificacioacuten de la lengua oral queacabamos de constatar el surgimiento de la linguumliacutestica de corpus y muy especialmente lasnecesidades derivadas del intercambio electroacutenico de textos propiciaron la aparicioacuten de proyectose iniciativas centrados en la creacioacuten de estaacutendares tanto en lo que se refiere a la transcripcioacutencomo a la codificacioacuten En los proacuteximos apartados revisamos sucintamente algunos de ellos

Uno de los capiacutetulos de las Guiacuteas desarrolladas por la TEI estaacute dedicado a la transcripcioacutende corpus orales (Johansson 1995a b) En eacutel se describe la estructura baacutesica de la representacioacutende un texto oral - cabecera texto y divisiones - y se definen los procedimientos basados enSGML para la representacioacuten de los elementos estructurales baacutesicos informacioacuten contextualinformacioacuten temporal enunciados pausas elementos vocalizados semi-leacutexicos o no leacutexicoselementos kineacutesicos otros tipos de eventos comunicativos y texto presentado en forma escrita alhablante Tambieacuten se ofrecen en este capiacutetulo indicaciones para la segmentacioacuten y el alineamientoasiacute como recomendaciones para la transcripcioacuten de superposiciones entre hablantes de formas depalabras prosodia elementos paralinguumliacutesticos - tempo intensidad rango tonal tensioacuten ritmo ycalidad de voz - y alteraciones en el decurso foacutenico Para la representacioacuten de la informacioacutenfoneacutetica se recomienda el uso del AFI En la siguiente tabla se resumen los principales elementospropuestos por la TEI para la codificacioacuten de corpus orales considerados especiacuteficos de este tipode texto (Sperberg-McQueen y Burnard eds 1994)

Elemento codificado Marca decodificacioacutenen SGML

Definicioacuten

Divisiones (division) ltdivgt Unidades intermedias entre el texto y el enunciado que permitendelimitar partes diferenciadas en un texto

Enunciado (utterance) ltugt Segmento de habla comprendido entre dos pausas o delimitado porun cambio en el turno de palabra puede incluir ademaacutesinformacioacuten sobre la superposicioacuten (ltoverlapgt) de turnos cuando

interviene simultaacuteneamente maacutes de un hablantePausa (pause) ltpausegt Interrupcioacuten de la fonacioacuten percibida entre dos enunciados o en el

interior de los mismos puede describirse en teacuterminos relativos oindicando su duracioacuten

Vocal (vocal) ltvocalgt Elemento vocalizado semi-leacutexico o no leacutexico (pej pausas llenas otoses)

Kineacutesico (kinesic) ltkinesicgt Cualquier fenoacutemeno comunicativo no vocal (p ej gestos)Acontecimiento (event) lteventgt Cualquier fenoacutemeno identificado en la grabacioacuten no necesariamente

vocalizado ni con valor comunicativo (p ej ruidos de fondo)Texto escrito (writing) ltwritinggt Texto escrito que se presenta al hablante durante su intervencioacutenCambio (shift) ltshiftgt Momento en el que se produce un cambio en alguno de los rasgos

paralinguumliacutesticos - calidad de voz intensidad rango tonal ritmo yvelocidad de elocucioacuten - cada uno de los rasgos puede describirsemediante una lista de caracteriacutesticas

Tabla 1 Elementos codificados en las transcripciones de lengua oral seguacuten los estaacutendares de la TEI(Adaptada de Sperberg-McQueen y Burnard eds1994)

Por otra parte la TEI ofrece mecanismos para indicar el comienzo y el final de unfenoacutemeno su duracioacuten y su sincronizacioacuten temporal con otros elementos presenta tambieacuten laposibilidad de marcar unidades inferiores al enunciado - segmentos ltseggt - que permitendelimitar por ejemplo unidades prosoacutedicas e incluye tambieacuten entre sus propuestas las marcasnecesarias para sentildealar fenoacutemenos propios de la lengua hablada como palabras truncadasrepeticiones falsos principios - marcados como ltdelgt (deletion) y especificando el fenoacutemeno -Las partes de la grabacioacuten que el transcriptor no llega a interpretar correctamente - ltuncleargt - ono puede escuchar - ltgapgt - o las correcciones de errores de produccioacuten realizadas por eltranscriptor - ltsicgt para delimitar el error y ltcorrgt para indicar la correccioacuten - son tambieacutenelementos para los cuales la TEI establece marcas de codificacioacuten

Aunque las Guiacuteas de la TEI pueden considerarse un sistema adecuado para la transcripcioacuteny codificacioacuten de gran variedad de materiales los autores propios autores reconocen que

[] the present proposals are not intended to support unmodified every variety of researchundertaken upon spoken material now or in the future some discourse analysts phonologistsand doubtless other may wish to extend the scheme presented here to express more precisely theset of distinctions they wish to draw in their transcriptions Speech regarded as a purely acousticphenomenon may well require different methods from those outlined here as may speechregarded solely as a process of social interaction (Sperberg-McQueen y Burnard eds 1994 cap11)

El proyecto NERC - Network of European Reference Corpora (NERC 1994) se planteoacutecomo uno de sus objetivos la viabilidad de desarrollar una serie de recomendaciones para laconstitucioacuten de corpus y por tanto incluye entre sus resultados indicaciones sobre el tratamientode los corpus orales tanto en lo que se refiere a su codificacioacuten como a la transcripcioacuten de loselementos segmentales y suprasegmentales (Sinclair 1994) El sistema adoptado para latranscripcioacuten y codificacioacuten de corpus se basa como hemos indicado anteriormente en eldesarrollado por French (1991 1992) para la transcripcioacuten del corpus oral desarrollado en elproyecto COBUILD La transcripcioacuten se plantea como una operacioacuten que puede desarrollarse envarios niveles

bull Nivel I consiste en la representacioacuten ortograacutefica introduciendo los miacutenimossignos de puntuacioacuten necesarios sin informacioacuten sobre la interaccioacuten entre hablantes Eneste nivel se contemplan convenciones desarrolladas para la representacioacuten ortograacutefica ypara precisar el uso de la puntuacioacuten

bull Nivel II consiste en una representacioacuten ortograacutefica enriquecida con informacioacutenbaacutesica sobre la identidad de los hablantes el turno de palabra y los elementos no verbales

bull Nivel III contiene toda la informacioacuten presente en el nivel II ademaacutes deinformacioacuten sobre la interaccioacuten entre hablantes - marcando el principio y el final de lossolapamientos - y sobre la entonacioacuten - sentildealando las fronteras entre unidades tonales ylas siacutelabas acentuadas- En opinioacuten de French (1992) la transcripcioacuten a este nivel requiereuna formacioacuten especiacutefica en foneacutetica

bull Nivel IV constituye el nivel maacutes detallado de representacioacuten incluyendo lainformacioacuten propia del nivel III junto con marcas de tonos siacutelabas nucleares y con unatranscripcioacuten fonoloacutegica alineada con una representacioacuten acuacutestica - espectrograma y curvameloacutedica - del enunciado

La recomendacioacuten del proyecto NERC es que la transcripcioacuten de un corpus para el estudiode la lengua oral se lleve a cabo seguacuten las especificaciones del Nivel II adecuado seguacuten Frenchpara todas aquellas investigaciones que no requieran informacioacuten prosoacutedica

En el marco de NERC se llevoacute tambieacuten a cabo una evaluacioacuten de las Guiacuteas de la TEI para latranscripcioacuten de corpus orales de la que se concluye que ldquoThe TEI proposals are broadlycompatible with current practice in the user community as represented by JP Frenchconventions Furthermore in the majority of cases it will be a straightforward matter to link themachine-friendly TEI codes to the more user-friendly encoding systems such as JP Frenchconventions by means of a simple conversion programmerdquo (Payne 199260) La idea de unaconversioacuten automaacutetica entre las transcripciones realizadas seguacuten las propuestas de NERC y de laTEI es naturalmente interesante y refuerza la idea de que existe una compatibilidad general entreambos sistemas (Payne 1992 Johansson 1995a EAGLES 1996) prueba de ello es que en elinforme final de NERC se recomienda el uso de las normas de la TEI

Uno de los objetivos del Grupo de Trabajo sobre Textos Orales de EAGLES fue proponerun conjunto miacutenimo de fenoacutemenos que deberiacutean codificarse en cualquier texto oral La propuestarealizada se describe en EAGLES (1996) y toma elementos del proyecto NERC de la TEI y delGrupo de Trabajo sobre Lengua Oral de EAGLES Considerando los elementos comunes a lossistemas que sirven de base se sugiere que la codificacioacuten de un texto oral debe contener almenos informacioacuten sobre los siguientes aspectos

(1) Elementos vocales y no vocalesbull Elementos vocales semi-leacutexicos

Pertenecen a esta categoriacutea los elementos utilizados principalmente en elhabla espontaacutenea durante los momentos en que el hablante planifica lacontinuacioacuten de su discurso como las llamadas ldquopausas llenasrdquo o ldquosonorasrdquo y los

elementos que marcan dudas en el momento de la produccioacuten del hablaCorresponden a los elementos que en la TEI se marcan con la etiqueta ltvocalgtbull Elementos vocales no leacutexicos

Se incluyen aquiacute todo tipo de sonidos producidos por el hablante - tosesrisas bostezos estornudos etc - que no constituyen formas leacutexicas de la lenguaCorresponden igualmente a los codificados con la marca ltvocalgt en la TEIbull Acontecimientos no vocales y no comunicativos

Comprenden los ruidos producidos por otros hablantes o procedentes delentorno de grabacioacuten Estos acontecimientos se codifican en la TEI mediante lamarca lteventgt

(2) Elementos necesarios en la transcripcioacuten de interacciones verbalesbull Identidad del hablante

Este es un elemento imprescindible en la transcripcioacuten de interaccionesverbales La TEI dispone de los mecanismos para documentar informacioacuten sobrelos hablantes en la cabecera de los textos asiacute como de un sistema para marcar laidentidad de cada participante en el interior del texto aunque pueden utilizarsetambieacuten otros procedimientosbull Turnos de palabra

La finalidad del marcado de los turnos de palabra es indicar un cambio dehablante Ademaacutes de las convenciones de la TEI pueden emplearse otrosprocedimientos mientras se mantenga esta informacioacuten esencial en el estudio de lainteraccioacuten verbalbull Superposicioacuten de turnos de palabra

Existen igualmente diferentes procedimientos para marcar la superposicioacutende emisiones de dos hablantes ademaacutes de las propuestas de la TEI que los tratacomo parte de las estrategias para codificar acontecimientos simultaacuteneos

(3) Elementos relacionados con la actuacioacuten del hablantebull Omisiones en un texto leiacutedo

Si se transcribe un texto leiacutedo y se dispone del original es recomendableanotar las palabras o segmentos omitidos por el locutorbull Autocorrecciones

Es propio del habla espontaacutenea aunque tambieacuten de la lectura que loshablantes realicen correcciones de su propia produccioacuten linguumliacutestica (self-repairs)Parece conveniente marcarlas en la transcripcioacuten de un corpus oralbull Fragmentos de palabras

Los fragmentos de palabras corresponden a uno o maacutes segmentospertenecientes a una palabra que no ha sido totalmente pronunciada por el hablanteen un primer intento y que suelen repetirse cuando eacuteste consigue producir lapalabra completa Es importante indicar este fenoacutemeno en la transcripcioacuten

bull Fragmentos ininteligiblesSe trata de partes de la grabacioacuten que no son comprendidas por el

transcriptor y en la TEI se codifican con la etiqueta ltuncleargt aunque si se desease pueden utilizar marcas maacutes detalladas distinguiendo entre transcripcionescompletamente ininteligibles y entre una posible interpretacioacuten ofrecida por eltranscriptor

Un aspecto conflictivo sigue siendo la identificacioacuten de los enunciados que conforman untexto oral (Schuetze-Coburn 1991) Mientras que en un texto escrito los signos de puntuacioacutenconstituyen un criterio de delimitacioacuten en el habla disponemos de indicios como las pausas laentonacioacuten o el cambio de turno de palabra que nos permiten al menos convencionalmentedefinir un enunciado Sin embargo hasta el momento no se han desarrollado auacuten criteriosobjetivos y consistentes para resolver este problema

7- CONCLUSIONES

La revisioacuten - sin pretensiones de exhaustividad - de los principales sistemas detranscripcioacuten etiquetado y codificacioacuten de corpus orales expuesta en este trabajo pone demanifiesto en primer lugar la multiplicidad de propuestas desarrolladas frente a los intentos deestandarizacioacuten algunos de los cuales auacuten no se han consolidado plenamente pese a su crecienteaceptacioacuten En segundo lugar destaca tambieacuten la heterogeneidad de tradiciones que confluyen enel estudio de la lengua hablada desde la foneacutetica y las tecnologiacuteas del habla hasta el anaacutelisis deldiscurso y de la conversacioacuten diversidad que lleva a la creacioacuten de convenciones especiacuteficas pararesponder a las necesidades de diversas comunidades cientiacuteficas Ante esta situacioacuten la distincioacutenpropuesta por Sinclair (1995107) entre ldquoconformidadrdquo y ldquocompatibilidadrdquo adquiere todo susentido ya que si en ciertos casos la conformidad a un estaacutendar determinado es problemaacutetica porlas limitaciones inherentes a todo sistema comuacuten la compatibilidad - entendida como la facilidadde conversioacuten entre sistemas - deberiacutea ser en cambio un requisito imprescindible en el desarrollode los recursos linguumliacutesticos De esta manera puede tal alcanzarse el equilibrio entre lasnecesidades de un proyecto y las indudables ventajas cientiacuteficas y econoacutemicas que resultan de lareutilizacioacuten de los datos disponibles

BIBLIOGRAFIacuteA

Allen GD 1988 The PHONASCII System Journal of the International PhoneticAssociation 181 9-25

Anderson AH M Badger EG Bard E Boyle G Doherty S Garrod S Isard JKowtko J Mcallister J Miller C Sotillo HS Thompson y R Weinert 1991 The HCRCMap Task corpus Language and Speech 344 351-366

Autesserre D G Peacuterennou y M Rossi 1989 Methodology for the transcription andlabeling of a speech corpus Journal of the International Phonetic Association 191 2-15

Barry WJ y AJ Fourcin 1992 Levels of Labelling Computer Speech and Language 61-14

Beckman ME y GM Ayers GM 1994 Guidelines for ToBI Labelling Version 20February 1994[Documento de Internet disponible en httplingohio-stateeduPhoneticsToBIToBI0html]

Beckman ME y J Hirschberg J 1994 The ToBI Annotation Conventions Apeacutendice A deME Beckman y GM Ayers 1994 Guidelines for ToBI Labelling Version 20 February 1994[Documento de Internet disponible en httplingohio-stateeduPhoneticsToBIToBI0html]

Bruce G 1988 23 Supasegmental categories and 24 The symbolization of temporalevents Journal of the International Phonetic Association 182 75-76

Bruce G 1989 Report from the IPA working group on suprasegmental categories LundUniversity Department of Linguistics General Linguistics Phonetics Working Papers 35 25-40

Burnard L 1995 What is SGML and how does it help Computers and the Humanities291 41-50 The Text Encoding Initiative Background and Context Eds N Ide y J VeacuteronisDordrecht Kluwer Academic Publishers

Burnard L 1995a Text Encoding for Information Exchange An Introduction to the TextEncoding Initiaive TEI Document TEI J31 [Documento de Internet disponible enhttpwwwuiceduorgsteiinfoteij31]

Burnard L 1995b The Text Encoding Initiative an overviewrdquo Spoken English onComputer Transcription Markup and Applications Eds G LEECH G MYERS y JTHOMAS Harlow Longman 69-81

Chafe W 1995 Adequacy user-friendliness and practicality in transcribingrdquo English onComputer Transcription Markup and Applications Eds G Leech G Myers y J ThomasHarlow Longman 54-61

Chan D A Fourcin D Gibbon B Granstroumlm M Huckvale G Kokkinakis K KvaleL Lamel B Lindberg A Moreno J Mouropoulos F Senia I Trancoso C Veld y J Zeiliger1995 EUROM - A Spoken Language Resource for the EU Eurospeech95 Proceedings of the4th European Conference on Speech Communication and Speech Technology Madrid Spain 18-21 September 1995 Vol 1 867-870

Cole RA BT Oshika M Noel T Lander y M Fanty 1994 Labeler Agreement inPhonetic Labeling of Continuous Speech Proceedings of the 1994 International Conference onSpoken Language Processing Yokohama Japan 18-22 September 1994[Documento de Internet disponible en httpwwwcseogieduCSLUcorporapapershtml]

Cook G 1995 Theoretical issues transcribing the untranscribablerdquo Spoken English onComputer Transcription Markup and Applications Eds G Leech G Myers y J ThomasHarlow Longman 35-53

Du Bois JW 1991 Transcription design principles for spoken discourse researchPragmatics 1 71-106

Du Bois JW S Schuetze-Coburn S Cumming y D Paolino 1993 Outline of discoursetranscriptionrdquo Talking Data Transcription and Coding in Discourse Research Eds JAEdwards y MD Lampert Hillsdale NJ Lawrence Erlbaum Associates 45-90

EAGLES 1996 Preliminary Recommendations on Spoken Texts EAGLES DocumentEAG-TCWG-STPP May 1996[Documento de Internet disponible enhttpwwwilcpicnritEAGLES96spokentxspokentxhtml]

Edwards JA 1992 Design principles in the transcription of spoken discourserdquoDirections in Corpus Linguistics Proceedings of Nobel Symposium 82 Stockholm 4-8 August1991 Ed J Svartvik Berlin Mouton de Gruyter 129-147

Edwards JA 1993 Principles and Contrasting Systems of Discourse TranscriptionrdquoTalking Data Transcription and Coding in Discourse Research Eds JA Edwards y MDLampert Hillsdale Hillsdale NJ Lawrence Erlbaum Associates 3-32

Edwards JA 1995 Principles and alternative systems in the transcription coding andmark-up of spoken discourserdquo Spoken English on Computer Transcription Markup andApplications Eds G Leech G Myers y J Thomas Harlow Longman 19-34

Ehlich K 1993 HIAT A Transcription System for Discourse Datardquo Talking DataTranscription and Coding in Discourse Research Eds JA Edwards y MD Lampert HillsdaleNJ Lawrence Erlbaum Associates 123-148

Eisen B 1993 Reliability of speech segmentation and labelling at different levels oftranscription Eurospeech93 3rd European Conference on Speech Communication andTechnology Berlin Germany 21-23 September 1993 Vol 1 673-676

Esling JH y H Gaylord 1993 Computer Codes for Phonetic Symbols Journal of theInternational Phonetic Association 232 77-82

Esling JH 1988 Computer coding of IPA symbols and detailed phonetic representationsof computer databases Journal of the International Phonetic Association 182 99-106

Esling JH 1990 Computer Coding of the IPA Supplementary Report Journal of theInternational Phonetic Association 201 22-26

Fourcin A y JM Dolmazon (on behalf of the SAM Project) 1991 Speech knowledgestandards and assessment Actes du XIIegraveme Congregraves International des Sciences Phoneacutetiques 19-24 aoucirct 1991 Aix-en-Provence France Aix-en-Provence Universiteacute de Provence Service desPublications Vol 5 430-433

Fourcin A G Harland W Barry y V Hazan eds 1989 Speech Input and OutputAssessment Multilingual Methods and Standards Chichester Ellis Horwood Ltd

French JP 1991 Updated notes for soundprint transcribers Working paper Universityof Birmingham October 1991 NERC-WP4-47

French JP 1992 Transcription proposals multilevel system Working paper Universityof Birmingham October 1992 NERC-WP4-50

Gibbon D 1989 Survey of Prosodic Labelling for EC Languages SAM-UBI-190 12February 1989 Report e6 in ESPRIT 2589 (SAM) Interim Report Year 1 Ref SAM-UCLG002 University College London February 1990

Gibbon D R Moore y R Winski eds 1997 Handbook on Standards and Resources forSpoken Language Systems Berlin Mouton De Gruyter [Documento de Internet disponible en httpcoralliliuni-bielefelddeEAGLESeagbookeagbookhtml]

Groslashnnum Thorsen N 1987 Suprasegmental transcription ARIPUC - Annual Report ofthe Institute of Phonetics University of Copenhagen 21 1-27

Gumperz JJ y J Berenz 1993 Transcribing Conversational Exchangesrdquo Talking DataTranscription and Coding in Discourse Research Eds JA Ewards y M D Lampert HillsdaleNJ Lawrence Erlbaum Associates 91-122

Hart J lsquoT R Collier y A Cohen 1990 A Perceptual Study of Intonation An Experimental- Phonetic Approach to Intonation Cambridge Cambridge University Press (Cambridge Studiesin Speech Science and Communication)

Hess W K Kohler y HG Tillmann 1995 The PhonDat-Verbmobil Speech CorpusEurospeech95 Proceedings of the 4th European Conference on Speech Communication andSpeech Technology Madrid Spain 18-21 September 1995 Vol 1 863-866

Hieronymus JL 1994 ASCII phonetic symbols for the worlds languages WorldbetATampT Bell Laboratories Technical Memo [Documento de Internet disponible enhttpwwwcseogieduCSLUcorporapapershtml]

Hirst D A Di Cristo y R Espesser en prensaLevels of representation and levels ofanalysis for intonation Prosody Theory and Experiments Ed M Horne Dordrecht Kluwer

Hirst DJ y A Di Cristo en prensa A survey of intonation systemsrdquo IntonationSystems A Survey of 20 Languages Eds D Hirst y A Di Cristo Cambridge CambridgeUniversity Press

Hirst DJ 1991 Intonation models towards a third generation Actes du XIIegraveme CongregravesInternational des Sciences Phoneacutetiques 19-24 aoucirct 1991 Aix-en-Provence France Aix-en-Provence Universiteacute de Provence Service des Publications Vol 1 305-310

Hirst DJ A Di Cristo M Le Besnerais Z Najim P Nicolas y P Romeacuteas 1993Multilingual modelling of intonation patternsrdquo Proceedings of an ESCA Workshop on ProsodySeptember 27-29 1993 Lund Sweden Eds D House y P Touati Lund University Departmentof Linguistics and Phonetics Working Papers 41 204-207

Hirst DJ N Ide y J Veacuteronis 1994 Coding fundamental frequency patterns for multi-lingual synthesis with INTSINT in the MULTEXT project Conference Proceedings of theSecond ESCAIEEE Workshop on Speech Synthesis September 12-15 1994 Mohonk MountainHouse New Paltz New York USA 77-80

Ide N y J Veacuteronis eds 1995 The Text Encoding Initiative Background and ContextsComputers and the Humanities 29 1-3 Publicado en forma de libro en Dordrecht KluwerAcademic Publishers

IPA 1989 The IPA 1989 Kiel Convention Workgroup 9 report Computer Coding of IPAsymbols and Computer Representation of Individual Languages Journal of the InternationalPhonetic Association 192 81-92

IPA 1993 IPA Chart revised to 1993 Journal of the International Phonetic Association231 [Documento de Internet disponible en httpwwwartsglaacukIPAipacharthtml]

IPA 1995 Preview of the IPA Handbook Journal of the International Phonetic Association251

ISO 8879 1986 Information Processing Text and Office Systems Standard GeneralizedMarkup Language (SGML) Geneva International Organization for Standardization

Johansson S 1995a The approach of the Text Encoding Initiative to the encoding ofspoken discourse Spoken English on Computer Transcription Markup and Applications EdsG Leech G Myers y J Thomas Harlow Longman 82-98

Johansson S 1995b The Encoding of Spoken Texts Computers and the Humanities291 149-158 The Text Encoding Initiative Background and Context Eds N Ide y J VeacuteronisDordrecht Kluwer Academic Publishers 149-158

Keating P P MacEachern A Shryock y S Domiacutenguez 1994 A manual for phonetictranscription Segmentation and labelling of words in spontaneous speech UCLA WorkingPapers in Phonetics 88 91-120

Kluger-Kruse M 1987 Computer Phonetic Alphabet ESPRIT Linguistic Analysis of theEuropean Languages Report BU-CPA0267 July 1987

Krot C y B Taylor 1995 Criteria for Acoustic-Phonetic Segmentation and WordLabelling in the Australian National Database of Spoken Language[Documento de Internet disponible en httpwwwshlrcmqeduaucriteriahtml]

Lander T 1997 The CSLU Labeling Guide Center for Spoken Language UnderstandingOregon Graduate Institute[Documento de Internet disponible en httpwwwcseogieduCSLUcorporapapershtml]

Llisterri J 1994 Prosody Encoding Survey WP 1 Specifications and Standards T15Markup Specifications Deliverable 153 Final version 15 September 1994 LRE Project 62-050MULTEXT

Llisterri J ed 1996 Prosody Tools Efficiency and Failures WP 4 Corpus T46 SpeechMarkup and Validation Deliverable 452 Final version 15 October 1996 LRE Project 62-050MULTEXT

MacWhinney B 1991The CHILDES Project Tools for Analyzing Talk Hillsdale NJLawrence Erlbaum

Marchal A N Nguyen y W Hardcastle 1995 Multitiered phonetic approach to speechlabelling Levels in Speech Communication Relations and Interactions A Tribute to MaxWajskop Hommage agrave Max Wajskop Eds C Sorin J Mariani H Meloni y J SchoengenAmsterdam Elsevier Science BV 149-158

NERC 1994 NERC-1 Network of European Reference Corpora Final Report PisaInstituto di Linguistica Computazionale - CNR January 1994 versioacuten en curso de publicacioacutenTowards a Network of European Reference Corpora Eds N Calzolari M Baker y PG KruytPisa Giardini

Nicolas P y D Hirst 1995 Symbolic coding of Higher-Level Characteristics ofFundamental Frequency Curvesrdquo Eurospeech95 Proceedings of the 4th European Conferenceon Speech Communication and Technology Madrid Spain 18-21 September 1995 Vol 2 989-992

OConnell DC y S Kowal 1994 Some Current Transcription Systems for SpokenDiscourse A critical Analysis Pragmatics 4 81-107

Ochs E 1979 Transcription as Theory Developmental Pragmatics Eds E Ochs E yBB Schieffelin New York Academic Press 43-72

Payne J 1992 Report on the compatibility of JP Frenchs spoken corpus transcriptionconventions with the TEI guidelines for transcription of spoken texts Working paper COBUILDBirmingham and IDS Mannheim December 1992 NERC-WP8WP4-122

Payne J 1995 The COBUILD spoken corpus transcription conventions SpokenEnglish on Computer Transcription Markup and Applications Eds G Leech G Myers y JThomas Harlow Longman 203-207

Payratoacute Ll 1995 Transcripcioacuten del discurso coloquialrdquo El espantildeol coloquial Actas del ISimposio sobre Anaacutelisis del Discurso Oral Almeriacutea 23-25 de noviembre de 1994 Ed L CorteacutesRodriacuteguez Almeriacutea Universidad de Almeriacutea Servicio de Publicaciones 43-70

Pierrehumbert J B 1897 (1980) The Phonology and Phonetics of English IntonationPhD Thesis Department of Linguistics MIT Bloomington Indiana University Linguistics Club

Pitrelli J M Beckman y J Hirschberg 1994 Evaluation of prosodic transcriptionlabelling reliability in the ToBI frameworkrdquo Proceedings of the Third International Conference onSpoken Language Processing Yokohama ICSLP Vol 2 123-126

Pullum GK y WA Ladusaw 1996 (1986) Phonetic Symbol Guide Chicago TheUniversity of Chicago Press 2nd edition

Roach P H Roach A Dew y P Rowlands 1990 Phonetic analysis and the automaticsegmentation and labeling of speech sounds Journal of the International Phonetic Association201 15-21

Schmidt MS C Scott y MA Jack 1993 Phonetic transcription standards for Europeannames (ONOMASTICA) Eurospeech93 3rd European Conference on Speech Communicationand Technology Berlin Germany 21-23 September 1993 Vol 1 279-282

Schuetze-Coburn S 1991Units of intonation in discourse a comparison of acoustic andauditory analysis Language and Speech 343 207-234

Selting M 1987 Descriptive categories for the auditive analysis of intonation inconversation Journal of Pragmatics 11 777-791

Selting M 1988 The role of intonation in the organisation of repair and problem handlingsequences in conversation Journal of Pragmatics 12 293-322

Senia F y JG Van Velden 1997 Specifications of orthographic transcription and lexiconconventions LRE-4001 SpeechDat Technical Report SD132 Final version 10 January 1997[Documento de Internet disponible en httpwwwphonetikuni-muenchendeSpeechDathtml]

Silverman K M Beckman J Pitrelli M Ostendorf C Wightman P Price JPierrehumbert y J Hirschberg 1992 TOBI A standard for labelling English prosodyProceedings of the Second International Conference on Spoken Language Processing ICSLP-92Banff October 1992 867-870

Sinclair J 1994 Spoken Language [3B] PhoneticPhonemic and Prosodic Annotation[52] NERC 1994 NERC-1 Network of European Reference Corpora Final Report PisaVersioacuten en curso de publicacioacuten Towards a Network of European Reference Corpora Eds NCalzolari M Baker y PG Kruyt Pisa Giardini

Sinclair J 1995 From theory to practicerdquo Spoken English on Computer TranscriptionMarkup and Applications Eds G Leech G Myers Y J Thomas Harlow Longman 99- 112

Sperberg-McQueen CM y L Burnard eds 1994 Guidelines for Electronic Text Encodingand Interchange TEI P3 Chicago and Oxford Association for Computational Linguistics Association for Computers and the Humanities Association for Literary and LinguisticComputing [Cap 11 Transcriptions of Speech] [Documento de Internet disponible enhttpetextvirginiaeduTEIhtml]

Strangert E y M Heldner 1995 Labelling of boundaries and prominences byphonetically experienced and non-experienced transcribers Phonum 3 Reports from theDepartment of Phonetics Umearing University 85-109 [Documento de Internet disponible enhttpwwwlingumusefonphonum3html]

Teubert W 1993 Phonetic Phonemic and Prosodic Annotation Final Report IDSMannheim February 1993 NERC-WP8-171

Tillmann HG y B Pompino-Marschall 1993 Theoretical Principles ConcerningSegmentation Labelling Strategies and Levels of Categorical Annotation for Spoken LanguageDatabase Systems Eurospeech93 3rd European Conference on Speech Communication andTechnology Berlin Germany 21-23 September 1993 Vol 3 1691-1694

Trancoso I 1995 The ONOMASTICA Interlanguage Pronunciation LexiconrdquoEurospeech95 Proceedings of the 4th European Conference on Speech Communication andTechnology Madrid Spain 18-21 September 1995 Vol 1 829-832

Wells JC 1987 Computer Coded Phonetic Transcription Journal of the InternationalPhonetic Association 172 94-114

Wells JC 1989 Computer-coded phonemic notation of individual languages of theEuropean Community Journal of the International Phonetic Association 191 31-54

Wells JC 1994 Computer-coding the IPA a proposed extension of SAMPA SpeechHearing and Language Work in Progress 1994 (University College London Department ofPhonetics and Linguistics) 8 271-289

Wells JC 1995 SAMPROSA (SAM Prosodic Transcription [Documento de Internetdisponible en httpwwwphonuclacukhomesampasamprosahtm]

Wells JC W Barry M Grice A Fourcin y D Gibbon 1992 Standard Computer-Compatible Transcription SAM Stage Report Sen3 SAM UCL-037 28 February 1992 SAM(1992) Esprit Project 2589 (SAM) Multilingual Speech InputOutput AssessmentMethodologyand Standardisation Final Report Year Three 1III91-28II1992 London University CollegeLondon

Wesenick M-B y F Schiel 1995 Feasibility of Automatic Annotation and BuildingPronunciation Lexica from Corpus Material LRE-63314 SpeechDat Report D3123 Finalversion 10 October 1995[Documento de Internet disponible en httpwwwicpgrenetfrSpeechDathomehtml]

Winski R R Moore y D Gibbon 1995 EAGLES Spoken Language Working GroupOverview and Resultsrdquo Eurospeech95 Proceedings of the 4th European Conference on SpeechCommunication and Speech Technology Madrid Spain 18-21 September 1995 Vol 1 841-844[Documento de Internet disponible en httpcoralliliuni-bielefeldde~gibbonEAGLESrwpaperrwpaperhtml]

  • 1- INTRODUCCIOacuteN
  • 2- NIVELES DE REPRESENTACIOacuteN ETIQUETADO Y CODIFICACIOacuteN
  • 3- REPRESENTACIOacuteN ORTOGRAacuteFICA DE CORPUS ORALES
  • 31- Propuestas para la representacioacuten ortograacutefica de corpus orales en el aacutembito de la linguumliacutestica de corpus
  • 32- Propuestas para la representacioacuten ortograacutefica de corpus orales en el aacutembito de las tecnologiacuteas del habla
  • 4- REPRESENTACIOacuteN FONEacuteTICA DE CORPUS ORALES
  • 41- La representacioacuten foneacutetica de los elementos segmentales
  • 42- La representacioacuten foneacutetica de los elementos suprasegmentales
  • 5- ETIQUETADO FONEacuteTICO DE CORPUS ORALES
  • 51- Niveles de etiquetado foneacutetico de corpus orales
  • 52- La transcripcioacuten y el etiquetado automaacutetico de corpus orales
  • 6- TRANSCRIPCIOacuteN Y CODIFICACIOacuteN DE CORPUS PARA EL ANAacuteLISIS DE LA LENGUA ORAL
  • 61- Los requisitos de una transcripcioacuten
  • 62- Propuestas de estandarizacioacuten para la transcripcioacuten y codificacioacuten de corpus orales
  • 7- CONCLUSIONES
  • BIBLIOGRAFIacuteA
Page 2: Transcripción, etiquetado y codificación de corpus orales

2- NIVELES DE REPRESENTACIOacuteN ETIQUETADO Y CODIFICACIOacuteN

Tanto si es oral como escrito un corpus puede concebirse como un conjunto estructuradode materiales linguumliacutesticos en el que se distinguen diversos niveles de representacioacutencorrespondientes a diferentes grados de elaboracioacuten de los datos que lo constituyen Elestablecimiento de estos niveles es una de las tareas que se llevan a cabo en la fase de definicioacutendel corpus y responde loacutegicamente a los objetivos del mismo

Para cada nivel de representacioacuten suele establecerse un conjunto de ldquoetiquetasrdquo que seasocian a un determinado fragmento del corpus - un segmento sonoro una unidad prosoacutedica unapalabra etc - y definen sus propiedades El etiquetado conlleva un enriquecimiento del corpusmediante informacioacuten adicional introducida por el investigador en funcioacuten de sus objetivos y loque es maacutes importante de su interpretacioacuten linguumliacutestica de los materiales recogidos Elestablecimiento del inventario de etiquetas - estrechamente relacionado con los fenoacutemenos quedesean anotarse en un corpus - y las caracteriacutesticas que se sentildealan con cada una de ellas no es enabsoluto una tarea trivial especialmente en el marco de proyectos multilinguumles que deben cubrirsimultaacuteneamente las necesidades de varias lenguas

Finalmente es preciso definir en el proceso de creacioacuten de recursos linguumliacutesticos un sistemao esquema de codificacioacuten tanto de los fenoacutemenos representados en los diferentes niveles delcorpus como de sus correspondientes etiquetas La codificacioacuten constituye pues tal como seconcibe en la actualidad una herramienta que dota al corpus de una estructura Un esquema decodificacioacuten adecuado permite entre otras cosas mantener una distincioacuten entre los datos y suforma de representacioacuten que es uacutetil cuando se requiere el intercambio de corpus o su reutilizacioacutenen otros proyectos Por ello es esencial a la hora de disentildear tal esquema considerar sistemas quecumplan este requisito entre los cuales destaca el SGML (Standard Generalized MarkupLanguage) un lenguaje jeraacuterquico de codificacioacuten plenamente estandarizado (ISO 8879 Burnard1995)

En el caso de un corpus oral el primer nivel de representacioacuten necesario es el de latranscripcioacuten Esto responde a la exigencia de materializar o fijar la informacioacuten linguumliacutestica ycomunicativa presente en una sentildeal sonora esencialmente transitoria Tal como la caracterizaPayratoacute (199545) la transcripcioacuten es ldquoun procedimiento de traslado o transposicioacuten a una formagraacutefica (escrita) de una produccioacuten (linguumliacutestica discursiva) originariamente oralrdquo Atendiendo aesta definicioacuten podemos referirnos tanto a la transcripcioacuten ortograacutefica como a la transcripcioacutenfoneacutetica que se lleva a cabo mediante un conjunto de siacutembolos especialmente disentildeados para talfin En los apartados que siguen centraremos nuestra atencioacuten en estos dos niveles derepresentacioacuten el ortograacutefico y el foneacutetico considerando tambieacuten algunos aspectos relativos aletiquetado en el nivel foneacutetico

3- REPRESENTACIOacuteN ORTOGRAacuteFICA DE CORPUS ORALES

Uno de los primeros problemas a los que se enfrenta un investigador en el momento deconstituir un corpus oral es evidentemente el de la representacioacuten ortograacutefica Estarepresentacioacuten constituye una transcripcioacuten de los enunciados producidos por los hablantesutilizando la ortografiacutea convencional o dicho en otras palabras una transliteracioacuten Puesto que se

trata de un nivel de representacioacuten comuacuten a todo tipo de corpus orales sea cual sea su aplicacioacutense han realizado una notable cantidad de propuestas en lo que concierne a la forma escrita de loscorpus orales En el informe del Grupo de Trabajo sobre Textos Orales de EAGLES - cuyosprincipales elementos se retoman a continuacioacuten - se revisan algunas de ellas incluyendo las queproceden del proyecto NERC en la tradicioacuten de la linguumliacutestica de corpus y las que se derivan deproyectos en el aacutembito de las tecnologiacuteas del habla como SpeechDat o las desarrolladas en elpropio aacutembito de EAGLES

31- Propuestas para la representacioacuten ortograacutefica de corpus orales en el aacutembito de lalinguumliacutestica de corpus

En el marco del proyecto NERC - Network of European Reference Corpora (NERC 1994) seadoptaron para la representacioacuten ortograacutefica de corpus orales las convenciones desarrolladas porFrench (1991 1992) esencialmente concebidas para ser utilizadas en la constitucioacuten de la parteoral del corpus COBUILD (Payne 1995) En ellas se detalla el uso de los signos de puntuacioacuten -por ejemplo no se utilizan comas entre frases y se emplean puntos para delimitar frases - de lasmayuacutesculas - uacutenicamente al inicio de frase - o de los apoacutestrofes y las contracciones

Por su parte en el informe del Grupo de Trabajo sobre Textos Orales de EAGLES - ExpertAdvisory Group on Language Engineering Standards (EAGLES 1996) se proponen unasrecomendaciones baacutesicas para la transcripcioacuten ortograacutefica de corpus orales recogiendo tanto lassugerencias de NERC como algunas de las ideas desarrolladas en el aacutembito de las tecnologiacuteas delhabla que se discuten en el proacuteximo apartado Las recomendaciones pueden resumirse en trespuntos

bull Se recomienda utilizar siempre que sea posible las formas ortograacuteficas queaparecen en los diccionarios normativos o estaacutendares para cada lengua convencioacuten que seaplica tambieacuten a contracciones formas reducidas apoacutestrofes formas dialectalesinterjecciones y formas semi-leacutexicas

bull Si puede darse maacutes de una forma ortograacutefica de la misma palabra o si se introducenrepresentaciones ortograacuteficas que no aparecen en los diccionarios es recomendablemantener una base de datos con las formas utilizadas en la transcripcioacuten

bull Los nuacutemeros las abreviaturas los acroacutenimos y las palabras deletreadas debenrepresentarse ortograacuteficamente tal como son pronunciadas por el hablante utilizando laforma ortograacutefica completa

Como puede observarse eacutestas son recomendaciones generales que constituyen principiosbaacutesicos Un aspecto que requiere una discusioacuten maacutes detallada es el empleo de los signos depuntuacioacuten en la transcripcioacuten ortograacutefica de corpus tema sobre el que existen diversas posturasdesde las que propugnan su completa eliminacioacuten - lo que disminuye notablemente la legibilidaddel texto - hasta las que abogan por su uso seguacuten las normas habituales de cada lengua Taldiversidad de opiniones es obviamente debida a las dificultades que plantea la introduccioacuten depuntuacioacuten en transcripciones de habla espontaacutenea ya que implica necesariamente unasegmentacioacuten del enunciado que en algunos casos puede estar sujeta a la interpretacioacuten deltranscriptor

32- Propuestas para la representacioacuten ortograacutefica de corpus orales en el aacutembito de lastecnologiacuteas del habla

En el campo de las tecnologiacuteas del habla existen diversas propuestas para la representacioacutenortograacutefica dos de las cuales se presentan a continuacioacuten Pueden verse otros ejemplos en lasGuiacuteas de Transcripcioacuten del Center for Spoken Language Understanding (CSLU OregonGraduate Institute ) (Lander 1997) y en las convenciones desarrolladas para corpus como elHCRC Map Task (Anderson et al 1991) o en el proyecto Verbmobil (Hess et al 1995)

Los sucesivos proyectos LRE-63314 SpeechDat - Infrastructure for Spoken LanguageResources y LE2-4001 SpeechDat II - Speech Databases for the Creation of Voice DrivenTeleservices tienen entre sus objetivos desarrollar estaacutendares para la creacioacuten de recursoslinguumliacutesticos especialmente adecuados al entrenamiento y evaluacioacuten de sistemas dereconocimiento automaacutetico del habla Para llevar a cabo la transcripcioacuten ortograacutefica se handefinido una serie de convenciones - resumidas en dos recomendaciones ldquoKeep it simplerdquo yldquoDocument everything adequatelyrdquo - entre las cuales se contempla el uso de mayuacutesculas yminuacutesculas la transcripcioacuten de secuencias de nuacutemeros de letras y el empleo de los signos depuntuacioacuten se establecen tambieacuten procedimientos para la transcripcioacuten de errores depronunciacioacuten de palabras ininteligibles fragmentos de palabras elisiones y acontecimientosacuacutesticos no verbales como las denominadas pausas llenas ruidos producidos por el hablantesruidos estacionarios en la grabacioacuten o ruidos intermitentes respondiendo estas uacuteltimas categoriacuteasa las necesidades de transcripcioacuten de una base de datos recogida a traveacutes del teleacutefono (Senia y vanVelden 1997)

Los documentos del Grupo de Trabajo sobre Lengua Oral de EAGLES (Winski et al 1995Gibbon Moore y Winski eds 1997) ofrecen las siguientes recomendaciones para transcripcioacutenortograacutefica de corpus orales

bull Las formas reducidas de las palabras se transcriben tal como aparecen en losdiccionarios normativos

bull Si es necesario y si se documentan adecuadamente pueden utilizarse formas queno aparezcan en los diccionarios

bull Se recomienda el uso de formas reducidas si aparecen frecuentemente y si implicanelisiones de siacutelabas

bull Las formas dialectales se marcan en la transcripcioacutenbull Los nuacutemeros se transliteran como palabrasbull En la transcripcioacuten ortograacutefica se utilizan las formas completas de las abreviaturasbull Las abreviaturas que los hablantes pronuncian como palabras se transcriben de

este mismo modobull En las transcripciones se indica la aparicioacuten de palabras deletreadasbull Las interjecciones se transcriben con la representacioacuten ortograacutefica que aparece en

los diccionarios

Como puede deducirse faacutecilmente la filosofiacutea general de esta propuesta consiste en utilizarsiempre las formas que aparecen en los diccionarios normativos y documentar adecuadamente lasformas no estaacutendares que se encuentren durante el proceso de transcripcioacuten

4- REPRESENTACIOacuteN FONEacuteTICA DE CORPUS ORALES

A la hora de plantearse la eleccioacuten de un sistema de transcripcioacuten foneacutetica para un corpusoral son uacutetiles los planteamientos que Johansson (199593) realiza en el marco de la TEI (TextEncoding Initiative)1 ldquoThe degree of phonetic detail given in speech transcription varies fromnone to a very precise phonetic or phonemic transcription [] Where there is a great deal ofphonetic or phonemic detail it will be more convenient to design a specialized writing systemrdquo

Evidentemente hay casos en los que el objeto de la investigacioacuten no requiere la utilizacioacutende un sistema de transcripcioacuten foneacutetica pero cuando es necesario disponer de un ldquosistemaespecializado de escriturardquo el AFI (Alfabeto Foneacutetico Internacional) aparece como el primercandidato para cubrir las necesidades de la investigacioacuten siendo igualmente el sistemarecomendado tanto por la TEI como por el Grupo de Trabajo sobre Textos Orales de EAGLESSin embargo cuando se requiere el intercambio electroacutenico de textos SAMPA (SAM PhoneticAlphabet) - considerado como una versioacuten informaacutetica de parte del AFI (Gibbon Moore yWinski eds 1997) - se presenta como una opcioacuten vaacutelida especialmente en lo que se refiere a laslengua europeas cuando se requiere una transcripcioacuten de caraacutecter fonoloacutegico Existe una extensioacutende SAMPA (X-SAMPA) que ofrece los elementos del AFI inexistentes en SAMPA y que por lotanto puede considerarse como un sistema adecuado para la transcripcioacuten de corpus orales(EAGLES 1996) Por otra parte cabe considerar tambieacuten Wordlbet como una alternativa cuandola naturaleza del corpus aconseje disponer de un sistema maacutes detallado Estos procedimientoscomuacutenmente utilizados en la transcripcioacuten de corpus orales desarrollados en el aacutembito de lafoneacutetica y las tecnologiacuteas del habla se presentan someramente a continuacioacuten Dada la diversidadde meacutetodos existentes parece clara la conveniencia de desarrollar mecanismos que permitan lacompatibilidad asegurando la faacutecil traduccioacuten de una representacioacuten a otra de modo quediferentes investigadores puedan hacer uso de corpus ya transcritos foneacuteticamenteincorporaacutendolos a su propio entorno de trabajo

41- La representacioacuten foneacutetica de los elementos segmentales

El Alfabeto Foneacutetico Internacional (AFI IPA International Phonetic Alphabet)2 es elsistema maacutes ampliamente utilizado para la transcripcioacuten foneacutetica Es bien sabido que se basa en

1 Ademaacutes de las Guidelines for Electronic Text Encoding and Interchange (Sperberg-McQueen y Burnard eds1994) puede verse tambieacuten sobre la TEI la recopilacioacuten de Ide y Veacuteronis eds 1995 Para una introduccioacuten generalson uacutetiles Burnard (1995a b) Se encuentra maacutes informacioacuten en URL httpwww-teiuiceduorgsteiy en URL httpetextvirginiaeduTEIhtml2 La versioacuten maacutes reciente del AFI data de 1993 (IPA 1993) y puede encontrarse en URLhttpwwwartsglaacukIPAipacharthtml El Summer Institute of Linguistics (URLhttpwwwsilorgcomputingfonts) distribuye tipos de letra (fonts) que permiten trabajar con los sistemasoperativos maacutes corrientes utilizando los siacutembolos del AFI Tambieacuten pueden obtenerse en University CollegeLondon (URL httpwwwphonuclacuk) a partir de la paacutegina de Linguist (URL httplinguistlistorg) del

un principio fonoloacutegico seguacuten el cual se transcriben aquellos segmentos con valor diferencialutilizaacutendose los diacriacuteticos para introducir aspectos de tipo foneacutetico (IPA 1995) Sin embargo apesar del uso extendido del AFI existen tambieacuten diversas tradiciones nacionales resultantes engeneral de las necesidades derivadas de la transcripcioacuten estrecha de una determinada lengua o de laorientacioacuten de la investigacioacuten hacia un determinada aacuterea linguumliacutestica (Pullum y Ladusaw 1986)

La necesidad de intercambiar electroacutenicamente textos que contienen transcripcionesfoneacuteticas llevoacute a finales de los antildeos 80 a plantearse la codificacioacuten de los siacutembolos del AFI demodo que para cada uno de los siacutembolos del alfabeto se ha definido un nuacutemero (denominadoldquonuacutemero AFIrdquo) que puede relacionarse tambieacuten con los coacutedigos ASCII (Esling 1988 1990 IPA1989 Esling y Gaylord 1993) Las equivalencias entre siacutembolos nuacutemeros AFI y coacutedigos ASCIIforman parte de las convenciones conocidas como CRIL (Computer Representation of IndividualLanguages) surgidas del congreso de la Asociacioacuten Foneacutetica Internacional celebrado en Kiel en1991

SAMPA (SAM Phonetic Alphabet) constituye seguramente el esfuerzo maacutes significativo yextendido por desarrollar un sistema de transcripcioacuten foneacutetica informatizado SAMPA tiene suorigen en el proyecto ESPRIT 1541 SAM - Speech Assessment Methods (Fourcin et al 1989Fourcin y Dolmazon 1991) llevado a cabo entre 1987 y 1989 Al final del proyecto existiacuteanversiones de SAMPA en daneacutes neerlandeacutes ingleacutes franceacutes alemaacuten e italiano incorporaacutendose en1992 el noruego y el sueco y el espantildeol el griego y el portugueacutes en 1993 Durante 1996 seextendioacute a una serie de lenguas de los paiacuteses de la Europa del Este en el marco del proyectoBABEL (URL httpmidwichreadingacukresearchspeechlabbabel) y en principio no hayninguacuten obstaacuteculo para su adaptacioacuten a otros idiomas En cuanto a su utilizacioacuten praacutectica puedesentildealarse que es el sistema desarrollado para la transcripcioacuten del corpus multilinguumle EUROM(Chan et al 1995) y tambieacuten el adoptado en el proyecto ONOMASTICA centrado en latranscripcioacuten de nombres propios en diversas lenguas europeas (Schmidt 1993 Trancoso 1995)

SAMPA (Wells 1987 1989) se basa en un conjunto de equivalencias entre siacutembolos delAFI y coacutedigos ASCII restringieacutendose al uso de caracteres de 7 bits (coacutedigos 32 a 127) Elprincipio que rige las transcripciones en SAMPA al igual que en el caso del AFI esesencialmente fonoloacutegico empleaacutendose uacutenicamente siacutembolos distintos en el caso de segmentoscon valor diferencial Esta filosofiacutea viene motivada por tres razones simplicidad de latranscripcioacuten sin incorporar ambiguumledades ya que determinadas alofoacutenicas son predictibles apartir del contexto facilidad de utilizacioacuten por parte personas con poca formacioacuten en foneacutetica yfalta de coacutedigos ASCII para la transcripcioacuten alofoacutenica de todas las lenguas Sin embargo enalgunos casos se introducen siacutembolos para la representacioacuten de aloacutefonos cuando losinvestigadores que han desarrollado las adaptaciones para cada lengua lo han consideradonecesario

Una de las limitaciones de SAMPA es que no establece una codificacioacuten para todos lossiacutembolos del AFI Por este motivo Wells (1994) propone un sistema denominado X-SAMPA en

Yamada Language Center (URL httpbabeluoregoneduyamadafontsphonetichtml) o de la paacutegina de la propiaAsociacioacuten Foneacutetica Internacional (URL httpwwwartsglaacukIPAipafontshtml)

el que se preveacuten equivalencias en coacutedigos ASCII para la totalidad de siacutembolos del AFI en surevisioacuten de 1993 incluyendo diacriacuteticos y marcas tonales Una de las aplicaciones propuestaspara este sistema es el enviacuteo de textos en transcripcioacuten foneacutetica a traveacutes del correo electroacutenico

Por otra parte Worldbet constituye una propuesta maacutes ambiciosa que SAMPA y que suextensioacuten X-SAMPA pues parte de la base de que ldquoany spectrally and temporally distinct speechsound (not including pitch) which is phonemic in some language should have a separate basesymbolrdquo (Hieronymus 1994 ) los siacutembolos de base consisten normalmente en la concatenacioacuten deun siacutembolo del AFI con una serie de diacriacuteticos de modo que puede representarse una granvariedad de aloacutefonos hallados en las lenguas del mundo incluyendo siacutembolos inexistentes en elAFI Uno de los objetivos de Wordlbet - que en su versioacuten actual usa 299 siacutembolos compuestosde dos caracteres ASCII - es facilitar la transcripcioacuten de bases de datos multilinguumles que incluyanlenguas indias asiaacuteticas y africanas ademaacutes de las europeas Este sistema se ha utilizado porejemplo en la transcripcioacuten de los corpus distribuidos por el CSLU (Center for Spoken LanguageUnderstanding Oregon Graduate Institute) (Lander 1997)

Existen otros sistemas de transcripcioacuten foneacutetica concebidos para el intercambio electroacutenicode textos tanto desarrollados desde la perspectiva de las tecnologiacuteas del habla - por ejemplo elCPA (Computer Phonetic Alphabet) surgido en el marco del proyecto ESPRIT Linguistic Analysisof European Languages (Kluger-Kruse 1987) - como disentildeados para otros fines En el aacutembito delestudio del lenguaje infantil el proyecto CHILDES - Child Language Data Exchange System(MacWhinney 1991utiliza el sistema conocido como PHONASCII (Allen 1988) consistente enun conjunto de siacutembolos fonoloacutegicos - UNIBET - y un alfabeto foneacutetico que permite latranscripcioacuten estrecha

42- La representacioacuten foneacutetica de los elementos suprasegmentales

La incorporacioacuten de informacioacuten sobre los elementos suprasegmentales - informacioacutenprosoacutedica - en un corpus oral plantea diversos problemas derivados precisamente de la propianaturaleza de estos elementos que se manifiestan en variaciones continuas en los dominios de lafrecuencia la intensidad y el tiempo Por tanto es preciso llevar a cabo una abstraccioacuten paradeterminar en primer lugar cuaacuteles de estas variaciones son linguumliacutesticamente significativas y ensegundo lugar coacutemo se relacionan con categoriacuteas discretas Finalmente estas categoriacuteas debenrepresentarse en un sistema de notacioacuten No es pues extrantildeo que se hayan desarrollado diversasconvenciones para la simbolizacioacuten de los elementos suprasegmentales (Groslashnnum-Thorsen 1987Llisterri 1994) algunas de las cuales se presentan en los apartados siguientes

En el momento de plantearse la seleccioacuten de un sistema de transcripcioacuten prosoacutedicaadecuado a un corpus oral el investigador se enfrenta nuevamente a la diversidad de sistemas aligual que sucede en el caso de la transcripcioacuten segmental Aunque como veremos maacutes adelanteToBI parece que se estaacute convirtiendo raacutepidamente en un estaacutendar a pesar de su orientacioacuten haciala transcripcioacuten del ingleacutes y al modelo fonoloacutegico subyacente SAMPROSA ofrece la ventaja dehaberse desarrollado teniendo en cuenta las necesidades de las tecnologiacuteas del habla ademaacutesSAMPROSA se enmarca en el contexto de estaacutendares extendidos en Europa como los delproyecto SAM recomendados por ejemplo por NERC (Teubert 1993 Sinclair 1994) Enconjunto el sistema ideal de transcripcioacuten prosoacutedica deberiacutea permitir una representacioacuten en varios

niveles ser compatible con el intercambio electroacutenico de datos y cubrir las necesidades del mayornuacutemero de lenguas posible pudiendo aplicarse automaacuteticamente en lugar de basarse en lasimpresiones intuitivas del transcriptor con vistas a la transcripcioacuten de grandes corpus Enausencia de un sistema que reuacutena tales caracteriacutesticas parece adecuado establecer mecanismos decompatibilidad entre los existentes a fin de facilitar la reutilizacioacuten de los datos

El AFI ofrece ademaacutes de la posibilidades de transcripcioacuten segmental un conjunto desiacutembolos para la representacioacuten de los elementos suprasegmentales Con motivo del congresopara la revisioacuten del AFI celebrado en Kiel en 1989 se creoacute un grupo de trabajo sobre categoriacuteassuprasegmentales (Bruce 1988 1989) concluyeacutendose la necesidad de representar las categoriacuteassuprasegmentales de un modo maacutes adecuado especialmente en lo que se refiere la entonacioacuten Elconjunto actual de siacutembolos del AFI para los elementos suprasegmentales permite transcribir eltono asiacute como la duracioacuten y el acento

Las necesidades derivadas de una descripcioacuten detallada de la entonacioacuten tanto en el campode la foneacutetica como en el de las tecnologiacuteas del habla han propiciado la creacioacuten de diversossistemas de transcripcioacuten prosoacutedica algunos de los cuales se presentan a continuacioacuten

En el marco del proyecto ESPRIT SAM anteriormente mencionado se llevoacute tambieacuten a caboel desarrollo de sistemas de transcripcioacuten prosoacutedica compatibles con las necesidades de anotacioacutende bases de datos en soporte electroacutenico resultando de ello propuestas como PROSPASAMSINT o SAMPROSA (Gibbon 1989 Wells et al 1992) PROSPA fue originalmenteconcebido por Selting y Gibbon (Selting 1987 1988) para el anaacutelisis de la conversacioacuten y deldiscurso y por tal motivo se basa en criterios auditivos recogiendo uacutenicamente los elementosnecesarios para este fin Por su parte SAMSINT (SAM System for Intonation Transcription) seplantea como objetivo la transcripcioacuten de contornos meloacutedicos en el interior de unidadesentonativas basaacutendose en INTSINT - presentado maacutes adelante - con algunas modificacionesadicionales

A pesar de la coexistencia de los sistemas anteriormente mencionados en el proyecto SAMprobablemente el conjunto de siacutembolos maacutes extendido actualmente para la transcripcioacutenprosoacutedica sea SAMPROSA (SAM Prosodic Alphabet) propuesto inicialmente por Gibbon(1989) y desarrollado por Wells et al (1992) hasta llegar a su forma actual (Wells 1995)SAMPROSA ofrece al igual que SAMPA un conjunto de caracteres correspondientes a coacutedigosASCII mediante los cuales es posible transcribir tonos globales locales terminales y nucleares laduracioacuten el acento la pausas y las fronteras entre unidades prosoacutedicas Aunque presenta rasgoscaracteriacutesticos de la tradicioacuten britaacutenica de anaacutelisis de la entonacioacuten como por ejemplo lacodificacioacuten de tonos nucleares es un sistema que se plantea como adecuado para la transcripcioacutende diversas lenguas

En el aacutembito americano ToBI (Tone and Break Index) se desarrolloacute para cubrir al mismotiempo las necesidades de la descripcioacuten foneacutetica y de la anotacioacuten de corpus adecuados aldesarrollo de sistemas de tecnologiacuteas del habla (Silverman et al 1992 Beckman y Hirschberg1994 Beckman y Ayers 1994) Basado en el ingleacutes americano ToBI permite principalmente latranscripcioacuten de patrones entonativos partiendo de un anaacutelisis de la curva meloacutedica representadacomo evolucioacuten temporal de la frecuencia fundamental mediante herramientas de anaacutelisis y

etiquetado como el programa Wavestrade Sin embargo se han definido tambieacuten convenciones parala anotacioacuten de textos representados ortograacuteficamente Una transcripcioacuten utilizando ToBI constade cuatro niveles

bull Representacioacuten ortograacutefica del enunciadobull Nivel de iacutendices de ruptura (break index) en el que se introducen los indicadores

de liacutemite que marcan las fronteras entre las unidades meloacutedicas estableciendo cuatro gradosde cohesioacuten entre las mismas

bull Nivel tonal en el que se marcan los denominados ldquoeventos tonalesrdquo (pitch events)divididos en tonos de frase al principio y al final de las unidades meloacutedicas y en acentostonales (pitch accent) en las siacutelabas en las que se produce un movimiento de la frecuenciafundamental

bull Nivel miscelaacuteneo que facilita por ejemplo introducir los comentarios deltranscriptor

Para cada uno de los niveles se define un conjunto de siacutembolos alineados temporalmentecon los fenoacutemenos entonativos transcritos si se dispone de una herramienta adecuada comoWavestrade

Las criacuteticas que se realizan maacutes frecuentemente a ToBI son por una parte su dependenciadel modelo fonoloacutegico desarrollado por Pierrehumbert (1980) y por otra su mejor adaptacioacuten alingleacutes que a otras lenguas lo que explicariacutea su amplia utilizacioacuten en Estados Unidos Sin embargose han realizado trabajos en italiano alemaacuten huacutengaro y espantildeol entre otras lenguas usando ToBIcomo sistema de representacioacuten Un inconveniente maacutes importante es que la anotacioacuten medianteToBI requiere un cierto conocimiento previo de los patrones entonativos de la lengua Aun asiacute esun sistema que ofrece indudables ventajas como pueden ser su estructura jeraacuterquica que permiteseleccionar entre subconjuntos o conjuntos mayores de siacutembolos la posibilidad de representarproblemas que aparecen en la transcripcioacuten y el hecho de que existan experimentos demostrandoun alto grado de acuerdo entre transcriptores diferentes (Pitrelli et al 1994)

En el Institute for Perception Research (IPO Eindhoven) se ha desarrollado una teoriacutea sobrela entonacioacuten basada en el modelado de contornos entonativos consistentes en representacionesestilizadas perceptivamente equivalentes al contorno original (lsquot Hart et al 1990) Esta teoriacutea hallevado tambieacuten a la formalizacioacuten de un sistema de representacioacuten de la curva meloacutedica definidacomo un conjunto de movimientos tonales que se agrupan en secuencias de configuracionestonales la agrupacioacuten de estas configuraciones da lugar a su vez a contornos meloacutedicosdefinieacutendose los patrones entonativos en funcioacuten de agrupaciones similares de contornosmeloacutedicos Un sistema jerarquizado de esta naturaleza permite una representacioacuten de la curvameloacutedica adecuada para la transcripcioacuten prosoacutedica aunque que inicialmente no haya sido disentildeadopara tales fines

El objetivo de INTSINT (International Transcription System for Intonation) en cambio esproporcionar un sistema para la comparacioacuten interlinguumliacutestica de sistemas prosoacutedicosDesarrollado por Hirst (1991 Hirst y Di Cristo en prensa Hirst Di Cristo y Espesser enprensa) en el marco de un proyecto de anaacutelisis automaacutetico de la entonacioacuten INTSINT se basa en

la estilizacioacuten de la curva meloacutedica realizada a partir de una interpolacioacuten entre puntos en los quese da un cambio significativo en el valor de la frecuencia fundamental (target points) Estospuntos que podriacuteamos denominar ldquode inflexioacutenrdquo - definidos como la combinacioacuten de un valortemporal y un valor frecuencial - son susceptibles de codificarse automaacuteticamente mediante lossiacutembolos de INTSINT previa introduccioacuten de marcas de frontera entre las unidades entonativasCon ello se obtiene una representacioacuten fonoloacutegica del contorno meloacutedico simbolizando losdiferentes niveles tonales de la curva original El sistema se basa en la representacioacuten desecuencias tonales consideradas tanto desde una perspectiva global en funcioacuten del rango devariacioacuten tonal del hablante como desde un punto de vista local en relacioacuten con la altura de puntosde inflexioacuten anteriores En el primer caso se definen tres niveles T (Top) M (Mid) y B (Bottom)mientras que en el segundo se marcan cinco posibilidades H (Higher) L (Lower) S (Same) U(Upstep) o D (Downstep) El proceso de modelizacioacuten necesario para transcribir medianteINTSINT ha sido aplicado a varias lenguas (Hirst et al 1993) y se emplea tambieacuten para laanotacioacuten prosoacutedica de parte del corpus EUROM en franceacutes ingleacutes alemaacuten sueco y espantildeol(Hirst et al 1994 Llisterri ed 1996) llevada a cabo en el marco del proyecto LRE 62-050MULTEXT - Multilingual Text Tools and Corpora Es posible tambieacuten aplicar INTSINT aniveles maacutes altos como el paacuterrafo tal como se muestra en Nicolas y Hirst (1995)

5- ETIQUETADO FONEacuteTICO DE CORPUS ORALES

Al igual que en el caso de los corpus textuales una vez recogidos los materiales de base deun corpus oral debe llevarse a cabo un tratamiento de los mismos que permita su utilizacioacutenposterior El primer paso suele ser la transcripcioacuten ortograacutefica que en determinado tipo de corpusse acompantildea de una transcripcioacuten foneacutetica o fonoloacutegica A continuacioacuten a cada segmento de laonda sonora se le asocia una etiqueta (labelling) que lo define en teacuterminos foneacuteticos o fonoloacutegicosy se lleva a cabo la alineacioacuten (alignment) entre la sentildeal sonora y las etiquetas obteniendo unarepresentacioacuten que puede compararse a la partitura musical de una obra para voz y orquesta Elproceso de etiquetado segmental puede llevarse a cabo a varios niveles como veremos en esteapartado y completarse con una anotacioacuten de las caracteriacutesticas suprasegmentales codificadasseguacuten los diversos sistemas que hemos expuesto anteriormente Si se cumplen las etapasmencionadas se llega a disponer de un corpus que contiene la sentildeal sonora sincronizada con latranscripcioacuten ortograacutefica y con la transcripcioacuten foneacutetica o fonoloacutegica de modo que una vezdefinida una estructura de base de datos es posible consultar el corpus partiendo de etiquetasfoneacuteticas de marcas prosoacutedicas o de la transcripcioacuten ortograacutefica al tiempo que se accede a lagrabacioacuten correspondiente

Los corpus de lengua oral que consisten uacutenicamente en transcripciones ortograacuteficas - ya queno suele ser factible realizar una transcripcioacuten foneacutetica completa de un nuacutemero elevado de horasde grabacioacuten - conllevan un procesamiento menos complejo aunque en algunos casos contienenmarcas prosoacutedicas uacutetiles para el anaacutelisis del discurso o de la conversacioacuten como veremos en elapartado 6

51- Niveles de etiquetado foneacutetico de corpus orales

Una cuestioacuten que se plantea inevitablemente a la hora de introducir informacioacuten adicionalsobre los datos recogidos es el nivel de etiquetado del corpus Se han realizado varias propuestassobre los distintos niveles en los que se puede realizar el etiquetado foneacutetico de un corpusalgunas de ellas ligadas al proyecto SAM como la de Barry y Fourcin (1992) en la que seplantean cinco niveles posibles de etiquetado foneacutetico de un corpus

bull Nivel fiacutesico en el que se etiquetan las propiedades acuacutesticas presentes en la sentildealsonora

bull Nivel acuacutestico-foneacutetico en el que se marcan las propiedades de los segmentos enteacuterminos de categoriacuteas foneacuteticas como oclusioacuten friccioacuten sonoridad nasalizacioacuten etc

bull Nivel de transcripcioacuten estrecha en el que se caracterizan los segmentos utilizandolos siacutembolos del AFI o de sus equivalentes computacionales

bull Nivel de transcripcioacuten fonoloacutegica (o foneacutemica) sentildealando uacutenicamente aquelloselementos funcionalmente distintivos que se encuentran en la palabra pronunciadaaisladamente en un estilo cuidado (citation form)

bull Nivel de transcripcioacuten ancha en el que se utilizan los siacutembolos correspondientes alos elementos fonoloacutegicos en una lengua dada para transcribir realizaciones alofoacutenicascondicionadas por el contexto3

A estos cinco niveles debe antildeadirse auacuten la anotacioacuten prosoacutedica considerada de formaindependiente por los autores de la propuesta

Una propuesta similar de etiquetado tambieacuten en cinco niveles - caracteriacutesticas acuacutesticas denaturaleza subfoneacutemica caracteriacutesticas segmentales realizaciones foneacuteticas forma canoacutenica de laspalabras y transcripcioacuten ortograacutefica - se presenta en Tillmann y Pompino-Marschall (1993) y hasido utilizada con eacutexito en el proyecto alemaacuten PhonDat Igualmente pueden verse las propuestasde Autesserre et al (1989) enmarcadas en el contexto del proyecto SAM y los trabajos deMarchal et al (1995) o Roach et al (1990)

La transcripcioacuten y el etiquetado de corpus orales se ha abordado en el marco del proyectoEAGLES desde una doble perspectiva la de la foneacutetica y las tecnologiacuteas del habla en el Grupo deTrabajo sobre Lengua Oral y desde la de la linguumliacutestica de corpus en el marco de las actividades delGrupo de Trabajo sobre Corpus Textuales El trabajo llevado a cabo en el grupo dedicado a lalengua hablada en EAGLES recoge esencialmente las propuestas desarrolladas en el marco deSAM y de PhonDat Los niveles de etiquetado propuesto son los siguientes (Gibbon Moore yWinski eds 1997)

bull Nivel ortograacutefico en el que se utiliza la representacioacuten ortograacutefica convencional

3 La distincioacuten entre los dos uacuteltimos niveles puede ejemplificarse con el caso de las asimilaciones mientras que enla transcripcioacuten ancha encontrariacuteamos [um poko] (un poco) en el caso de una transcripcioacuten fonoloacutegica apareceriacutea [unpoko] si se opta por no simbolizar archifonemas en la transcripcioacuten En cambio [mismo] se representariacutea de lamisma forma en ambos niveles encontraacutendose la transcripioacuten [mizmo] en el nivel de transcripcioacuten estrecha

bull Nivel de formas canoacutenicas (citation form) representando la forma depronunciacioacuten aislada de las palabra en estilo cuidado

bull Nivel de transcripcioacuten ancha o fonotiacutepica en este nivel se utilizan los siacutembolosque representan elementos fonoloacutegicos en una lengua dada pero al igual que en lapropuesta de Barry y Fourcin se transcriben aquellos fenoacutemenos predictibles propios dela foneacutetica sintaacutectica SAMPA seriacutea pues un alfabeto foneacutetico adecuado para este nivelde transcripcioacuten

bull Nivel de transcripcioacuten estrecha basado en una representacioacuten alofoacutenica de lasrealizaciones foneacuteticas de los hablantes para el cual puede utilizarse un alfabeto foneacuteticocomo X-SAMPA

bull Nivel acuacutestico-foneacutetico en el que se distinguen caracteriacutesticas acuacutesticas de lossegmentos observables en una representacioacuten de la onda sonora

bull Nivel fiacutesico representado en teacuterminos de paraacutemetros acuacutesticos o articulatoriosbull Fenoacutemenos no linguumliacutesticos la inclusioacuten de este nivel permite representar sonidos

de naturaleza comunicativa o no introducidos por el hablante asiacute como toda aquellainformacioacuten paralinguumliacutestica que se considere de intereacutes tambieacuten permite sentildealas los ruidosexternos en la grabacioacuten

Vale la pena detenerse brevemente en el nivel de las formas canoacutenicas y en el concepto deldquotranscripcioacuten fonotiacutepicardquo que como puede verse aparecen de forma recurrente en diversaspropuestas La inclusioacuten de forma canoacutenicas en el etiquetado de un corpus responde a un doblemotivo especialmente ligado a necesidades tecnoloacutegicas en primer lugar estas formas permitenderivar automaacuteticamente mediante un conjunto de reglas una transcripcioacuten ancha o fonotiacutepica enla que se incluyen los elementos alofoacutenicos cuya aparicioacuten esta condicionada por el contextofoneacutetico en segundo lugar a partir de las formas canoacutenicas puede crearse de forma automaacutetica undiccionario foneacutetico partiendo de un corpus transcrito (Wesenick y Schiel 1995 Senia y vanVelden 1997) lo que tiene utilidad para el desarrollo de sistemas de siacutentesis y reconocimiento delhabla y tambieacuten para la descripcioacuten linguumliacutestica La transcripcioacuten denominada ldquofonotiacutepicardquo en lostrabajos de SAM constituye un nivel intermedio entre la realizacioacuten foneacutetica y la transcripcioacutenpuramente fonoloacutegica Por otra parte el nivel de transcripcioacuten de formas canoacutenicas estaacutedirectamente relacionado con la representacioacuten ortograacutefica facilitando asiacute la transcripcioacuten foneacuteticaautomaacutetica de corpus en este nivel mediante el desarrollo de los correspondientes sistemas dereglas

En el informe del Grupo de Trabajo de Corpus Textuales de EAGLES (EAGLES 1996) seintenta realizar una siacutentesis entre las necesidades de diversos campos de estudio Se sugieren porello tres niveles de representacioacuten

bull S1 representacioacuten ortograacutefica del textobull S2 representacioacuten fonoloacutegica de las palabras en su forma canoacutenicabull S3 transcripcioacuten foneacutetica consistente en una representacioacuten simboacutelica discreta de

la realizacioacuten del enunciado tal como es percibido por el transcriptor

Como puede observarse estos tres niveles encuentran su equivalente en los nivelespropuesto por Barry y Fourcin (1992) y en los definidos por el Grupo de Trabajo de Lengua

Oral Para la transcripcioacuten del nivel S2 puede utilizarse SAMPA mientras que la del nivel S3requiere el uso de un alfabeto foneacutetico como X-SAMPA

52- La transcripcioacuten y el etiquetado automaacutetico de corpus orales

La tarea de transcribir y etiquetar foneacuteticamente un corpus oral representa un considerableesfuerzo tanto en teacuterminos de tiempo como de los recursos econoacutemicos necesarios para llevar acabo esta labor El etiquetado manual requiere por otro lado el desarrollo de convencionesdetalladas para asegurar la consistencia entre diversos transcriptores (Keating et al 1994 Krot yTaylor 1995 Lander 1997) ademaacutes del establecimiento de un proceso de validacioacutencomprobando la fiabilidad de los resultados obtenidos (Eisen 1993 Cole et al 1994 Strangert yHeldener 1995) Por estos motivos uno de los intereses principales de los investigadores en elcampo de las tecnologiacuteas del habla ha sido llevar a cabo el etiquetado de forma semi-automaacutetica oidealmente automaacutetica Un primer nivel de transcripcioacuten - tanto de formas canoacutenicas comofonotiacutepica - puede obtenerse automaacuteticamente como acabamos de mencionar a partir de larepresentacioacuten ortograacutefica si se dispone de un conjunto de reglas que establezcan lascorrespondencias entre la representacioacuten ortograacutefica y la foneacutetica

Sin embargo un etiquetado foneacutetico en los niveles de transcripcioacuten maacutes detallada requiere laposibilidad de acceder a la onda sonora y un procedimiento de anaacutelisis de la sentildeal La primeraoperacioacuten que debe realizar un sistema de etiquetado automaacutetico es la segmentacioacuten del continuumsonoro en unidades menores - segmentos o caracteriacutesticas acuacutesticas en funcioacuten del nivel detranscripcioacuten deseado - para pasar despueacutes a la asignacioacuten de etiquetas - siacutembolos detranscripcioacuten - que describan sus caracteriacutesticas Este es el proceso conocido propiamente comoetiquetado (labelling) que cuando se realiza de forma automaacutetica debe superar los obstaacuteculosderivados de la naturaleza no discreta de la sentildeal sonora - resultado de mecanismos como lacoarticulacioacuten - y de la variabilidad de realizaciones foneacuteticas entre hablantes o incluso en unmismo hablante

Para que el corpus sea uacutetil el etiquetado foneacutetico debe estar temporalmente sincronizadocon la sentildeal sonora y con la representacioacuten ortograacutefica operacioacuten que se realiza en el procesoconocido como alineacioacuten temporal (time alignment) llevado a cabo tambieacuten de forma automaacuteticaEsta alineacioacuten puede hacerse de un modo global sentildealando en la onda sonora las fronteras entrepalabras ortograacuteficas - para facilitar el acceso a la grabacioacuten a partir de este nivel de representacioacuten(Lander 1997) - o los puntos en los que se encuentran siacutelabas acentuadas tal como sucede porejemplo en el proyecto MULTEXT

En el campo de las tecnologiacuteas del habla se han llevado a cabo numerosiacutesimos trabajosencaminados al disentildeo de sistemas de segmentacioacuten etiquetado y alineacioacuten temporal automaacuteticasde corpus orales utilizando las teacutecnicas propias del reconocimiento del habla como los Modelosde Markov o las redes neuronales Cabe destacar que tales teacutecnicas no soacutelo son uacutetiles en eldesarrollo de corpus en este aacutembito sino que constituyen una herramienta importante en otrostipos de corpus sin embargo es preciso reconocer que el habla espontaacutenea - especialmente si seha recogido mediante grabaciones realizadas en un entorno natural - plantea auacuten problemas en lo

que se refiere a su transcripcioacuten y etiquetado automaacuteticos pese a los notabiliacutesimos avances quetienen lugar en este campo

6- TRANSCRIPCIOacuteN Y CODIFICACIOacuteN DE CORPUS PARA EL ANAacuteLISIS DE LA LENGUA ORAL

En este uacuteltimo apartado incidiremos en las cuestiones relacionadas con la transcripcioacuten ycodificacioacuten de corpus orales que pueden presentar un mayor intereacutes para aacutembitos como elanaacutelisis de discurso o de la conversacioacuten y para el estudio de la lengua oral en todos los niveles dela descripcioacuten linguumliacutestica Como indicaacutebamos al principio la transcripcioacuten y la codificacioacuten de loselementos transcritos son en principio dos operaciones conceptualmente diferentes Sinembargo en la praacutectica habitual en las disciplinas a las que se refiere este apartado suelen ser dosoperaciones que se realizan simultaacuteneamente ya que al mismo tiempo que se realiza latransliteracioacuten se introducen las marcas necesarias para la codificacioacuten de los elementos que se hadecidido introducir en el corpus Por ello en muchos casos la discusioacuten sobre la transcripcioacuten y lacodificacioacuten se realiza conjuntamente en la bibliografiacutea sobre el tema

61- Los requisitos de una transcripcioacuten

El investigador que decide constituir un corpus de lengua oral se encuentra en estosmomentos con una gran variedad de criterios en lo que se refiere a la transcripcioacuten y a la seleccioacutende los elementos que apareceraacuten codificados en el corpus Hemos hecho ya referencia en elapartado 3 a las diversas convenciones para la representacioacuten ortograacutefica y cintildeeacutendonos al aacutembitodel anaacutelisis del discurso y la conversacioacuten constatamos igualmente la existencia una grandiversidad de propuestas En una revisioacuten de las mismas Payratoacute (1995) hace por ejemploreferencia a los sistemas de transcripcioacuten y codificacioacuten procedentes de la etnometodologiacuteainteresados en reflejar la interaccioacuten verbal a los meacutetodos desarrollados en el marco de laetnografiacutea de la comunicacioacuten y de la sociolinguumliacutestica interaccional4 o a propuestas utilizadas en elestudio del lenguaje infantil Ante tal situacioacuten parece conveniente plantearse cuaacuteles son losrequisitos que debe cumplir una transcripcioacuten de la lengua oral tema que ha sido abordado pordiversos autores (DuBois 1991 Elich 1993 Edwards 1993 OrsquoConnell y Kowal 1994) Trasrevisar aportaciones anteriores Payratoacute (1995) resume los requisitos que teoacutericamente deberiacuteanexigirse a toda transcripcioacuten

bull Neutralidad o fidelidad de modo que la transcripcioacuten no sea interpretativabull Globalidad o complejidad recogiendo la totalidad de los fenoacutemenos que aparecen

en el discurso oralbull Omnifuncionalidad permitiendo diversos usos y aplicacionesbull Claridad tanto desde el punto de vista del aprendizaje del sistema como de la

legibilidad de la representacioacutenbull Universalidad y compatibilidad entre sistemas informaacuteticos

4 Estos sistemas se comparan en OrsquoConnell y Kowal (1994) Pueden encontrarse consideraciones generales sobre latranscripcioacuten y codificacioacuten de la lengua oral en el anaacutelisis del discurso y la conversacioacuten en 1995Ochs (1979) DuBois (1991) Edwards (1992 1993 1995) Du Bois et al (1993) Gumperz y Berenz (1993) Cook (1995) Chafe(1995) y en Sinclair (1995)

Sin embargo puesto que en la praacutectica se transcribe en funcioacuten de los objetivos para losque se ha definido el corpus Payratoacute (1995) considera que un sistema de transcripcioacuten debe serante todo interpretativo de los datos selectivo en cuanto a los fenoacutemenos que se transcribenpertinente para el objeto de investigacioacuten coherente con la base teoacuterica adoptada por elinvestigador fiel en cuanto a la representacioacuten de los datos y flexible para que sea posible suutilizacioacuten en diversos estudios Por otra parte en opinioacuten de este autor la simbologiacutea utilizadadebe ser clara econoacutemica sencilla exenta de ambiguumledad y compatible con sistemas internacionesestandarizados Este uacuteltimo aspecto nos parece especialmente importante ya que como sentildeala elmismo Payratoacute (1995 58)

[] en ninguacuten caso puede olvidarse que los datos de una investigacioacuten no deberiacutean sertratados nunca de forma tan parcial o idiosincraacutesica que se impidiera o dificultara el uso por partede otros investigadores La transcripcioacuten del discurso oral es una actividad suficientementecostosa y conflictiva para tomar precauciones en este sentido y ninguna comunidad cientiacuteficapuede permitirse el lujo de particularismos (en aspectos tan elementales) que obstruyan el debateo conviertan en inaprovechables una fuente de informacioacuten

62- Propuestas de estandarizacioacuten para la transcripcioacuten y codificacioacuten de corpus orales

Ante la diversidad de propuestas para la transcripcioacuten y codificacioacuten de la lengua oral queacabamos de constatar el surgimiento de la linguumliacutestica de corpus y muy especialmente lasnecesidades derivadas del intercambio electroacutenico de textos propiciaron la aparicioacuten de proyectose iniciativas centrados en la creacioacuten de estaacutendares tanto en lo que se refiere a la transcripcioacutencomo a la codificacioacuten En los proacuteximos apartados revisamos sucintamente algunos de ellos

Uno de los capiacutetulos de las Guiacuteas desarrolladas por la TEI estaacute dedicado a la transcripcioacutende corpus orales (Johansson 1995a b) En eacutel se describe la estructura baacutesica de la representacioacutende un texto oral - cabecera texto y divisiones - y se definen los procedimientos basados enSGML para la representacioacuten de los elementos estructurales baacutesicos informacioacuten contextualinformacioacuten temporal enunciados pausas elementos vocalizados semi-leacutexicos o no leacutexicoselementos kineacutesicos otros tipos de eventos comunicativos y texto presentado en forma escrita alhablante Tambieacuten se ofrecen en este capiacutetulo indicaciones para la segmentacioacuten y el alineamientoasiacute como recomendaciones para la transcripcioacuten de superposiciones entre hablantes de formas depalabras prosodia elementos paralinguumliacutesticos - tempo intensidad rango tonal tensioacuten ritmo ycalidad de voz - y alteraciones en el decurso foacutenico Para la representacioacuten de la informacioacutenfoneacutetica se recomienda el uso del AFI En la siguiente tabla se resumen los principales elementospropuestos por la TEI para la codificacioacuten de corpus orales considerados especiacuteficos de este tipode texto (Sperberg-McQueen y Burnard eds 1994)

Elemento codificado Marca decodificacioacutenen SGML

Definicioacuten

Divisiones (division) ltdivgt Unidades intermedias entre el texto y el enunciado que permitendelimitar partes diferenciadas en un texto

Enunciado (utterance) ltugt Segmento de habla comprendido entre dos pausas o delimitado porun cambio en el turno de palabra puede incluir ademaacutesinformacioacuten sobre la superposicioacuten (ltoverlapgt) de turnos cuando

interviene simultaacuteneamente maacutes de un hablantePausa (pause) ltpausegt Interrupcioacuten de la fonacioacuten percibida entre dos enunciados o en el

interior de los mismos puede describirse en teacuterminos relativos oindicando su duracioacuten

Vocal (vocal) ltvocalgt Elemento vocalizado semi-leacutexico o no leacutexico (pej pausas llenas otoses)

Kineacutesico (kinesic) ltkinesicgt Cualquier fenoacutemeno comunicativo no vocal (p ej gestos)Acontecimiento (event) lteventgt Cualquier fenoacutemeno identificado en la grabacioacuten no necesariamente

vocalizado ni con valor comunicativo (p ej ruidos de fondo)Texto escrito (writing) ltwritinggt Texto escrito que se presenta al hablante durante su intervencioacutenCambio (shift) ltshiftgt Momento en el que se produce un cambio en alguno de los rasgos

paralinguumliacutesticos - calidad de voz intensidad rango tonal ritmo yvelocidad de elocucioacuten - cada uno de los rasgos puede describirsemediante una lista de caracteriacutesticas

Tabla 1 Elementos codificados en las transcripciones de lengua oral seguacuten los estaacutendares de la TEI(Adaptada de Sperberg-McQueen y Burnard eds1994)

Por otra parte la TEI ofrece mecanismos para indicar el comienzo y el final de unfenoacutemeno su duracioacuten y su sincronizacioacuten temporal con otros elementos presenta tambieacuten laposibilidad de marcar unidades inferiores al enunciado - segmentos ltseggt - que permitendelimitar por ejemplo unidades prosoacutedicas e incluye tambieacuten entre sus propuestas las marcasnecesarias para sentildealar fenoacutemenos propios de la lengua hablada como palabras truncadasrepeticiones falsos principios - marcados como ltdelgt (deletion) y especificando el fenoacutemeno -Las partes de la grabacioacuten que el transcriptor no llega a interpretar correctamente - ltuncleargt - ono puede escuchar - ltgapgt - o las correcciones de errores de produccioacuten realizadas por eltranscriptor - ltsicgt para delimitar el error y ltcorrgt para indicar la correccioacuten - son tambieacutenelementos para los cuales la TEI establece marcas de codificacioacuten

Aunque las Guiacuteas de la TEI pueden considerarse un sistema adecuado para la transcripcioacuteny codificacioacuten de gran variedad de materiales los autores propios autores reconocen que

[] the present proposals are not intended to support unmodified every variety of researchundertaken upon spoken material now or in the future some discourse analysts phonologistsand doubtless other may wish to extend the scheme presented here to express more precisely theset of distinctions they wish to draw in their transcriptions Speech regarded as a purely acousticphenomenon may well require different methods from those outlined here as may speechregarded solely as a process of social interaction (Sperberg-McQueen y Burnard eds 1994 cap11)

El proyecto NERC - Network of European Reference Corpora (NERC 1994) se planteoacutecomo uno de sus objetivos la viabilidad de desarrollar una serie de recomendaciones para laconstitucioacuten de corpus y por tanto incluye entre sus resultados indicaciones sobre el tratamientode los corpus orales tanto en lo que se refiere a su codificacioacuten como a la transcripcioacuten de loselementos segmentales y suprasegmentales (Sinclair 1994) El sistema adoptado para latranscripcioacuten y codificacioacuten de corpus se basa como hemos indicado anteriormente en eldesarrollado por French (1991 1992) para la transcripcioacuten del corpus oral desarrollado en elproyecto COBUILD La transcripcioacuten se plantea como una operacioacuten que puede desarrollarse envarios niveles

bull Nivel I consiste en la representacioacuten ortograacutefica introduciendo los miacutenimossignos de puntuacioacuten necesarios sin informacioacuten sobre la interaccioacuten entre hablantes Eneste nivel se contemplan convenciones desarrolladas para la representacioacuten ortograacutefica ypara precisar el uso de la puntuacioacuten

bull Nivel II consiste en una representacioacuten ortograacutefica enriquecida con informacioacutenbaacutesica sobre la identidad de los hablantes el turno de palabra y los elementos no verbales

bull Nivel III contiene toda la informacioacuten presente en el nivel II ademaacutes deinformacioacuten sobre la interaccioacuten entre hablantes - marcando el principio y el final de lossolapamientos - y sobre la entonacioacuten - sentildealando las fronteras entre unidades tonales ylas siacutelabas acentuadas- En opinioacuten de French (1992) la transcripcioacuten a este nivel requiereuna formacioacuten especiacutefica en foneacutetica

bull Nivel IV constituye el nivel maacutes detallado de representacioacuten incluyendo lainformacioacuten propia del nivel III junto con marcas de tonos siacutelabas nucleares y con unatranscripcioacuten fonoloacutegica alineada con una representacioacuten acuacutestica - espectrograma y curvameloacutedica - del enunciado

La recomendacioacuten del proyecto NERC es que la transcripcioacuten de un corpus para el estudiode la lengua oral se lleve a cabo seguacuten las especificaciones del Nivel II adecuado seguacuten Frenchpara todas aquellas investigaciones que no requieran informacioacuten prosoacutedica

En el marco de NERC se llevoacute tambieacuten a cabo una evaluacioacuten de las Guiacuteas de la TEI para latranscripcioacuten de corpus orales de la que se concluye que ldquoThe TEI proposals are broadlycompatible with current practice in the user community as represented by JP Frenchconventions Furthermore in the majority of cases it will be a straightforward matter to link themachine-friendly TEI codes to the more user-friendly encoding systems such as JP Frenchconventions by means of a simple conversion programmerdquo (Payne 199260) La idea de unaconversioacuten automaacutetica entre las transcripciones realizadas seguacuten las propuestas de NERC y de laTEI es naturalmente interesante y refuerza la idea de que existe una compatibilidad general entreambos sistemas (Payne 1992 Johansson 1995a EAGLES 1996) prueba de ello es que en elinforme final de NERC se recomienda el uso de las normas de la TEI

Uno de los objetivos del Grupo de Trabajo sobre Textos Orales de EAGLES fue proponerun conjunto miacutenimo de fenoacutemenos que deberiacutean codificarse en cualquier texto oral La propuestarealizada se describe en EAGLES (1996) y toma elementos del proyecto NERC de la TEI y delGrupo de Trabajo sobre Lengua Oral de EAGLES Considerando los elementos comunes a lossistemas que sirven de base se sugiere que la codificacioacuten de un texto oral debe contener almenos informacioacuten sobre los siguientes aspectos

(1) Elementos vocales y no vocalesbull Elementos vocales semi-leacutexicos

Pertenecen a esta categoriacutea los elementos utilizados principalmente en elhabla espontaacutenea durante los momentos en que el hablante planifica lacontinuacioacuten de su discurso como las llamadas ldquopausas llenasrdquo o ldquosonorasrdquo y los

elementos que marcan dudas en el momento de la produccioacuten del hablaCorresponden a los elementos que en la TEI se marcan con la etiqueta ltvocalgtbull Elementos vocales no leacutexicos

Se incluyen aquiacute todo tipo de sonidos producidos por el hablante - tosesrisas bostezos estornudos etc - que no constituyen formas leacutexicas de la lenguaCorresponden igualmente a los codificados con la marca ltvocalgt en la TEIbull Acontecimientos no vocales y no comunicativos

Comprenden los ruidos producidos por otros hablantes o procedentes delentorno de grabacioacuten Estos acontecimientos se codifican en la TEI mediante lamarca lteventgt

(2) Elementos necesarios en la transcripcioacuten de interacciones verbalesbull Identidad del hablante

Este es un elemento imprescindible en la transcripcioacuten de interaccionesverbales La TEI dispone de los mecanismos para documentar informacioacuten sobrelos hablantes en la cabecera de los textos asiacute como de un sistema para marcar laidentidad de cada participante en el interior del texto aunque pueden utilizarsetambieacuten otros procedimientosbull Turnos de palabra

La finalidad del marcado de los turnos de palabra es indicar un cambio dehablante Ademaacutes de las convenciones de la TEI pueden emplearse otrosprocedimientos mientras se mantenga esta informacioacuten esencial en el estudio de lainteraccioacuten verbalbull Superposicioacuten de turnos de palabra

Existen igualmente diferentes procedimientos para marcar la superposicioacutende emisiones de dos hablantes ademaacutes de las propuestas de la TEI que los tratacomo parte de las estrategias para codificar acontecimientos simultaacuteneos

(3) Elementos relacionados con la actuacioacuten del hablantebull Omisiones en un texto leiacutedo

Si se transcribe un texto leiacutedo y se dispone del original es recomendableanotar las palabras o segmentos omitidos por el locutorbull Autocorrecciones

Es propio del habla espontaacutenea aunque tambieacuten de la lectura que loshablantes realicen correcciones de su propia produccioacuten linguumliacutestica (self-repairs)Parece conveniente marcarlas en la transcripcioacuten de un corpus oralbull Fragmentos de palabras

Los fragmentos de palabras corresponden a uno o maacutes segmentospertenecientes a una palabra que no ha sido totalmente pronunciada por el hablanteen un primer intento y que suelen repetirse cuando eacuteste consigue producir lapalabra completa Es importante indicar este fenoacutemeno en la transcripcioacuten

bull Fragmentos ininteligiblesSe trata de partes de la grabacioacuten que no son comprendidas por el

transcriptor y en la TEI se codifican con la etiqueta ltuncleargt aunque si se desease pueden utilizar marcas maacutes detalladas distinguiendo entre transcripcionescompletamente ininteligibles y entre una posible interpretacioacuten ofrecida por eltranscriptor

Un aspecto conflictivo sigue siendo la identificacioacuten de los enunciados que conforman untexto oral (Schuetze-Coburn 1991) Mientras que en un texto escrito los signos de puntuacioacutenconstituyen un criterio de delimitacioacuten en el habla disponemos de indicios como las pausas laentonacioacuten o el cambio de turno de palabra que nos permiten al menos convencionalmentedefinir un enunciado Sin embargo hasta el momento no se han desarrollado auacuten criteriosobjetivos y consistentes para resolver este problema

7- CONCLUSIONES

La revisioacuten - sin pretensiones de exhaustividad - de los principales sistemas detranscripcioacuten etiquetado y codificacioacuten de corpus orales expuesta en este trabajo pone demanifiesto en primer lugar la multiplicidad de propuestas desarrolladas frente a los intentos deestandarizacioacuten algunos de los cuales auacuten no se han consolidado plenamente pese a su crecienteaceptacioacuten En segundo lugar destaca tambieacuten la heterogeneidad de tradiciones que confluyen enel estudio de la lengua hablada desde la foneacutetica y las tecnologiacuteas del habla hasta el anaacutelisis deldiscurso y de la conversacioacuten diversidad que lleva a la creacioacuten de convenciones especiacuteficas pararesponder a las necesidades de diversas comunidades cientiacuteficas Ante esta situacioacuten la distincioacutenpropuesta por Sinclair (1995107) entre ldquoconformidadrdquo y ldquocompatibilidadrdquo adquiere todo susentido ya que si en ciertos casos la conformidad a un estaacutendar determinado es problemaacutetica porlas limitaciones inherentes a todo sistema comuacuten la compatibilidad - entendida como la facilidadde conversioacuten entre sistemas - deberiacutea ser en cambio un requisito imprescindible en el desarrollode los recursos linguumliacutesticos De esta manera puede tal alcanzarse el equilibrio entre lasnecesidades de un proyecto y las indudables ventajas cientiacuteficas y econoacutemicas que resultan de lareutilizacioacuten de los datos disponibles

BIBLIOGRAFIacuteA

Allen GD 1988 The PHONASCII System Journal of the International PhoneticAssociation 181 9-25

Anderson AH M Badger EG Bard E Boyle G Doherty S Garrod S Isard JKowtko J Mcallister J Miller C Sotillo HS Thompson y R Weinert 1991 The HCRCMap Task corpus Language and Speech 344 351-366

Autesserre D G Peacuterennou y M Rossi 1989 Methodology for the transcription andlabeling of a speech corpus Journal of the International Phonetic Association 191 2-15

Barry WJ y AJ Fourcin 1992 Levels of Labelling Computer Speech and Language 61-14

Beckman ME y GM Ayers GM 1994 Guidelines for ToBI Labelling Version 20February 1994[Documento de Internet disponible en httplingohio-stateeduPhoneticsToBIToBI0html]

Beckman ME y J Hirschberg J 1994 The ToBI Annotation Conventions Apeacutendice A deME Beckman y GM Ayers 1994 Guidelines for ToBI Labelling Version 20 February 1994[Documento de Internet disponible en httplingohio-stateeduPhoneticsToBIToBI0html]

Bruce G 1988 23 Supasegmental categories and 24 The symbolization of temporalevents Journal of the International Phonetic Association 182 75-76

Bruce G 1989 Report from the IPA working group on suprasegmental categories LundUniversity Department of Linguistics General Linguistics Phonetics Working Papers 35 25-40

Burnard L 1995 What is SGML and how does it help Computers and the Humanities291 41-50 The Text Encoding Initiative Background and Context Eds N Ide y J VeacuteronisDordrecht Kluwer Academic Publishers

Burnard L 1995a Text Encoding for Information Exchange An Introduction to the TextEncoding Initiaive TEI Document TEI J31 [Documento de Internet disponible enhttpwwwuiceduorgsteiinfoteij31]

Burnard L 1995b The Text Encoding Initiative an overviewrdquo Spoken English onComputer Transcription Markup and Applications Eds G LEECH G MYERS y JTHOMAS Harlow Longman 69-81

Chafe W 1995 Adequacy user-friendliness and practicality in transcribingrdquo English onComputer Transcription Markup and Applications Eds G Leech G Myers y J ThomasHarlow Longman 54-61

Chan D A Fourcin D Gibbon B Granstroumlm M Huckvale G Kokkinakis K KvaleL Lamel B Lindberg A Moreno J Mouropoulos F Senia I Trancoso C Veld y J Zeiliger1995 EUROM - A Spoken Language Resource for the EU Eurospeech95 Proceedings of the4th European Conference on Speech Communication and Speech Technology Madrid Spain 18-21 September 1995 Vol 1 867-870

Cole RA BT Oshika M Noel T Lander y M Fanty 1994 Labeler Agreement inPhonetic Labeling of Continuous Speech Proceedings of the 1994 International Conference onSpoken Language Processing Yokohama Japan 18-22 September 1994[Documento de Internet disponible en httpwwwcseogieduCSLUcorporapapershtml]

Cook G 1995 Theoretical issues transcribing the untranscribablerdquo Spoken English onComputer Transcription Markup and Applications Eds G Leech G Myers y J ThomasHarlow Longman 35-53

Du Bois JW 1991 Transcription design principles for spoken discourse researchPragmatics 1 71-106

Du Bois JW S Schuetze-Coburn S Cumming y D Paolino 1993 Outline of discoursetranscriptionrdquo Talking Data Transcription and Coding in Discourse Research Eds JAEdwards y MD Lampert Hillsdale NJ Lawrence Erlbaum Associates 45-90

EAGLES 1996 Preliminary Recommendations on Spoken Texts EAGLES DocumentEAG-TCWG-STPP May 1996[Documento de Internet disponible enhttpwwwilcpicnritEAGLES96spokentxspokentxhtml]

Edwards JA 1992 Design principles in the transcription of spoken discourserdquoDirections in Corpus Linguistics Proceedings of Nobel Symposium 82 Stockholm 4-8 August1991 Ed J Svartvik Berlin Mouton de Gruyter 129-147

Edwards JA 1993 Principles and Contrasting Systems of Discourse TranscriptionrdquoTalking Data Transcription and Coding in Discourse Research Eds JA Edwards y MDLampert Hillsdale Hillsdale NJ Lawrence Erlbaum Associates 3-32

Edwards JA 1995 Principles and alternative systems in the transcription coding andmark-up of spoken discourserdquo Spoken English on Computer Transcription Markup andApplications Eds G Leech G Myers y J Thomas Harlow Longman 19-34

Ehlich K 1993 HIAT A Transcription System for Discourse Datardquo Talking DataTranscription and Coding in Discourse Research Eds JA Edwards y MD Lampert HillsdaleNJ Lawrence Erlbaum Associates 123-148

Eisen B 1993 Reliability of speech segmentation and labelling at different levels oftranscription Eurospeech93 3rd European Conference on Speech Communication andTechnology Berlin Germany 21-23 September 1993 Vol 1 673-676

Esling JH y H Gaylord 1993 Computer Codes for Phonetic Symbols Journal of theInternational Phonetic Association 232 77-82

Esling JH 1988 Computer coding of IPA symbols and detailed phonetic representationsof computer databases Journal of the International Phonetic Association 182 99-106

Esling JH 1990 Computer Coding of the IPA Supplementary Report Journal of theInternational Phonetic Association 201 22-26

Fourcin A y JM Dolmazon (on behalf of the SAM Project) 1991 Speech knowledgestandards and assessment Actes du XIIegraveme Congregraves International des Sciences Phoneacutetiques 19-24 aoucirct 1991 Aix-en-Provence France Aix-en-Provence Universiteacute de Provence Service desPublications Vol 5 430-433

Fourcin A G Harland W Barry y V Hazan eds 1989 Speech Input and OutputAssessment Multilingual Methods and Standards Chichester Ellis Horwood Ltd

French JP 1991 Updated notes for soundprint transcribers Working paper Universityof Birmingham October 1991 NERC-WP4-47

French JP 1992 Transcription proposals multilevel system Working paper Universityof Birmingham October 1992 NERC-WP4-50

Gibbon D 1989 Survey of Prosodic Labelling for EC Languages SAM-UBI-190 12February 1989 Report e6 in ESPRIT 2589 (SAM) Interim Report Year 1 Ref SAM-UCLG002 University College London February 1990

Gibbon D R Moore y R Winski eds 1997 Handbook on Standards and Resources forSpoken Language Systems Berlin Mouton De Gruyter [Documento de Internet disponible en httpcoralliliuni-bielefelddeEAGLESeagbookeagbookhtml]

Groslashnnum Thorsen N 1987 Suprasegmental transcription ARIPUC - Annual Report ofthe Institute of Phonetics University of Copenhagen 21 1-27

Gumperz JJ y J Berenz 1993 Transcribing Conversational Exchangesrdquo Talking DataTranscription and Coding in Discourse Research Eds JA Ewards y M D Lampert HillsdaleNJ Lawrence Erlbaum Associates 91-122

Hart J lsquoT R Collier y A Cohen 1990 A Perceptual Study of Intonation An Experimental- Phonetic Approach to Intonation Cambridge Cambridge University Press (Cambridge Studiesin Speech Science and Communication)

Hess W K Kohler y HG Tillmann 1995 The PhonDat-Verbmobil Speech CorpusEurospeech95 Proceedings of the 4th European Conference on Speech Communication andSpeech Technology Madrid Spain 18-21 September 1995 Vol 1 863-866

Hieronymus JL 1994 ASCII phonetic symbols for the worlds languages WorldbetATampT Bell Laboratories Technical Memo [Documento de Internet disponible enhttpwwwcseogieduCSLUcorporapapershtml]

Hirst D A Di Cristo y R Espesser en prensaLevels of representation and levels ofanalysis for intonation Prosody Theory and Experiments Ed M Horne Dordrecht Kluwer

Hirst DJ y A Di Cristo en prensa A survey of intonation systemsrdquo IntonationSystems A Survey of 20 Languages Eds D Hirst y A Di Cristo Cambridge CambridgeUniversity Press

Hirst DJ 1991 Intonation models towards a third generation Actes du XIIegraveme CongregravesInternational des Sciences Phoneacutetiques 19-24 aoucirct 1991 Aix-en-Provence France Aix-en-Provence Universiteacute de Provence Service des Publications Vol 1 305-310

Hirst DJ A Di Cristo M Le Besnerais Z Najim P Nicolas y P Romeacuteas 1993Multilingual modelling of intonation patternsrdquo Proceedings of an ESCA Workshop on ProsodySeptember 27-29 1993 Lund Sweden Eds D House y P Touati Lund University Departmentof Linguistics and Phonetics Working Papers 41 204-207

Hirst DJ N Ide y J Veacuteronis 1994 Coding fundamental frequency patterns for multi-lingual synthesis with INTSINT in the MULTEXT project Conference Proceedings of theSecond ESCAIEEE Workshop on Speech Synthesis September 12-15 1994 Mohonk MountainHouse New Paltz New York USA 77-80

Ide N y J Veacuteronis eds 1995 The Text Encoding Initiative Background and ContextsComputers and the Humanities 29 1-3 Publicado en forma de libro en Dordrecht KluwerAcademic Publishers

IPA 1989 The IPA 1989 Kiel Convention Workgroup 9 report Computer Coding of IPAsymbols and Computer Representation of Individual Languages Journal of the InternationalPhonetic Association 192 81-92

IPA 1993 IPA Chart revised to 1993 Journal of the International Phonetic Association231 [Documento de Internet disponible en httpwwwartsglaacukIPAipacharthtml]

IPA 1995 Preview of the IPA Handbook Journal of the International Phonetic Association251

ISO 8879 1986 Information Processing Text and Office Systems Standard GeneralizedMarkup Language (SGML) Geneva International Organization for Standardization

Johansson S 1995a The approach of the Text Encoding Initiative to the encoding ofspoken discourse Spoken English on Computer Transcription Markup and Applications EdsG Leech G Myers y J Thomas Harlow Longman 82-98

Johansson S 1995b The Encoding of Spoken Texts Computers and the Humanities291 149-158 The Text Encoding Initiative Background and Context Eds N Ide y J VeacuteronisDordrecht Kluwer Academic Publishers 149-158

Keating P P MacEachern A Shryock y S Domiacutenguez 1994 A manual for phonetictranscription Segmentation and labelling of words in spontaneous speech UCLA WorkingPapers in Phonetics 88 91-120

Kluger-Kruse M 1987 Computer Phonetic Alphabet ESPRIT Linguistic Analysis of theEuropean Languages Report BU-CPA0267 July 1987

Krot C y B Taylor 1995 Criteria for Acoustic-Phonetic Segmentation and WordLabelling in the Australian National Database of Spoken Language[Documento de Internet disponible en httpwwwshlrcmqeduaucriteriahtml]

Lander T 1997 The CSLU Labeling Guide Center for Spoken Language UnderstandingOregon Graduate Institute[Documento de Internet disponible en httpwwwcseogieduCSLUcorporapapershtml]

Llisterri J 1994 Prosody Encoding Survey WP 1 Specifications and Standards T15Markup Specifications Deliverable 153 Final version 15 September 1994 LRE Project 62-050MULTEXT

Llisterri J ed 1996 Prosody Tools Efficiency and Failures WP 4 Corpus T46 SpeechMarkup and Validation Deliverable 452 Final version 15 October 1996 LRE Project 62-050MULTEXT

MacWhinney B 1991The CHILDES Project Tools for Analyzing Talk Hillsdale NJLawrence Erlbaum

Marchal A N Nguyen y W Hardcastle 1995 Multitiered phonetic approach to speechlabelling Levels in Speech Communication Relations and Interactions A Tribute to MaxWajskop Hommage agrave Max Wajskop Eds C Sorin J Mariani H Meloni y J SchoengenAmsterdam Elsevier Science BV 149-158

NERC 1994 NERC-1 Network of European Reference Corpora Final Report PisaInstituto di Linguistica Computazionale - CNR January 1994 versioacuten en curso de publicacioacutenTowards a Network of European Reference Corpora Eds N Calzolari M Baker y PG KruytPisa Giardini

Nicolas P y D Hirst 1995 Symbolic coding of Higher-Level Characteristics ofFundamental Frequency Curvesrdquo Eurospeech95 Proceedings of the 4th European Conferenceon Speech Communication and Technology Madrid Spain 18-21 September 1995 Vol 2 989-992

OConnell DC y S Kowal 1994 Some Current Transcription Systems for SpokenDiscourse A critical Analysis Pragmatics 4 81-107

Ochs E 1979 Transcription as Theory Developmental Pragmatics Eds E Ochs E yBB Schieffelin New York Academic Press 43-72

Payne J 1992 Report on the compatibility of JP Frenchs spoken corpus transcriptionconventions with the TEI guidelines for transcription of spoken texts Working paper COBUILDBirmingham and IDS Mannheim December 1992 NERC-WP8WP4-122

Payne J 1995 The COBUILD spoken corpus transcription conventions SpokenEnglish on Computer Transcription Markup and Applications Eds G Leech G Myers y JThomas Harlow Longman 203-207

Payratoacute Ll 1995 Transcripcioacuten del discurso coloquialrdquo El espantildeol coloquial Actas del ISimposio sobre Anaacutelisis del Discurso Oral Almeriacutea 23-25 de noviembre de 1994 Ed L CorteacutesRodriacuteguez Almeriacutea Universidad de Almeriacutea Servicio de Publicaciones 43-70

Pierrehumbert J B 1897 (1980) The Phonology and Phonetics of English IntonationPhD Thesis Department of Linguistics MIT Bloomington Indiana University Linguistics Club

Pitrelli J M Beckman y J Hirschberg 1994 Evaluation of prosodic transcriptionlabelling reliability in the ToBI frameworkrdquo Proceedings of the Third International Conference onSpoken Language Processing Yokohama ICSLP Vol 2 123-126

Pullum GK y WA Ladusaw 1996 (1986) Phonetic Symbol Guide Chicago TheUniversity of Chicago Press 2nd edition

Roach P H Roach A Dew y P Rowlands 1990 Phonetic analysis and the automaticsegmentation and labeling of speech sounds Journal of the International Phonetic Association201 15-21

Schmidt MS C Scott y MA Jack 1993 Phonetic transcription standards for Europeannames (ONOMASTICA) Eurospeech93 3rd European Conference on Speech Communicationand Technology Berlin Germany 21-23 September 1993 Vol 1 279-282

Schuetze-Coburn S 1991Units of intonation in discourse a comparison of acoustic andauditory analysis Language and Speech 343 207-234

Selting M 1987 Descriptive categories for the auditive analysis of intonation inconversation Journal of Pragmatics 11 777-791

Selting M 1988 The role of intonation in the organisation of repair and problem handlingsequences in conversation Journal of Pragmatics 12 293-322

Senia F y JG Van Velden 1997 Specifications of orthographic transcription and lexiconconventions LRE-4001 SpeechDat Technical Report SD132 Final version 10 January 1997[Documento de Internet disponible en httpwwwphonetikuni-muenchendeSpeechDathtml]

Silverman K M Beckman J Pitrelli M Ostendorf C Wightman P Price JPierrehumbert y J Hirschberg 1992 TOBI A standard for labelling English prosodyProceedings of the Second International Conference on Spoken Language Processing ICSLP-92Banff October 1992 867-870

Sinclair J 1994 Spoken Language [3B] PhoneticPhonemic and Prosodic Annotation[52] NERC 1994 NERC-1 Network of European Reference Corpora Final Report PisaVersioacuten en curso de publicacioacuten Towards a Network of European Reference Corpora Eds NCalzolari M Baker y PG Kruyt Pisa Giardini

Sinclair J 1995 From theory to practicerdquo Spoken English on Computer TranscriptionMarkup and Applications Eds G Leech G Myers Y J Thomas Harlow Longman 99- 112

Sperberg-McQueen CM y L Burnard eds 1994 Guidelines for Electronic Text Encodingand Interchange TEI P3 Chicago and Oxford Association for Computational Linguistics Association for Computers and the Humanities Association for Literary and LinguisticComputing [Cap 11 Transcriptions of Speech] [Documento de Internet disponible enhttpetextvirginiaeduTEIhtml]

Strangert E y M Heldner 1995 Labelling of boundaries and prominences byphonetically experienced and non-experienced transcribers Phonum 3 Reports from theDepartment of Phonetics Umearing University 85-109 [Documento de Internet disponible enhttpwwwlingumusefonphonum3html]

Teubert W 1993 Phonetic Phonemic and Prosodic Annotation Final Report IDSMannheim February 1993 NERC-WP8-171

Tillmann HG y B Pompino-Marschall 1993 Theoretical Principles ConcerningSegmentation Labelling Strategies and Levels of Categorical Annotation for Spoken LanguageDatabase Systems Eurospeech93 3rd European Conference on Speech Communication andTechnology Berlin Germany 21-23 September 1993 Vol 3 1691-1694

Trancoso I 1995 The ONOMASTICA Interlanguage Pronunciation LexiconrdquoEurospeech95 Proceedings of the 4th European Conference on Speech Communication andTechnology Madrid Spain 18-21 September 1995 Vol 1 829-832

Wells JC 1987 Computer Coded Phonetic Transcription Journal of the InternationalPhonetic Association 172 94-114

Wells JC 1989 Computer-coded phonemic notation of individual languages of theEuropean Community Journal of the International Phonetic Association 191 31-54

Wells JC 1994 Computer-coding the IPA a proposed extension of SAMPA SpeechHearing and Language Work in Progress 1994 (University College London Department ofPhonetics and Linguistics) 8 271-289

Wells JC 1995 SAMPROSA (SAM Prosodic Transcription [Documento de Internetdisponible en httpwwwphonuclacukhomesampasamprosahtm]

Wells JC W Barry M Grice A Fourcin y D Gibbon 1992 Standard Computer-Compatible Transcription SAM Stage Report Sen3 SAM UCL-037 28 February 1992 SAM(1992) Esprit Project 2589 (SAM) Multilingual Speech InputOutput AssessmentMethodologyand Standardisation Final Report Year Three 1III91-28II1992 London University CollegeLondon

Wesenick M-B y F Schiel 1995 Feasibility of Automatic Annotation and BuildingPronunciation Lexica from Corpus Material LRE-63314 SpeechDat Report D3123 Finalversion 10 October 1995[Documento de Internet disponible en httpwwwicpgrenetfrSpeechDathomehtml]

Winski R R Moore y D Gibbon 1995 EAGLES Spoken Language Working GroupOverview and Resultsrdquo Eurospeech95 Proceedings of the 4th European Conference on SpeechCommunication and Speech Technology Madrid Spain 18-21 September 1995 Vol 1 841-844[Documento de Internet disponible en httpcoralliliuni-bielefeldde~gibbonEAGLESrwpaperrwpaperhtml]

  • 1- INTRODUCCIOacuteN
  • 2- NIVELES DE REPRESENTACIOacuteN ETIQUETADO Y CODIFICACIOacuteN
  • 3- REPRESENTACIOacuteN ORTOGRAacuteFICA DE CORPUS ORALES
  • 31- Propuestas para la representacioacuten ortograacutefica de corpus orales en el aacutembito de la linguumliacutestica de corpus
  • 32- Propuestas para la representacioacuten ortograacutefica de corpus orales en el aacutembito de las tecnologiacuteas del habla
  • 4- REPRESENTACIOacuteN FONEacuteTICA DE CORPUS ORALES
  • 41- La representacioacuten foneacutetica de los elementos segmentales
  • 42- La representacioacuten foneacutetica de los elementos suprasegmentales
  • 5- ETIQUETADO FONEacuteTICO DE CORPUS ORALES
  • 51- Niveles de etiquetado foneacutetico de corpus orales
  • 52- La transcripcioacuten y el etiquetado automaacutetico de corpus orales
  • 6- TRANSCRIPCIOacuteN Y CODIFICACIOacuteN DE CORPUS PARA EL ANAacuteLISIS DE LA LENGUA ORAL
  • 61- Los requisitos de una transcripcioacuten
  • 62- Propuestas de estandarizacioacuten para la transcripcioacuten y codificacioacuten de corpus orales
  • 7- CONCLUSIONES
  • BIBLIOGRAFIacuteA
Page 3: Transcripción, etiquetado y codificación de corpus orales

trata de un nivel de representacioacuten comuacuten a todo tipo de corpus orales sea cual sea su aplicacioacutense han realizado una notable cantidad de propuestas en lo que concierne a la forma escrita de loscorpus orales En el informe del Grupo de Trabajo sobre Textos Orales de EAGLES - cuyosprincipales elementos se retoman a continuacioacuten - se revisan algunas de ellas incluyendo las queproceden del proyecto NERC en la tradicioacuten de la linguumliacutestica de corpus y las que se derivan deproyectos en el aacutembito de las tecnologiacuteas del habla como SpeechDat o las desarrolladas en elpropio aacutembito de EAGLES

31- Propuestas para la representacioacuten ortograacutefica de corpus orales en el aacutembito de lalinguumliacutestica de corpus

En el marco del proyecto NERC - Network of European Reference Corpora (NERC 1994) seadoptaron para la representacioacuten ortograacutefica de corpus orales las convenciones desarrolladas porFrench (1991 1992) esencialmente concebidas para ser utilizadas en la constitucioacuten de la parteoral del corpus COBUILD (Payne 1995) En ellas se detalla el uso de los signos de puntuacioacuten -por ejemplo no se utilizan comas entre frases y se emplean puntos para delimitar frases - de lasmayuacutesculas - uacutenicamente al inicio de frase - o de los apoacutestrofes y las contracciones

Por su parte en el informe del Grupo de Trabajo sobre Textos Orales de EAGLES - ExpertAdvisory Group on Language Engineering Standards (EAGLES 1996) se proponen unasrecomendaciones baacutesicas para la transcripcioacuten ortograacutefica de corpus orales recogiendo tanto lassugerencias de NERC como algunas de las ideas desarrolladas en el aacutembito de las tecnologiacuteas delhabla que se discuten en el proacuteximo apartado Las recomendaciones pueden resumirse en trespuntos

bull Se recomienda utilizar siempre que sea posible las formas ortograacuteficas queaparecen en los diccionarios normativos o estaacutendares para cada lengua convencioacuten que seaplica tambieacuten a contracciones formas reducidas apoacutestrofes formas dialectalesinterjecciones y formas semi-leacutexicas

bull Si puede darse maacutes de una forma ortograacutefica de la misma palabra o si se introducenrepresentaciones ortograacuteficas que no aparecen en los diccionarios es recomendablemantener una base de datos con las formas utilizadas en la transcripcioacuten

bull Los nuacutemeros las abreviaturas los acroacutenimos y las palabras deletreadas debenrepresentarse ortograacuteficamente tal como son pronunciadas por el hablante utilizando laforma ortograacutefica completa

Como puede observarse eacutestas son recomendaciones generales que constituyen principiosbaacutesicos Un aspecto que requiere una discusioacuten maacutes detallada es el empleo de los signos depuntuacioacuten en la transcripcioacuten ortograacutefica de corpus tema sobre el que existen diversas posturasdesde las que propugnan su completa eliminacioacuten - lo que disminuye notablemente la legibilidaddel texto - hasta las que abogan por su uso seguacuten las normas habituales de cada lengua Taldiversidad de opiniones es obviamente debida a las dificultades que plantea la introduccioacuten depuntuacioacuten en transcripciones de habla espontaacutenea ya que implica necesariamente unasegmentacioacuten del enunciado que en algunos casos puede estar sujeta a la interpretacioacuten deltranscriptor

32- Propuestas para la representacioacuten ortograacutefica de corpus orales en el aacutembito de lastecnologiacuteas del habla

En el campo de las tecnologiacuteas del habla existen diversas propuestas para la representacioacutenortograacutefica dos de las cuales se presentan a continuacioacuten Pueden verse otros ejemplos en lasGuiacuteas de Transcripcioacuten del Center for Spoken Language Understanding (CSLU OregonGraduate Institute ) (Lander 1997) y en las convenciones desarrolladas para corpus como elHCRC Map Task (Anderson et al 1991) o en el proyecto Verbmobil (Hess et al 1995)

Los sucesivos proyectos LRE-63314 SpeechDat - Infrastructure for Spoken LanguageResources y LE2-4001 SpeechDat II - Speech Databases for the Creation of Voice DrivenTeleservices tienen entre sus objetivos desarrollar estaacutendares para la creacioacuten de recursoslinguumliacutesticos especialmente adecuados al entrenamiento y evaluacioacuten de sistemas dereconocimiento automaacutetico del habla Para llevar a cabo la transcripcioacuten ortograacutefica se handefinido una serie de convenciones - resumidas en dos recomendaciones ldquoKeep it simplerdquo yldquoDocument everything adequatelyrdquo - entre las cuales se contempla el uso de mayuacutesculas yminuacutesculas la transcripcioacuten de secuencias de nuacutemeros de letras y el empleo de los signos depuntuacioacuten se establecen tambieacuten procedimientos para la transcripcioacuten de errores depronunciacioacuten de palabras ininteligibles fragmentos de palabras elisiones y acontecimientosacuacutesticos no verbales como las denominadas pausas llenas ruidos producidos por el hablantesruidos estacionarios en la grabacioacuten o ruidos intermitentes respondiendo estas uacuteltimas categoriacuteasa las necesidades de transcripcioacuten de una base de datos recogida a traveacutes del teleacutefono (Senia y vanVelden 1997)

Los documentos del Grupo de Trabajo sobre Lengua Oral de EAGLES (Winski et al 1995Gibbon Moore y Winski eds 1997) ofrecen las siguientes recomendaciones para transcripcioacutenortograacutefica de corpus orales

bull Las formas reducidas de las palabras se transcriben tal como aparecen en losdiccionarios normativos

bull Si es necesario y si se documentan adecuadamente pueden utilizarse formas queno aparezcan en los diccionarios

bull Se recomienda el uso de formas reducidas si aparecen frecuentemente y si implicanelisiones de siacutelabas

bull Las formas dialectales se marcan en la transcripcioacutenbull Los nuacutemeros se transliteran como palabrasbull En la transcripcioacuten ortograacutefica se utilizan las formas completas de las abreviaturasbull Las abreviaturas que los hablantes pronuncian como palabras se transcriben de

este mismo modobull En las transcripciones se indica la aparicioacuten de palabras deletreadasbull Las interjecciones se transcriben con la representacioacuten ortograacutefica que aparece en

los diccionarios

Como puede deducirse faacutecilmente la filosofiacutea general de esta propuesta consiste en utilizarsiempre las formas que aparecen en los diccionarios normativos y documentar adecuadamente lasformas no estaacutendares que se encuentren durante el proceso de transcripcioacuten

4- REPRESENTACIOacuteN FONEacuteTICA DE CORPUS ORALES

A la hora de plantearse la eleccioacuten de un sistema de transcripcioacuten foneacutetica para un corpusoral son uacutetiles los planteamientos que Johansson (199593) realiza en el marco de la TEI (TextEncoding Initiative)1 ldquoThe degree of phonetic detail given in speech transcription varies fromnone to a very precise phonetic or phonemic transcription [] Where there is a great deal ofphonetic or phonemic detail it will be more convenient to design a specialized writing systemrdquo

Evidentemente hay casos en los que el objeto de la investigacioacuten no requiere la utilizacioacutende un sistema de transcripcioacuten foneacutetica pero cuando es necesario disponer de un ldquosistemaespecializado de escriturardquo el AFI (Alfabeto Foneacutetico Internacional) aparece como el primercandidato para cubrir las necesidades de la investigacioacuten siendo igualmente el sistemarecomendado tanto por la TEI como por el Grupo de Trabajo sobre Textos Orales de EAGLESSin embargo cuando se requiere el intercambio electroacutenico de textos SAMPA (SAM PhoneticAlphabet) - considerado como una versioacuten informaacutetica de parte del AFI (Gibbon Moore yWinski eds 1997) - se presenta como una opcioacuten vaacutelida especialmente en lo que se refiere a laslengua europeas cuando se requiere una transcripcioacuten de caraacutecter fonoloacutegico Existe una extensioacutende SAMPA (X-SAMPA) que ofrece los elementos del AFI inexistentes en SAMPA y que por lotanto puede considerarse como un sistema adecuado para la transcripcioacuten de corpus orales(EAGLES 1996) Por otra parte cabe considerar tambieacuten Wordlbet como una alternativa cuandola naturaleza del corpus aconseje disponer de un sistema maacutes detallado Estos procedimientoscomuacutenmente utilizados en la transcripcioacuten de corpus orales desarrollados en el aacutembito de lafoneacutetica y las tecnologiacuteas del habla se presentan someramente a continuacioacuten Dada la diversidadde meacutetodos existentes parece clara la conveniencia de desarrollar mecanismos que permitan lacompatibilidad asegurando la faacutecil traduccioacuten de una representacioacuten a otra de modo quediferentes investigadores puedan hacer uso de corpus ya transcritos foneacuteticamenteincorporaacutendolos a su propio entorno de trabajo

41- La representacioacuten foneacutetica de los elementos segmentales

El Alfabeto Foneacutetico Internacional (AFI IPA International Phonetic Alphabet)2 es elsistema maacutes ampliamente utilizado para la transcripcioacuten foneacutetica Es bien sabido que se basa en

1 Ademaacutes de las Guidelines for Electronic Text Encoding and Interchange (Sperberg-McQueen y Burnard eds1994) puede verse tambieacuten sobre la TEI la recopilacioacuten de Ide y Veacuteronis eds 1995 Para una introduccioacuten generalson uacutetiles Burnard (1995a b) Se encuentra maacutes informacioacuten en URL httpwww-teiuiceduorgsteiy en URL httpetextvirginiaeduTEIhtml2 La versioacuten maacutes reciente del AFI data de 1993 (IPA 1993) y puede encontrarse en URLhttpwwwartsglaacukIPAipacharthtml El Summer Institute of Linguistics (URLhttpwwwsilorgcomputingfonts) distribuye tipos de letra (fonts) que permiten trabajar con los sistemasoperativos maacutes corrientes utilizando los siacutembolos del AFI Tambieacuten pueden obtenerse en University CollegeLondon (URL httpwwwphonuclacuk) a partir de la paacutegina de Linguist (URL httplinguistlistorg) del

un principio fonoloacutegico seguacuten el cual se transcriben aquellos segmentos con valor diferencialutilizaacutendose los diacriacuteticos para introducir aspectos de tipo foneacutetico (IPA 1995) Sin embargo apesar del uso extendido del AFI existen tambieacuten diversas tradiciones nacionales resultantes engeneral de las necesidades derivadas de la transcripcioacuten estrecha de una determinada lengua o de laorientacioacuten de la investigacioacuten hacia un determinada aacuterea linguumliacutestica (Pullum y Ladusaw 1986)

La necesidad de intercambiar electroacutenicamente textos que contienen transcripcionesfoneacuteticas llevoacute a finales de los antildeos 80 a plantearse la codificacioacuten de los siacutembolos del AFI demodo que para cada uno de los siacutembolos del alfabeto se ha definido un nuacutemero (denominadoldquonuacutemero AFIrdquo) que puede relacionarse tambieacuten con los coacutedigos ASCII (Esling 1988 1990 IPA1989 Esling y Gaylord 1993) Las equivalencias entre siacutembolos nuacutemeros AFI y coacutedigos ASCIIforman parte de las convenciones conocidas como CRIL (Computer Representation of IndividualLanguages) surgidas del congreso de la Asociacioacuten Foneacutetica Internacional celebrado en Kiel en1991

SAMPA (SAM Phonetic Alphabet) constituye seguramente el esfuerzo maacutes significativo yextendido por desarrollar un sistema de transcripcioacuten foneacutetica informatizado SAMPA tiene suorigen en el proyecto ESPRIT 1541 SAM - Speech Assessment Methods (Fourcin et al 1989Fourcin y Dolmazon 1991) llevado a cabo entre 1987 y 1989 Al final del proyecto existiacuteanversiones de SAMPA en daneacutes neerlandeacutes ingleacutes franceacutes alemaacuten e italiano incorporaacutendose en1992 el noruego y el sueco y el espantildeol el griego y el portugueacutes en 1993 Durante 1996 seextendioacute a una serie de lenguas de los paiacuteses de la Europa del Este en el marco del proyectoBABEL (URL httpmidwichreadingacukresearchspeechlabbabel) y en principio no hayninguacuten obstaacuteculo para su adaptacioacuten a otros idiomas En cuanto a su utilizacioacuten praacutectica puedesentildealarse que es el sistema desarrollado para la transcripcioacuten del corpus multilinguumle EUROM(Chan et al 1995) y tambieacuten el adoptado en el proyecto ONOMASTICA centrado en latranscripcioacuten de nombres propios en diversas lenguas europeas (Schmidt 1993 Trancoso 1995)

SAMPA (Wells 1987 1989) se basa en un conjunto de equivalencias entre siacutembolos delAFI y coacutedigos ASCII restringieacutendose al uso de caracteres de 7 bits (coacutedigos 32 a 127) Elprincipio que rige las transcripciones en SAMPA al igual que en el caso del AFI esesencialmente fonoloacutegico empleaacutendose uacutenicamente siacutembolos distintos en el caso de segmentoscon valor diferencial Esta filosofiacutea viene motivada por tres razones simplicidad de latranscripcioacuten sin incorporar ambiguumledades ya que determinadas alofoacutenicas son predictibles apartir del contexto facilidad de utilizacioacuten por parte personas con poca formacioacuten en foneacutetica yfalta de coacutedigos ASCII para la transcripcioacuten alofoacutenica de todas las lenguas Sin embargo enalgunos casos se introducen siacutembolos para la representacioacuten de aloacutefonos cuando losinvestigadores que han desarrollado las adaptaciones para cada lengua lo han consideradonecesario

Una de las limitaciones de SAMPA es que no establece una codificacioacuten para todos lossiacutembolos del AFI Por este motivo Wells (1994) propone un sistema denominado X-SAMPA en

Yamada Language Center (URL httpbabeluoregoneduyamadafontsphonetichtml) o de la paacutegina de la propiaAsociacioacuten Foneacutetica Internacional (URL httpwwwartsglaacukIPAipafontshtml)

el que se preveacuten equivalencias en coacutedigos ASCII para la totalidad de siacutembolos del AFI en surevisioacuten de 1993 incluyendo diacriacuteticos y marcas tonales Una de las aplicaciones propuestaspara este sistema es el enviacuteo de textos en transcripcioacuten foneacutetica a traveacutes del correo electroacutenico

Por otra parte Worldbet constituye una propuesta maacutes ambiciosa que SAMPA y que suextensioacuten X-SAMPA pues parte de la base de que ldquoany spectrally and temporally distinct speechsound (not including pitch) which is phonemic in some language should have a separate basesymbolrdquo (Hieronymus 1994 ) los siacutembolos de base consisten normalmente en la concatenacioacuten deun siacutembolo del AFI con una serie de diacriacuteticos de modo que puede representarse una granvariedad de aloacutefonos hallados en las lenguas del mundo incluyendo siacutembolos inexistentes en elAFI Uno de los objetivos de Wordlbet - que en su versioacuten actual usa 299 siacutembolos compuestosde dos caracteres ASCII - es facilitar la transcripcioacuten de bases de datos multilinguumles que incluyanlenguas indias asiaacuteticas y africanas ademaacutes de las europeas Este sistema se ha utilizado porejemplo en la transcripcioacuten de los corpus distribuidos por el CSLU (Center for Spoken LanguageUnderstanding Oregon Graduate Institute) (Lander 1997)

Existen otros sistemas de transcripcioacuten foneacutetica concebidos para el intercambio electroacutenicode textos tanto desarrollados desde la perspectiva de las tecnologiacuteas del habla - por ejemplo elCPA (Computer Phonetic Alphabet) surgido en el marco del proyecto ESPRIT Linguistic Analysisof European Languages (Kluger-Kruse 1987) - como disentildeados para otros fines En el aacutembito delestudio del lenguaje infantil el proyecto CHILDES - Child Language Data Exchange System(MacWhinney 1991utiliza el sistema conocido como PHONASCII (Allen 1988) consistente enun conjunto de siacutembolos fonoloacutegicos - UNIBET - y un alfabeto foneacutetico que permite latranscripcioacuten estrecha

42- La representacioacuten foneacutetica de los elementos suprasegmentales

La incorporacioacuten de informacioacuten sobre los elementos suprasegmentales - informacioacutenprosoacutedica - en un corpus oral plantea diversos problemas derivados precisamente de la propianaturaleza de estos elementos que se manifiestan en variaciones continuas en los dominios de lafrecuencia la intensidad y el tiempo Por tanto es preciso llevar a cabo una abstraccioacuten paradeterminar en primer lugar cuaacuteles de estas variaciones son linguumliacutesticamente significativas y ensegundo lugar coacutemo se relacionan con categoriacuteas discretas Finalmente estas categoriacuteas debenrepresentarse en un sistema de notacioacuten No es pues extrantildeo que se hayan desarrollado diversasconvenciones para la simbolizacioacuten de los elementos suprasegmentales (Groslashnnum-Thorsen 1987Llisterri 1994) algunas de las cuales se presentan en los apartados siguientes

En el momento de plantearse la seleccioacuten de un sistema de transcripcioacuten prosoacutedicaadecuado a un corpus oral el investigador se enfrenta nuevamente a la diversidad de sistemas aligual que sucede en el caso de la transcripcioacuten segmental Aunque como veremos maacutes adelanteToBI parece que se estaacute convirtiendo raacutepidamente en un estaacutendar a pesar de su orientacioacuten haciala transcripcioacuten del ingleacutes y al modelo fonoloacutegico subyacente SAMPROSA ofrece la ventaja dehaberse desarrollado teniendo en cuenta las necesidades de las tecnologiacuteas del habla ademaacutesSAMPROSA se enmarca en el contexto de estaacutendares extendidos en Europa como los delproyecto SAM recomendados por ejemplo por NERC (Teubert 1993 Sinclair 1994) Enconjunto el sistema ideal de transcripcioacuten prosoacutedica deberiacutea permitir una representacioacuten en varios

niveles ser compatible con el intercambio electroacutenico de datos y cubrir las necesidades del mayornuacutemero de lenguas posible pudiendo aplicarse automaacuteticamente en lugar de basarse en lasimpresiones intuitivas del transcriptor con vistas a la transcripcioacuten de grandes corpus Enausencia de un sistema que reuacutena tales caracteriacutesticas parece adecuado establecer mecanismos decompatibilidad entre los existentes a fin de facilitar la reutilizacioacuten de los datos

El AFI ofrece ademaacutes de la posibilidades de transcripcioacuten segmental un conjunto desiacutembolos para la representacioacuten de los elementos suprasegmentales Con motivo del congresopara la revisioacuten del AFI celebrado en Kiel en 1989 se creoacute un grupo de trabajo sobre categoriacuteassuprasegmentales (Bruce 1988 1989) concluyeacutendose la necesidad de representar las categoriacuteassuprasegmentales de un modo maacutes adecuado especialmente en lo que se refiere la entonacioacuten Elconjunto actual de siacutembolos del AFI para los elementos suprasegmentales permite transcribir eltono asiacute como la duracioacuten y el acento

Las necesidades derivadas de una descripcioacuten detallada de la entonacioacuten tanto en el campode la foneacutetica como en el de las tecnologiacuteas del habla han propiciado la creacioacuten de diversossistemas de transcripcioacuten prosoacutedica algunos de los cuales se presentan a continuacioacuten

En el marco del proyecto ESPRIT SAM anteriormente mencionado se llevoacute tambieacuten a caboel desarrollo de sistemas de transcripcioacuten prosoacutedica compatibles con las necesidades de anotacioacutende bases de datos en soporte electroacutenico resultando de ello propuestas como PROSPASAMSINT o SAMPROSA (Gibbon 1989 Wells et al 1992) PROSPA fue originalmenteconcebido por Selting y Gibbon (Selting 1987 1988) para el anaacutelisis de la conversacioacuten y deldiscurso y por tal motivo se basa en criterios auditivos recogiendo uacutenicamente los elementosnecesarios para este fin Por su parte SAMSINT (SAM System for Intonation Transcription) seplantea como objetivo la transcripcioacuten de contornos meloacutedicos en el interior de unidadesentonativas basaacutendose en INTSINT - presentado maacutes adelante - con algunas modificacionesadicionales

A pesar de la coexistencia de los sistemas anteriormente mencionados en el proyecto SAMprobablemente el conjunto de siacutembolos maacutes extendido actualmente para la transcripcioacutenprosoacutedica sea SAMPROSA (SAM Prosodic Alphabet) propuesto inicialmente por Gibbon(1989) y desarrollado por Wells et al (1992) hasta llegar a su forma actual (Wells 1995)SAMPROSA ofrece al igual que SAMPA un conjunto de caracteres correspondientes a coacutedigosASCII mediante los cuales es posible transcribir tonos globales locales terminales y nucleares laduracioacuten el acento la pausas y las fronteras entre unidades prosoacutedicas Aunque presenta rasgoscaracteriacutesticos de la tradicioacuten britaacutenica de anaacutelisis de la entonacioacuten como por ejemplo lacodificacioacuten de tonos nucleares es un sistema que se plantea como adecuado para la transcripcioacutende diversas lenguas

En el aacutembito americano ToBI (Tone and Break Index) se desarrolloacute para cubrir al mismotiempo las necesidades de la descripcioacuten foneacutetica y de la anotacioacuten de corpus adecuados aldesarrollo de sistemas de tecnologiacuteas del habla (Silverman et al 1992 Beckman y Hirschberg1994 Beckman y Ayers 1994) Basado en el ingleacutes americano ToBI permite principalmente latranscripcioacuten de patrones entonativos partiendo de un anaacutelisis de la curva meloacutedica representadacomo evolucioacuten temporal de la frecuencia fundamental mediante herramientas de anaacutelisis y

etiquetado como el programa Wavestrade Sin embargo se han definido tambieacuten convenciones parala anotacioacuten de textos representados ortograacuteficamente Una transcripcioacuten utilizando ToBI constade cuatro niveles

bull Representacioacuten ortograacutefica del enunciadobull Nivel de iacutendices de ruptura (break index) en el que se introducen los indicadores

de liacutemite que marcan las fronteras entre las unidades meloacutedicas estableciendo cuatro gradosde cohesioacuten entre las mismas

bull Nivel tonal en el que se marcan los denominados ldquoeventos tonalesrdquo (pitch events)divididos en tonos de frase al principio y al final de las unidades meloacutedicas y en acentostonales (pitch accent) en las siacutelabas en las que se produce un movimiento de la frecuenciafundamental

bull Nivel miscelaacuteneo que facilita por ejemplo introducir los comentarios deltranscriptor

Para cada uno de los niveles se define un conjunto de siacutembolos alineados temporalmentecon los fenoacutemenos entonativos transcritos si se dispone de una herramienta adecuada comoWavestrade

Las criacuteticas que se realizan maacutes frecuentemente a ToBI son por una parte su dependenciadel modelo fonoloacutegico desarrollado por Pierrehumbert (1980) y por otra su mejor adaptacioacuten alingleacutes que a otras lenguas lo que explicariacutea su amplia utilizacioacuten en Estados Unidos Sin embargose han realizado trabajos en italiano alemaacuten huacutengaro y espantildeol entre otras lenguas usando ToBIcomo sistema de representacioacuten Un inconveniente maacutes importante es que la anotacioacuten medianteToBI requiere un cierto conocimiento previo de los patrones entonativos de la lengua Aun asiacute esun sistema que ofrece indudables ventajas como pueden ser su estructura jeraacuterquica que permiteseleccionar entre subconjuntos o conjuntos mayores de siacutembolos la posibilidad de representarproblemas que aparecen en la transcripcioacuten y el hecho de que existan experimentos demostrandoun alto grado de acuerdo entre transcriptores diferentes (Pitrelli et al 1994)

En el Institute for Perception Research (IPO Eindhoven) se ha desarrollado una teoriacutea sobrela entonacioacuten basada en el modelado de contornos entonativos consistentes en representacionesestilizadas perceptivamente equivalentes al contorno original (lsquot Hart et al 1990) Esta teoriacutea hallevado tambieacuten a la formalizacioacuten de un sistema de representacioacuten de la curva meloacutedica definidacomo un conjunto de movimientos tonales que se agrupan en secuencias de configuracionestonales la agrupacioacuten de estas configuraciones da lugar a su vez a contornos meloacutedicosdefinieacutendose los patrones entonativos en funcioacuten de agrupaciones similares de contornosmeloacutedicos Un sistema jerarquizado de esta naturaleza permite una representacioacuten de la curvameloacutedica adecuada para la transcripcioacuten prosoacutedica aunque que inicialmente no haya sido disentildeadopara tales fines

El objetivo de INTSINT (International Transcription System for Intonation) en cambio esproporcionar un sistema para la comparacioacuten interlinguumliacutestica de sistemas prosoacutedicosDesarrollado por Hirst (1991 Hirst y Di Cristo en prensa Hirst Di Cristo y Espesser enprensa) en el marco de un proyecto de anaacutelisis automaacutetico de la entonacioacuten INTSINT se basa en

la estilizacioacuten de la curva meloacutedica realizada a partir de una interpolacioacuten entre puntos en los quese da un cambio significativo en el valor de la frecuencia fundamental (target points) Estospuntos que podriacuteamos denominar ldquode inflexioacutenrdquo - definidos como la combinacioacuten de un valortemporal y un valor frecuencial - son susceptibles de codificarse automaacuteticamente mediante lossiacutembolos de INTSINT previa introduccioacuten de marcas de frontera entre las unidades entonativasCon ello se obtiene una representacioacuten fonoloacutegica del contorno meloacutedico simbolizando losdiferentes niveles tonales de la curva original El sistema se basa en la representacioacuten desecuencias tonales consideradas tanto desde una perspectiva global en funcioacuten del rango devariacioacuten tonal del hablante como desde un punto de vista local en relacioacuten con la altura de puntosde inflexioacuten anteriores En el primer caso se definen tres niveles T (Top) M (Mid) y B (Bottom)mientras que en el segundo se marcan cinco posibilidades H (Higher) L (Lower) S (Same) U(Upstep) o D (Downstep) El proceso de modelizacioacuten necesario para transcribir medianteINTSINT ha sido aplicado a varias lenguas (Hirst et al 1993) y se emplea tambieacuten para laanotacioacuten prosoacutedica de parte del corpus EUROM en franceacutes ingleacutes alemaacuten sueco y espantildeol(Hirst et al 1994 Llisterri ed 1996) llevada a cabo en el marco del proyecto LRE 62-050MULTEXT - Multilingual Text Tools and Corpora Es posible tambieacuten aplicar INTSINT aniveles maacutes altos como el paacuterrafo tal como se muestra en Nicolas y Hirst (1995)

5- ETIQUETADO FONEacuteTICO DE CORPUS ORALES

Al igual que en el caso de los corpus textuales una vez recogidos los materiales de base deun corpus oral debe llevarse a cabo un tratamiento de los mismos que permita su utilizacioacutenposterior El primer paso suele ser la transcripcioacuten ortograacutefica que en determinado tipo de corpusse acompantildea de una transcripcioacuten foneacutetica o fonoloacutegica A continuacioacuten a cada segmento de laonda sonora se le asocia una etiqueta (labelling) que lo define en teacuterminos foneacuteticos o fonoloacutegicosy se lleva a cabo la alineacioacuten (alignment) entre la sentildeal sonora y las etiquetas obteniendo unarepresentacioacuten que puede compararse a la partitura musical de una obra para voz y orquesta Elproceso de etiquetado segmental puede llevarse a cabo a varios niveles como veremos en esteapartado y completarse con una anotacioacuten de las caracteriacutesticas suprasegmentales codificadasseguacuten los diversos sistemas que hemos expuesto anteriormente Si se cumplen las etapasmencionadas se llega a disponer de un corpus que contiene la sentildeal sonora sincronizada con latranscripcioacuten ortograacutefica y con la transcripcioacuten foneacutetica o fonoloacutegica de modo que una vezdefinida una estructura de base de datos es posible consultar el corpus partiendo de etiquetasfoneacuteticas de marcas prosoacutedicas o de la transcripcioacuten ortograacutefica al tiempo que se accede a lagrabacioacuten correspondiente

Los corpus de lengua oral que consisten uacutenicamente en transcripciones ortograacuteficas - ya queno suele ser factible realizar una transcripcioacuten foneacutetica completa de un nuacutemero elevado de horasde grabacioacuten - conllevan un procesamiento menos complejo aunque en algunos casos contienenmarcas prosoacutedicas uacutetiles para el anaacutelisis del discurso o de la conversacioacuten como veremos en elapartado 6

51- Niveles de etiquetado foneacutetico de corpus orales

Una cuestioacuten que se plantea inevitablemente a la hora de introducir informacioacuten adicionalsobre los datos recogidos es el nivel de etiquetado del corpus Se han realizado varias propuestassobre los distintos niveles en los que se puede realizar el etiquetado foneacutetico de un corpusalgunas de ellas ligadas al proyecto SAM como la de Barry y Fourcin (1992) en la que seplantean cinco niveles posibles de etiquetado foneacutetico de un corpus

bull Nivel fiacutesico en el que se etiquetan las propiedades acuacutesticas presentes en la sentildealsonora

bull Nivel acuacutestico-foneacutetico en el que se marcan las propiedades de los segmentos enteacuterminos de categoriacuteas foneacuteticas como oclusioacuten friccioacuten sonoridad nasalizacioacuten etc

bull Nivel de transcripcioacuten estrecha en el que se caracterizan los segmentos utilizandolos siacutembolos del AFI o de sus equivalentes computacionales

bull Nivel de transcripcioacuten fonoloacutegica (o foneacutemica) sentildealando uacutenicamente aquelloselementos funcionalmente distintivos que se encuentran en la palabra pronunciadaaisladamente en un estilo cuidado (citation form)

bull Nivel de transcripcioacuten ancha en el que se utilizan los siacutembolos correspondientes alos elementos fonoloacutegicos en una lengua dada para transcribir realizaciones alofoacutenicascondicionadas por el contexto3

A estos cinco niveles debe antildeadirse auacuten la anotacioacuten prosoacutedica considerada de formaindependiente por los autores de la propuesta

Una propuesta similar de etiquetado tambieacuten en cinco niveles - caracteriacutesticas acuacutesticas denaturaleza subfoneacutemica caracteriacutesticas segmentales realizaciones foneacuteticas forma canoacutenica de laspalabras y transcripcioacuten ortograacutefica - se presenta en Tillmann y Pompino-Marschall (1993) y hasido utilizada con eacutexito en el proyecto alemaacuten PhonDat Igualmente pueden verse las propuestasde Autesserre et al (1989) enmarcadas en el contexto del proyecto SAM y los trabajos deMarchal et al (1995) o Roach et al (1990)

La transcripcioacuten y el etiquetado de corpus orales se ha abordado en el marco del proyectoEAGLES desde una doble perspectiva la de la foneacutetica y las tecnologiacuteas del habla en el Grupo deTrabajo sobre Lengua Oral y desde la de la linguumliacutestica de corpus en el marco de las actividades delGrupo de Trabajo sobre Corpus Textuales El trabajo llevado a cabo en el grupo dedicado a lalengua hablada en EAGLES recoge esencialmente las propuestas desarrolladas en el marco deSAM y de PhonDat Los niveles de etiquetado propuesto son los siguientes (Gibbon Moore yWinski eds 1997)

bull Nivel ortograacutefico en el que se utiliza la representacioacuten ortograacutefica convencional

3 La distincioacuten entre los dos uacuteltimos niveles puede ejemplificarse con el caso de las asimilaciones mientras que enla transcripcioacuten ancha encontrariacuteamos [um poko] (un poco) en el caso de una transcripcioacuten fonoloacutegica apareceriacutea [unpoko] si se opta por no simbolizar archifonemas en la transcripcioacuten En cambio [mismo] se representariacutea de lamisma forma en ambos niveles encontraacutendose la transcripioacuten [mizmo] en el nivel de transcripcioacuten estrecha

bull Nivel de formas canoacutenicas (citation form) representando la forma depronunciacioacuten aislada de las palabra en estilo cuidado

bull Nivel de transcripcioacuten ancha o fonotiacutepica en este nivel se utilizan los siacutembolosque representan elementos fonoloacutegicos en una lengua dada pero al igual que en lapropuesta de Barry y Fourcin se transcriben aquellos fenoacutemenos predictibles propios dela foneacutetica sintaacutectica SAMPA seriacutea pues un alfabeto foneacutetico adecuado para este nivelde transcripcioacuten

bull Nivel de transcripcioacuten estrecha basado en una representacioacuten alofoacutenica de lasrealizaciones foneacuteticas de los hablantes para el cual puede utilizarse un alfabeto foneacuteticocomo X-SAMPA

bull Nivel acuacutestico-foneacutetico en el que se distinguen caracteriacutesticas acuacutesticas de lossegmentos observables en una representacioacuten de la onda sonora

bull Nivel fiacutesico representado en teacuterminos de paraacutemetros acuacutesticos o articulatoriosbull Fenoacutemenos no linguumliacutesticos la inclusioacuten de este nivel permite representar sonidos

de naturaleza comunicativa o no introducidos por el hablante asiacute como toda aquellainformacioacuten paralinguumliacutestica que se considere de intereacutes tambieacuten permite sentildealas los ruidosexternos en la grabacioacuten

Vale la pena detenerse brevemente en el nivel de las formas canoacutenicas y en el concepto deldquotranscripcioacuten fonotiacutepicardquo que como puede verse aparecen de forma recurrente en diversaspropuestas La inclusioacuten de forma canoacutenicas en el etiquetado de un corpus responde a un doblemotivo especialmente ligado a necesidades tecnoloacutegicas en primer lugar estas formas permitenderivar automaacuteticamente mediante un conjunto de reglas una transcripcioacuten ancha o fonotiacutepica enla que se incluyen los elementos alofoacutenicos cuya aparicioacuten esta condicionada por el contextofoneacutetico en segundo lugar a partir de las formas canoacutenicas puede crearse de forma automaacutetica undiccionario foneacutetico partiendo de un corpus transcrito (Wesenick y Schiel 1995 Senia y vanVelden 1997) lo que tiene utilidad para el desarrollo de sistemas de siacutentesis y reconocimiento delhabla y tambieacuten para la descripcioacuten linguumliacutestica La transcripcioacuten denominada ldquofonotiacutepicardquo en lostrabajos de SAM constituye un nivel intermedio entre la realizacioacuten foneacutetica y la transcripcioacutenpuramente fonoloacutegica Por otra parte el nivel de transcripcioacuten de formas canoacutenicas estaacutedirectamente relacionado con la representacioacuten ortograacutefica facilitando asiacute la transcripcioacuten foneacuteticaautomaacutetica de corpus en este nivel mediante el desarrollo de los correspondientes sistemas dereglas

En el informe del Grupo de Trabajo de Corpus Textuales de EAGLES (EAGLES 1996) seintenta realizar una siacutentesis entre las necesidades de diversos campos de estudio Se sugieren porello tres niveles de representacioacuten

bull S1 representacioacuten ortograacutefica del textobull S2 representacioacuten fonoloacutegica de las palabras en su forma canoacutenicabull S3 transcripcioacuten foneacutetica consistente en una representacioacuten simboacutelica discreta de

la realizacioacuten del enunciado tal como es percibido por el transcriptor

Como puede observarse estos tres niveles encuentran su equivalente en los nivelespropuesto por Barry y Fourcin (1992) y en los definidos por el Grupo de Trabajo de Lengua

Oral Para la transcripcioacuten del nivel S2 puede utilizarse SAMPA mientras que la del nivel S3requiere el uso de un alfabeto foneacutetico como X-SAMPA

52- La transcripcioacuten y el etiquetado automaacutetico de corpus orales

La tarea de transcribir y etiquetar foneacuteticamente un corpus oral representa un considerableesfuerzo tanto en teacuterminos de tiempo como de los recursos econoacutemicos necesarios para llevar acabo esta labor El etiquetado manual requiere por otro lado el desarrollo de convencionesdetalladas para asegurar la consistencia entre diversos transcriptores (Keating et al 1994 Krot yTaylor 1995 Lander 1997) ademaacutes del establecimiento de un proceso de validacioacutencomprobando la fiabilidad de los resultados obtenidos (Eisen 1993 Cole et al 1994 Strangert yHeldener 1995) Por estos motivos uno de los intereses principales de los investigadores en elcampo de las tecnologiacuteas del habla ha sido llevar a cabo el etiquetado de forma semi-automaacutetica oidealmente automaacutetica Un primer nivel de transcripcioacuten - tanto de formas canoacutenicas comofonotiacutepica - puede obtenerse automaacuteticamente como acabamos de mencionar a partir de larepresentacioacuten ortograacutefica si se dispone de un conjunto de reglas que establezcan lascorrespondencias entre la representacioacuten ortograacutefica y la foneacutetica

Sin embargo un etiquetado foneacutetico en los niveles de transcripcioacuten maacutes detallada requiere laposibilidad de acceder a la onda sonora y un procedimiento de anaacutelisis de la sentildeal La primeraoperacioacuten que debe realizar un sistema de etiquetado automaacutetico es la segmentacioacuten del continuumsonoro en unidades menores - segmentos o caracteriacutesticas acuacutesticas en funcioacuten del nivel detranscripcioacuten deseado - para pasar despueacutes a la asignacioacuten de etiquetas - siacutembolos detranscripcioacuten - que describan sus caracteriacutesticas Este es el proceso conocido propiamente comoetiquetado (labelling) que cuando se realiza de forma automaacutetica debe superar los obstaacuteculosderivados de la naturaleza no discreta de la sentildeal sonora - resultado de mecanismos como lacoarticulacioacuten - y de la variabilidad de realizaciones foneacuteticas entre hablantes o incluso en unmismo hablante

Para que el corpus sea uacutetil el etiquetado foneacutetico debe estar temporalmente sincronizadocon la sentildeal sonora y con la representacioacuten ortograacutefica operacioacuten que se realiza en el procesoconocido como alineacioacuten temporal (time alignment) llevado a cabo tambieacuten de forma automaacuteticaEsta alineacioacuten puede hacerse de un modo global sentildealando en la onda sonora las fronteras entrepalabras ortograacuteficas - para facilitar el acceso a la grabacioacuten a partir de este nivel de representacioacuten(Lander 1997) - o los puntos en los que se encuentran siacutelabas acentuadas tal como sucede porejemplo en el proyecto MULTEXT

En el campo de las tecnologiacuteas del habla se han llevado a cabo numerosiacutesimos trabajosencaminados al disentildeo de sistemas de segmentacioacuten etiquetado y alineacioacuten temporal automaacuteticasde corpus orales utilizando las teacutecnicas propias del reconocimiento del habla como los Modelosde Markov o las redes neuronales Cabe destacar que tales teacutecnicas no soacutelo son uacutetiles en eldesarrollo de corpus en este aacutembito sino que constituyen una herramienta importante en otrostipos de corpus sin embargo es preciso reconocer que el habla espontaacutenea - especialmente si seha recogido mediante grabaciones realizadas en un entorno natural - plantea auacuten problemas en lo

que se refiere a su transcripcioacuten y etiquetado automaacuteticos pese a los notabiliacutesimos avances quetienen lugar en este campo

6- TRANSCRIPCIOacuteN Y CODIFICACIOacuteN DE CORPUS PARA EL ANAacuteLISIS DE LA LENGUA ORAL

En este uacuteltimo apartado incidiremos en las cuestiones relacionadas con la transcripcioacuten ycodificacioacuten de corpus orales que pueden presentar un mayor intereacutes para aacutembitos como elanaacutelisis de discurso o de la conversacioacuten y para el estudio de la lengua oral en todos los niveles dela descripcioacuten linguumliacutestica Como indicaacutebamos al principio la transcripcioacuten y la codificacioacuten de loselementos transcritos son en principio dos operaciones conceptualmente diferentes Sinembargo en la praacutectica habitual en las disciplinas a las que se refiere este apartado suelen ser dosoperaciones que se realizan simultaacuteneamente ya que al mismo tiempo que se realiza latransliteracioacuten se introducen las marcas necesarias para la codificacioacuten de los elementos que se hadecidido introducir en el corpus Por ello en muchos casos la discusioacuten sobre la transcripcioacuten y lacodificacioacuten se realiza conjuntamente en la bibliografiacutea sobre el tema

61- Los requisitos de una transcripcioacuten

El investigador que decide constituir un corpus de lengua oral se encuentra en estosmomentos con una gran variedad de criterios en lo que se refiere a la transcripcioacuten y a la seleccioacutende los elementos que apareceraacuten codificados en el corpus Hemos hecho ya referencia en elapartado 3 a las diversas convenciones para la representacioacuten ortograacutefica y cintildeeacutendonos al aacutembitodel anaacutelisis del discurso y la conversacioacuten constatamos igualmente la existencia una grandiversidad de propuestas En una revisioacuten de las mismas Payratoacute (1995) hace por ejemploreferencia a los sistemas de transcripcioacuten y codificacioacuten procedentes de la etnometodologiacuteainteresados en reflejar la interaccioacuten verbal a los meacutetodos desarrollados en el marco de laetnografiacutea de la comunicacioacuten y de la sociolinguumliacutestica interaccional4 o a propuestas utilizadas en elestudio del lenguaje infantil Ante tal situacioacuten parece conveniente plantearse cuaacuteles son losrequisitos que debe cumplir una transcripcioacuten de la lengua oral tema que ha sido abordado pordiversos autores (DuBois 1991 Elich 1993 Edwards 1993 OrsquoConnell y Kowal 1994) Trasrevisar aportaciones anteriores Payratoacute (1995) resume los requisitos que teoacutericamente deberiacuteanexigirse a toda transcripcioacuten

bull Neutralidad o fidelidad de modo que la transcripcioacuten no sea interpretativabull Globalidad o complejidad recogiendo la totalidad de los fenoacutemenos que aparecen

en el discurso oralbull Omnifuncionalidad permitiendo diversos usos y aplicacionesbull Claridad tanto desde el punto de vista del aprendizaje del sistema como de la

legibilidad de la representacioacutenbull Universalidad y compatibilidad entre sistemas informaacuteticos

4 Estos sistemas se comparan en OrsquoConnell y Kowal (1994) Pueden encontrarse consideraciones generales sobre latranscripcioacuten y codificacioacuten de la lengua oral en el anaacutelisis del discurso y la conversacioacuten en 1995Ochs (1979) DuBois (1991) Edwards (1992 1993 1995) Du Bois et al (1993) Gumperz y Berenz (1993) Cook (1995) Chafe(1995) y en Sinclair (1995)

Sin embargo puesto que en la praacutectica se transcribe en funcioacuten de los objetivos para losque se ha definido el corpus Payratoacute (1995) considera que un sistema de transcripcioacuten debe serante todo interpretativo de los datos selectivo en cuanto a los fenoacutemenos que se transcribenpertinente para el objeto de investigacioacuten coherente con la base teoacuterica adoptada por elinvestigador fiel en cuanto a la representacioacuten de los datos y flexible para que sea posible suutilizacioacuten en diversos estudios Por otra parte en opinioacuten de este autor la simbologiacutea utilizadadebe ser clara econoacutemica sencilla exenta de ambiguumledad y compatible con sistemas internacionesestandarizados Este uacuteltimo aspecto nos parece especialmente importante ya que como sentildeala elmismo Payratoacute (1995 58)

[] en ninguacuten caso puede olvidarse que los datos de una investigacioacuten no deberiacutean sertratados nunca de forma tan parcial o idiosincraacutesica que se impidiera o dificultara el uso por partede otros investigadores La transcripcioacuten del discurso oral es una actividad suficientementecostosa y conflictiva para tomar precauciones en este sentido y ninguna comunidad cientiacuteficapuede permitirse el lujo de particularismos (en aspectos tan elementales) que obstruyan el debateo conviertan en inaprovechables una fuente de informacioacuten

62- Propuestas de estandarizacioacuten para la transcripcioacuten y codificacioacuten de corpus orales

Ante la diversidad de propuestas para la transcripcioacuten y codificacioacuten de la lengua oral queacabamos de constatar el surgimiento de la linguumliacutestica de corpus y muy especialmente lasnecesidades derivadas del intercambio electroacutenico de textos propiciaron la aparicioacuten de proyectose iniciativas centrados en la creacioacuten de estaacutendares tanto en lo que se refiere a la transcripcioacutencomo a la codificacioacuten En los proacuteximos apartados revisamos sucintamente algunos de ellos

Uno de los capiacutetulos de las Guiacuteas desarrolladas por la TEI estaacute dedicado a la transcripcioacutende corpus orales (Johansson 1995a b) En eacutel se describe la estructura baacutesica de la representacioacutende un texto oral - cabecera texto y divisiones - y se definen los procedimientos basados enSGML para la representacioacuten de los elementos estructurales baacutesicos informacioacuten contextualinformacioacuten temporal enunciados pausas elementos vocalizados semi-leacutexicos o no leacutexicoselementos kineacutesicos otros tipos de eventos comunicativos y texto presentado en forma escrita alhablante Tambieacuten se ofrecen en este capiacutetulo indicaciones para la segmentacioacuten y el alineamientoasiacute como recomendaciones para la transcripcioacuten de superposiciones entre hablantes de formas depalabras prosodia elementos paralinguumliacutesticos - tempo intensidad rango tonal tensioacuten ritmo ycalidad de voz - y alteraciones en el decurso foacutenico Para la representacioacuten de la informacioacutenfoneacutetica se recomienda el uso del AFI En la siguiente tabla se resumen los principales elementospropuestos por la TEI para la codificacioacuten de corpus orales considerados especiacuteficos de este tipode texto (Sperberg-McQueen y Burnard eds 1994)

Elemento codificado Marca decodificacioacutenen SGML

Definicioacuten

Divisiones (division) ltdivgt Unidades intermedias entre el texto y el enunciado que permitendelimitar partes diferenciadas en un texto

Enunciado (utterance) ltugt Segmento de habla comprendido entre dos pausas o delimitado porun cambio en el turno de palabra puede incluir ademaacutesinformacioacuten sobre la superposicioacuten (ltoverlapgt) de turnos cuando

interviene simultaacuteneamente maacutes de un hablantePausa (pause) ltpausegt Interrupcioacuten de la fonacioacuten percibida entre dos enunciados o en el

interior de los mismos puede describirse en teacuterminos relativos oindicando su duracioacuten

Vocal (vocal) ltvocalgt Elemento vocalizado semi-leacutexico o no leacutexico (pej pausas llenas otoses)

Kineacutesico (kinesic) ltkinesicgt Cualquier fenoacutemeno comunicativo no vocal (p ej gestos)Acontecimiento (event) lteventgt Cualquier fenoacutemeno identificado en la grabacioacuten no necesariamente

vocalizado ni con valor comunicativo (p ej ruidos de fondo)Texto escrito (writing) ltwritinggt Texto escrito que se presenta al hablante durante su intervencioacutenCambio (shift) ltshiftgt Momento en el que se produce un cambio en alguno de los rasgos

paralinguumliacutesticos - calidad de voz intensidad rango tonal ritmo yvelocidad de elocucioacuten - cada uno de los rasgos puede describirsemediante una lista de caracteriacutesticas

Tabla 1 Elementos codificados en las transcripciones de lengua oral seguacuten los estaacutendares de la TEI(Adaptada de Sperberg-McQueen y Burnard eds1994)

Por otra parte la TEI ofrece mecanismos para indicar el comienzo y el final de unfenoacutemeno su duracioacuten y su sincronizacioacuten temporal con otros elementos presenta tambieacuten laposibilidad de marcar unidades inferiores al enunciado - segmentos ltseggt - que permitendelimitar por ejemplo unidades prosoacutedicas e incluye tambieacuten entre sus propuestas las marcasnecesarias para sentildealar fenoacutemenos propios de la lengua hablada como palabras truncadasrepeticiones falsos principios - marcados como ltdelgt (deletion) y especificando el fenoacutemeno -Las partes de la grabacioacuten que el transcriptor no llega a interpretar correctamente - ltuncleargt - ono puede escuchar - ltgapgt - o las correcciones de errores de produccioacuten realizadas por eltranscriptor - ltsicgt para delimitar el error y ltcorrgt para indicar la correccioacuten - son tambieacutenelementos para los cuales la TEI establece marcas de codificacioacuten

Aunque las Guiacuteas de la TEI pueden considerarse un sistema adecuado para la transcripcioacuteny codificacioacuten de gran variedad de materiales los autores propios autores reconocen que

[] the present proposals are not intended to support unmodified every variety of researchundertaken upon spoken material now or in the future some discourse analysts phonologistsand doubtless other may wish to extend the scheme presented here to express more precisely theset of distinctions they wish to draw in their transcriptions Speech regarded as a purely acousticphenomenon may well require different methods from those outlined here as may speechregarded solely as a process of social interaction (Sperberg-McQueen y Burnard eds 1994 cap11)

El proyecto NERC - Network of European Reference Corpora (NERC 1994) se planteoacutecomo uno de sus objetivos la viabilidad de desarrollar una serie de recomendaciones para laconstitucioacuten de corpus y por tanto incluye entre sus resultados indicaciones sobre el tratamientode los corpus orales tanto en lo que se refiere a su codificacioacuten como a la transcripcioacuten de loselementos segmentales y suprasegmentales (Sinclair 1994) El sistema adoptado para latranscripcioacuten y codificacioacuten de corpus se basa como hemos indicado anteriormente en eldesarrollado por French (1991 1992) para la transcripcioacuten del corpus oral desarrollado en elproyecto COBUILD La transcripcioacuten se plantea como una operacioacuten que puede desarrollarse envarios niveles

bull Nivel I consiste en la representacioacuten ortograacutefica introduciendo los miacutenimossignos de puntuacioacuten necesarios sin informacioacuten sobre la interaccioacuten entre hablantes Eneste nivel se contemplan convenciones desarrolladas para la representacioacuten ortograacutefica ypara precisar el uso de la puntuacioacuten

bull Nivel II consiste en una representacioacuten ortograacutefica enriquecida con informacioacutenbaacutesica sobre la identidad de los hablantes el turno de palabra y los elementos no verbales

bull Nivel III contiene toda la informacioacuten presente en el nivel II ademaacutes deinformacioacuten sobre la interaccioacuten entre hablantes - marcando el principio y el final de lossolapamientos - y sobre la entonacioacuten - sentildealando las fronteras entre unidades tonales ylas siacutelabas acentuadas- En opinioacuten de French (1992) la transcripcioacuten a este nivel requiereuna formacioacuten especiacutefica en foneacutetica

bull Nivel IV constituye el nivel maacutes detallado de representacioacuten incluyendo lainformacioacuten propia del nivel III junto con marcas de tonos siacutelabas nucleares y con unatranscripcioacuten fonoloacutegica alineada con una representacioacuten acuacutestica - espectrograma y curvameloacutedica - del enunciado

La recomendacioacuten del proyecto NERC es que la transcripcioacuten de un corpus para el estudiode la lengua oral se lleve a cabo seguacuten las especificaciones del Nivel II adecuado seguacuten Frenchpara todas aquellas investigaciones que no requieran informacioacuten prosoacutedica

En el marco de NERC se llevoacute tambieacuten a cabo una evaluacioacuten de las Guiacuteas de la TEI para latranscripcioacuten de corpus orales de la que se concluye que ldquoThe TEI proposals are broadlycompatible with current practice in the user community as represented by JP Frenchconventions Furthermore in the majority of cases it will be a straightforward matter to link themachine-friendly TEI codes to the more user-friendly encoding systems such as JP Frenchconventions by means of a simple conversion programmerdquo (Payne 199260) La idea de unaconversioacuten automaacutetica entre las transcripciones realizadas seguacuten las propuestas de NERC y de laTEI es naturalmente interesante y refuerza la idea de que existe una compatibilidad general entreambos sistemas (Payne 1992 Johansson 1995a EAGLES 1996) prueba de ello es que en elinforme final de NERC se recomienda el uso de las normas de la TEI

Uno de los objetivos del Grupo de Trabajo sobre Textos Orales de EAGLES fue proponerun conjunto miacutenimo de fenoacutemenos que deberiacutean codificarse en cualquier texto oral La propuestarealizada se describe en EAGLES (1996) y toma elementos del proyecto NERC de la TEI y delGrupo de Trabajo sobre Lengua Oral de EAGLES Considerando los elementos comunes a lossistemas que sirven de base se sugiere que la codificacioacuten de un texto oral debe contener almenos informacioacuten sobre los siguientes aspectos

(1) Elementos vocales y no vocalesbull Elementos vocales semi-leacutexicos

Pertenecen a esta categoriacutea los elementos utilizados principalmente en elhabla espontaacutenea durante los momentos en que el hablante planifica lacontinuacioacuten de su discurso como las llamadas ldquopausas llenasrdquo o ldquosonorasrdquo y los

elementos que marcan dudas en el momento de la produccioacuten del hablaCorresponden a los elementos que en la TEI se marcan con la etiqueta ltvocalgtbull Elementos vocales no leacutexicos

Se incluyen aquiacute todo tipo de sonidos producidos por el hablante - tosesrisas bostezos estornudos etc - que no constituyen formas leacutexicas de la lenguaCorresponden igualmente a los codificados con la marca ltvocalgt en la TEIbull Acontecimientos no vocales y no comunicativos

Comprenden los ruidos producidos por otros hablantes o procedentes delentorno de grabacioacuten Estos acontecimientos se codifican en la TEI mediante lamarca lteventgt

(2) Elementos necesarios en la transcripcioacuten de interacciones verbalesbull Identidad del hablante

Este es un elemento imprescindible en la transcripcioacuten de interaccionesverbales La TEI dispone de los mecanismos para documentar informacioacuten sobrelos hablantes en la cabecera de los textos asiacute como de un sistema para marcar laidentidad de cada participante en el interior del texto aunque pueden utilizarsetambieacuten otros procedimientosbull Turnos de palabra

La finalidad del marcado de los turnos de palabra es indicar un cambio dehablante Ademaacutes de las convenciones de la TEI pueden emplearse otrosprocedimientos mientras se mantenga esta informacioacuten esencial en el estudio de lainteraccioacuten verbalbull Superposicioacuten de turnos de palabra

Existen igualmente diferentes procedimientos para marcar la superposicioacutende emisiones de dos hablantes ademaacutes de las propuestas de la TEI que los tratacomo parte de las estrategias para codificar acontecimientos simultaacuteneos

(3) Elementos relacionados con la actuacioacuten del hablantebull Omisiones en un texto leiacutedo

Si se transcribe un texto leiacutedo y se dispone del original es recomendableanotar las palabras o segmentos omitidos por el locutorbull Autocorrecciones

Es propio del habla espontaacutenea aunque tambieacuten de la lectura que loshablantes realicen correcciones de su propia produccioacuten linguumliacutestica (self-repairs)Parece conveniente marcarlas en la transcripcioacuten de un corpus oralbull Fragmentos de palabras

Los fragmentos de palabras corresponden a uno o maacutes segmentospertenecientes a una palabra que no ha sido totalmente pronunciada por el hablanteen un primer intento y que suelen repetirse cuando eacuteste consigue producir lapalabra completa Es importante indicar este fenoacutemeno en la transcripcioacuten

bull Fragmentos ininteligiblesSe trata de partes de la grabacioacuten que no son comprendidas por el

transcriptor y en la TEI se codifican con la etiqueta ltuncleargt aunque si se desease pueden utilizar marcas maacutes detalladas distinguiendo entre transcripcionescompletamente ininteligibles y entre una posible interpretacioacuten ofrecida por eltranscriptor

Un aspecto conflictivo sigue siendo la identificacioacuten de los enunciados que conforman untexto oral (Schuetze-Coburn 1991) Mientras que en un texto escrito los signos de puntuacioacutenconstituyen un criterio de delimitacioacuten en el habla disponemos de indicios como las pausas laentonacioacuten o el cambio de turno de palabra que nos permiten al menos convencionalmentedefinir un enunciado Sin embargo hasta el momento no se han desarrollado auacuten criteriosobjetivos y consistentes para resolver este problema

7- CONCLUSIONES

La revisioacuten - sin pretensiones de exhaustividad - de los principales sistemas detranscripcioacuten etiquetado y codificacioacuten de corpus orales expuesta en este trabajo pone demanifiesto en primer lugar la multiplicidad de propuestas desarrolladas frente a los intentos deestandarizacioacuten algunos de los cuales auacuten no se han consolidado plenamente pese a su crecienteaceptacioacuten En segundo lugar destaca tambieacuten la heterogeneidad de tradiciones que confluyen enel estudio de la lengua hablada desde la foneacutetica y las tecnologiacuteas del habla hasta el anaacutelisis deldiscurso y de la conversacioacuten diversidad que lleva a la creacioacuten de convenciones especiacuteficas pararesponder a las necesidades de diversas comunidades cientiacuteficas Ante esta situacioacuten la distincioacutenpropuesta por Sinclair (1995107) entre ldquoconformidadrdquo y ldquocompatibilidadrdquo adquiere todo susentido ya que si en ciertos casos la conformidad a un estaacutendar determinado es problemaacutetica porlas limitaciones inherentes a todo sistema comuacuten la compatibilidad - entendida como la facilidadde conversioacuten entre sistemas - deberiacutea ser en cambio un requisito imprescindible en el desarrollode los recursos linguumliacutesticos De esta manera puede tal alcanzarse el equilibrio entre lasnecesidades de un proyecto y las indudables ventajas cientiacuteficas y econoacutemicas que resultan de lareutilizacioacuten de los datos disponibles

BIBLIOGRAFIacuteA

Allen GD 1988 The PHONASCII System Journal of the International PhoneticAssociation 181 9-25

Anderson AH M Badger EG Bard E Boyle G Doherty S Garrod S Isard JKowtko J Mcallister J Miller C Sotillo HS Thompson y R Weinert 1991 The HCRCMap Task corpus Language and Speech 344 351-366

Autesserre D G Peacuterennou y M Rossi 1989 Methodology for the transcription andlabeling of a speech corpus Journal of the International Phonetic Association 191 2-15

Barry WJ y AJ Fourcin 1992 Levels of Labelling Computer Speech and Language 61-14

Beckman ME y GM Ayers GM 1994 Guidelines for ToBI Labelling Version 20February 1994[Documento de Internet disponible en httplingohio-stateeduPhoneticsToBIToBI0html]

Beckman ME y J Hirschberg J 1994 The ToBI Annotation Conventions Apeacutendice A deME Beckman y GM Ayers 1994 Guidelines for ToBI Labelling Version 20 February 1994[Documento de Internet disponible en httplingohio-stateeduPhoneticsToBIToBI0html]

Bruce G 1988 23 Supasegmental categories and 24 The symbolization of temporalevents Journal of the International Phonetic Association 182 75-76

Bruce G 1989 Report from the IPA working group on suprasegmental categories LundUniversity Department of Linguistics General Linguistics Phonetics Working Papers 35 25-40

Burnard L 1995 What is SGML and how does it help Computers and the Humanities291 41-50 The Text Encoding Initiative Background and Context Eds N Ide y J VeacuteronisDordrecht Kluwer Academic Publishers

Burnard L 1995a Text Encoding for Information Exchange An Introduction to the TextEncoding Initiaive TEI Document TEI J31 [Documento de Internet disponible enhttpwwwuiceduorgsteiinfoteij31]

Burnard L 1995b The Text Encoding Initiative an overviewrdquo Spoken English onComputer Transcription Markup and Applications Eds G LEECH G MYERS y JTHOMAS Harlow Longman 69-81

Chafe W 1995 Adequacy user-friendliness and practicality in transcribingrdquo English onComputer Transcription Markup and Applications Eds G Leech G Myers y J ThomasHarlow Longman 54-61

Chan D A Fourcin D Gibbon B Granstroumlm M Huckvale G Kokkinakis K KvaleL Lamel B Lindberg A Moreno J Mouropoulos F Senia I Trancoso C Veld y J Zeiliger1995 EUROM - A Spoken Language Resource for the EU Eurospeech95 Proceedings of the4th European Conference on Speech Communication and Speech Technology Madrid Spain 18-21 September 1995 Vol 1 867-870

Cole RA BT Oshika M Noel T Lander y M Fanty 1994 Labeler Agreement inPhonetic Labeling of Continuous Speech Proceedings of the 1994 International Conference onSpoken Language Processing Yokohama Japan 18-22 September 1994[Documento de Internet disponible en httpwwwcseogieduCSLUcorporapapershtml]

Cook G 1995 Theoretical issues transcribing the untranscribablerdquo Spoken English onComputer Transcription Markup and Applications Eds G Leech G Myers y J ThomasHarlow Longman 35-53

Du Bois JW 1991 Transcription design principles for spoken discourse researchPragmatics 1 71-106

Du Bois JW S Schuetze-Coburn S Cumming y D Paolino 1993 Outline of discoursetranscriptionrdquo Talking Data Transcription and Coding in Discourse Research Eds JAEdwards y MD Lampert Hillsdale NJ Lawrence Erlbaum Associates 45-90

EAGLES 1996 Preliminary Recommendations on Spoken Texts EAGLES DocumentEAG-TCWG-STPP May 1996[Documento de Internet disponible enhttpwwwilcpicnritEAGLES96spokentxspokentxhtml]

Edwards JA 1992 Design principles in the transcription of spoken discourserdquoDirections in Corpus Linguistics Proceedings of Nobel Symposium 82 Stockholm 4-8 August1991 Ed J Svartvik Berlin Mouton de Gruyter 129-147

Edwards JA 1993 Principles and Contrasting Systems of Discourse TranscriptionrdquoTalking Data Transcription and Coding in Discourse Research Eds JA Edwards y MDLampert Hillsdale Hillsdale NJ Lawrence Erlbaum Associates 3-32

Edwards JA 1995 Principles and alternative systems in the transcription coding andmark-up of spoken discourserdquo Spoken English on Computer Transcription Markup andApplications Eds G Leech G Myers y J Thomas Harlow Longman 19-34

Ehlich K 1993 HIAT A Transcription System for Discourse Datardquo Talking DataTranscription and Coding in Discourse Research Eds JA Edwards y MD Lampert HillsdaleNJ Lawrence Erlbaum Associates 123-148

Eisen B 1993 Reliability of speech segmentation and labelling at different levels oftranscription Eurospeech93 3rd European Conference on Speech Communication andTechnology Berlin Germany 21-23 September 1993 Vol 1 673-676

Esling JH y H Gaylord 1993 Computer Codes for Phonetic Symbols Journal of theInternational Phonetic Association 232 77-82

Esling JH 1988 Computer coding of IPA symbols and detailed phonetic representationsof computer databases Journal of the International Phonetic Association 182 99-106

Esling JH 1990 Computer Coding of the IPA Supplementary Report Journal of theInternational Phonetic Association 201 22-26

Fourcin A y JM Dolmazon (on behalf of the SAM Project) 1991 Speech knowledgestandards and assessment Actes du XIIegraveme Congregraves International des Sciences Phoneacutetiques 19-24 aoucirct 1991 Aix-en-Provence France Aix-en-Provence Universiteacute de Provence Service desPublications Vol 5 430-433

Fourcin A G Harland W Barry y V Hazan eds 1989 Speech Input and OutputAssessment Multilingual Methods and Standards Chichester Ellis Horwood Ltd

French JP 1991 Updated notes for soundprint transcribers Working paper Universityof Birmingham October 1991 NERC-WP4-47

French JP 1992 Transcription proposals multilevel system Working paper Universityof Birmingham October 1992 NERC-WP4-50

Gibbon D 1989 Survey of Prosodic Labelling for EC Languages SAM-UBI-190 12February 1989 Report e6 in ESPRIT 2589 (SAM) Interim Report Year 1 Ref SAM-UCLG002 University College London February 1990

Gibbon D R Moore y R Winski eds 1997 Handbook on Standards and Resources forSpoken Language Systems Berlin Mouton De Gruyter [Documento de Internet disponible en httpcoralliliuni-bielefelddeEAGLESeagbookeagbookhtml]

Groslashnnum Thorsen N 1987 Suprasegmental transcription ARIPUC - Annual Report ofthe Institute of Phonetics University of Copenhagen 21 1-27

Gumperz JJ y J Berenz 1993 Transcribing Conversational Exchangesrdquo Talking DataTranscription and Coding in Discourse Research Eds JA Ewards y M D Lampert HillsdaleNJ Lawrence Erlbaum Associates 91-122

Hart J lsquoT R Collier y A Cohen 1990 A Perceptual Study of Intonation An Experimental- Phonetic Approach to Intonation Cambridge Cambridge University Press (Cambridge Studiesin Speech Science and Communication)

Hess W K Kohler y HG Tillmann 1995 The PhonDat-Verbmobil Speech CorpusEurospeech95 Proceedings of the 4th European Conference on Speech Communication andSpeech Technology Madrid Spain 18-21 September 1995 Vol 1 863-866

Hieronymus JL 1994 ASCII phonetic symbols for the worlds languages WorldbetATampT Bell Laboratories Technical Memo [Documento de Internet disponible enhttpwwwcseogieduCSLUcorporapapershtml]

Hirst D A Di Cristo y R Espesser en prensaLevels of representation and levels ofanalysis for intonation Prosody Theory and Experiments Ed M Horne Dordrecht Kluwer

Hirst DJ y A Di Cristo en prensa A survey of intonation systemsrdquo IntonationSystems A Survey of 20 Languages Eds D Hirst y A Di Cristo Cambridge CambridgeUniversity Press

Hirst DJ 1991 Intonation models towards a third generation Actes du XIIegraveme CongregravesInternational des Sciences Phoneacutetiques 19-24 aoucirct 1991 Aix-en-Provence France Aix-en-Provence Universiteacute de Provence Service des Publications Vol 1 305-310

Hirst DJ A Di Cristo M Le Besnerais Z Najim P Nicolas y P Romeacuteas 1993Multilingual modelling of intonation patternsrdquo Proceedings of an ESCA Workshop on ProsodySeptember 27-29 1993 Lund Sweden Eds D House y P Touati Lund University Departmentof Linguistics and Phonetics Working Papers 41 204-207

Hirst DJ N Ide y J Veacuteronis 1994 Coding fundamental frequency patterns for multi-lingual synthesis with INTSINT in the MULTEXT project Conference Proceedings of theSecond ESCAIEEE Workshop on Speech Synthesis September 12-15 1994 Mohonk MountainHouse New Paltz New York USA 77-80

Ide N y J Veacuteronis eds 1995 The Text Encoding Initiative Background and ContextsComputers and the Humanities 29 1-3 Publicado en forma de libro en Dordrecht KluwerAcademic Publishers

IPA 1989 The IPA 1989 Kiel Convention Workgroup 9 report Computer Coding of IPAsymbols and Computer Representation of Individual Languages Journal of the InternationalPhonetic Association 192 81-92

IPA 1993 IPA Chart revised to 1993 Journal of the International Phonetic Association231 [Documento de Internet disponible en httpwwwartsglaacukIPAipacharthtml]

IPA 1995 Preview of the IPA Handbook Journal of the International Phonetic Association251

ISO 8879 1986 Information Processing Text and Office Systems Standard GeneralizedMarkup Language (SGML) Geneva International Organization for Standardization

Johansson S 1995a The approach of the Text Encoding Initiative to the encoding ofspoken discourse Spoken English on Computer Transcription Markup and Applications EdsG Leech G Myers y J Thomas Harlow Longman 82-98

Johansson S 1995b The Encoding of Spoken Texts Computers and the Humanities291 149-158 The Text Encoding Initiative Background and Context Eds N Ide y J VeacuteronisDordrecht Kluwer Academic Publishers 149-158

Keating P P MacEachern A Shryock y S Domiacutenguez 1994 A manual for phonetictranscription Segmentation and labelling of words in spontaneous speech UCLA WorkingPapers in Phonetics 88 91-120

Kluger-Kruse M 1987 Computer Phonetic Alphabet ESPRIT Linguistic Analysis of theEuropean Languages Report BU-CPA0267 July 1987

Krot C y B Taylor 1995 Criteria for Acoustic-Phonetic Segmentation and WordLabelling in the Australian National Database of Spoken Language[Documento de Internet disponible en httpwwwshlrcmqeduaucriteriahtml]

Lander T 1997 The CSLU Labeling Guide Center for Spoken Language UnderstandingOregon Graduate Institute[Documento de Internet disponible en httpwwwcseogieduCSLUcorporapapershtml]

Llisterri J 1994 Prosody Encoding Survey WP 1 Specifications and Standards T15Markup Specifications Deliverable 153 Final version 15 September 1994 LRE Project 62-050MULTEXT

Llisterri J ed 1996 Prosody Tools Efficiency and Failures WP 4 Corpus T46 SpeechMarkup and Validation Deliverable 452 Final version 15 October 1996 LRE Project 62-050MULTEXT

MacWhinney B 1991The CHILDES Project Tools for Analyzing Talk Hillsdale NJLawrence Erlbaum

Marchal A N Nguyen y W Hardcastle 1995 Multitiered phonetic approach to speechlabelling Levels in Speech Communication Relations and Interactions A Tribute to MaxWajskop Hommage agrave Max Wajskop Eds C Sorin J Mariani H Meloni y J SchoengenAmsterdam Elsevier Science BV 149-158

NERC 1994 NERC-1 Network of European Reference Corpora Final Report PisaInstituto di Linguistica Computazionale - CNR January 1994 versioacuten en curso de publicacioacutenTowards a Network of European Reference Corpora Eds N Calzolari M Baker y PG KruytPisa Giardini

Nicolas P y D Hirst 1995 Symbolic coding of Higher-Level Characteristics ofFundamental Frequency Curvesrdquo Eurospeech95 Proceedings of the 4th European Conferenceon Speech Communication and Technology Madrid Spain 18-21 September 1995 Vol 2 989-992

OConnell DC y S Kowal 1994 Some Current Transcription Systems for SpokenDiscourse A critical Analysis Pragmatics 4 81-107

Ochs E 1979 Transcription as Theory Developmental Pragmatics Eds E Ochs E yBB Schieffelin New York Academic Press 43-72

Payne J 1992 Report on the compatibility of JP Frenchs spoken corpus transcriptionconventions with the TEI guidelines for transcription of spoken texts Working paper COBUILDBirmingham and IDS Mannheim December 1992 NERC-WP8WP4-122

Payne J 1995 The COBUILD spoken corpus transcription conventions SpokenEnglish on Computer Transcription Markup and Applications Eds G Leech G Myers y JThomas Harlow Longman 203-207

Payratoacute Ll 1995 Transcripcioacuten del discurso coloquialrdquo El espantildeol coloquial Actas del ISimposio sobre Anaacutelisis del Discurso Oral Almeriacutea 23-25 de noviembre de 1994 Ed L CorteacutesRodriacuteguez Almeriacutea Universidad de Almeriacutea Servicio de Publicaciones 43-70

Pierrehumbert J B 1897 (1980) The Phonology and Phonetics of English IntonationPhD Thesis Department of Linguistics MIT Bloomington Indiana University Linguistics Club

Pitrelli J M Beckman y J Hirschberg 1994 Evaluation of prosodic transcriptionlabelling reliability in the ToBI frameworkrdquo Proceedings of the Third International Conference onSpoken Language Processing Yokohama ICSLP Vol 2 123-126

Pullum GK y WA Ladusaw 1996 (1986) Phonetic Symbol Guide Chicago TheUniversity of Chicago Press 2nd edition

Roach P H Roach A Dew y P Rowlands 1990 Phonetic analysis and the automaticsegmentation and labeling of speech sounds Journal of the International Phonetic Association201 15-21

Schmidt MS C Scott y MA Jack 1993 Phonetic transcription standards for Europeannames (ONOMASTICA) Eurospeech93 3rd European Conference on Speech Communicationand Technology Berlin Germany 21-23 September 1993 Vol 1 279-282

Schuetze-Coburn S 1991Units of intonation in discourse a comparison of acoustic andauditory analysis Language and Speech 343 207-234

Selting M 1987 Descriptive categories for the auditive analysis of intonation inconversation Journal of Pragmatics 11 777-791

Selting M 1988 The role of intonation in the organisation of repair and problem handlingsequences in conversation Journal of Pragmatics 12 293-322

Senia F y JG Van Velden 1997 Specifications of orthographic transcription and lexiconconventions LRE-4001 SpeechDat Technical Report SD132 Final version 10 January 1997[Documento de Internet disponible en httpwwwphonetikuni-muenchendeSpeechDathtml]

Silverman K M Beckman J Pitrelli M Ostendorf C Wightman P Price JPierrehumbert y J Hirschberg 1992 TOBI A standard for labelling English prosodyProceedings of the Second International Conference on Spoken Language Processing ICSLP-92Banff October 1992 867-870

Sinclair J 1994 Spoken Language [3B] PhoneticPhonemic and Prosodic Annotation[52] NERC 1994 NERC-1 Network of European Reference Corpora Final Report PisaVersioacuten en curso de publicacioacuten Towards a Network of European Reference Corpora Eds NCalzolari M Baker y PG Kruyt Pisa Giardini

Sinclair J 1995 From theory to practicerdquo Spoken English on Computer TranscriptionMarkup and Applications Eds G Leech G Myers Y J Thomas Harlow Longman 99- 112

Sperberg-McQueen CM y L Burnard eds 1994 Guidelines for Electronic Text Encodingand Interchange TEI P3 Chicago and Oxford Association for Computational Linguistics Association for Computers and the Humanities Association for Literary and LinguisticComputing [Cap 11 Transcriptions of Speech] [Documento de Internet disponible enhttpetextvirginiaeduTEIhtml]

Strangert E y M Heldner 1995 Labelling of boundaries and prominences byphonetically experienced and non-experienced transcribers Phonum 3 Reports from theDepartment of Phonetics Umearing University 85-109 [Documento de Internet disponible enhttpwwwlingumusefonphonum3html]

Teubert W 1993 Phonetic Phonemic and Prosodic Annotation Final Report IDSMannheim February 1993 NERC-WP8-171

Tillmann HG y B Pompino-Marschall 1993 Theoretical Principles ConcerningSegmentation Labelling Strategies and Levels of Categorical Annotation for Spoken LanguageDatabase Systems Eurospeech93 3rd European Conference on Speech Communication andTechnology Berlin Germany 21-23 September 1993 Vol 3 1691-1694

Trancoso I 1995 The ONOMASTICA Interlanguage Pronunciation LexiconrdquoEurospeech95 Proceedings of the 4th European Conference on Speech Communication andTechnology Madrid Spain 18-21 September 1995 Vol 1 829-832

Wells JC 1987 Computer Coded Phonetic Transcription Journal of the InternationalPhonetic Association 172 94-114

Wells JC 1989 Computer-coded phonemic notation of individual languages of theEuropean Community Journal of the International Phonetic Association 191 31-54

Wells JC 1994 Computer-coding the IPA a proposed extension of SAMPA SpeechHearing and Language Work in Progress 1994 (University College London Department ofPhonetics and Linguistics) 8 271-289

Wells JC 1995 SAMPROSA (SAM Prosodic Transcription [Documento de Internetdisponible en httpwwwphonuclacukhomesampasamprosahtm]

Wells JC W Barry M Grice A Fourcin y D Gibbon 1992 Standard Computer-Compatible Transcription SAM Stage Report Sen3 SAM UCL-037 28 February 1992 SAM(1992) Esprit Project 2589 (SAM) Multilingual Speech InputOutput AssessmentMethodologyand Standardisation Final Report Year Three 1III91-28II1992 London University CollegeLondon

Wesenick M-B y F Schiel 1995 Feasibility of Automatic Annotation and BuildingPronunciation Lexica from Corpus Material LRE-63314 SpeechDat Report D3123 Finalversion 10 October 1995[Documento de Internet disponible en httpwwwicpgrenetfrSpeechDathomehtml]

Winski R R Moore y D Gibbon 1995 EAGLES Spoken Language Working GroupOverview and Resultsrdquo Eurospeech95 Proceedings of the 4th European Conference on SpeechCommunication and Speech Technology Madrid Spain 18-21 September 1995 Vol 1 841-844[Documento de Internet disponible en httpcoralliliuni-bielefeldde~gibbonEAGLESrwpaperrwpaperhtml]

  • 1- INTRODUCCIOacuteN
  • 2- NIVELES DE REPRESENTACIOacuteN ETIQUETADO Y CODIFICACIOacuteN
  • 3- REPRESENTACIOacuteN ORTOGRAacuteFICA DE CORPUS ORALES
  • 31- Propuestas para la representacioacuten ortograacutefica de corpus orales en el aacutembito de la linguumliacutestica de corpus
  • 32- Propuestas para la representacioacuten ortograacutefica de corpus orales en el aacutembito de las tecnologiacuteas del habla
  • 4- REPRESENTACIOacuteN FONEacuteTICA DE CORPUS ORALES
  • 41- La representacioacuten foneacutetica de los elementos segmentales
  • 42- La representacioacuten foneacutetica de los elementos suprasegmentales
  • 5- ETIQUETADO FONEacuteTICO DE CORPUS ORALES
  • 51- Niveles de etiquetado foneacutetico de corpus orales
  • 52- La transcripcioacuten y el etiquetado automaacutetico de corpus orales
  • 6- TRANSCRIPCIOacuteN Y CODIFICACIOacuteN DE CORPUS PARA EL ANAacuteLISIS DE LA LENGUA ORAL
  • 61- Los requisitos de una transcripcioacuten
  • 62- Propuestas de estandarizacioacuten para la transcripcioacuten y codificacioacuten de corpus orales
  • 7- CONCLUSIONES
  • BIBLIOGRAFIacuteA
Page 4: Transcripción, etiquetado y codificación de corpus orales

32- Propuestas para la representacioacuten ortograacutefica de corpus orales en el aacutembito de lastecnologiacuteas del habla

En el campo de las tecnologiacuteas del habla existen diversas propuestas para la representacioacutenortograacutefica dos de las cuales se presentan a continuacioacuten Pueden verse otros ejemplos en lasGuiacuteas de Transcripcioacuten del Center for Spoken Language Understanding (CSLU OregonGraduate Institute ) (Lander 1997) y en las convenciones desarrolladas para corpus como elHCRC Map Task (Anderson et al 1991) o en el proyecto Verbmobil (Hess et al 1995)

Los sucesivos proyectos LRE-63314 SpeechDat - Infrastructure for Spoken LanguageResources y LE2-4001 SpeechDat II - Speech Databases for the Creation of Voice DrivenTeleservices tienen entre sus objetivos desarrollar estaacutendares para la creacioacuten de recursoslinguumliacutesticos especialmente adecuados al entrenamiento y evaluacioacuten de sistemas dereconocimiento automaacutetico del habla Para llevar a cabo la transcripcioacuten ortograacutefica se handefinido una serie de convenciones - resumidas en dos recomendaciones ldquoKeep it simplerdquo yldquoDocument everything adequatelyrdquo - entre las cuales se contempla el uso de mayuacutesculas yminuacutesculas la transcripcioacuten de secuencias de nuacutemeros de letras y el empleo de los signos depuntuacioacuten se establecen tambieacuten procedimientos para la transcripcioacuten de errores depronunciacioacuten de palabras ininteligibles fragmentos de palabras elisiones y acontecimientosacuacutesticos no verbales como las denominadas pausas llenas ruidos producidos por el hablantesruidos estacionarios en la grabacioacuten o ruidos intermitentes respondiendo estas uacuteltimas categoriacuteasa las necesidades de transcripcioacuten de una base de datos recogida a traveacutes del teleacutefono (Senia y vanVelden 1997)

Los documentos del Grupo de Trabajo sobre Lengua Oral de EAGLES (Winski et al 1995Gibbon Moore y Winski eds 1997) ofrecen las siguientes recomendaciones para transcripcioacutenortograacutefica de corpus orales

bull Las formas reducidas de las palabras se transcriben tal como aparecen en losdiccionarios normativos

bull Si es necesario y si se documentan adecuadamente pueden utilizarse formas queno aparezcan en los diccionarios

bull Se recomienda el uso de formas reducidas si aparecen frecuentemente y si implicanelisiones de siacutelabas

bull Las formas dialectales se marcan en la transcripcioacutenbull Los nuacutemeros se transliteran como palabrasbull En la transcripcioacuten ortograacutefica se utilizan las formas completas de las abreviaturasbull Las abreviaturas que los hablantes pronuncian como palabras se transcriben de

este mismo modobull En las transcripciones se indica la aparicioacuten de palabras deletreadasbull Las interjecciones se transcriben con la representacioacuten ortograacutefica que aparece en

los diccionarios

Como puede deducirse faacutecilmente la filosofiacutea general de esta propuesta consiste en utilizarsiempre las formas que aparecen en los diccionarios normativos y documentar adecuadamente lasformas no estaacutendares que se encuentren durante el proceso de transcripcioacuten

4- REPRESENTACIOacuteN FONEacuteTICA DE CORPUS ORALES

A la hora de plantearse la eleccioacuten de un sistema de transcripcioacuten foneacutetica para un corpusoral son uacutetiles los planteamientos que Johansson (199593) realiza en el marco de la TEI (TextEncoding Initiative)1 ldquoThe degree of phonetic detail given in speech transcription varies fromnone to a very precise phonetic or phonemic transcription [] Where there is a great deal ofphonetic or phonemic detail it will be more convenient to design a specialized writing systemrdquo

Evidentemente hay casos en los que el objeto de la investigacioacuten no requiere la utilizacioacutende un sistema de transcripcioacuten foneacutetica pero cuando es necesario disponer de un ldquosistemaespecializado de escriturardquo el AFI (Alfabeto Foneacutetico Internacional) aparece como el primercandidato para cubrir las necesidades de la investigacioacuten siendo igualmente el sistemarecomendado tanto por la TEI como por el Grupo de Trabajo sobre Textos Orales de EAGLESSin embargo cuando se requiere el intercambio electroacutenico de textos SAMPA (SAM PhoneticAlphabet) - considerado como una versioacuten informaacutetica de parte del AFI (Gibbon Moore yWinski eds 1997) - se presenta como una opcioacuten vaacutelida especialmente en lo que se refiere a laslengua europeas cuando se requiere una transcripcioacuten de caraacutecter fonoloacutegico Existe una extensioacutende SAMPA (X-SAMPA) que ofrece los elementos del AFI inexistentes en SAMPA y que por lotanto puede considerarse como un sistema adecuado para la transcripcioacuten de corpus orales(EAGLES 1996) Por otra parte cabe considerar tambieacuten Wordlbet como una alternativa cuandola naturaleza del corpus aconseje disponer de un sistema maacutes detallado Estos procedimientoscomuacutenmente utilizados en la transcripcioacuten de corpus orales desarrollados en el aacutembito de lafoneacutetica y las tecnologiacuteas del habla se presentan someramente a continuacioacuten Dada la diversidadde meacutetodos existentes parece clara la conveniencia de desarrollar mecanismos que permitan lacompatibilidad asegurando la faacutecil traduccioacuten de una representacioacuten a otra de modo quediferentes investigadores puedan hacer uso de corpus ya transcritos foneacuteticamenteincorporaacutendolos a su propio entorno de trabajo

41- La representacioacuten foneacutetica de los elementos segmentales

El Alfabeto Foneacutetico Internacional (AFI IPA International Phonetic Alphabet)2 es elsistema maacutes ampliamente utilizado para la transcripcioacuten foneacutetica Es bien sabido que se basa en

1 Ademaacutes de las Guidelines for Electronic Text Encoding and Interchange (Sperberg-McQueen y Burnard eds1994) puede verse tambieacuten sobre la TEI la recopilacioacuten de Ide y Veacuteronis eds 1995 Para una introduccioacuten generalson uacutetiles Burnard (1995a b) Se encuentra maacutes informacioacuten en URL httpwww-teiuiceduorgsteiy en URL httpetextvirginiaeduTEIhtml2 La versioacuten maacutes reciente del AFI data de 1993 (IPA 1993) y puede encontrarse en URLhttpwwwartsglaacukIPAipacharthtml El Summer Institute of Linguistics (URLhttpwwwsilorgcomputingfonts) distribuye tipos de letra (fonts) que permiten trabajar con los sistemasoperativos maacutes corrientes utilizando los siacutembolos del AFI Tambieacuten pueden obtenerse en University CollegeLondon (URL httpwwwphonuclacuk) a partir de la paacutegina de Linguist (URL httplinguistlistorg) del

un principio fonoloacutegico seguacuten el cual se transcriben aquellos segmentos con valor diferencialutilizaacutendose los diacriacuteticos para introducir aspectos de tipo foneacutetico (IPA 1995) Sin embargo apesar del uso extendido del AFI existen tambieacuten diversas tradiciones nacionales resultantes engeneral de las necesidades derivadas de la transcripcioacuten estrecha de una determinada lengua o de laorientacioacuten de la investigacioacuten hacia un determinada aacuterea linguumliacutestica (Pullum y Ladusaw 1986)

La necesidad de intercambiar electroacutenicamente textos que contienen transcripcionesfoneacuteticas llevoacute a finales de los antildeos 80 a plantearse la codificacioacuten de los siacutembolos del AFI demodo que para cada uno de los siacutembolos del alfabeto se ha definido un nuacutemero (denominadoldquonuacutemero AFIrdquo) que puede relacionarse tambieacuten con los coacutedigos ASCII (Esling 1988 1990 IPA1989 Esling y Gaylord 1993) Las equivalencias entre siacutembolos nuacutemeros AFI y coacutedigos ASCIIforman parte de las convenciones conocidas como CRIL (Computer Representation of IndividualLanguages) surgidas del congreso de la Asociacioacuten Foneacutetica Internacional celebrado en Kiel en1991

SAMPA (SAM Phonetic Alphabet) constituye seguramente el esfuerzo maacutes significativo yextendido por desarrollar un sistema de transcripcioacuten foneacutetica informatizado SAMPA tiene suorigen en el proyecto ESPRIT 1541 SAM - Speech Assessment Methods (Fourcin et al 1989Fourcin y Dolmazon 1991) llevado a cabo entre 1987 y 1989 Al final del proyecto existiacuteanversiones de SAMPA en daneacutes neerlandeacutes ingleacutes franceacutes alemaacuten e italiano incorporaacutendose en1992 el noruego y el sueco y el espantildeol el griego y el portugueacutes en 1993 Durante 1996 seextendioacute a una serie de lenguas de los paiacuteses de la Europa del Este en el marco del proyectoBABEL (URL httpmidwichreadingacukresearchspeechlabbabel) y en principio no hayninguacuten obstaacuteculo para su adaptacioacuten a otros idiomas En cuanto a su utilizacioacuten praacutectica puedesentildealarse que es el sistema desarrollado para la transcripcioacuten del corpus multilinguumle EUROM(Chan et al 1995) y tambieacuten el adoptado en el proyecto ONOMASTICA centrado en latranscripcioacuten de nombres propios en diversas lenguas europeas (Schmidt 1993 Trancoso 1995)

SAMPA (Wells 1987 1989) se basa en un conjunto de equivalencias entre siacutembolos delAFI y coacutedigos ASCII restringieacutendose al uso de caracteres de 7 bits (coacutedigos 32 a 127) Elprincipio que rige las transcripciones en SAMPA al igual que en el caso del AFI esesencialmente fonoloacutegico empleaacutendose uacutenicamente siacutembolos distintos en el caso de segmentoscon valor diferencial Esta filosofiacutea viene motivada por tres razones simplicidad de latranscripcioacuten sin incorporar ambiguumledades ya que determinadas alofoacutenicas son predictibles apartir del contexto facilidad de utilizacioacuten por parte personas con poca formacioacuten en foneacutetica yfalta de coacutedigos ASCII para la transcripcioacuten alofoacutenica de todas las lenguas Sin embargo enalgunos casos se introducen siacutembolos para la representacioacuten de aloacutefonos cuando losinvestigadores que han desarrollado las adaptaciones para cada lengua lo han consideradonecesario

Una de las limitaciones de SAMPA es que no establece una codificacioacuten para todos lossiacutembolos del AFI Por este motivo Wells (1994) propone un sistema denominado X-SAMPA en

Yamada Language Center (URL httpbabeluoregoneduyamadafontsphonetichtml) o de la paacutegina de la propiaAsociacioacuten Foneacutetica Internacional (URL httpwwwartsglaacukIPAipafontshtml)

el que se preveacuten equivalencias en coacutedigos ASCII para la totalidad de siacutembolos del AFI en surevisioacuten de 1993 incluyendo diacriacuteticos y marcas tonales Una de las aplicaciones propuestaspara este sistema es el enviacuteo de textos en transcripcioacuten foneacutetica a traveacutes del correo electroacutenico

Por otra parte Worldbet constituye una propuesta maacutes ambiciosa que SAMPA y que suextensioacuten X-SAMPA pues parte de la base de que ldquoany spectrally and temporally distinct speechsound (not including pitch) which is phonemic in some language should have a separate basesymbolrdquo (Hieronymus 1994 ) los siacutembolos de base consisten normalmente en la concatenacioacuten deun siacutembolo del AFI con una serie de diacriacuteticos de modo que puede representarse una granvariedad de aloacutefonos hallados en las lenguas del mundo incluyendo siacutembolos inexistentes en elAFI Uno de los objetivos de Wordlbet - que en su versioacuten actual usa 299 siacutembolos compuestosde dos caracteres ASCII - es facilitar la transcripcioacuten de bases de datos multilinguumles que incluyanlenguas indias asiaacuteticas y africanas ademaacutes de las europeas Este sistema se ha utilizado porejemplo en la transcripcioacuten de los corpus distribuidos por el CSLU (Center for Spoken LanguageUnderstanding Oregon Graduate Institute) (Lander 1997)

Existen otros sistemas de transcripcioacuten foneacutetica concebidos para el intercambio electroacutenicode textos tanto desarrollados desde la perspectiva de las tecnologiacuteas del habla - por ejemplo elCPA (Computer Phonetic Alphabet) surgido en el marco del proyecto ESPRIT Linguistic Analysisof European Languages (Kluger-Kruse 1987) - como disentildeados para otros fines En el aacutembito delestudio del lenguaje infantil el proyecto CHILDES - Child Language Data Exchange System(MacWhinney 1991utiliza el sistema conocido como PHONASCII (Allen 1988) consistente enun conjunto de siacutembolos fonoloacutegicos - UNIBET - y un alfabeto foneacutetico que permite latranscripcioacuten estrecha

42- La representacioacuten foneacutetica de los elementos suprasegmentales

La incorporacioacuten de informacioacuten sobre los elementos suprasegmentales - informacioacutenprosoacutedica - en un corpus oral plantea diversos problemas derivados precisamente de la propianaturaleza de estos elementos que se manifiestan en variaciones continuas en los dominios de lafrecuencia la intensidad y el tiempo Por tanto es preciso llevar a cabo una abstraccioacuten paradeterminar en primer lugar cuaacuteles de estas variaciones son linguumliacutesticamente significativas y ensegundo lugar coacutemo se relacionan con categoriacuteas discretas Finalmente estas categoriacuteas debenrepresentarse en un sistema de notacioacuten No es pues extrantildeo que se hayan desarrollado diversasconvenciones para la simbolizacioacuten de los elementos suprasegmentales (Groslashnnum-Thorsen 1987Llisterri 1994) algunas de las cuales se presentan en los apartados siguientes

En el momento de plantearse la seleccioacuten de un sistema de transcripcioacuten prosoacutedicaadecuado a un corpus oral el investigador se enfrenta nuevamente a la diversidad de sistemas aligual que sucede en el caso de la transcripcioacuten segmental Aunque como veremos maacutes adelanteToBI parece que se estaacute convirtiendo raacutepidamente en un estaacutendar a pesar de su orientacioacuten haciala transcripcioacuten del ingleacutes y al modelo fonoloacutegico subyacente SAMPROSA ofrece la ventaja dehaberse desarrollado teniendo en cuenta las necesidades de las tecnologiacuteas del habla ademaacutesSAMPROSA se enmarca en el contexto de estaacutendares extendidos en Europa como los delproyecto SAM recomendados por ejemplo por NERC (Teubert 1993 Sinclair 1994) Enconjunto el sistema ideal de transcripcioacuten prosoacutedica deberiacutea permitir una representacioacuten en varios

niveles ser compatible con el intercambio electroacutenico de datos y cubrir las necesidades del mayornuacutemero de lenguas posible pudiendo aplicarse automaacuteticamente en lugar de basarse en lasimpresiones intuitivas del transcriptor con vistas a la transcripcioacuten de grandes corpus Enausencia de un sistema que reuacutena tales caracteriacutesticas parece adecuado establecer mecanismos decompatibilidad entre los existentes a fin de facilitar la reutilizacioacuten de los datos

El AFI ofrece ademaacutes de la posibilidades de transcripcioacuten segmental un conjunto desiacutembolos para la representacioacuten de los elementos suprasegmentales Con motivo del congresopara la revisioacuten del AFI celebrado en Kiel en 1989 se creoacute un grupo de trabajo sobre categoriacuteassuprasegmentales (Bruce 1988 1989) concluyeacutendose la necesidad de representar las categoriacuteassuprasegmentales de un modo maacutes adecuado especialmente en lo que se refiere la entonacioacuten Elconjunto actual de siacutembolos del AFI para los elementos suprasegmentales permite transcribir eltono asiacute como la duracioacuten y el acento

Las necesidades derivadas de una descripcioacuten detallada de la entonacioacuten tanto en el campode la foneacutetica como en el de las tecnologiacuteas del habla han propiciado la creacioacuten de diversossistemas de transcripcioacuten prosoacutedica algunos de los cuales se presentan a continuacioacuten

En el marco del proyecto ESPRIT SAM anteriormente mencionado se llevoacute tambieacuten a caboel desarrollo de sistemas de transcripcioacuten prosoacutedica compatibles con las necesidades de anotacioacutende bases de datos en soporte electroacutenico resultando de ello propuestas como PROSPASAMSINT o SAMPROSA (Gibbon 1989 Wells et al 1992) PROSPA fue originalmenteconcebido por Selting y Gibbon (Selting 1987 1988) para el anaacutelisis de la conversacioacuten y deldiscurso y por tal motivo se basa en criterios auditivos recogiendo uacutenicamente los elementosnecesarios para este fin Por su parte SAMSINT (SAM System for Intonation Transcription) seplantea como objetivo la transcripcioacuten de contornos meloacutedicos en el interior de unidadesentonativas basaacutendose en INTSINT - presentado maacutes adelante - con algunas modificacionesadicionales

A pesar de la coexistencia de los sistemas anteriormente mencionados en el proyecto SAMprobablemente el conjunto de siacutembolos maacutes extendido actualmente para la transcripcioacutenprosoacutedica sea SAMPROSA (SAM Prosodic Alphabet) propuesto inicialmente por Gibbon(1989) y desarrollado por Wells et al (1992) hasta llegar a su forma actual (Wells 1995)SAMPROSA ofrece al igual que SAMPA un conjunto de caracteres correspondientes a coacutedigosASCII mediante los cuales es posible transcribir tonos globales locales terminales y nucleares laduracioacuten el acento la pausas y las fronteras entre unidades prosoacutedicas Aunque presenta rasgoscaracteriacutesticos de la tradicioacuten britaacutenica de anaacutelisis de la entonacioacuten como por ejemplo lacodificacioacuten de tonos nucleares es un sistema que se plantea como adecuado para la transcripcioacutende diversas lenguas

En el aacutembito americano ToBI (Tone and Break Index) se desarrolloacute para cubrir al mismotiempo las necesidades de la descripcioacuten foneacutetica y de la anotacioacuten de corpus adecuados aldesarrollo de sistemas de tecnologiacuteas del habla (Silverman et al 1992 Beckman y Hirschberg1994 Beckman y Ayers 1994) Basado en el ingleacutes americano ToBI permite principalmente latranscripcioacuten de patrones entonativos partiendo de un anaacutelisis de la curva meloacutedica representadacomo evolucioacuten temporal de la frecuencia fundamental mediante herramientas de anaacutelisis y

etiquetado como el programa Wavestrade Sin embargo se han definido tambieacuten convenciones parala anotacioacuten de textos representados ortograacuteficamente Una transcripcioacuten utilizando ToBI constade cuatro niveles

bull Representacioacuten ortograacutefica del enunciadobull Nivel de iacutendices de ruptura (break index) en el que se introducen los indicadores

de liacutemite que marcan las fronteras entre las unidades meloacutedicas estableciendo cuatro gradosde cohesioacuten entre las mismas

bull Nivel tonal en el que se marcan los denominados ldquoeventos tonalesrdquo (pitch events)divididos en tonos de frase al principio y al final de las unidades meloacutedicas y en acentostonales (pitch accent) en las siacutelabas en las que se produce un movimiento de la frecuenciafundamental

bull Nivel miscelaacuteneo que facilita por ejemplo introducir los comentarios deltranscriptor

Para cada uno de los niveles se define un conjunto de siacutembolos alineados temporalmentecon los fenoacutemenos entonativos transcritos si se dispone de una herramienta adecuada comoWavestrade

Las criacuteticas que se realizan maacutes frecuentemente a ToBI son por una parte su dependenciadel modelo fonoloacutegico desarrollado por Pierrehumbert (1980) y por otra su mejor adaptacioacuten alingleacutes que a otras lenguas lo que explicariacutea su amplia utilizacioacuten en Estados Unidos Sin embargose han realizado trabajos en italiano alemaacuten huacutengaro y espantildeol entre otras lenguas usando ToBIcomo sistema de representacioacuten Un inconveniente maacutes importante es que la anotacioacuten medianteToBI requiere un cierto conocimiento previo de los patrones entonativos de la lengua Aun asiacute esun sistema que ofrece indudables ventajas como pueden ser su estructura jeraacuterquica que permiteseleccionar entre subconjuntos o conjuntos mayores de siacutembolos la posibilidad de representarproblemas que aparecen en la transcripcioacuten y el hecho de que existan experimentos demostrandoun alto grado de acuerdo entre transcriptores diferentes (Pitrelli et al 1994)

En el Institute for Perception Research (IPO Eindhoven) se ha desarrollado una teoriacutea sobrela entonacioacuten basada en el modelado de contornos entonativos consistentes en representacionesestilizadas perceptivamente equivalentes al contorno original (lsquot Hart et al 1990) Esta teoriacutea hallevado tambieacuten a la formalizacioacuten de un sistema de representacioacuten de la curva meloacutedica definidacomo un conjunto de movimientos tonales que se agrupan en secuencias de configuracionestonales la agrupacioacuten de estas configuraciones da lugar a su vez a contornos meloacutedicosdefinieacutendose los patrones entonativos en funcioacuten de agrupaciones similares de contornosmeloacutedicos Un sistema jerarquizado de esta naturaleza permite una representacioacuten de la curvameloacutedica adecuada para la transcripcioacuten prosoacutedica aunque que inicialmente no haya sido disentildeadopara tales fines

El objetivo de INTSINT (International Transcription System for Intonation) en cambio esproporcionar un sistema para la comparacioacuten interlinguumliacutestica de sistemas prosoacutedicosDesarrollado por Hirst (1991 Hirst y Di Cristo en prensa Hirst Di Cristo y Espesser enprensa) en el marco de un proyecto de anaacutelisis automaacutetico de la entonacioacuten INTSINT se basa en

la estilizacioacuten de la curva meloacutedica realizada a partir de una interpolacioacuten entre puntos en los quese da un cambio significativo en el valor de la frecuencia fundamental (target points) Estospuntos que podriacuteamos denominar ldquode inflexioacutenrdquo - definidos como la combinacioacuten de un valortemporal y un valor frecuencial - son susceptibles de codificarse automaacuteticamente mediante lossiacutembolos de INTSINT previa introduccioacuten de marcas de frontera entre las unidades entonativasCon ello se obtiene una representacioacuten fonoloacutegica del contorno meloacutedico simbolizando losdiferentes niveles tonales de la curva original El sistema se basa en la representacioacuten desecuencias tonales consideradas tanto desde una perspectiva global en funcioacuten del rango devariacioacuten tonal del hablante como desde un punto de vista local en relacioacuten con la altura de puntosde inflexioacuten anteriores En el primer caso se definen tres niveles T (Top) M (Mid) y B (Bottom)mientras que en el segundo se marcan cinco posibilidades H (Higher) L (Lower) S (Same) U(Upstep) o D (Downstep) El proceso de modelizacioacuten necesario para transcribir medianteINTSINT ha sido aplicado a varias lenguas (Hirst et al 1993) y se emplea tambieacuten para laanotacioacuten prosoacutedica de parte del corpus EUROM en franceacutes ingleacutes alemaacuten sueco y espantildeol(Hirst et al 1994 Llisterri ed 1996) llevada a cabo en el marco del proyecto LRE 62-050MULTEXT - Multilingual Text Tools and Corpora Es posible tambieacuten aplicar INTSINT aniveles maacutes altos como el paacuterrafo tal como se muestra en Nicolas y Hirst (1995)

5- ETIQUETADO FONEacuteTICO DE CORPUS ORALES

Al igual que en el caso de los corpus textuales una vez recogidos los materiales de base deun corpus oral debe llevarse a cabo un tratamiento de los mismos que permita su utilizacioacutenposterior El primer paso suele ser la transcripcioacuten ortograacutefica que en determinado tipo de corpusse acompantildea de una transcripcioacuten foneacutetica o fonoloacutegica A continuacioacuten a cada segmento de laonda sonora se le asocia una etiqueta (labelling) que lo define en teacuterminos foneacuteticos o fonoloacutegicosy se lleva a cabo la alineacioacuten (alignment) entre la sentildeal sonora y las etiquetas obteniendo unarepresentacioacuten que puede compararse a la partitura musical de una obra para voz y orquesta Elproceso de etiquetado segmental puede llevarse a cabo a varios niveles como veremos en esteapartado y completarse con una anotacioacuten de las caracteriacutesticas suprasegmentales codificadasseguacuten los diversos sistemas que hemos expuesto anteriormente Si se cumplen las etapasmencionadas se llega a disponer de un corpus que contiene la sentildeal sonora sincronizada con latranscripcioacuten ortograacutefica y con la transcripcioacuten foneacutetica o fonoloacutegica de modo que una vezdefinida una estructura de base de datos es posible consultar el corpus partiendo de etiquetasfoneacuteticas de marcas prosoacutedicas o de la transcripcioacuten ortograacutefica al tiempo que se accede a lagrabacioacuten correspondiente

Los corpus de lengua oral que consisten uacutenicamente en transcripciones ortograacuteficas - ya queno suele ser factible realizar una transcripcioacuten foneacutetica completa de un nuacutemero elevado de horasde grabacioacuten - conllevan un procesamiento menos complejo aunque en algunos casos contienenmarcas prosoacutedicas uacutetiles para el anaacutelisis del discurso o de la conversacioacuten como veremos en elapartado 6

51- Niveles de etiquetado foneacutetico de corpus orales

Una cuestioacuten que se plantea inevitablemente a la hora de introducir informacioacuten adicionalsobre los datos recogidos es el nivel de etiquetado del corpus Se han realizado varias propuestassobre los distintos niveles en los que se puede realizar el etiquetado foneacutetico de un corpusalgunas de ellas ligadas al proyecto SAM como la de Barry y Fourcin (1992) en la que seplantean cinco niveles posibles de etiquetado foneacutetico de un corpus

bull Nivel fiacutesico en el que se etiquetan las propiedades acuacutesticas presentes en la sentildealsonora

bull Nivel acuacutestico-foneacutetico en el que se marcan las propiedades de los segmentos enteacuterminos de categoriacuteas foneacuteticas como oclusioacuten friccioacuten sonoridad nasalizacioacuten etc

bull Nivel de transcripcioacuten estrecha en el que se caracterizan los segmentos utilizandolos siacutembolos del AFI o de sus equivalentes computacionales

bull Nivel de transcripcioacuten fonoloacutegica (o foneacutemica) sentildealando uacutenicamente aquelloselementos funcionalmente distintivos que se encuentran en la palabra pronunciadaaisladamente en un estilo cuidado (citation form)

bull Nivel de transcripcioacuten ancha en el que se utilizan los siacutembolos correspondientes alos elementos fonoloacutegicos en una lengua dada para transcribir realizaciones alofoacutenicascondicionadas por el contexto3

A estos cinco niveles debe antildeadirse auacuten la anotacioacuten prosoacutedica considerada de formaindependiente por los autores de la propuesta

Una propuesta similar de etiquetado tambieacuten en cinco niveles - caracteriacutesticas acuacutesticas denaturaleza subfoneacutemica caracteriacutesticas segmentales realizaciones foneacuteticas forma canoacutenica de laspalabras y transcripcioacuten ortograacutefica - se presenta en Tillmann y Pompino-Marschall (1993) y hasido utilizada con eacutexito en el proyecto alemaacuten PhonDat Igualmente pueden verse las propuestasde Autesserre et al (1989) enmarcadas en el contexto del proyecto SAM y los trabajos deMarchal et al (1995) o Roach et al (1990)

La transcripcioacuten y el etiquetado de corpus orales se ha abordado en el marco del proyectoEAGLES desde una doble perspectiva la de la foneacutetica y las tecnologiacuteas del habla en el Grupo deTrabajo sobre Lengua Oral y desde la de la linguumliacutestica de corpus en el marco de las actividades delGrupo de Trabajo sobre Corpus Textuales El trabajo llevado a cabo en el grupo dedicado a lalengua hablada en EAGLES recoge esencialmente las propuestas desarrolladas en el marco deSAM y de PhonDat Los niveles de etiquetado propuesto son los siguientes (Gibbon Moore yWinski eds 1997)

bull Nivel ortograacutefico en el que se utiliza la representacioacuten ortograacutefica convencional

3 La distincioacuten entre los dos uacuteltimos niveles puede ejemplificarse con el caso de las asimilaciones mientras que enla transcripcioacuten ancha encontrariacuteamos [um poko] (un poco) en el caso de una transcripcioacuten fonoloacutegica apareceriacutea [unpoko] si se opta por no simbolizar archifonemas en la transcripcioacuten En cambio [mismo] se representariacutea de lamisma forma en ambos niveles encontraacutendose la transcripioacuten [mizmo] en el nivel de transcripcioacuten estrecha

bull Nivel de formas canoacutenicas (citation form) representando la forma depronunciacioacuten aislada de las palabra en estilo cuidado

bull Nivel de transcripcioacuten ancha o fonotiacutepica en este nivel se utilizan los siacutembolosque representan elementos fonoloacutegicos en una lengua dada pero al igual que en lapropuesta de Barry y Fourcin se transcriben aquellos fenoacutemenos predictibles propios dela foneacutetica sintaacutectica SAMPA seriacutea pues un alfabeto foneacutetico adecuado para este nivelde transcripcioacuten

bull Nivel de transcripcioacuten estrecha basado en una representacioacuten alofoacutenica de lasrealizaciones foneacuteticas de los hablantes para el cual puede utilizarse un alfabeto foneacuteticocomo X-SAMPA

bull Nivel acuacutestico-foneacutetico en el que se distinguen caracteriacutesticas acuacutesticas de lossegmentos observables en una representacioacuten de la onda sonora

bull Nivel fiacutesico representado en teacuterminos de paraacutemetros acuacutesticos o articulatoriosbull Fenoacutemenos no linguumliacutesticos la inclusioacuten de este nivel permite representar sonidos

de naturaleza comunicativa o no introducidos por el hablante asiacute como toda aquellainformacioacuten paralinguumliacutestica que se considere de intereacutes tambieacuten permite sentildealas los ruidosexternos en la grabacioacuten

Vale la pena detenerse brevemente en el nivel de las formas canoacutenicas y en el concepto deldquotranscripcioacuten fonotiacutepicardquo que como puede verse aparecen de forma recurrente en diversaspropuestas La inclusioacuten de forma canoacutenicas en el etiquetado de un corpus responde a un doblemotivo especialmente ligado a necesidades tecnoloacutegicas en primer lugar estas formas permitenderivar automaacuteticamente mediante un conjunto de reglas una transcripcioacuten ancha o fonotiacutepica enla que se incluyen los elementos alofoacutenicos cuya aparicioacuten esta condicionada por el contextofoneacutetico en segundo lugar a partir de las formas canoacutenicas puede crearse de forma automaacutetica undiccionario foneacutetico partiendo de un corpus transcrito (Wesenick y Schiel 1995 Senia y vanVelden 1997) lo que tiene utilidad para el desarrollo de sistemas de siacutentesis y reconocimiento delhabla y tambieacuten para la descripcioacuten linguumliacutestica La transcripcioacuten denominada ldquofonotiacutepicardquo en lostrabajos de SAM constituye un nivel intermedio entre la realizacioacuten foneacutetica y la transcripcioacutenpuramente fonoloacutegica Por otra parte el nivel de transcripcioacuten de formas canoacutenicas estaacutedirectamente relacionado con la representacioacuten ortograacutefica facilitando asiacute la transcripcioacuten foneacuteticaautomaacutetica de corpus en este nivel mediante el desarrollo de los correspondientes sistemas dereglas

En el informe del Grupo de Trabajo de Corpus Textuales de EAGLES (EAGLES 1996) seintenta realizar una siacutentesis entre las necesidades de diversos campos de estudio Se sugieren porello tres niveles de representacioacuten

bull S1 representacioacuten ortograacutefica del textobull S2 representacioacuten fonoloacutegica de las palabras en su forma canoacutenicabull S3 transcripcioacuten foneacutetica consistente en una representacioacuten simboacutelica discreta de

la realizacioacuten del enunciado tal como es percibido por el transcriptor

Como puede observarse estos tres niveles encuentran su equivalente en los nivelespropuesto por Barry y Fourcin (1992) y en los definidos por el Grupo de Trabajo de Lengua

Oral Para la transcripcioacuten del nivel S2 puede utilizarse SAMPA mientras que la del nivel S3requiere el uso de un alfabeto foneacutetico como X-SAMPA

52- La transcripcioacuten y el etiquetado automaacutetico de corpus orales

La tarea de transcribir y etiquetar foneacuteticamente un corpus oral representa un considerableesfuerzo tanto en teacuterminos de tiempo como de los recursos econoacutemicos necesarios para llevar acabo esta labor El etiquetado manual requiere por otro lado el desarrollo de convencionesdetalladas para asegurar la consistencia entre diversos transcriptores (Keating et al 1994 Krot yTaylor 1995 Lander 1997) ademaacutes del establecimiento de un proceso de validacioacutencomprobando la fiabilidad de los resultados obtenidos (Eisen 1993 Cole et al 1994 Strangert yHeldener 1995) Por estos motivos uno de los intereses principales de los investigadores en elcampo de las tecnologiacuteas del habla ha sido llevar a cabo el etiquetado de forma semi-automaacutetica oidealmente automaacutetica Un primer nivel de transcripcioacuten - tanto de formas canoacutenicas comofonotiacutepica - puede obtenerse automaacuteticamente como acabamos de mencionar a partir de larepresentacioacuten ortograacutefica si se dispone de un conjunto de reglas que establezcan lascorrespondencias entre la representacioacuten ortograacutefica y la foneacutetica

Sin embargo un etiquetado foneacutetico en los niveles de transcripcioacuten maacutes detallada requiere laposibilidad de acceder a la onda sonora y un procedimiento de anaacutelisis de la sentildeal La primeraoperacioacuten que debe realizar un sistema de etiquetado automaacutetico es la segmentacioacuten del continuumsonoro en unidades menores - segmentos o caracteriacutesticas acuacutesticas en funcioacuten del nivel detranscripcioacuten deseado - para pasar despueacutes a la asignacioacuten de etiquetas - siacutembolos detranscripcioacuten - que describan sus caracteriacutesticas Este es el proceso conocido propiamente comoetiquetado (labelling) que cuando se realiza de forma automaacutetica debe superar los obstaacuteculosderivados de la naturaleza no discreta de la sentildeal sonora - resultado de mecanismos como lacoarticulacioacuten - y de la variabilidad de realizaciones foneacuteticas entre hablantes o incluso en unmismo hablante

Para que el corpus sea uacutetil el etiquetado foneacutetico debe estar temporalmente sincronizadocon la sentildeal sonora y con la representacioacuten ortograacutefica operacioacuten que se realiza en el procesoconocido como alineacioacuten temporal (time alignment) llevado a cabo tambieacuten de forma automaacuteticaEsta alineacioacuten puede hacerse de un modo global sentildealando en la onda sonora las fronteras entrepalabras ortograacuteficas - para facilitar el acceso a la grabacioacuten a partir de este nivel de representacioacuten(Lander 1997) - o los puntos en los que se encuentran siacutelabas acentuadas tal como sucede porejemplo en el proyecto MULTEXT

En el campo de las tecnologiacuteas del habla se han llevado a cabo numerosiacutesimos trabajosencaminados al disentildeo de sistemas de segmentacioacuten etiquetado y alineacioacuten temporal automaacuteticasde corpus orales utilizando las teacutecnicas propias del reconocimiento del habla como los Modelosde Markov o las redes neuronales Cabe destacar que tales teacutecnicas no soacutelo son uacutetiles en eldesarrollo de corpus en este aacutembito sino que constituyen una herramienta importante en otrostipos de corpus sin embargo es preciso reconocer que el habla espontaacutenea - especialmente si seha recogido mediante grabaciones realizadas en un entorno natural - plantea auacuten problemas en lo

que se refiere a su transcripcioacuten y etiquetado automaacuteticos pese a los notabiliacutesimos avances quetienen lugar en este campo

6- TRANSCRIPCIOacuteN Y CODIFICACIOacuteN DE CORPUS PARA EL ANAacuteLISIS DE LA LENGUA ORAL

En este uacuteltimo apartado incidiremos en las cuestiones relacionadas con la transcripcioacuten ycodificacioacuten de corpus orales que pueden presentar un mayor intereacutes para aacutembitos como elanaacutelisis de discurso o de la conversacioacuten y para el estudio de la lengua oral en todos los niveles dela descripcioacuten linguumliacutestica Como indicaacutebamos al principio la transcripcioacuten y la codificacioacuten de loselementos transcritos son en principio dos operaciones conceptualmente diferentes Sinembargo en la praacutectica habitual en las disciplinas a las que se refiere este apartado suelen ser dosoperaciones que se realizan simultaacuteneamente ya que al mismo tiempo que se realiza latransliteracioacuten se introducen las marcas necesarias para la codificacioacuten de los elementos que se hadecidido introducir en el corpus Por ello en muchos casos la discusioacuten sobre la transcripcioacuten y lacodificacioacuten se realiza conjuntamente en la bibliografiacutea sobre el tema

61- Los requisitos de una transcripcioacuten

El investigador que decide constituir un corpus de lengua oral se encuentra en estosmomentos con una gran variedad de criterios en lo que se refiere a la transcripcioacuten y a la seleccioacutende los elementos que apareceraacuten codificados en el corpus Hemos hecho ya referencia en elapartado 3 a las diversas convenciones para la representacioacuten ortograacutefica y cintildeeacutendonos al aacutembitodel anaacutelisis del discurso y la conversacioacuten constatamos igualmente la existencia una grandiversidad de propuestas En una revisioacuten de las mismas Payratoacute (1995) hace por ejemploreferencia a los sistemas de transcripcioacuten y codificacioacuten procedentes de la etnometodologiacuteainteresados en reflejar la interaccioacuten verbal a los meacutetodos desarrollados en el marco de laetnografiacutea de la comunicacioacuten y de la sociolinguumliacutestica interaccional4 o a propuestas utilizadas en elestudio del lenguaje infantil Ante tal situacioacuten parece conveniente plantearse cuaacuteles son losrequisitos que debe cumplir una transcripcioacuten de la lengua oral tema que ha sido abordado pordiversos autores (DuBois 1991 Elich 1993 Edwards 1993 OrsquoConnell y Kowal 1994) Trasrevisar aportaciones anteriores Payratoacute (1995) resume los requisitos que teoacutericamente deberiacuteanexigirse a toda transcripcioacuten

bull Neutralidad o fidelidad de modo que la transcripcioacuten no sea interpretativabull Globalidad o complejidad recogiendo la totalidad de los fenoacutemenos que aparecen

en el discurso oralbull Omnifuncionalidad permitiendo diversos usos y aplicacionesbull Claridad tanto desde el punto de vista del aprendizaje del sistema como de la

legibilidad de la representacioacutenbull Universalidad y compatibilidad entre sistemas informaacuteticos

4 Estos sistemas se comparan en OrsquoConnell y Kowal (1994) Pueden encontrarse consideraciones generales sobre latranscripcioacuten y codificacioacuten de la lengua oral en el anaacutelisis del discurso y la conversacioacuten en 1995Ochs (1979) DuBois (1991) Edwards (1992 1993 1995) Du Bois et al (1993) Gumperz y Berenz (1993) Cook (1995) Chafe(1995) y en Sinclair (1995)

Sin embargo puesto que en la praacutectica se transcribe en funcioacuten de los objetivos para losque se ha definido el corpus Payratoacute (1995) considera que un sistema de transcripcioacuten debe serante todo interpretativo de los datos selectivo en cuanto a los fenoacutemenos que se transcribenpertinente para el objeto de investigacioacuten coherente con la base teoacuterica adoptada por elinvestigador fiel en cuanto a la representacioacuten de los datos y flexible para que sea posible suutilizacioacuten en diversos estudios Por otra parte en opinioacuten de este autor la simbologiacutea utilizadadebe ser clara econoacutemica sencilla exenta de ambiguumledad y compatible con sistemas internacionesestandarizados Este uacuteltimo aspecto nos parece especialmente importante ya que como sentildeala elmismo Payratoacute (1995 58)

[] en ninguacuten caso puede olvidarse que los datos de una investigacioacuten no deberiacutean sertratados nunca de forma tan parcial o idiosincraacutesica que se impidiera o dificultara el uso por partede otros investigadores La transcripcioacuten del discurso oral es una actividad suficientementecostosa y conflictiva para tomar precauciones en este sentido y ninguna comunidad cientiacuteficapuede permitirse el lujo de particularismos (en aspectos tan elementales) que obstruyan el debateo conviertan en inaprovechables una fuente de informacioacuten

62- Propuestas de estandarizacioacuten para la transcripcioacuten y codificacioacuten de corpus orales

Ante la diversidad de propuestas para la transcripcioacuten y codificacioacuten de la lengua oral queacabamos de constatar el surgimiento de la linguumliacutestica de corpus y muy especialmente lasnecesidades derivadas del intercambio electroacutenico de textos propiciaron la aparicioacuten de proyectose iniciativas centrados en la creacioacuten de estaacutendares tanto en lo que se refiere a la transcripcioacutencomo a la codificacioacuten En los proacuteximos apartados revisamos sucintamente algunos de ellos

Uno de los capiacutetulos de las Guiacuteas desarrolladas por la TEI estaacute dedicado a la transcripcioacutende corpus orales (Johansson 1995a b) En eacutel se describe la estructura baacutesica de la representacioacutende un texto oral - cabecera texto y divisiones - y se definen los procedimientos basados enSGML para la representacioacuten de los elementos estructurales baacutesicos informacioacuten contextualinformacioacuten temporal enunciados pausas elementos vocalizados semi-leacutexicos o no leacutexicoselementos kineacutesicos otros tipos de eventos comunicativos y texto presentado en forma escrita alhablante Tambieacuten se ofrecen en este capiacutetulo indicaciones para la segmentacioacuten y el alineamientoasiacute como recomendaciones para la transcripcioacuten de superposiciones entre hablantes de formas depalabras prosodia elementos paralinguumliacutesticos - tempo intensidad rango tonal tensioacuten ritmo ycalidad de voz - y alteraciones en el decurso foacutenico Para la representacioacuten de la informacioacutenfoneacutetica se recomienda el uso del AFI En la siguiente tabla se resumen los principales elementospropuestos por la TEI para la codificacioacuten de corpus orales considerados especiacuteficos de este tipode texto (Sperberg-McQueen y Burnard eds 1994)

Elemento codificado Marca decodificacioacutenen SGML

Definicioacuten

Divisiones (division) ltdivgt Unidades intermedias entre el texto y el enunciado que permitendelimitar partes diferenciadas en un texto

Enunciado (utterance) ltugt Segmento de habla comprendido entre dos pausas o delimitado porun cambio en el turno de palabra puede incluir ademaacutesinformacioacuten sobre la superposicioacuten (ltoverlapgt) de turnos cuando

interviene simultaacuteneamente maacutes de un hablantePausa (pause) ltpausegt Interrupcioacuten de la fonacioacuten percibida entre dos enunciados o en el

interior de los mismos puede describirse en teacuterminos relativos oindicando su duracioacuten

Vocal (vocal) ltvocalgt Elemento vocalizado semi-leacutexico o no leacutexico (pej pausas llenas otoses)

Kineacutesico (kinesic) ltkinesicgt Cualquier fenoacutemeno comunicativo no vocal (p ej gestos)Acontecimiento (event) lteventgt Cualquier fenoacutemeno identificado en la grabacioacuten no necesariamente

vocalizado ni con valor comunicativo (p ej ruidos de fondo)Texto escrito (writing) ltwritinggt Texto escrito que se presenta al hablante durante su intervencioacutenCambio (shift) ltshiftgt Momento en el que se produce un cambio en alguno de los rasgos

paralinguumliacutesticos - calidad de voz intensidad rango tonal ritmo yvelocidad de elocucioacuten - cada uno de los rasgos puede describirsemediante una lista de caracteriacutesticas

Tabla 1 Elementos codificados en las transcripciones de lengua oral seguacuten los estaacutendares de la TEI(Adaptada de Sperberg-McQueen y Burnard eds1994)

Por otra parte la TEI ofrece mecanismos para indicar el comienzo y el final de unfenoacutemeno su duracioacuten y su sincronizacioacuten temporal con otros elementos presenta tambieacuten laposibilidad de marcar unidades inferiores al enunciado - segmentos ltseggt - que permitendelimitar por ejemplo unidades prosoacutedicas e incluye tambieacuten entre sus propuestas las marcasnecesarias para sentildealar fenoacutemenos propios de la lengua hablada como palabras truncadasrepeticiones falsos principios - marcados como ltdelgt (deletion) y especificando el fenoacutemeno -Las partes de la grabacioacuten que el transcriptor no llega a interpretar correctamente - ltuncleargt - ono puede escuchar - ltgapgt - o las correcciones de errores de produccioacuten realizadas por eltranscriptor - ltsicgt para delimitar el error y ltcorrgt para indicar la correccioacuten - son tambieacutenelementos para los cuales la TEI establece marcas de codificacioacuten

Aunque las Guiacuteas de la TEI pueden considerarse un sistema adecuado para la transcripcioacuteny codificacioacuten de gran variedad de materiales los autores propios autores reconocen que

[] the present proposals are not intended to support unmodified every variety of researchundertaken upon spoken material now or in the future some discourse analysts phonologistsand doubtless other may wish to extend the scheme presented here to express more precisely theset of distinctions they wish to draw in their transcriptions Speech regarded as a purely acousticphenomenon may well require different methods from those outlined here as may speechregarded solely as a process of social interaction (Sperberg-McQueen y Burnard eds 1994 cap11)

El proyecto NERC - Network of European Reference Corpora (NERC 1994) se planteoacutecomo uno de sus objetivos la viabilidad de desarrollar una serie de recomendaciones para laconstitucioacuten de corpus y por tanto incluye entre sus resultados indicaciones sobre el tratamientode los corpus orales tanto en lo que se refiere a su codificacioacuten como a la transcripcioacuten de loselementos segmentales y suprasegmentales (Sinclair 1994) El sistema adoptado para latranscripcioacuten y codificacioacuten de corpus se basa como hemos indicado anteriormente en eldesarrollado por French (1991 1992) para la transcripcioacuten del corpus oral desarrollado en elproyecto COBUILD La transcripcioacuten se plantea como una operacioacuten que puede desarrollarse envarios niveles

bull Nivel I consiste en la representacioacuten ortograacutefica introduciendo los miacutenimossignos de puntuacioacuten necesarios sin informacioacuten sobre la interaccioacuten entre hablantes Eneste nivel se contemplan convenciones desarrolladas para la representacioacuten ortograacutefica ypara precisar el uso de la puntuacioacuten

bull Nivel II consiste en una representacioacuten ortograacutefica enriquecida con informacioacutenbaacutesica sobre la identidad de los hablantes el turno de palabra y los elementos no verbales

bull Nivel III contiene toda la informacioacuten presente en el nivel II ademaacutes deinformacioacuten sobre la interaccioacuten entre hablantes - marcando el principio y el final de lossolapamientos - y sobre la entonacioacuten - sentildealando las fronteras entre unidades tonales ylas siacutelabas acentuadas- En opinioacuten de French (1992) la transcripcioacuten a este nivel requiereuna formacioacuten especiacutefica en foneacutetica

bull Nivel IV constituye el nivel maacutes detallado de representacioacuten incluyendo lainformacioacuten propia del nivel III junto con marcas de tonos siacutelabas nucleares y con unatranscripcioacuten fonoloacutegica alineada con una representacioacuten acuacutestica - espectrograma y curvameloacutedica - del enunciado

La recomendacioacuten del proyecto NERC es que la transcripcioacuten de un corpus para el estudiode la lengua oral se lleve a cabo seguacuten las especificaciones del Nivel II adecuado seguacuten Frenchpara todas aquellas investigaciones que no requieran informacioacuten prosoacutedica

En el marco de NERC se llevoacute tambieacuten a cabo una evaluacioacuten de las Guiacuteas de la TEI para latranscripcioacuten de corpus orales de la que se concluye que ldquoThe TEI proposals are broadlycompatible with current practice in the user community as represented by JP Frenchconventions Furthermore in the majority of cases it will be a straightforward matter to link themachine-friendly TEI codes to the more user-friendly encoding systems such as JP Frenchconventions by means of a simple conversion programmerdquo (Payne 199260) La idea de unaconversioacuten automaacutetica entre las transcripciones realizadas seguacuten las propuestas de NERC y de laTEI es naturalmente interesante y refuerza la idea de que existe una compatibilidad general entreambos sistemas (Payne 1992 Johansson 1995a EAGLES 1996) prueba de ello es que en elinforme final de NERC se recomienda el uso de las normas de la TEI

Uno de los objetivos del Grupo de Trabajo sobre Textos Orales de EAGLES fue proponerun conjunto miacutenimo de fenoacutemenos que deberiacutean codificarse en cualquier texto oral La propuestarealizada se describe en EAGLES (1996) y toma elementos del proyecto NERC de la TEI y delGrupo de Trabajo sobre Lengua Oral de EAGLES Considerando los elementos comunes a lossistemas que sirven de base se sugiere que la codificacioacuten de un texto oral debe contener almenos informacioacuten sobre los siguientes aspectos

(1) Elementos vocales y no vocalesbull Elementos vocales semi-leacutexicos

Pertenecen a esta categoriacutea los elementos utilizados principalmente en elhabla espontaacutenea durante los momentos en que el hablante planifica lacontinuacioacuten de su discurso como las llamadas ldquopausas llenasrdquo o ldquosonorasrdquo y los

elementos que marcan dudas en el momento de la produccioacuten del hablaCorresponden a los elementos que en la TEI se marcan con la etiqueta ltvocalgtbull Elementos vocales no leacutexicos

Se incluyen aquiacute todo tipo de sonidos producidos por el hablante - tosesrisas bostezos estornudos etc - que no constituyen formas leacutexicas de la lenguaCorresponden igualmente a los codificados con la marca ltvocalgt en la TEIbull Acontecimientos no vocales y no comunicativos

Comprenden los ruidos producidos por otros hablantes o procedentes delentorno de grabacioacuten Estos acontecimientos se codifican en la TEI mediante lamarca lteventgt

(2) Elementos necesarios en la transcripcioacuten de interacciones verbalesbull Identidad del hablante

Este es un elemento imprescindible en la transcripcioacuten de interaccionesverbales La TEI dispone de los mecanismos para documentar informacioacuten sobrelos hablantes en la cabecera de los textos asiacute como de un sistema para marcar laidentidad de cada participante en el interior del texto aunque pueden utilizarsetambieacuten otros procedimientosbull Turnos de palabra

La finalidad del marcado de los turnos de palabra es indicar un cambio dehablante Ademaacutes de las convenciones de la TEI pueden emplearse otrosprocedimientos mientras se mantenga esta informacioacuten esencial en el estudio de lainteraccioacuten verbalbull Superposicioacuten de turnos de palabra

Existen igualmente diferentes procedimientos para marcar la superposicioacutende emisiones de dos hablantes ademaacutes de las propuestas de la TEI que los tratacomo parte de las estrategias para codificar acontecimientos simultaacuteneos

(3) Elementos relacionados con la actuacioacuten del hablantebull Omisiones en un texto leiacutedo

Si se transcribe un texto leiacutedo y se dispone del original es recomendableanotar las palabras o segmentos omitidos por el locutorbull Autocorrecciones

Es propio del habla espontaacutenea aunque tambieacuten de la lectura que loshablantes realicen correcciones de su propia produccioacuten linguumliacutestica (self-repairs)Parece conveniente marcarlas en la transcripcioacuten de un corpus oralbull Fragmentos de palabras

Los fragmentos de palabras corresponden a uno o maacutes segmentospertenecientes a una palabra que no ha sido totalmente pronunciada por el hablanteen un primer intento y que suelen repetirse cuando eacuteste consigue producir lapalabra completa Es importante indicar este fenoacutemeno en la transcripcioacuten

bull Fragmentos ininteligiblesSe trata de partes de la grabacioacuten que no son comprendidas por el

transcriptor y en la TEI se codifican con la etiqueta ltuncleargt aunque si se desease pueden utilizar marcas maacutes detalladas distinguiendo entre transcripcionescompletamente ininteligibles y entre una posible interpretacioacuten ofrecida por eltranscriptor

Un aspecto conflictivo sigue siendo la identificacioacuten de los enunciados que conforman untexto oral (Schuetze-Coburn 1991) Mientras que en un texto escrito los signos de puntuacioacutenconstituyen un criterio de delimitacioacuten en el habla disponemos de indicios como las pausas laentonacioacuten o el cambio de turno de palabra que nos permiten al menos convencionalmentedefinir un enunciado Sin embargo hasta el momento no se han desarrollado auacuten criteriosobjetivos y consistentes para resolver este problema

7- CONCLUSIONES

La revisioacuten - sin pretensiones de exhaustividad - de los principales sistemas detranscripcioacuten etiquetado y codificacioacuten de corpus orales expuesta en este trabajo pone demanifiesto en primer lugar la multiplicidad de propuestas desarrolladas frente a los intentos deestandarizacioacuten algunos de los cuales auacuten no se han consolidado plenamente pese a su crecienteaceptacioacuten En segundo lugar destaca tambieacuten la heterogeneidad de tradiciones que confluyen enel estudio de la lengua hablada desde la foneacutetica y las tecnologiacuteas del habla hasta el anaacutelisis deldiscurso y de la conversacioacuten diversidad que lleva a la creacioacuten de convenciones especiacuteficas pararesponder a las necesidades de diversas comunidades cientiacuteficas Ante esta situacioacuten la distincioacutenpropuesta por Sinclair (1995107) entre ldquoconformidadrdquo y ldquocompatibilidadrdquo adquiere todo susentido ya que si en ciertos casos la conformidad a un estaacutendar determinado es problemaacutetica porlas limitaciones inherentes a todo sistema comuacuten la compatibilidad - entendida como la facilidadde conversioacuten entre sistemas - deberiacutea ser en cambio un requisito imprescindible en el desarrollode los recursos linguumliacutesticos De esta manera puede tal alcanzarse el equilibrio entre lasnecesidades de un proyecto y las indudables ventajas cientiacuteficas y econoacutemicas que resultan de lareutilizacioacuten de los datos disponibles

BIBLIOGRAFIacuteA

Allen GD 1988 The PHONASCII System Journal of the International PhoneticAssociation 181 9-25

Anderson AH M Badger EG Bard E Boyle G Doherty S Garrod S Isard JKowtko J Mcallister J Miller C Sotillo HS Thompson y R Weinert 1991 The HCRCMap Task corpus Language and Speech 344 351-366

Autesserre D G Peacuterennou y M Rossi 1989 Methodology for the transcription andlabeling of a speech corpus Journal of the International Phonetic Association 191 2-15

Barry WJ y AJ Fourcin 1992 Levels of Labelling Computer Speech and Language 61-14

Beckman ME y GM Ayers GM 1994 Guidelines for ToBI Labelling Version 20February 1994[Documento de Internet disponible en httplingohio-stateeduPhoneticsToBIToBI0html]

Beckman ME y J Hirschberg J 1994 The ToBI Annotation Conventions Apeacutendice A deME Beckman y GM Ayers 1994 Guidelines for ToBI Labelling Version 20 February 1994[Documento de Internet disponible en httplingohio-stateeduPhoneticsToBIToBI0html]

Bruce G 1988 23 Supasegmental categories and 24 The symbolization of temporalevents Journal of the International Phonetic Association 182 75-76

Bruce G 1989 Report from the IPA working group on suprasegmental categories LundUniversity Department of Linguistics General Linguistics Phonetics Working Papers 35 25-40

Burnard L 1995 What is SGML and how does it help Computers and the Humanities291 41-50 The Text Encoding Initiative Background and Context Eds N Ide y J VeacuteronisDordrecht Kluwer Academic Publishers

Burnard L 1995a Text Encoding for Information Exchange An Introduction to the TextEncoding Initiaive TEI Document TEI J31 [Documento de Internet disponible enhttpwwwuiceduorgsteiinfoteij31]

Burnard L 1995b The Text Encoding Initiative an overviewrdquo Spoken English onComputer Transcription Markup and Applications Eds G LEECH G MYERS y JTHOMAS Harlow Longman 69-81

Chafe W 1995 Adequacy user-friendliness and practicality in transcribingrdquo English onComputer Transcription Markup and Applications Eds G Leech G Myers y J ThomasHarlow Longman 54-61

Chan D A Fourcin D Gibbon B Granstroumlm M Huckvale G Kokkinakis K KvaleL Lamel B Lindberg A Moreno J Mouropoulos F Senia I Trancoso C Veld y J Zeiliger1995 EUROM - A Spoken Language Resource for the EU Eurospeech95 Proceedings of the4th European Conference on Speech Communication and Speech Technology Madrid Spain 18-21 September 1995 Vol 1 867-870

Cole RA BT Oshika M Noel T Lander y M Fanty 1994 Labeler Agreement inPhonetic Labeling of Continuous Speech Proceedings of the 1994 International Conference onSpoken Language Processing Yokohama Japan 18-22 September 1994[Documento de Internet disponible en httpwwwcseogieduCSLUcorporapapershtml]

Cook G 1995 Theoretical issues transcribing the untranscribablerdquo Spoken English onComputer Transcription Markup and Applications Eds G Leech G Myers y J ThomasHarlow Longman 35-53

Du Bois JW 1991 Transcription design principles for spoken discourse researchPragmatics 1 71-106

Du Bois JW S Schuetze-Coburn S Cumming y D Paolino 1993 Outline of discoursetranscriptionrdquo Talking Data Transcription and Coding in Discourse Research Eds JAEdwards y MD Lampert Hillsdale NJ Lawrence Erlbaum Associates 45-90

EAGLES 1996 Preliminary Recommendations on Spoken Texts EAGLES DocumentEAG-TCWG-STPP May 1996[Documento de Internet disponible enhttpwwwilcpicnritEAGLES96spokentxspokentxhtml]

Edwards JA 1992 Design principles in the transcription of spoken discourserdquoDirections in Corpus Linguistics Proceedings of Nobel Symposium 82 Stockholm 4-8 August1991 Ed J Svartvik Berlin Mouton de Gruyter 129-147

Edwards JA 1993 Principles and Contrasting Systems of Discourse TranscriptionrdquoTalking Data Transcription and Coding in Discourse Research Eds JA Edwards y MDLampert Hillsdale Hillsdale NJ Lawrence Erlbaum Associates 3-32

Edwards JA 1995 Principles and alternative systems in the transcription coding andmark-up of spoken discourserdquo Spoken English on Computer Transcription Markup andApplications Eds G Leech G Myers y J Thomas Harlow Longman 19-34

Ehlich K 1993 HIAT A Transcription System for Discourse Datardquo Talking DataTranscription and Coding in Discourse Research Eds JA Edwards y MD Lampert HillsdaleNJ Lawrence Erlbaum Associates 123-148

Eisen B 1993 Reliability of speech segmentation and labelling at different levels oftranscription Eurospeech93 3rd European Conference on Speech Communication andTechnology Berlin Germany 21-23 September 1993 Vol 1 673-676

Esling JH y H Gaylord 1993 Computer Codes for Phonetic Symbols Journal of theInternational Phonetic Association 232 77-82

Esling JH 1988 Computer coding of IPA symbols and detailed phonetic representationsof computer databases Journal of the International Phonetic Association 182 99-106

Esling JH 1990 Computer Coding of the IPA Supplementary Report Journal of theInternational Phonetic Association 201 22-26

Fourcin A y JM Dolmazon (on behalf of the SAM Project) 1991 Speech knowledgestandards and assessment Actes du XIIegraveme Congregraves International des Sciences Phoneacutetiques 19-24 aoucirct 1991 Aix-en-Provence France Aix-en-Provence Universiteacute de Provence Service desPublications Vol 5 430-433

Fourcin A G Harland W Barry y V Hazan eds 1989 Speech Input and OutputAssessment Multilingual Methods and Standards Chichester Ellis Horwood Ltd

French JP 1991 Updated notes for soundprint transcribers Working paper Universityof Birmingham October 1991 NERC-WP4-47

French JP 1992 Transcription proposals multilevel system Working paper Universityof Birmingham October 1992 NERC-WP4-50

Gibbon D 1989 Survey of Prosodic Labelling for EC Languages SAM-UBI-190 12February 1989 Report e6 in ESPRIT 2589 (SAM) Interim Report Year 1 Ref SAM-UCLG002 University College London February 1990

Gibbon D R Moore y R Winski eds 1997 Handbook on Standards and Resources forSpoken Language Systems Berlin Mouton De Gruyter [Documento de Internet disponible en httpcoralliliuni-bielefelddeEAGLESeagbookeagbookhtml]

Groslashnnum Thorsen N 1987 Suprasegmental transcription ARIPUC - Annual Report ofthe Institute of Phonetics University of Copenhagen 21 1-27

Gumperz JJ y J Berenz 1993 Transcribing Conversational Exchangesrdquo Talking DataTranscription and Coding in Discourse Research Eds JA Ewards y M D Lampert HillsdaleNJ Lawrence Erlbaum Associates 91-122

Hart J lsquoT R Collier y A Cohen 1990 A Perceptual Study of Intonation An Experimental- Phonetic Approach to Intonation Cambridge Cambridge University Press (Cambridge Studiesin Speech Science and Communication)

Hess W K Kohler y HG Tillmann 1995 The PhonDat-Verbmobil Speech CorpusEurospeech95 Proceedings of the 4th European Conference on Speech Communication andSpeech Technology Madrid Spain 18-21 September 1995 Vol 1 863-866

Hieronymus JL 1994 ASCII phonetic symbols for the worlds languages WorldbetATampT Bell Laboratories Technical Memo [Documento de Internet disponible enhttpwwwcseogieduCSLUcorporapapershtml]

Hirst D A Di Cristo y R Espesser en prensaLevels of representation and levels ofanalysis for intonation Prosody Theory and Experiments Ed M Horne Dordrecht Kluwer

Hirst DJ y A Di Cristo en prensa A survey of intonation systemsrdquo IntonationSystems A Survey of 20 Languages Eds D Hirst y A Di Cristo Cambridge CambridgeUniversity Press

Hirst DJ 1991 Intonation models towards a third generation Actes du XIIegraveme CongregravesInternational des Sciences Phoneacutetiques 19-24 aoucirct 1991 Aix-en-Provence France Aix-en-Provence Universiteacute de Provence Service des Publications Vol 1 305-310

Hirst DJ A Di Cristo M Le Besnerais Z Najim P Nicolas y P Romeacuteas 1993Multilingual modelling of intonation patternsrdquo Proceedings of an ESCA Workshop on ProsodySeptember 27-29 1993 Lund Sweden Eds D House y P Touati Lund University Departmentof Linguistics and Phonetics Working Papers 41 204-207

Hirst DJ N Ide y J Veacuteronis 1994 Coding fundamental frequency patterns for multi-lingual synthesis with INTSINT in the MULTEXT project Conference Proceedings of theSecond ESCAIEEE Workshop on Speech Synthesis September 12-15 1994 Mohonk MountainHouse New Paltz New York USA 77-80

Ide N y J Veacuteronis eds 1995 The Text Encoding Initiative Background and ContextsComputers and the Humanities 29 1-3 Publicado en forma de libro en Dordrecht KluwerAcademic Publishers

IPA 1989 The IPA 1989 Kiel Convention Workgroup 9 report Computer Coding of IPAsymbols and Computer Representation of Individual Languages Journal of the InternationalPhonetic Association 192 81-92

IPA 1993 IPA Chart revised to 1993 Journal of the International Phonetic Association231 [Documento de Internet disponible en httpwwwartsglaacukIPAipacharthtml]

IPA 1995 Preview of the IPA Handbook Journal of the International Phonetic Association251

ISO 8879 1986 Information Processing Text and Office Systems Standard GeneralizedMarkup Language (SGML) Geneva International Organization for Standardization

Johansson S 1995a The approach of the Text Encoding Initiative to the encoding ofspoken discourse Spoken English on Computer Transcription Markup and Applications EdsG Leech G Myers y J Thomas Harlow Longman 82-98

Johansson S 1995b The Encoding of Spoken Texts Computers and the Humanities291 149-158 The Text Encoding Initiative Background and Context Eds N Ide y J VeacuteronisDordrecht Kluwer Academic Publishers 149-158

Keating P P MacEachern A Shryock y S Domiacutenguez 1994 A manual for phonetictranscription Segmentation and labelling of words in spontaneous speech UCLA WorkingPapers in Phonetics 88 91-120

Kluger-Kruse M 1987 Computer Phonetic Alphabet ESPRIT Linguistic Analysis of theEuropean Languages Report BU-CPA0267 July 1987

Krot C y B Taylor 1995 Criteria for Acoustic-Phonetic Segmentation and WordLabelling in the Australian National Database of Spoken Language[Documento de Internet disponible en httpwwwshlrcmqeduaucriteriahtml]

Lander T 1997 The CSLU Labeling Guide Center for Spoken Language UnderstandingOregon Graduate Institute[Documento de Internet disponible en httpwwwcseogieduCSLUcorporapapershtml]

Llisterri J 1994 Prosody Encoding Survey WP 1 Specifications and Standards T15Markup Specifications Deliverable 153 Final version 15 September 1994 LRE Project 62-050MULTEXT

Llisterri J ed 1996 Prosody Tools Efficiency and Failures WP 4 Corpus T46 SpeechMarkup and Validation Deliverable 452 Final version 15 October 1996 LRE Project 62-050MULTEXT

MacWhinney B 1991The CHILDES Project Tools for Analyzing Talk Hillsdale NJLawrence Erlbaum

Marchal A N Nguyen y W Hardcastle 1995 Multitiered phonetic approach to speechlabelling Levels in Speech Communication Relations and Interactions A Tribute to MaxWajskop Hommage agrave Max Wajskop Eds C Sorin J Mariani H Meloni y J SchoengenAmsterdam Elsevier Science BV 149-158

NERC 1994 NERC-1 Network of European Reference Corpora Final Report PisaInstituto di Linguistica Computazionale - CNR January 1994 versioacuten en curso de publicacioacutenTowards a Network of European Reference Corpora Eds N Calzolari M Baker y PG KruytPisa Giardini

Nicolas P y D Hirst 1995 Symbolic coding of Higher-Level Characteristics ofFundamental Frequency Curvesrdquo Eurospeech95 Proceedings of the 4th European Conferenceon Speech Communication and Technology Madrid Spain 18-21 September 1995 Vol 2 989-992

OConnell DC y S Kowal 1994 Some Current Transcription Systems for SpokenDiscourse A critical Analysis Pragmatics 4 81-107

Ochs E 1979 Transcription as Theory Developmental Pragmatics Eds E Ochs E yBB Schieffelin New York Academic Press 43-72

Payne J 1992 Report on the compatibility of JP Frenchs spoken corpus transcriptionconventions with the TEI guidelines for transcription of spoken texts Working paper COBUILDBirmingham and IDS Mannheim December 1992 NERC-WP8WP4-122

Payne J 1995 The COBUILD spoken corpus transcription conventions SpokenEnglish on Computer Transcription Markup and Applications Eds G Leech G Myers y JThomas Harlow Longman 203-207

Payratoacute Ll 1995 Transcripcioacuten del discurso coloquialrdquo El espantildeol coloquial Actas del ISimposio sobre Anaacutelisis del Discurso Oral Almeriacutea 23-25 de noviembre de 1994 Ed L CorteacutesRodriacuteguez Almeriacutea Universidad de Almeriacutea Servicio de Publicaciones 43-70

Pierrehumbert J B 1897 (1980) The Phonology and Phonetics of English IntonationPhD Thesis Department of Linguistics MIT Bloomington Indiana University Linguistics Club

Pitrelli J M Beckman y J Hirschberg 1994 Evaluation of prosodic transcriptionlabelling reliability in the ToBI frameworkrdquo Proceedings of the Third International Conference onSpoken Language Processing Yokohama ICSLP Vol 2 123-126

Pullum GK y WA Ladusaw 1996 (1986) Phonetic Symbol Guide Chicago TheUniversity of Chicago Press 2nd edition

Roach P H Roach A Dew y P Rowlands 1990 Phonetic analysis and the automaticsegmentation and labeling of speech sounds Journal of the International Phonetic Association201 15-21

Schmidt MS C Scott y MA Jack 1993 Phonetic transcription standards for Europeannames (ONOMASTICA) Eurospeech93 3rd European Conference on Speech Communicationand Technology Berlin Germany 21-23 September 1993 Vol 1 279-282

Schuetze-Coburn S 1991Units of intonation in discourse a comparison of acoustic andauditory analysis Language and Speech 343 207-234

Selting M 1987 Descriptive categories for the auditive analysis of intonation inconversation Journal of Pragmatics 11 777-791

Selting M 1988 The role of intonation in the organisation of repair and problem handlingsequences in conversation Journal of Pragmatics 12 293-322

Senia F y JG Van Velden 1997 Specifications of orthographic transcription and lexiconconventions LRE-4001 SpeechDat Technical Report SD132 Final version 10 January 1997[Documento de Internet disponible en httpwwwphonetikuni-muenchendeSpeechDathtml]

Silverman K M Beckman J Pitrelli M Ostendorf C Wightman P Price JPierrehumbert y J Hirschberg 1992 TOBI A standard for labelling English prosodyProceedings of the Second International Conference on Spoken Language Processing ICSLP-92Banff October 1992 867-870

Sinclair J 1994 Spoken Language [3B] PhoneticPhonemic and Prosodic Annotation[52] NERC 1994 NERC-1 Network of European Reference Corpora Final Report PisaVersioacuten en curso de publicacioacuten Towards a Network of European Reference Corpora Eds NCalzolari M Baker y PG Kruyt Pisa Giardini

Sinclair J 1995 From theory to practicerdquo Spoken English on Computer TranscriptionMarkup and Applications Eds G Leech G Myers Y J Thomas Harlow Longman 99- 112

Sperberg-McQueen CM y L Burnard eds 1994 Guidelines for Electronic Text Encodingand Interchange TEI P3 Chicago and Oxford Association for Computational Linguistics Association for Computers and the Humanities Association for Literary and LinguisticComputing [Cap 11 Transcriptions of Speech] [Documento de Internet disponible enhttpetextvirginiaeduTEIhtml]

Strangert E y M Heldner 1995 Labelling of boundaries and prominences byphonetically experienced and non-experienced transcribers Phonum 3 Reports from theDepartment of Phonetics Umearing University 85-109 [Documento de Internet disponible enhttpwwwlingumusefonphonum3html]

Teubert W 1993 Phonetic Phonemic and Prosodic Annotation Final Report IDSMannheim February 1993 NERC-WP8-171

Tillmann HG y B Pompino-Marschall 1993 Theoretical Principles ConcerningSegmentation Labelling Strategies and Levels of Categorical Annotation for Spoken LanguageDatabase Systems Eurospeech93 3rd European Conference on Speech Communication andTechnology Berlin Germany 21-23 September 1993 Vol 3 1691-1694

Trancoso I 1995 The ONOMASTICA Interlanguage Pronunciation LexiconrdquoEurospeech95 Proceedings of the 4th European Conference on Speech Communication andTechnology Madrid Spain 18-21 September 1995 Vol 1 829-832

Wells JC 1987 Computer Coded Phonetic Transcription Journal of the InternationalPhonetic Association 172 94-114

Wells JC 1989 Computer-coded phonemic notation of individual languages of theEuropean Community Journal of the International Phonetic Association 191 31-54

Wells JC 1994 Computer-coding the IPA a proposed extension of SAMPA SpeechHearing and Language Work in Progress 1994 (University College London Department ofPhonetics and Linguistics) 8 271-289

Wells JC 1995 SAMPROSA (SAM Prosodic Transcription [Documento de Internetdisponible en httpwwwphonuclacukhomesampasamprosahtm]

Wells JC W Barry M Grice A Fourcin y D Gibbon 1992 Standard Computer-Compatible Transcription SAM Stage Report Sen3 SAM UCL-037 28 February 1992 SAM(1992) Esprit Project 2589 (SAM) Multilingual Speech InputOutput AssessmentMethodologyand Standardisation Final Report Year Three 1III91-28II1992 London University CollegeLondon

Wesenick M-B y F Schiel 1995 Feasibility of Automatic Annotation and BuildingPronunciation Lexica from Corpus Material LRE-63314 SpeechDat Report D3123 Finalversion 10 October 1995[Documento de Internet disponible en httpwwwicpgrenetfrSpeechDathomehtml]

Winski R R Moore y D Gibbon 1995 EAGLES Spoken Language Working GroupOverview and Resultsrdquo Eurospeech95 Proceedings of the 4th European Conference on SpeechCommunication and Speech Technology Madrid Spain 18-21 September 1995 Vol 1 841-844[Documento de Internet disponible en httpcoralliliuni-bielefeldde~gibbonEAGLESrwpaperrwpaperhtml]

  • 1- INTRODUCCIOacuteN
  • 2- NIVELES DE REPRESENTACIOacuteN ETIQUETADO Y CODIFICACIOacuteN
  • 3- REPRESENTACIOacuteN ORTOGRAacuteFICA DE CORPUS ORALES
  • 31- Propuestas para la representacioacuten ortograacutefica de corpus orales en el aacutembito de la linguumliacutestica de corpus
  • 32- Propuestas para la representacioacuten ortograacutefica de corpus orales en el aacutembito de las tecnologiacuteas del habla
  • 4- REPRESENTACIOacuteN FONEacuteTICA DE CORPUS ORALES
  • 41- La representacioacuten foneacutetica de los elementos segmentales
  • 42- La representacioacuten foneacutetica de los elementos suprasegmentales
  • 5- ETIQUETADO FONEacuteTICO DE CORPUS ORALES
  • 51- Niveles de etiquetado foneacutetico de corpus orales
  • 52- La transcripcioacuten y el etiquetado automaacutetico de corpus orales
  • 6- TRANSCRIPCIOacuteN Y CODIFICACIOacuteN DE CORPUS PARA EL ANAacuteLISIS DE LA LENGUA ORAL
  • 61- Los requisitos de una transcripcioacuten
  • 62- Propuestas de estandarizacioacuten para la transcripcioacuten y codificacioacuten de corpus orales
  • 7- CONCLUSIONES
  • BIBLIOGRAFIacuteA
Page 5: Transcripción, etiquetado y codificación de corpus orales

Como puede deducirse faacutecilmente la filosofiacutea general de esta propuesta consiste en utilizarsiempre las formas que aparecen en los diccionarios normativos y documentar adecuadamente lasformas no estaacutendares que se encuentren durante el proceso de transcripcioacuten

4- REPRESENTACIOacuteN FONEacuteTICA DE CORPUS ORALES

A la hora de plantearse la eleccioacuten de un sistema de transcripcioacuten foneacutetica para un corpusoral son uacutetiles los planteamientos que Johansson (199593) realiza en el marco de la TEI (TextEncoding Initiative)1 ldquoThe degree of phonetic detail given in speech transcription varies fromnone to a very precise phonetic or phonemic transcription [] Where there is a great deal ofphonetic or phonemic detail it will be more convenient to design a specialized writing systemrdquo

Evidentemente hay casos en los que el objeto de la investigacioacuten no requiere la utilizacioacutende un sistema de transcripcioacuten foneacutetica pero cuando es necesario disponer de un ldquosistemaespecializado de escriturardquo el AFI (Alfabeto Foneacutetico Internacional) aparece como el primercandidato para cubrir las necesidades de la investigacioacuten siendo igualmente el sistemarecomendado tanto por la TEI como por el Grupo de Trabajo sobre Textos Orales de EAGLESSin embargo cuando se requiere el intercambio electroacutenico de textos SAMPA (SAM PhoneticAlphabet) - considerado como una versioacuten informaacutetica de parte del AFI (Gibbon Moore yWinski eds 1997) - se presenta como una opcioacuten vaacutelida especialmente en lo que se refiere a laslengua europeas cuando se requiere una transcripcioacuten de caraacutecter fonoloacutegico Existe una extensioacutende SAMPA (X-SAMPA) que ofrece los elementos del AFI inexistentes en SAMPA y que por lotanto puede considerarse como un sistema adecuado para la transcripcioacuten de corpus orales(EAGLES 1996) Por otra parte cabe considerar tambieacuten Wordlbet como una alternativa cuandola naturaleza del corpus aconseje disponer de un sistema maacutes detallado Estos procedimientoscomuacutenmente utilizados en la transcripcioacuten de corpus orales desarrollados en el aacutembito de lafoneacutetica y las tecnologiacuteas del habla se presentan someramente a continuacioacuten Dada la diversidadde meacutetodos existentes parece clara la conveniencia de desarrollar mecanismos que permitan lacompatibilidad asegurando la faacutecil traduccioacuten de una representacioacuten a otra de modo quediferentes investigadores puedan hacer uso de corpus ya transcritos foneacuteticamenteincorporaacutendolos a su propio entorno de trabajo

41- La representacioacuten foneacutetica de los elementos segmentales

El Alfabeto Foneacutetico Internacional (AFI IPA International Phonetic Alphabet)2 es elsistema maacutes ampliamente utilizado para la transcripcioacuten foneacutetica Es bien sabido que se basa en

1 Ademaacutes de las Guidelines for Electronic Text Encoding and Interchange (Sperberg-McQueen y Burnard eds1994) puede verse tambieacuten sobre la TEI la recopilacioacuten de Ide y Veacuteronis eds 1995 Para una introduccioacuten generalson uacutetiles Burnard (1995a b) Se encuentra maacutes informacioacuten en URL httpwww-teiuiceduorgsteiy en URL httpetextvirginiaeduTEIhtml2 La versioacuten maacutes reciente del AFI data de 1993 (IPA 1993) y puede encontrarse en URLhttpwwwartsglaacukIPAipacharthtml El Summer Institute of Linguistics (URLhttpwwwsilorgcomputingfonts) distribuye tipos de letra (fonts) que permiten trabajar con los sistemasoperativos maacutes corrientes utilizando los siacutembolos del AFI Tambieacuten pueden obtenerse en University CollegeLondon (URL httpwwwphonuclacuk) a partir de la paacutegina de Linguist (URL httplinguistlistorg) del

un principio fonoloacutegico seguacuten el cual se transcriben aquellos segmentos con valor diferencialutilizaacutendose los diacriacuteticos para introducir aspectos de tipo foneacutetico (IPA 1995) Sin embargo apesar del uso extendido del AFI existen tambieacuten diversas tradiciones nacionales resultantes engeneral de las necesidades derivadas de la transcripcioacuten estrecha de una determinada lengua o de laorientacioacuten de la investigacioacuten hacia un determinada aacuterea linguumliacutestica (Pullum y Ladusaw 1986)

La necesidad de intercambiar electroacutenicamente textos que contienen transcripcionesfoneacuteticas llevoacute a finales de los antildeos 80 a plantearse la codificacioacuten de los siacutembolos del AFI demodo que para cada uno de los siacutembolos del alfabeto se ha definido un nuacutemero (denominadoldquonuacutemero AFIrdquo) que puede relacionarse tambieacuten con los coacutedigos ASCII (Esling 1988 1990 IPA1989 Esling y Gaylord 1993) Las equivalencias entre siacutembolos nuacutemeros AFI y coacutedigos ASCIIforman parte de las convenciones conocidas como CRIL (Computer Representation of IndividualLanguages) surgidas del congreso de la Asociacioacuten Foneacutetica Internacional celebrado en Kiel en1991

SAMPA (SAM Phonetic Alphabet) constituye seguramente el esfuerzo maacutes significativo yextendido por desarrollar un sistema de transcripcioacuten foneacutetica informatizado SAMPA tiene suorigen en el proyecto ESPRIT 1541 SAM - Speech Assessment Methods (Fourcin et al 1989Fourcin y Dolmazon 1991) llevado a cabo entre 1987 y 1989 Al final del proyecto existiacuteanversiones de SAMPA en daneacutes neerlandeacutes ingleacutes franceacutes alemaacuten e italiano incorporaacutendose en1992 el noruego y el sueco y el espantildeol el griego y el portugueacutes en 1993 Durante 1996 seextendioacute a una serie de lenguas de los paiacuteses de la Europa del Este en el marco del proyectoBABEL (URL httpmidwichreadingacukresearchspeechlabbabel) y en principio no hayninguacuten obstaacuteculo para su adaptacioacuten a otros idiomas En cuanto a su utilizacioacuten praacutectica puedesentildealarse que es el sistema desarrollado para la transcripcioacuten del corpus multilinguumle EUROM(Chan et al 1995) y tambieacuten el adoptado en el proyecto ONOMASTICA centrado en latranscripcioacuten de nombres propios en diversas lenguas europeas (Schmidt 1993 Trancoso 1995)

SAMPA (Wells 1987 1989) se basa en un conjunto de equivalencias entre siacutembolos delAFI y coacutedigos ASCII restringieacutendose al uso de caracteres de 7 bits (coacutedigos 32 a 127) Elprincipio que rige las transcripciones en SAMPA al igual que en el caso del AFI esesencialmente fonoloacutegico empleaacutendose uacutenicamente siacutembolos distintos en el caso de segmentoscon valor diferencial Esta filosofiacutea viene motivada por tres razones simplicidad de latranscripcioacuten sin incorporar ambiguumledades ya que determinadas alofoacutenicas son predictibles apartir del contexto facilidad de utilizacioacuten por parte personas con poca formacioacuten en foneacutetica yfalta de coacutedigos ASCII para la transcripcioacuten alofoacutenica de todas las lenguas Sin embargo enalgunos casos se introducen siacutembolos para la representacioacuten de aloacutefonos cuando losinvestigadores que han desarrollado las adaptaciones para cada lengua lo han consideradonecesario

Una de las limitaciones de SAMPA es que no establece una codificacioacuten para todos lossiacutembolos del AFI Por este motivo Wells (1994) propone un sistema denominado X-SAMPA en

Yamada Language Center (URL httpbabeluoregoneduyamadafontsphonetichtml) o de la paacutegina de la propiaAsociacioacuten Foneacutetica Internacional (URL httpwwwartsglaacukIPAipafontshtml)

el que se preveacuten equivalencias en coacutedigos ASCII para la totalidad de siacutembolos del AFI en surevisioacuten de 1993 incluyendo diacriacuteticos y marcas tonales Una de las aplicaciones propuestaspara este sistema es el enviacuteo de textos en transcripcioacuten foneacutetica a traveacutes del correo electroacutenico

Por otra parte Worldbet constituye una propuesta maacutes ambiciosa que SAMPA y que suextensioacuten X-SAMPA pues parte de la base de que ldquoany spectrally and temporally distinct speechsound (not including pitch) which is phonemic in some language should have a separate basesymbolrdquo (Hieronymus 1994 ) los siacutembolos de base consisten normalmente en la concatenacioacuten deun siacutembolo del AFI con una serie de diacriacuteticos de modo que puede representarse una granvariedad de aloacutefonos hallados en las lenguas del mundo incluyendo siacutembolos inexistentes en elAFI Uno de los objetivos de Wordlbet - que en su versioacuten actual usa 299 siacutembolos compuestosde dos caracteres ASCII - es facilitar la transcripcioacuten de bases de datos multilinguumles que incluyanlenguas indias asiaacuteticas y africanas ademaacutes de las europeas Este sistema se ha utilizado porejemplo en la transcripcioacuten de los corpus distribuidos por el CSLU (Center for Spoken LanguageUnderstanding Oregon Graduate Institute) (Lander 1997)

Existen otros sistemas de transcripcioacuten foneacutetica concebidos para el intercambio electroacutenicode textos tanto desarrollados desde la perspectiva de las tecnologiacuteas del habla - por ejemplo elCPA (Computer Phonetic Alphabet) surgido en el marco del proyecto ESPRIT Linguistic Analysisof European Languages (Kluger-Kruse 1987) - como disentildeados para otros fines En el aacutembito delestudio del lenguaje infantil el proyecto CHILDES - Child Language Data Exchange System(MacWhinney 1991utiliza el sistema conocido como PHONASCII (Allen 1988) consistente enun conjunto de siacutembolos fonoloacutegicos - UNIBET - y un alfabeto foneacutetico que permite latranscripcioacuten estrecha

42- La representacioacuten foneacutetica de los elementos suprasegmentales

La incorporacioacuten de informacioacuten sobre los elementos suprasegmentales - informacioacutenprosoacutedica - en un corpus oral plantea diversos problemas derivados precisamente de la propianaturaleza de estos elementos que se manifiestan en variaciones continuas en los dominios de lafrecuencia la intensidad y el tiempo Por tanto es preciso llevar a cabo una abstraccioacuten paradeterminar en primer lugar cuaacuteles de estas variaciones son linguumliacutesticamente significativas y ensegundo lugar coacutemo se relacionan con categoriacuteas discretas Finalmente estas categoriacuteas debenrepresentarse en un sistema de notacioacuten No es pues extrantildeo que se hayan desarrollado diversasconvenciones para la simbolizacioacuten de los elementos suprasegmentales (Groslashnnum-Thorsen 1987Llisterri 1994) algunas de las cuales se presentan en los apartados siguientes

En el momento de plantearse la seleccioacuten de un sistema de transcripcioacuten prosoacutedicaadecuado a un corpus oral el investigador se enfrenta nuevamente a la diversidad de sistemas aligual que sucede en el caso de la transcripcioacuten segmental Aunque como veremos maacutes adelanteToBI parece que se estaacute convirtiendo raacutepidamente en un estaacutendar a pesar de su orientacioacuten haciala transcripcioacuten del ingleacutes y al modelo fonoloacutegico subyacente SAMPROSA ofrece la ventaja dehaberse desarrollado teniendo en cuenta las necesidades de las tecnologiacuteas del habla ademaacutesSAMPROSA se enmarca en el contexto de estaacutendares extendidos en Europa como los delproyecto SAM recomendados por ejemplo por NERC (Teubert 1993 Sinclair 1994) Enconjunto el sistema ideal de transcripcioacuten prosoacutedica deberiacutea permitir una representacioacuten en varios

niveles ser compatible con el intercambio electroacutenico de datos y cubrir las necesidades del mayornuacutemero de lenguas posible pudiendo aplicarse automaacuteticamente en lugar de basarse en lasimpresiones intuitivas del transcriptor con vistas a la transcripcioacuten de grandes corpus Enausencia de un sistema que reuacutena tales caracteriacutesticas parece adecuado establecer mecanismos decompatibilidad entre los existentes a fin de facilitar la reutilizacioacuten de los datos

El AFI ofrece ademaacutes de la posibilidades de transcripcioacuten segmental un conjunto desiacutembolos para la representacioacuten de los elementos suprasegmentales Con motivo del congresopara la revisioacuten del AFI celebrado en Kiel en 1989 se creoacute un grupo de trabajo sobre categoriacuteassuprasegmentales (Bruce 1988 1989) concluyeacutendose la necesidad de representar las categoriacuteassuprasegmentales de un modo maacutes adecuado especialmente en lo que se refiere la entonacioacuten Elconjunto actual de siacutembolos del AFI para los elementos suprasegmentales permite transcribir eltono asiacute como la duracioacuten y el acento

Las necesidades derivadas de una descripcioacuten detallada de la entonacioacuten tanto en el campode la foneacutetica como en el de las tecnologiacuteas del habla han propiciado la creacioacuten de diversossistemas de transcripcioacuten prosoacutedica algunos de los cuales se presentan a continuacioacuten

En el marco del proyecto ESPRIT SAM anteriormente mencionado se llevoacute tambieacuten a caboel desarrollo de sistemas de transcripcioacuten prosoacutedica compatibles con las necesidades de anotacioacutende bases de datos en soporte electroacutenico resultando de ello propuestas como PROSPASAMSINT o SAMPROSA (Gibbon 1989 Wells et al 1992) PROSPA fue originalmenteconcebido por Selting y Gibbon (Selting 1987 1988) para el anaacutelisis de la conversacioacuten y deldiscurso y por tal motivo se basa en criterios auditivos recogiendo uacutenicamente los elementosnecesarios para este fin Por su parte SAMSINT (SAM System for Intonation Transcription) seplantea como objetivo la transcripcioacuten de contornos meloacutedicos en el interior de unidadesentonativas basaacutendose en INTSINT - presentado maacutes adelante - con algunas modificacionesadicionales

A pesar de la coexistencia de los sistemas anteriormente mencionados en el proyecto SAMprobablemente el conjunto de siacutembolos maacutes extendido actualmente para la transcripcioacutenprosoacutedica sea SAMPROSA (SAM Prosodic Alphabet) propuesto inicialmente por Gibbon(1989) y desarrollado por Wells et al (1992) hasta llegar a su forma actual (Wells 1995)SAMPROSA ofrece al igual que SAMPA un conjunto de caracteres correspondientes a coacutedigosASCII mediante los cuales es posible transcribir tonos globales locales terminales y nucleares laduracioacuten el acento la pausas y las fronteras entre unidades prosoacutedicas Aunque presenta rasgoscaracteriacutesticos de la tradicioacuten britaacutenica de anaacutelisis de la entonacioacuten como por ejemplo lacodificacioacuten de tonos nucleares es un sistema que se plantea como adecuado para la transcripcioacutende diversas lenguas

En el aacutembito americano ToBI (Tone and Break Index) se desarrolloacute para cubrir al mismotiempo las necesidades de la descripcioacuten foneacutetica y de la anotacioacuten de corpus adecuados aldesarrollo de sistemas de tecnologiacuteas del habla (Silverman et al 1992 Beckman y Hirschberg1994 Beckman y Ayers 1994) Basado en el ingleacutes americano ToBI permite principalmente latranscripcioacuten de patrones entonativos partiendo de un anaacutelisis de la curva meloacutedica representadacomo evolucioacuten temporal de la frecuencia fundamental mediante herramientas de anaacutelisis y

etiquetado como el programa Wavestrade Sin embargo se han definido tambieacuten convenciones parala anotacioacuten de textos representados ortograacuteficamente Una transcripcioacuten utilizando ToBI constade cuatro niveles

bull Representacioacuten ortograacutefica del enunciadobull Nivel de iacutendices de ruptura (break index) en el que se introducen los indicadores

de liacutemite que marcan las fronteras entre las unidades meloacutedicas estableciendo cuatro gradosde cohesioacuten entre las mismas

bull Nivel tonal en el que se marcan los denominados ldquoeventos tonalesrdquo (pitch events)divididos en tonos de frase al principio y al final de las unidades meloacutedicas y en acentostonales (pitch accent) en las siacutelabas en las que se produce un movimiento de la frecuenciafundamental

bull Nivel miscelaacuteneo que facilita por ejemplo introducir los comentarios deltranscriptor

Para cada uno de los niveles se define un conjunto de siacutembolos alineados temporalmentecon los fenoacutemenos entonativos transcritos si se dispone de una herramienta adecuada comoWavestrade

Las criacuteticas que se realizan maacutes frecuentemente a ToBI son por una parte su dependenciadel modelo fonoloacutegico desarrollado por Pierrehumbert (1980) y por otra su mejor adaptacioacuten alingleacutes que a otras lenguas lo que explicariacutea su amplia utilizacioacuten en Estados Unidos Sin embargose han realizado trabajos en italiano alemaacuten huacutengaro y espantildeol entre otras lenguas usando ToBIcomo sistema de representacioacuten Un inconveniente maacutes importante es que la anotacioacuten medianteToBI requiere un cierto conocimiento previo de los patrones entonativos de la lengua Aun asiacute esun sistema que ofrece indudables ventajas como pueden ser su estructura jeraacuterquica que permiteseleccionar entre subconjuntos o conjuntos mayores de siacutembolos la posibilidad de representarproblemas que aparecen en la transcripcioacuten y el hecho de que existan experimentos demostrandoun alto grado de acuerdo entre transcriptores diferentes (Pitrelli et al 1994)

En el Institute for Perception Research (IPO Eindhoven) se ha desarrollado una teoriacutea sobrela entonacioacuten basada en el modelado de contornos entonativos consistentes en representacionesestilizadas perceptivamente equivalentes al contorno original (lsquot Hart et al 1990) Esta teoriacutea hallevado tambieacuten a la formalizacioacuten de un sistema de representacioacuten de la curva meloacutedica definidacomo un conjunto de movimientos tonales que se agrupan en secuencias de configuracionestonales la agrupacioacuten de estas configuraciones da lugar a su vez a contornos meloacutedicosdefinieacutendose los patrones entonativos en funcioacuten de agrupaciones similares de contornosmeloacutedicos Un sistema jerarquizado de esta naturaleza permite una representacioacuten de la curvameloacutedica adecuada para la transcripcioacuten prosoacutedica aunque que inicialmente no haya sido disentildeadopara tales fines

El objetivo de INTSINT (International Transcription System for Intonation) en cambio esproporcionar un sistema para la comparacioacuten interlinguumliacutestica de sistemas prosoacutedicosDesarrollado por Hirst (1991 Hirst y Di Cristo en prensa Hirst Di Cristo y Espesser enprensa) en el marco de un proyecto de anaacutelisis automaacutetico de la entonacioacuten INTSINT se basa en

la estilizacioacuten de la curva meloacutedica realizada a partir de una interpolacioacuten entre puntos en los quese da un cambio significativo en el valor de la frecuencia fundamental (target points) Estospuntos que podriacuteamos denominar ldquode inflexioacutenrdquo - definidos como la combinacioacuten de un valortemporal y un valor frecuencial - son susceptibles de codificarse automaacuteticamente mediante lossiacutembolos de INTSINT previa introduccioacuten de marcas de frontera entre las unidades entonativasCon ello se obtiene una representacioacuten fonoloacutegica del contorno meloacutedico simbolizando losdiferentes niveles tonales de la curva original El sistema se basa en la representacioacuten desecuencias tonales consideradas tanto desde una perspectiva global en funcioacuten del rango devariacioacuten tonal del hablante como desde un punto de vista local en relacioacuten con la altura de puntosde inflexioacuten anteriores En el primer caso se definen tres niveles T (Top) M (Mid) y B (Bottom)mientras que en el segundo se marcan cinco posibilidades H (Higher) L (Lower) S (Same) U(Upstep) o D (Downstep) El proceso de modelizacioacuten necesario para transcribir medianteINTSINT ha sido aplicado a varias lenguas (Hirst et al 1993) y se emplea tambieacuten para laanotacioacuten prosoacutedica de parte del corpus EUROM en franceacutes ingleacutes alemaacuten sueco y espantildeol(Hirst et al 1994 Llisterri ed 1996) llevada a cabo en el marco del proyecto LRE 62-050MULTEXT - Multilingual Text Tools and Corpora Es posible tambieacuten aplicar INTSINT aniveles maacutes altos como el paacuterrafo tal como se muestra en Nicolas y Hirst (1995)

5- ETIQUETADO FONEacuteTICO DE CORPUS ORALES

Al igual que en el caso de los corpus textuales una vez recogidos los materiales de base deun corpus oral debe llevarse a cabo un tratamiento de los mismos que permita su utilizacioacutenposterior El primer paso suele ser la transcripcioacuten ortograacutefica que en determinado tipo de corpusse acompantildea de una transcripcioacuten foneacutetica o fonoloacutegica A continuacioacuten a cada segmento de laonda sonora se le asocia una etiqueta (labelling) que lo define en teacuterminos foneacuteticos o fonoloacutegicosy se lleva a cabo la alineacioacuten (alignment) entre la sentildeal sonora y las etiquetas obteniendo unarepresentacioacuten que puede compararse a la partitura musical de una obra para voz y orquesta Elproceso de etiquetado segmental puede llevarse a cabo a varios niveles como veremos en esteapartado y completarse con una anotacioacuten de las caracteriacutesticas suprasegmentales codificadasseguacuten los diversos sistemas que hemos expuesto anteriormente Si se cumplen las etapasmencionadas se llega a disponer de un corpus que contiene la sentildeal sonora sincronizada con latranscripcioacuten ortograacutefica y con la transcripcioacuten foneacutetica o fonoloacutegica de modo que una vezdefinida una estructura de base de datos es posible consultar el corpus partiendo de etiquetasfoneacuteticas de marcas prosoacutedicas o de la transcripcioacuten ortograacutefica al tiempo que se accede a lagrabacioacuten correspondiente

Los corpus de lengua oral que consisten uacutenicamente en transcripciones ortograacuteficas - ya queno suele ser factible realizar una transcripcioacuten foneacutetica completa de un nuacutemero elevado de horasde grabacioacuten - conllevan un procesamiento menos complejo aunque en algunos casos contienenmarcas prosoacutedicas uacutetiles para el anaacutelisis del discurso o de la conversacioacuten como veremos en elapartado 6

51- Niveles de etiquetado foneacutetico de corpus orales

Una cuestioacuten que se plantea inevitablemente a la hora de introducir informacioacuten adicionalsobre los datos recogidos es el nivel de etiquetado del corpus Se han realizado varias propuestassobre los distintos niveles en los que se puede realizar el etiquetado foneacutetico de un corpusalgunas de ellas ligadas al proyecto SAM como la de Barry y Fourcin (1992) en la que seplantean cinco niveles posibles de etiquetado foneacutetico de un corpus

bull Nivel fiacutesico en el que se etiquetan las propiedades acuacutesticas presentes en la sentildealsonora

bull Nivel acuacutestico-foneacutetico en el que se marcan las propiedades de los segmentos enteacuterminos de categoriacuteas foneacuteticas como oclusioacuten friccioacuten sonoridad nasalizacioacuten etc

bull Nivel de transcripcioacuten estrecha en el que se caracterizan los segmentos utilizandolos siacutembolos del AFI o de sus equivalentes computacionales

bull Nivel de transcripcioacuten fonoloacutegica (o foneacutemica) sentildealando uacutenicamente aquelloselementos funcionalmente distintivos que se encuentran en la palabra pronunciadaaisladamente en un estilo cuidado (citation form)

bull Nivel de transcripcioacuten ancha en el que se utilizan los siacutembolos correspondientes alos elementos fonoloacutegicos en una lengua dada para transcribir realizaciones alofoacutenicascondicionadas por el contexto3

A estos cinco niveles debe antildeadirse auacuten la anotacioacuten prosoacutedica considerada de formaindependiente por los autores de la propuesta

Una propuesta similar de etiquetado tambieacuten en cinco niveles - caracteriacutesticas acuacutesticas denaturaleza subfoneacutemica caracteriacutesticas segmentales realizaciones foneacuteticas forma canoacutenica de laspalabras y transcripcioacuten ortograacutefica - se presenta en Tillmann y Pompino-Marschall (1993) y hasido utilizada con eacutexito en el proyecto alemaacuten PhonDat Igualmente pueden verse las propuestasde Autesserre et al (1989) enmarcadas en el contexto del proyecto SAM y los trabajos deMarchal et al (1995) o Roach et al (1990)

La transcripcioacuten y el etiquetado de corpus orales se ha abordado en el marco del proyectoEAGLES desde una doble perspectiva la de la foneacutetica y las tecnologiacuteas del habla en el Grupo deTrabajo sobre Lengua Oral y desde la de la linguumliacutestica de corpus en el marco de las actividades delGrupo de Trabajo sobre Corpus Textuales El trabajo llevado a cabo en el grupo dedicado a lalengua hablada en EAGLES recoge esencialmente las propuestas desarrolladas en el marco deSAM y de PhonDat Los niveles de etiquetado propuesto son los siguientes (Gibbon Moore yWinski eds 1997)

bull Nivel ortograacutefico en el que se utiliza la representacioacuten ortograacutefica convencional

3 La distincioacuten entre los dos uacuteltimos niveles puede ejemplificarse con el caso de las asimilaciones mientras que enla transcripcioacuten ancha encontrariacuteamos [um poko] (un poco) en el caso de una transcripcioacuten fonoloacutegica apareceriacutea [unpoko] si se opta por no simbolizar archifonemas en la transcripcioacuten En cambio [mismo] se representariacutea de lamisma forma en ambos niveles encontraacutendose la transcripioacuten [mizmo] en el nivel de transcripcioacuten estrecha

bull Nivel de formas canoacutenicas (citation form) representando la forma depronunciacioacuten aislada de las palabra en estilo cuidado

bull Nivel de transcripcioacuten ancha o fonotiacutepica en este nivel se utilizan los siacutembolosque representan elementos fonoloacutegicos en una lengua dada pero al igual que en lapropuesta de Barry y Fourcin se transcriben aquellos fenoacutemenos predictibles propios dela foneacutetica sintaacutectica SAMPA seriacutea pues un alfabeto foneacutetico adecuado para este nivelde transcripcioacuten

bull Nivel de transcripcioacuten estrecha basado en una representacioacuten alofoacutenica de lasrealizaciones foneacuteticas de los hablantes para el cual puede utilizarse un alfabeto foneacuteticocomo X-SAMPA

bull Nivel acuacutestico-foneacutetico en el que se distinguen caracteriacutesticas acuacutesticas de lossegmentos observables en una representacioacuten de la onda sonora

bull Nivel fiacutesico representado en teacuterminos de paraacutemetros acuacutesticos o articulatoriosbull Fenoacutemenos no linguumliacutesticos la inclusioacuten de este nivel permite representar sonidos

de naturaleza comunicativa o no introducidos por el hablante asiacute como toda aquellainformacioacuten paralinguumliacutestica que se considere de intereacutes tambieacuten permite sentildealas los ruidosexternos en la grabacioacuten

Vale la pena detenerse brevemente en el nivel de las formas canoacutenicas y en el concepto deldquotranscripcioacuten fonotiacutepicardquo que como puede verse aparecen de forma recurrente en diversaspropuestas La inclusioacuten de forma canoacutenicas en el etiquetado de un corpus responde a un doblemotivo especialmente ligado a necesidades tecnoloacutegicas en primer lugar estas formas permitenderivar automaacuteticamente mediante un conjunto de reglas una transcripcioacuten ancha o fonotiacutepica enla que se incluyen los elementos alofoacutenicos cuya aparicioacuten esta condicionada por el contextofoneacutetico en segundo lugar a partir de las formas canoacutenicas puede crearse de forma automaacutetica undiccionario foneacutetico partiendo de un corpus transcrito (Wesenick y Schiel 1995 Senia y vanVelden 1997) lo que tiene utilidad para el desarrollo de sistemas de siacutentesis y reconocimiento delhabla y tambieacuten para la descripcioacuten linguumliacutestica La transcripcioacuten denominada ldquofonotiacutepicardquo en lostrabajos de SAM constituye un nivel intermedio entre la realizacioacuten foneacutetica y la transcripcioacutenpuramente fonoloacutegica Por otra parte el nivel de transcripcioacuten de formas canoacutenicas estaacutedirectamente relacionado con la representacioacuten ortograacutefica facilitando asiacute la transcripcioacuten foneacuteticaautomaacutetica de corpus en este nivel mediante el desarrollo de los correspondientes sistemas dereglas

En el informe del Grupo de Trabajo de Corpus Textuales de EAGLES (EAGLES 1996) seintenta realizar una siacutentesis entre las necesidades de diversos campos de estudio Se sugieren porello tres niveles de representacioacuten

bull S1 representacioacuten ortograacutefica del textobull S2 representacioacuten fonoloacutegica de las palabras en su forma canoacutenicabull S3 transcripcioacuten foneacutetica consistente en una representacioacuten simboacutelica discreta de

la realizacioacuten del enunciado tal como es percibido por el transcriptor

Como puede observarse estos tres niveles encuentran su equivalente en los nivelespropuesto por Barry y Fourcin (1992) y en los definidos por el Grupo de Trabajo de Lengua

Oral Para la transcripcioacuten del nivel S2 puede utilizarse SAMPA mientras que la del nivel S3requiere el uso de un alfabeto foneacutetico como X-SAMPA

52- La transcripcioacuten y el etiquetado automaacutetico de corpus orales

La tarea de transcribir y etiquetar foneacuteticamente un corpus oral representa un considerableesfuerzo tanto en teacuterminos de tiempo como de los recursos econoacutemicos necesarios para llevar acabo esta labor El etiquetado manual requiere por otro lado el desarrollo de convencionesdetalladas para asegurar la consistencia entre diversos transcriptores (Keating et al 1994 Krot yTaylor 1995 Lander 1997) ademaacutes del establecimiento de un proceso de validacioacutencomprobando la fiabilidad de los resultados obtenidos (Eisen 1993 Cole et al 1994 Strangert yHeldener 1995) Por estos motivos uno de los intereses principales de los investigadores en elcampo de las tecnologiacuteas del habla ha sido llevar a cabo el etiquetado de forma semi-automaacutetica oidealmente automaacutetica Un primer nivel de transcripcioacuten - tanto de formas canoacutenicas comofonotiacutepica - puede obtenerse automaacuteticamente como acabamos de mencionar a partir de larepresentacioacuten ortograacutefica si se dispone de un conjunto de reglas que establezcan lascorrespondencias entre la representacioacuten ortograacutefica y la foneacutetica

Sin embargo un etiquetado foneacutetico en los niveles de transcripcioacuten maacutes detallada requiere laposibilidad de acceder a la onda sonora y un procedimiento de anaacutelisis de la sentildeal La primeraoperacioacuten que debe realizar un sistema de etiquetado automaacutetico es la segmentacioacuten del continuumsonoro en unidades menores - segmentos o caracteriacutesticas acuacutesticas en funcioacuten del nivel detranscripcioacuten deseado - para pasar despueacutes a la asignacioacuten de etiquetas - siacutembolos detranscripcioacuten - que describan sus caracteriacutesticas Este es el proceso conocido propiamente comoetiquetado (labelling) que cuando se realiza de forma automaacutetica debe superar los obstaacuteculosderivados de la naturaleza no discreta de la sentildeal sonora - resultado de mecanismos como lacoarticulacioacuten - y de la variabilidad de realizaciones foneacuteticas entre hablantes o incluso en unmismo hablante

Para que el corpus sea uacutetil el etiquetado foneacutetico debe estar temporalmente sincronizadocon la sentildeal sonora y con la representacioacuten ortograacutefica operacioacuten que se realiza en el procesoconocido como alineacioacuten temporal (time alignment) llevado a cabo tambieacuten de forma automaacuteticaEsta alineacioacuten puede hacerse de un modo global sentildealando en la onda sonora las fronteras entrepalabras ortograacuteficas - para facilitar el acceso a la grabacioacuten a partir de este nivel de representacioacuten(Lander 1997) - o los puntos en los que se encuentran siacutelabas acentuadas tal como sucede porejemplo en el proyecto MULTEXT

En el campo de las tecnologiacuteas del habla se han llevado a cabo numerosiacutesimos trabajosencaminados al disentildeo de sistemas de segmentacioacuten etiquetado y alineacioacuten temporal automaacuteticasde corpus orales utilizando las teacutecnicas propias del reconocimiento del habla como los Modelosde Markov o las redes neuronales Cabe destacar que tales teacutecnicas no soacutelo son uacutetiles en eldesarrollo de corpus en este aacutembito sino que constituyen una herramienta importante en otrostipos de corpus sin embargo es preciso reconocer que el habla espontaacutenea - especialmente si seha recogido mediante grabaciones realizadas en un entorno natural - plantea auacuten problemas en lo

que se refiere a su transcripcioacuten y etiquetado automaacuteticos pese a los notabiliacutesimos avances quetienen lugar en este campo

6- TRANSCRIPCIOacuteN Y CODIFICACIOacuteN DE CORPUS PARA EL ANAacuteLISIS DE LA LENGUA ORAL

En este uacuteltimo apartado incidiremos en las cuestiones relacionadas con la transcripcioacuten ycodificacioacuten de corpus orales que pueden presentar un mayor intereacutes para aacutembitos como elanaacutelisis de discurso o de la conversacioacuten y para el estudio de la lengua oral en todos los niveles dela descripcioacuten linguumliacutestica Como indicaacutebamos al principio la transcripcioacuten y la codificacioacuten de loselementos transcritos son en principio dos operaciones conceptualmente diferentes Sinembargo en la praacutectica habitual en las disciplinas a las que se refiere este apartado suelen ser dosoperaciones que se realizan simultaacuteneamente ya que al mismo tiempo que se realiza latransliteracioacuten se introducen las marcas necesarias para la codificacioacuten de los elementos que se hadecidido introducir en el corpus Por ello en muchos casos la discusioacuten sobre la transcripcioacuten y lacodificacioacuten se realiza conjuntamente en la bibliografiacutea sobre el tema

61- Los requisitos de una transcripcioacuten

El investigador que decide constituir un corpus de lengua oral se encuentra en estosmomentos con una gran variedad de criterios en lo que se refiere a la transcripcioacuten y a la seleccioacutende los elementos que apareceraacuten codificados en el corpus Hemos hecho ya referencia en elapartado 3 a las diversas convenciones para la representacioacuten ortograacutefica y cintildeeacutendonos al aacutembitodel anaacutelisis del discurso y la conversacioacuten constatamos igualmente la existencia una grandiversidad de propuestas En una revisioacuten de las mismas Payratoacute (1995) hace por ejemploreferencia a los sistemas de transcripcioacuten y codificacioacuten procedentes de la etnometodologiacuteainteresados en reflejar la interaccioacuten verbal a los meacutetodos desarrollados en el marco de laetnografiacutea de la comunicacioacuten y de la sociolinguumliacutestica interaccional4 o a propuestas utilizadas en elestudio del lenguaje infantil Ante tal situacioacuten parece conveniente plantearse cuaacuteles son losrequisitos que debe cumplir una transcripcioacuten de la lengua oral tema que ha sido abordado pordiversos autores (DuBois 1991 Elich 1993 Edwards 1993 OrsquoConnell y Kowal 1994) Trasrevisar aportaciones anteriores Payratoacute (1995) resume los requisitos que teoacutericamente deberiacuteanexigirse a toda transcripcioacuten

bull Neutralidad o fidelidad de modo que la transcripcioacuten no sea interpretativabull Globalidad o complejidad recogiendo la totalidad de los fenoacutemenos que aparecen

en el discurso oralbull Omnifuncionalidad permitiendo diversos usos y aplicacionesbull Claridad tanto desde el punto de vista del aprendizaje del sistema como de la

legibilidad de la representacioacutenbull Universalidad y compatibilidad entre sistemas informaacuteticos

4 Estos sistemas se comparan en OrsquoConnell y Kowal (1994) Pueden encontrarse consideraciones generales sobre latranscripcioacuten y codificacioacuten de la lengua oral en el anaacutelisis del discurso y la conversacioacuten en 1995Ochs (1979) DuBois (1991) Edwards (1992 1993 1995) Du Bois et al (1993) Gumperz y Berenz (1993) Cook (1995) Chafe(1995) y en Sinclair (1995)

Sin embargo puesto que en la praacutectica se transcribe en funcioacuten de los objetivos para losque se ha definido el corpus Payratoacute (1995) considera que un sistema de transcripcioacuten debe serante todo interpretativo de los datos selectivo en cuanto a los fenoacutemenos que se transcribenpertinente para el objeto de investigacioacuten coherente con la base teoacuterica adoptada por elinvestigador fiel en cuanto a la representacioacuten de los datos y flexible para que sea posible suutilizacioacuten en diversos estudios Por otra parte en opinioacuten de este autor la simbologiacutea utilizadadebe ser clara econoacutemica sencilla exenta de ambiguumledad y compatible con sistemas internacionesestandarizados Este uacuteltimo aspecto nos parece especialmente importante ya que como sentildeala elmismo Payratoacute (1995 58)

[] en ninguacuten caso puede olvidarse que los datos de una investigacioacuten no deberiacutean sertratados nunca de forma tan parcial o idiosincraacutesica que se impidiera o dificultara el uso por partede otros investigadores La transcripcioacuten del discurso oral es una actividad suficientementecostosa y conflictiva para tomar precauciones en este sentido y ninguna comunidad cientiacuteficapuede permitirse el lujo de particularismos (en aspectos tan elementales) que obstruyan el debateo conviertan en inaprovechables una fuente de informacioacuten

62- Propuestas de estandarizacioacuten para la transcripcioacuten y codificacioacuten de corpus orales

Ante la diversidad de propuestas para la transcripcioacuten y codificacioacuten de la lengua oral queacabamos de constatar el surgimiento de la linguumliacutestica de corpus y muy especialmente lasnecesidades derivadas del intercambio electroacutenico de textos propiciaron la aparicioacuten de proyectose iniciativas centrados en la creacioacuten de estaacutendares tanto en lo que se refiere a la transcripcioacutencomo a la codificacioacuten En los proacuteximos apartados revisamos sucintamente algunos de ellos

Uno de los capiacutetulos de las Guiacuteas desarrolladas por la TEI estaacute dedicado a la transcripcioacutende corpus orales (Johansson 1995a b) En eacutel se describe la estructura baacutesica de la representacioacutende un texto oral - cabecera texto y divisiones - y se definen los procedimientos basados enSGML para la representacioacuten de los elementos estructurales baacutesicos informacioacuten contextualinformacioacuten temporal enunciados pausas elementos vocalizados semi-leacutexicos o no leacutexicoselementos kineacutesicos otros tipos de eventos comunicativos y texto presentado en forma escrita alhablante Tambieacuten se ofrecen en este capiacutetulo indicaciones para la segmentacioacuten y el alineamientoasiacute como recomendaciones para la transcripcioacuten de superposiciones entre hablantes de formas depalabras prosodia elementos paralinguumliacutesticos - tempo intensidad rango tonal tensioacuten ritmo ycalidad de voz - y alteraciones en el decurso foacutenico Para la representacioacuten de la informacioacutenfoneacutetica se recomienda el uso del AFI En la siguiente tabla se resumen los principales elementospropuestos por la TEI para la codificacioacuten de corpus orales considerados especiacuteficos de este tipode texto (Sperberg-McQueen y Burnard eds 1994)

Elemento codificado Marca decodificacioacutenen SGML

Definicioacuten

Divisiones (division) ltdivgt Unidades intermedias entre el texto y el enunciado que permitendelimitar partes diferenciadas en un texto

Enunciado (utterance) ltugt Segmento de habla comprendido entre dos pausas o delimitado porun cambio en el turno de palabra puede incluir ademaacutesinformacioacuten sobre la superposicioacuten (ltoverlapgt) de turnos cuando

interviene simultaacuteneamente maacutes de un hablantePausa (pause) ltpausegt Interrupcioacuten de la fonacioacuten percibida entre dos enunciados o en el

interior de los mismos puede describirse en teacuterminos relativos oindicando su duracioacuten

Vocal (vocal) ltvocalgt Elemento vocalizado semi-leacutexico o no leacutexico (pej pausas llenas otoses)

Kineacutesico (kinesic) ltkinesicgt Cualquier fenoacutemeno comunicativo no vocal (p ej gestos)Acontecimiento (event) lteventgt Cualquier fenoacutemeno identificado en la grabacioacuten no necesariamente

vocalizado ni con valor comunicativo (p ej ruidos de fondo)Texto escrito (writing) ltwritinggt Texto escrito que se presenta al hablante durante su intervencioacutenCambio (shift) ltshiftgt Momento en el que se produce un cambio en alguno de los rasgos

paralinguumliacutesticos - calidad de voz intensidad rango tonal ritmo yvelocidad de elocucioacuten - cada uno de los rasgos puede describirsemediante una lista de caracteriacutesticas

Tabla 1 Elementos codificados en las transcripciones de lengua oral seguacuten los estaacutendares de la TEI(Adaptada de Sperberg-McQueen y Burnard eds1994)

Por otra parte la TEI ofrece mecanismos para indicar el comienzo y el final de unfenoacutemeno su duracioacuten y su sincronizacioacuten temporal con otros elementos presenta tambieacuten laposibilidad de marcar unidades inferiores al enunciado - segmentos ltseggt - que permitendelimitar por ejemplo unidades prosoacutedicas e incluye tambieacuten entre sus propuestas las marcasnecesarias para sentildealar fenoacutemenos propios de la lengua hablada como palabras truncadasrepeticiones falsos principios - marcados como ltdelgt (deletion) y especificando el fenoacutemeno -Las partes de la grabacioacuten que el transcriptor no llega a interpretar correctamente - ltuncleargt - ono puede escuchar - ltgapgt - o las correcciones de errores de produccioacuten realizadas por eltranscriptor - ltsicgt para delimitar el error y ltcorrgt para indicar la correccioacuten - son tambieacutenelementos para los cuales la TEI establece marcas de codificacioacuten

Aunque las Guiacuteas de la TEI pueden considerarse un sistema adecuado para la transcripcioacuteny codificacioacuten de gran variedad de materiales los autores propios autores reconocen que

[] the present proposals are not intended to support unmodified every variety of researchundertaken upon spoken material now or in the future some discourse analysts phonologistsand doubtless other may wish to extend the scheme presented here to express more precisely theset of distinctions they wish to draw in their transcriptions Speech regarded as a purely acousticphenomenon may well require different methods from those outlined here as may speechregarded solely as a process of social interaction (Sperberg-McQueen y Burnard eds 1994 cap11)

El proyecto NERC - Network of European Reference Corpora (NERC 1994) se planteoacutecomo uno de sus objetivos la viabilidad de desarrollar una serie de recomendaciones para laconstitucioacuten de corpus y por tanto incluye entre sus resultados indicaciones sobre el tratamientode los corpus orales tanto en lo que se refiere a su codificacioacuten como a la transcripcioacuten de loselementos segmentales y suprasegmentales (Sinclair 1994) El sistema adoptado para latranscripcioacuten y codificacioacuten de corpus se basa como hemos indicado anteriormente en eldesarrollado por French (1991 1992) para la transcripcioacuten del corpus oral desarrollado en elproyecto COBUILD La transcripcioacuten se plantea como una operacioacuten que puede desarrollarse envarios niveles

bull Nivel I consiste en la representacioacuten ortograacutefica introduciendo los miacutenimossignos de puntuacioacuten necesarios sin informacioacuten sobre la interaccioacuten entre hablantes Eneste nivel se contemplan convenciones desarrolladas para la representacioacuten ortograacutefica ypara precisar el uso de la puntuacioacuten

bull Nivel II consiste en una representacioacuten ortograacutefica enriquecida con informacioacutenbaacutesica sobre la identidad de los hablantes el turno de palabra y los elementos no verbales

bull Nivel III contiene toda la informacioacuten presente en el nivel II ademaacutes deinformacioacuten sobre la interaccioacuten entre hablantes - marcando el principio y el final de lossolapamientos - y sobre la entonacioacuten - sentildealando las fronteras entre unidades tonales ylas siacutelabas acentuadas- En opinioacuten de French (1992) la transcripcioacuten a este nivel requiereuna formacioacuten especiacutefica en foneacutetica

bull Nivel IV constituye el nivel maacutes detallado de representacioacuten incluyendo lainformacioacuten propia del nivel III junto con marcas de tonos siacutelabas nucleares y con unatranscripcioacuten fonoloacutegica alineada con una representacioacuten acuacutestica - espectrograma y curvameloacutedica - del enunciado

La recomendacioacuten del proyecto NERC es que la transcripcioacuten de un corpus para el estudiode la lengua oral se lleve a cabo seguacuten las especificaciones del Nivel II adecuado seguacuten Frenchpara todas aquellas investigaciones que no requieran informacioacuten prosoacutedica

En el marco de NERC se llevoacute tambieacuten a cabo una evaluacioacuten de las Guiacuteas de la TEI para latranscripcioacuten de corpus orales de la que se concluye que ldquoThe TEI proposals are broadlycompatible with current practice in the user community as represented by JP Frenchconventions Furthermore in the majority of cases it will be a straightforward matter to link themachine-friendly TEI codes to the more user-friendly encoding systems such as JP Frenchconventions by means of a simple conversion programmerdquo (Payne 199260) La idea de unaconversioacuten automaacutetica entre las transcripciones realizadas seguacuten las propuestas de NERC y de laTEI es naturalmente interesante y refuerza la idea de que existe una compatibilidad general entreambos sistemas (Payne 1992 Johansson 1995a EAGLES 1996) prueba de ello es que en elinforme final de NERC se recomienda el uso de las normas de la TEI

Uno de los objetivos del Grupo de Trabajo sobre Textos Orales de EAGLES fue proponerun conjunto miacutenimo de fenoacutemenos que deberiacutean codificarse en cualquier texto oral La propuestarealizada se describe en EAGLES (1996) y toma elementos del proyecto NERC de la TEI y delGrupo de Trabajo sobre Lengua Oral de EAGLES Considerando los elementos comunes a lossistemas que sirven de base se sugiere que la codificacioacuten de un texto oral debe contener almenos informacioacuten sobre los siguientes aspectos

(1) Elementos vocales y no vocalesbull Elementos vocales semi-leacutexicos

Pertenecen a esta categoriacutea los elementos utilizados principalmente en elhabla espontaacutenea durante los momentos en que el hablante planifica lacontinuacioacuten de su discurso como las llamadas ldquopausas llenasrdquo o ldquosonorasrdquo y los

elementos que marcan dudas en el momento de la produccioacuten del hablaCorresponden a los elementos que en la TEI se marcan con la etiqueta ltvocalgtbull Elementos vocales no leacutexicos

Se incluyen aquiacute todo tipo de sonidos producidos por el hablante - tosesrisas bostezos estornudos etc - que no constituyen formas leacutexicas de la lenguaCorresponden igualmente a los codificados con la marca ltvocalgt en la TEIbull Acontecimientos no vocales y no comunicativos

Comprenden los ruidos producidos por otros hablantes o procedentes delentorno de grabacioacuten Estos acontecimientos se codifican en la TEI mediante lamarca lteventgt

(2) Elementos necesarios en la transcripcioacuten de interacciones verbalesbull Identidad del hablante

Este es un elemento imprescindible en la transcripcioacuten de interaccionesverbales La TEI dispone de los mecanismos para documentar informacioacuten sobrelos hablantes en la cabecera de los textos asiacute como de un sistema para marcar laidentidad de cada participante en el interior del texto aunque pueden utilizarsetambieacuten otros procedimientosbull Turnos de palabra

La finalidad del marcado de los turnos de palabra es indicar un cambio dehablante Ademaacutes de las convenciones de la TEI pueden emplearse otrosprocedimientos mientras se mantenga esta informacioacuten esencial en el estudio de lainteraccioacuten verbalbull Superposicioacuten de turnos de palabra

Existen igualmente diferentes procedimientos para marcar la superposicioacutende emisiones de dos hablantes ademaacutes de las propuestas de la TEI que los tratacomo parte de las estrategias para codificar acontecimientos simultaacuteneos

(3) Elementos relacionados con la actuacioacuten del hablantebull Omisiones en un texto leiacutedo

Si se transcribe un texto leiacutedo y se dispone del original es recomendableanotar las palabras o segmentos omitidos por el locutorbull Autocorrecciones

Es propio del habla espontaacutenea aunque tambieacuten de la lectura que loshablantes realicen correcciones de su propia produccioacuten linguumliacutestica (self-repairs)Parece conveniente marcarlas en la transcripcioacuten de un corpus oralbull Fragmentos de palabras

Los fragmentos de palabras corresponden a uno o maacutes segmentospertenecientes a una palabra que no ha sido totalmente pronunciada por el hablanteen un primer intento y que suelen repetirse cuando eacuteste consigue producir lapalabra completa Es importante indicar este fenoacutemeno en la transcripcioacuten

bull Fragmentos ininteligiblesSe trata de partes de la grabacioacuten que no son comprendidas por el

transcriptor y en la TEI se codifican con la etiqueta ltuncleargt aunque si se desease pueden utilizar marcas maacutes detalladas distinguiendo entre transcripcionescompletamente ininteligibles y entre una posible interpretacioacuten ofrecida por eltranscriptor

Un aspecto conflictivo sigue siendo la identificacioacuten de los enunciados que conforman untexto oral (Schuetze-Coburn 1991) Mientras que en un texto escrito los signos de puntuacioacutenconstituyen un criterio de delimitacioacuten en el habla disponemos de indicios como las pausas laentonacioacuten o el cambio de turno de palabra que nos permiten al menos convencionalmentedefinir un enunciado Sin embargo hasta el momento no se han desarrollado auacuten criteriosobjetivos y consistentes para resolver este problema

7- CONCLUSIONES

La revisioacuten - sin pretensiones de exhaustividad - de los principales sistemas detranscripcioacuten etiquetado y codificacioacuten de corpus orales expuesta en este trabajo pone demanifiesto en primer lugar la multiplicidad de propuestas desarrolladas frente a los intentos deestandarizacioacuten algunos de los cuales auacuten no se han consolidado plenamente pese a su crecienteaceptacioacuten En segundo lugar destaca tambieacuten la heterogeneidad de tradiciones que confluyen enel estudio de la lengua hablada desde la foneacutetica y las tecnologiacuteas del habla hasta el anaacutelisis deldiscurso y de la conversacioacuten diversidad que lleva a la creacioacuten de convenciones especiacuteficas pararesponder a las necesidades de diversas comunidades cientiacuteficas Ante esta situacioacuten la distincioacutenpropuesta por Sinclair (1995107) entre ldquoconformidadrdquo y ldquocompatibilidadrdquo adquiere todo susentido ya que si en ciertos casos la conformidad a un estaacutendar determinado es problemaacutetica porlas limitaciones inherentes a todo sistema comuacuten la compatibilidad - entendida como la facilidadde conversioacuten entre sistemas - deberiacutea ser en cambio un requisito imprescindible en el desarrollode los recursos linguumliacutesticos De esta manera puede tal alcanzarse el equilibrio entre lasnecesidades de un proyecto y las indudables ventajas cientiacuteficas y econoacutemicas que resultan de lareutilizacioacuten de los datos disponibles

BIBLIOGRAFIacuteA

Allen GD 1988 The PHONASCII System Journal of the International PhoneticAssociation 181 9-25

Anderson AH M Badger EG Bard E Boyle G Doherty S Garrod S Isard JKowtko J Mcallister J Miller C Sotillo HS Thompson y R Weinert 1991 The HCRCMap Task corpus Language and Speech 344 351-366

Autesserre D G Peacuterennou y M Rossi 1989 Methodology for the transcription andlabeling of a speech corpus Journal of the International Phonetic Association 191 2-15

Barry WJ y AJ Fourcin 1992 Levels of Labelling Computer Speech and Language 61-14

Beckman ME y GM Ayers GM 1994 Guidelines for ToBI Labelling Version 20February 1994[Documento de Internet disponible en httplingohio-stateeduPhoneticsToBIToBI0html]

Beckman ME y J Hirschberg J 1994 The ToBI Annotation Conventions Apeacutendice A deME Beckman y GM Ayers 1994 Guidelines for ToBI Labelling Version 20 February 1994[Documento de Internet disponible en httplingohio-stateeduPhoneticsToBIToBI0html]

Bruce G 1988 23 Supasegmental categories and 24 The symbolization of temporalevents Journal of the International Phonetic Association 182 75-76

Bruce G 1989 Report from the IPA working group on suprasegmental categories LundUniversity Department of Linguistics General Linguistics Phonetics Working Papers 35 25-40

Burnard L 1995 What is SGML and how does it help Computers and the Humanities291 41-50 The Text Encoding Initiative Background and Context Eds N Ide y J VeacuteronisDordrecht Kluwer Academic Publishers

Burnard L 1995a Text Encoding for Information Exchange An Introduction to the TextEncoding Initiaive TEI Document TEI J31 [Documento de Internet disponible enhttpwwwuiceduorgsteiinfoteij31]

Burnard L 1995b The Text Encoding Initiative an overviewrdquo Spoken English onComputer Transcription Markup and Applications Eds G LEECH G MYERS y JTHOMAS Harlow Longman 69-81

Chafe W 1995 Adequacy user-friendliness and practicality in transcribingrdquo English onComputer Transcription Markup and Applications Eds G Leech G Myers y J ThomasHarlow Longman 54-61

Chan D A Fourcin D Gibbon B Granstroumlm M Huckvale G Kokkinakis K KvaleL Lamel B Lindberg A Moreno J Mouropoulos F Senia I Trancoso C Veld y J Zeiliger1995 EUROM - A Spoken Language Resource for the EU Eurospeech95 Proceedings of the4th European Conference on Speech Communication and Speech Technology Madrid Spain 18-21 September 1995 Vol 1 867-870

Cole RA BT Oshika M Noel T Lander y M Fanty 1994 Labeler Agreement inPhonetic Labeling of Continuous Speech Proceedings of the 1994 International Conference onSpoken Language Processing Yokohama Japan 18-22 September 1994[Documento de Internet disponible en httpwwwcseogieduCSLUcorporapapershtml]

Cook G 1995 Theoretical issues transcribing the untranscribablerdquo Spoken English onComputer Transcription Markup and Applications Eds G Leech G Myers y J ThomasHarlow Longman 35-53

Du Bois JW 1991 Transcription design principles for spoken discourse researchPragmatics 1 71-106

Du Bois JW S Schuetze-Coburn S Cumming y D Paolino 1993 Outline of discoursetranscriptionrdquo Talking Data Transcription and Coding in Discourse Research Eds JAEdwards y MD Lampert Hillsdale NJ Lawrence Erlbaum Associates 45-90

EAGLES 1996 Preliminary Recommendations on Spoken Texts EAGLES DocumentEAG-TCWG-STPP May 1996[Documento de Internet disponible enhttpwwwilcpicnritEAGLES96spokentxspokentxhtml]

Edwards JA 1992 Design principles in the transcription of spoken discourserdquoDirections in Corpus Linguistics Proceedings of Nobel Symposium 82 Stockholm 4-8 August1991 Ed J Svartvik Berlin Mouton de Gruyter 129-147

Edwards JA 1993 Principles and Contrasting Systems of Discourse TranscriptionrdquoTalking Data Transcription and Coding in Discourse Research Eds JA Edwards y MDLampert Hillsdale Hillsdale NJ Lawrence Erlbaum Associates 3-32

Edwards JA 1995 Principles and alternative systems in the transcription coding andmark-up of spoken discourserdquo Spoken English on Computer Transcription Markup andApplications Eds G Leech G Myers y J Thomas Harlow Longman 19-34

Ehlich K 1993 HIAT A Transcription System for Discourse Datardquo Talking DataTranscription and Coding in Discourse Research Eds JA Edwards y MD Lampert HillsdaleNJ Lawrence Erlbaum Associates 123-148

Eisen B 1993 Reliability of speech segmentation and labelling at different levels oftranscription Eurospeech93 3rd European Conference on Speech Communication andTechnology Berlin Germany 21-23 September 1993 Vol 1 673-676

Esling JH y H Gaylord 1993 Computer Codes for Phonetic Symbols Journal of theInternational Phonetic Association 232 77-82

Esling JH 1988 Computer coding of IPA symbols and detailed phonetic representationsof computer databases Journal of the International Phonetic Association 182 99-106

Esling JH 1990 Computer Coding of the IPA Supplementary Report Journal of theInternational Phonetic Association 201 22-26

Fourcin A y JM Dolmazon (on behalf of the SAM Project) 1991 Speech knowledgestandards and assessment Actes du XIIegraveme Congregraves International des Sciences Phoneacutetiques 19-24 aoucirct 1991 Aix-en-Provence France Aix-en-Provence Universiteacute de Provence Service desPublications Vol 5 430-433

Fourcin A G Harland W Barry y V Hazan eds 1989 Speech Input and OutputAssessment Multilingual Methods and Standards Chichester Ellis Horwood Ltd

French JP 1991 Updated notes for soundprint transcribers Working paper Universityof Birmingham October 1991 NERC-WP4-47

French JP 1992 Transcription proposals multilevel system Working paper Universityof Birmingham October 1992 NERC-WP4-50

Gibbon D 1989 Survey of Prosodic Labelling for EC Languages SAM-UBI-190 12February 1989 Report e6 in ESPRIT 2589 (SAM) Interim Report Year 1 Ref SAM-UCLG002 University College London February 1990

Gibbon D R Moore y R Winski eds 1997 Handbook on Standards and Resources forSpoken Language Systems Berlin Mouton De Gruyter [Documento de Internet disponible en httpcoralliliuni-bielefelddeEAGLESeagbookeagbookhtml]

Groslashnnum Thorsen N 1987 Suprasegmental transcription ARIPUC - Annual Report ofthe Institute of Phonetics University of Copenhagen 21 1-27

Gumperz JJ y J Berenz 1993 Transcribing Conversational Exchangesrdquo Talking DataTranscription and Coding in Discourse Research Eds JA Ewards y M D Lampert HillsdaleNJ Lawrence Erlbaum Associates 91-122

Hart J lsquoT R Collier y A Cohen 1990 A Perceptual Study of Intonation An Experimental- Phonetic Approach to Intonation Cambridge Cambridge University Press (Cambridge Studiesin Speech Science and Communication)

Hess W K Kohler y HG Tillmann 1995 The PhonDat-Verbmobil Speech CorpusEurospeech95 Proceedings of the 4th European Conference on Speech Communication andSpeech Technology Madrid Spain 18-21 September 1995 Vol 1 863-866

Hieronymus JL 1994 ASCII phonetic symbols for the worlds languages WorldbetATampT Bell Laboratories Technical Memo [Documento de Internet disponible enhttpwwwcseogieduCSLUcorporapapershtml]

Hirst D A Di Cristo y R Espesser en prensaLevels of representation and levels ofanalysis for intonation Prosody Theory and Experiments Ed M Horne Dordrecht Kluwer

Hirst DJ y A Di Cristo en prensa A survey of intonation systemsrdquo IntonationSystems A Survey of 20 Languages Eds D Hirst y A Di Cristo Cambridge CambridgeUniversity Press

Hirst DJ 1991 Intonation models towards a third generation Actes du XIIegraveme CongregravesInternational des Sciences Phoneacutetiques 19-24 aoucirct 1991 Aix-en-Provence France Aix-en-Provence Universiteacute de Provence Service des Publications Vol 1 305-310

Hirst DJ A Di Cristo M Le Besnerais Z Najim P Nicolas y P Romeacuteas 1993Multilingual modelling of intonation patternsrdquo Proceedings of an ESCA Workshop on ProsodySeptember 27-29 1993 Lund Sweden Eds D House y P Touati Lund University Departmentof Linguistics and Phonetics Working Papers 41 204-207

Hirst DJ N Ide y J Veacuteronis 1994 Coding fundamental frequency patterns for multi-lingual synthesis with INTSINT in the MULTEXT project Conference Proceedings of theSecond ESCAIEEE Workshop on Speech Synthesis September 12-15 1994 Mohonk MountainHouse New Paltz New York USA 77-80

Ide N y J Veacuteronis eds 1995 The Text Encoding Initiative Background and ContextsComputers and the Humanities 29 1-3 Publicado en forma de libro en Dordrecht KluwerAcademic Publishers

IPA 1989 The IPA 1989 Kiel Convention Workgroup 9 report Computer Coding of IPAsymbols and Computer Representation of Individual Languages Journal of the InternationalPhonetic Association 192 81-92

IPA 1993 IPA Chart revised to 1993 Journal of the International Phonetic Association231 [Documento de Internet disponible en httpwwwartsglaacukIPAipacharthtml]

IPA 1995 Preview of the IPA Handbook Journal of the International Phonetic Association251

ISO 8879 1986 Information Processing Text and Office Systems Standard GeneralizedMarkup Language (SGML) Geneva International Organization for Standardization

Johansson S 1995a The approach of the Text Encoding Initiative to the encoding ofspoken discourse Spoken English on Computer Transcription Markup and Applications EdsG Leech G Myers y J Thomas Harlow Longman 82-98

Johansson S 1995b The Encoding of Spoken Texts Computers and the Humanities291 149-158 The Text Encoding Initiative Background and Context Eds N Ide y J VeacuteronisDordrecht Kluwer Academic Publishers 149-158

Keating P P MacEachern A Shryock y S Domiacutenguez 1994 A manual for phonetictranscription Segmentation and labelling of words in spontaneous speech UCLA WorkingPapers in Phonetics 88 91-120

Kluger-Kruse M 1987 Computer Phonetic Alphabet ESPRIT Linguistic Analysis of theEuropean Languages Report BU-CPA0267 July 1987

Krot C y B Taylor 1995 Criteria for Acoustic-Phonetic Segmentation and WordLabelling in the Australian National Database of Spoken Language[Documento de Internet disponible en httpwwwshlrcmqeduaucriteriahtml]

Lander T 1997 The CSLU Labeling Guide Center for Spoken Language UnderstandingOregon Graduate Institute[Documento de Internet disponible en httpwwwcseogieduCSLUcorporapapershtml]

Llisterri J 1994 Prosody Encoding Survey WP 1 Specifications and Standards T15Markup Specifications Deliverable 153 Final version 15 September 1994 LRE Project 62-050MULTEXT

Llisterri J ed 1996 Prosody Tools Efficiency and Failures WP 4 Corpus T46 SpeechMarkup and Validation Deliverable 452 Final version 15 October 1996 LRE Project 62-050MULTEXT

MacWhinney B 1991The CHILDES Project Tools for Analyzing Talk Hillsdale NJLawrence Erlbaum

Marchal A N Nguyen y W Hardcastle 1995 Multitiered phonetic approach to speechlabelling Levels in Speech Communication Relations and Interactions A Tribute to MaxWajskop Hommage agrave Max Wajskop Eds C Sorin J Mariani H Meloni y J SchoengenAmsterdam Elsevier Science BV 149-158

NERC 1994 NERC-1 Network of European Reference Corpora Final Report PisaInstituto di Linguistica Computazionale - CNR January 1994 versioacuten en curso de publicacioacutenTowards a Network of European Reference Corpora Eds N Calzolari M Baker y PG KruytPisa Giardini

Nicolas P y D Hirst 1995 Symbolic coding of Higher-Level Characteristics ofFundamental Frequency Curvesrdquo Eurospeech95 Proceedings of the 4th European Conferenceon Speech Communication and Technology Madrid Spain 18-21 September 1995 Vol 2 989-992

OConnell DC y S Kowal 1994 Some Current Transcription Systems for SpokenDiscourse A critical Analysis Pragmatics 4 81-107

Ochs E 1979 Transcription as Theory Developmental Pragmatics Eds E Ochs E yBB Schieffelin New York Academic Press 43-72

Payne J 1992 Report on the compatibility of JP Frenchs spoken corpus transcriptionconventions with the TEI guidelines for transcription of spoken texts Working paper COBUILDBirmingham and IDS Mannheim December 1992 NERC-WP8WP4-122

Payne J 1995 The COBUILD spoken corpus transcription conventions SpokenEnglish on Computer Transcription Markup and Applications Eds G Leech G Myers y JThomas Harlow Longman 203-207

Payratoacute Ll 1995 Transcripcioacuten del discurso coloquialrdquo El espantildeol coloquial Actas del ISimposio sobre Anaacutelisis del Discurso Oral Almeriacutea 23-25 de noviembre de 1994 Ed L CorteacutesRodriacuteguez Almeriacutea Universidad de Almeriacutea Servicio de Publicaciones 43-70

Pierrehumbert J B 1897 (1980) The Phonology and Phonetics of English IntonationPhD Thesis Department of Linguistics MIT Bloomington Indiana University Linguistics Club

Pitrelli J M Beckman y J Hirschberg 1994 Evaluation of prosodic transcriptionlabelling reliability in the ToBI frameworkrdquo Proceedings of the Third International Conference onSpoken Language Processing Yokohama ICSLP Vol 2 123-126

Pullum GK y WA Ladusaw 1996 (1986) Phonetic Symbol Guide Chicago TheUniversity of Chicago Press 2nd edition

Roach P H Roach A Dew y P Rowlands 1990 Phonetic analysis and the automaticsegmentation and labeling of speech sounds Journal of the International Phonetic Association201 15-21

Schmidt MS C Scott y MA Jack 1993 Phonetic transcription standards for Europeannames (ONOMASTICA) Eurospeech93 3rd European Conference on Speech Communicationand Technology Berlin Germany 21-23 September 1993 Vol 1 279-282

Schuetze-Coburn S 1991Units of intonation in discourse a comparison of acoustic andauditory analysis Language and Speech 343 207-234

Selting M 1987 Descriptive categories for the auditive analysis of intonation inconversation Journal of Pragmatics 11 777-791

Selting M 1988 The role of intonation in the organisation of repair and problem handlingsequences in conversation Journal of Pragmatics 12 293-322

Senia F y JG Van Velden 1997 Specifications of orthographic transcription and lexiconconventions LRE-4001 SpeechDat Technical Report SD132 Final version 10 January 1997[Documento de Internet disponible en httpwwwphonetikuni-muenchendeSpeechDathtml]

Silverman K M Beckman J Pitrelli M Ostendorf C Wightman P Price JPierrehumbert y J Hirschberg 1992 TOBI A standard for labelling English prosodyProceedings of the Second International Conference on Spoken Language Processing ICSLP-92Banff October 1992 867-870

Sinclair J 1994 Spoken Language [3B] PhoneticPhonemic and Prosodic Annotation[52] NERC 1994 NERC-1 Network of European Reference Corpora Final Report PisaVersioacuten en curso de publicacioacuten Towards a Network of European Reference Corpora Eds NCalzolari M Baker y PG Kruyt Pisa Giardini

Sinclair J 1995 From theory to practicerdquo Spoken English on Computer TranscriptionMarkup and Applications Eds G Leech G Myers Y J Thomas Harlow Longman 99- 112

Sperberg-McQueen CM y L Burnard eds 1994 Guidelines for Electronic Text Encodingand Interchange TEI P3 Chicago and Oxford Association for Computational Linguistics Association for Computers and the Humanities Association for Literary and LinguisticComputing [Cap 11 Transcriptions of Speech] [Documento de Internet disponible enhttpetextvirginiaeduTEIhtml]

Strangert E y M Heldner 1995 Labelling of boundaries and prominences byphonetically experienced and non-experienced transcribers Phonum 3 Reports from theDepartment of Phonetics Umearing University 85-109 [Documento de Internet disponible enhttpwwwlingumusefonphonum3html]

Teubert W 1993 Phonetic Phonemic and Prosodic Annotation Final Report IDSMannheim February 1993 NERC-WP8-171

Tillmann HG y B Pompino-Marschall 1993 Theoretical Principles ConcerningSegmentation Labelling Strategies and Levels of Categorical Annotation for Spoken LanguageDatabase Systems Eurospeech93 3rd European Conference on Speech Communication andTechnology Berlin Germany 21-23 September 1993 Vol 3 1691-1694

Trancoso I 1995 The ONOMASTICA Interlanguage Pronunciation LexiconrdquoEurospeech95 Proceedings of the 4th European Conference on Speech Communication andTechnology Madrid Spain 18-21 September 1995 Vol 1 829-832

Wells JC 1987 Computer Coded Phonetic Transcription Journal of the InternationalPhonetic Association 172 94-114

Wells JC 1989 Computer-coded phonemic notation of individual languages of theEuropean Community Journal of the International Phonetic Association 191 31-54

Wells JC 1994 Computer-coding the IPA a proposed extension of SAMPA SpeechHearing and Language Work in Progress 1994 (University College London Department ofPhonetics and Linguistics) 8 271-289

Wells JC 1995 SAMPROSA (SAM Prosodic Transcription [Documento de Internetdisponible en httpwwwphonuclacukhomesampasamprosahtm]

Wells JC W Barry M Grice A Fourcin y D Gibbon 1992 Standard Computer-Compatible Transcription SAM Stage Report Sen3 SAM UCL-037 28 February 1992 SAM(1992) Esprit Project 2589 (SAM) Multilingual Speech InputOutput AssessmentMethodologyand Standardisation Final Report Year Three 1III91-28II1992 London University CollegeLondon

Wesenick M-B y F Schiel 1995 Feasibility of Automatic Annotation and BuildingPronunciation Lexica from Corpus Material LRE-63314 SpeechDat Report D3123 Finalversion 10 October 1995[Documento de Internet disponible en httpwwwicpgrenetfrSpeechDathomehtml]

Winski R R Moore y D Gibbon 1995 EAGLES Spoken Language Working GroupOverview and Resultsrdquo Eurospeech95 Proceedings of the 4th European Conference on SpeechCommunication and Speech Technology Madrid Spain 18-21 September 1995 Vol 1 841-844[Documento de Internet disponible en httpcoralliliuni-bielefeldde~gibbonEAGLESrwpaperrwpaperhtml]

  • 1- INTRODUCCIOacuteN
  • 2- NIVELES DE REPRESENTACIOacuteN ETIQUETADO Y CODIFICACIOacuteN
  • 3- REPRESENTACIOacuteN ORTOGRAacuteFICA DE CORPUS ORALES
  • 31- Propuestas para la representacioacuten ortograacutefica de corpus orales en el aacutembito de la linguumliacutestica de corpus
  • 32- Propuestas para la representacioacuten ortograacutefica de corpus orales en el aacutembito de las tecnologiacuteas del habla
  • 4- REPRESENTACIOacuteN FONEacuteTICA DE CORPUS ORALES
  • 41- La representacioacuten foneacutetica de los elementos segmentales
  • 42- La representacioacuten foneacutetica de los elementos suprasegmentales
  • 5- ETIQUETADO FONEacuteTICO DE CORPUS ORALES
  • 51- Niveles de etiquetado foneacutetico de corpus orales
  • 52- La transcripcioacuten y el etiquetado automaacutetico de corpus orales
  • 6- TRANSCRIPCIOacuteN Y CODIFICACIOacuteN DE CORPUS PARA EL ANAacuteLISIS DE LA LENGUA ORAL
  • 61- Los requisitos de una transcripcioacuten
  • 62- Propuestas de estandarizacioacuten para la transcripcioacuten y codificacioacuten de corpus orales
  • 7- CONCLUSIONES
  • BIBLIOGRAFIacuteA
Page 6: Transcripción, etiquetado y codificación de corpus orales

un principio fonoloacutegico seguacuten el cual se transcriben aquellos segmentos con valor diferencialutilizaacutendose los diacriacuteticos para introducir aspectos de tipo foneacutetico (IPA 1995) Sin embargo apesar del uso extendido del AFI existen tambieacuten diversas tradiciones nacionales resultantes engeneral de las necesidades derivadas de la transcripcioacuten estrecha de una determinada lengua o de laorientacioacuten de la investigacioacuten hacia un determinada aacuterea linguumliacutestica (Pullum y Ladusaw 1986)

La necesidad de intercambiar electroacutenicamente textos que contienen transcripcionesfoneacuteticas llevoacute a finales de los antildeos 80 a plantearse la codificacioacuten de los siacutembolos del AFI demodo que para cada uno de los siacutembolos del alfabeto se ha definido un nuacutemero (denominadoldquonuacutemero AFIrdquo) que puede relacionarse tambieacuten con los coacutedigos ASCII (Esling 1988 1990 IPA1989 Esling y Gaylord 1993) Las equivalencias entre siacutembolos nuacutemeros AFI y coacutedigos ASCIIforman parte de las convenciones conocidas como CRIL (Computer Representation of IndividualLanguages) surgidas del congreso de la Asociacioacuten Foneacutetica Internacional celebrado en Kiel en1991

SAMPA (SAM Phonetic Alphabet) constituye seguramente el esfuerzo maacutes significativo yextendido por desarrollar un sistema de transcripcioacuten foneacutetica informatizado SAMPA tiene suorigen en el proyecto ESPRIT 1541 SAM - Speech Assessment Methods (Fourcin et al 1989Fourcin y Dolmazon 1991) llevado a cabo entre 1987 y 1989 Al final del proyecto existiacuteanversiones de SAMPA en daneacutes neerlandeacutes ingleacutes franceacutes alemaacuten e italiano incorporaacutendose en1992 el noruego y el sueco y el espantildeol el griego y el portugueacutes en 1993 Durante 1996 seextendioacute a una serie de lenguas de los paiacuteses de la Europa del Este en el marco del proyectoBABEL (URL httpmidwichreadingacukresearchspeechlabbabel) y en principio no hayninguacuten obstaacuteculo para su adaptacioacuten a otros idiomas En cuanto a su utilizacioacuten praacutectica puedesentildealarse que es el sistema desarrollado para la transcripcioacuten del corpus multilinguumle EUROM(Chan et al 1995) y tambieacuten el adoptado en el proyecto ONOMASTICA centrado en latranscripcioacuten de nombres propios en diversas lenguas europeas (Schmidt 1993 Trancoso 1995)

SAMPA (Wells 1987 1989) se basa en un conjunto de equivalencias entre siacutembolos delAFI y coacutedigos ASCII restringieacutendose al uso de caracteres de 7 bits (coacutedigos 32 a 127) Elprincipio que rige las transcripciones en SAMPA al igual que en el caso del AFI esesencialmente fonoloacutegico empleaacutendose uacutenicamente siacutembolos distintos en el caso de segmentoscon valor diferencial Esta filosofiacutea viene motivada por tres razones simplicidad de latranscripcioacuten sin incorporar ambiguumledades ya que determinadas alofoacutenicas son predictibles apartir del contexto facilidad de utilizacioacuten por parte personas con poca formacioacuten en foneacutetica yfalta de coacutedigos ASCII para la transcripcioacuten alofoacutenica de todas las lenguas Sin embargo enalgunos casos se introducen siacutembolos para la representacioacuten de aloacutefonos cuando losinvestigadores que han desarrollado las adaptaciones para cada lengua lo han consideradonecesario

Una de las limitaciones de SAMPA es que no establece una codificacioacuten para todos lossiacutembolos del AFI Por este motivo Wells (1994) propone un sistema denominado X-SAMPA en

Yamada Language Center (URL httpbabeluoregoneduyamadafontsphonetichtml) o de la paacutegina de la propiaAsociacioacuten Foneacutetica Internacional (URL httpwwwartsglaacukIPAipafontshtml)

el que se preveacuten equivalencias en coacutedigos ASCII para la totalidad de siacutembolos del AFI en surevisioacuten de 1993 incluyendo diacriacuteticos y marcas tonales Una de las aplicaciones propuestaspara este sistema es el enviacuteo de textos en transcripcioacuten foneacutetica a traveacutes del correo electroacutenico

Por otra parte Worldbet constituye una propuesta maacutes ambiciosa que SAMPA y que suextensioacuten X-SAMPA pues parte de la base de que ldquoany spectrally and temporally distinct speechsound (not including pitch) which is phonemic in some language should have a separate basesymbolrdquo (Hieronymus 1994 ) los siacutembolos de base consisten normalmente en la concatenacioacuten deun siacutembolo del AFI con una serie de diacriacuteticos de modo que puede representarse una granvariedad de aloacutefonos hallados en las lenguas del mundo incluyendo siacutembolos inexistentes en elAFI Uno de los objetivos de Wordlbet - que en su versioacuten actual usa 299 siacutembolos compuestosde dos caracteres ASCII - es facilitar la transcripcioacuten de bases de datos multilinguumles que incluyanlenguas indias asiaacuteticas y africanas ademaacutes de las europeas Este sistema se ha utilizado porejemplo en la transcripcioacuten de los corpus distribuidos por el CSLU (Center for Spoken LanguageUnderstanding Oregon Graduate Institute) (Lander 1997)

Existen otros sistemas de transcripcioacuten foneacutetica concebidos para el intercambio electroacutenicode textos tanto desarrollados desde la perspectiva de las tecnologiacuteas del habla - por ejemplo elCPA (Computer Phonetic Alphabet) surgido en el marco del proyecto ESPRIT Linguistic Analysisof European Languages (Kluger-Kruse 1987) - como disentildeados para otros fines En el aacutembito delestudio del lenguaje infantil el proyecto CHILDES - Child Language Data Exchange System(MacWhinney 1991utiliza el sistema conocido como PHONASCII (Allen 1988) consistente enun conjunto de siacutembolos fonoloacutegicos - UNIBET - y un alfabeto foneacutetico que permite latranscripcioacuten estrecha

42- La representacioacuten foneacutetica de los elementos suprasegmentales

La incorporacioacuten de informacioacuten sobre los elementos suprasegmentales - informacioacutenprosoacutedica - en un corpus oral plantea diversos problemas derivados precisamente de la propianaturaleza de estos elementos que se manifiestan en variaciones continuas en los dominios de lafrecuencia la intensidad y el tiempo Por tanto es preciso llevar a cabo una abstraccioacuten paradeterminar en primer lugar cuaacuteles de estas variaciones son linguumliacutesticamente significativas y ensegundo lugar coacutemo se relacionan con categoriacuteas discretas Finalmente estas categoriacuteas debenrepresentarse en un sistema de notacioacuten No es pues extrantildeo que se hayan desarrollado diversasconvenciones para la simbolizacioacuten de los elementos suprasegmentales (Groslashnnum-Thorsen 1987Llisterri 1994) algunas de las cuales se presentan en los apartados siguientes

En el momento de plantearse la seleccioacuten de un sistema de transcripcioacuten prosoacutedicaadecuado a un corpus oral el investigador se enfrenta nuevamente a la diversidad de sistemas aligual que sucede en el caso de la transcripcioacuten segmental Aunque como veremos maacutes adelanteToBI parece que se estaacute convirtiendo raacutepidamente en un estaacutendar a pesar de su orientacioacuten haciala transcripcioacuten del ingleacutes y al modelo fonoloacutegico subyacente SAMPROSA ofrece la ventaja dehaberse desarrollado teniendo en cuenta las necesidades de las tecnologiacuteas del habla ademaacutesSAMPROSA se enmarca en el contexto de estaacutendares extendidos en Europa como los delproyecto SAM recomendados por ejemplo por NERC (Teubert 1993 Sinclair 1994) Enconjunto el sistema ideal de transcripcioacuten prosoacutedica deberiacutea permitir una representacioacuten en varios

niveles ser compatible con el intercambio electroacutenico de datos y cubrir las necesidades del mayornuacutemero de lenguas posible pudiendo aplicarse automaacuteticamente en lugar de basarse en lasimpresiones intuitivas del transcriptor con vistas a la transcripcioacuten de grandes corpus Enausencia de un sistema que reuacutena tales caracteriacutesticas parece adecuado establecer mecanismos decompatibilidad entre los existentes a fin de facilitar la reutilizacioacuten de los datos

El AFI ofrece ademaacutes de la posibilidades de transcripcioacuten segmental un conjunto desiacutembolos para la representacioacuten de los elementos suprasegmentales Con motivo del congresopara la revisioacuten del AFI celebrado en Kiel en 1989 se creoacute un grupo de trabajo sobre categoriacuteassuprasegmentales (Bruce 1988 1989) concluyeacutendose la necesidad de representar las categoriacuteassuprasegmentales de un modo maacutes adecuado especialmente en lo que se refiere la entonacioacuten Elconjunto actual de siacutembolos del AFI para los elementos suprasegmentales permite transcribir eltono asiacute como la duracioacuten y el acento

Las necesidades derivadas de una descripcioacuten detallada de la entonacioacuten tanto en el campode la foneacutetica como en el de las tecnologiacuteas del habla han propiciado la creacioacuten de diversossistemas de transcripcioacuten prosoacutedica algunos de los cuales se presentan a continuacioacuten

En el marco del proyecto ESPRIT SAM anteriormente mencionado se llevoacute tambieacuten a caboel desarrollo de sistemas de transcripcioacuten prosoacutedica compatibles con las necesidades de anotacioacutende bases de datos en soporte electroacutenico resultando de ello propuestas como PROSPASAMSINT o SAMPROSA (Gibbon 1989 Wells et al 1992) PROSPA fue originalmenteconcebido por Selting y Gibbon (Selting 1987 1988) para el anaacutelisis de la conversacioacuten y deldiscurso y por tal motivo se basa en criterios auditivos recogiendo uacutenicamente los elementosnecesarios para este fin Por su parte SAMSINT (SAM System for Intonation Transcription) seplantea como objetivo la transcripcioacuten de contornos meloacutedicos en el interior de unidadesentonativas basaacutendose en INTSINT - presentado maacutes adelante - con algunas modificacionesadicionales

A pesar de la coexistencia de los sistemas anteriormente mencionados en el proyecto SAMprobablemente el conjunto de siacutembolos maacutes extendido actualmente para la transcripcioacutenprosoacutedica sea SAMPROSA (SAM Prosodic Alphabet) propuesto inicialmente por Gibbon(1989) y desarrollado por Wells et al (1992) hasta llegar a su forma actual (Wells 1995)SAMPROSA ofrece al igual que SAMPA un conjunto de caracteres correspondientes a coacutedigosASCII mediante los cuales es posible transcribir tonos globales locales terminales y nucleares laduracioacuten el acento la pausas y las fronteras entre unidades prosoacutedicas Aunque presenta rasgoscaracteriacutesticos de la tradicioacuten britaacutenica de anaacutelisis de la entonacioacuten como por ejemplo lacodificacioacuten de tonos nucleares es un sistema que se plantea como adecuado para la transcripcioacutende diversas lenguas

En el aacutembito americano ToBI (Tone and Break Index) se desarrolloacute para cubrir al mismotiempo las necesidades de la descripcioacuten foneacutetica y de la anotacioacuten de corpus adecuados aldesarrollo de sistemas de tecnologiacuteas del habla (Silverman et al 1992 Beckman y Hirschberg1994 Beckman y Ayers 1994) Basado en el ingleacutes americano ToBI permite principalmente latranscripcioacuten de patrones entonativos partiendo de un anaacutelisis de la curva meloacutedica representadacomo evolucioacuten temporal de la frecuencia fundamental mediante herramientas de anaacutelisis y

etiquetado como el programa Wavestrade Sin embargo se han definido tambieacuten convenciones parala anotacioacuten de textos representados ortograacuteficamente Una transcripcioacuten utilizando ToBI constade cuatro niveles

bull Representacioacuten ortograacutefica del enunciadobull Nivel de iacutendices de ruptura (break index) en el que se introducen los indicadores

de liacutemite que marcan las fronteras entre las unidades meloacutedicas estableciendo cuatro gradosde cohesioacuten entre las mismas

bull Nivel tonal en el que se marcan los denominados ldquoeventos tonalesrdquo (pitch events)divididos en tonos de frase al principio y al final de las unidades meloacutedicas y en acentostonales (pitch accent) en las siacutelabas en las que se produce un movimiento de la frecuenciafundamental

bull Nivel miscelaacuteneo que facilita por ejemplo introducir los comentarios deltranscriptor

Para cada uno de los niveles se define un conjunto de siacutembolos alineados temporalmentecon los fenoacutemenos entonativos transcritos si se dispone de una herramienta adecuada comoWavestrade

Las criacuteticas que se realizan maacutes frecuentemente a ToBI son por una parte su dependenciadel modelo fonoloacutegico desarrollado por Pierrehumbert (1980) y por otra su mejor adaptacioacuten alingleacutes que a otras lenguas lo que explicariacutea su amplia utilizacioacuten en Estados Unidos Sin embargose han realizado trabajos en italiano alemaacuten huacutengaro y espantildeol entre otras lenguas usando ToBIcomo sistema de representacioacuten Un inconveniente maacutes importante es que la anotacioacuten medianteToBI requiere un cierto conocimiento previo de los patrones entonativos de la lengua Aun asiacute esun sistema que ofrece indudables ventajas como pueden ser su estructura jeraacuterquica que permiteseleccionar entre subconjuntos o conjuntos mayores de siacutembolos la posibilidad de representarproblemas que aparecen en la transcripcioacuten y el hecho de que existan experimentos demostrandoun alto grado de acuerdo entre transcriptores diferentes (Pitrelli et al 1994)

En el Institute for Perception Research (IPO Eindhoven) se ha desarrollado una teoriacutea sobrela entonacioacuten basada en el modelado de contornos entonativos consistentes en representacionesestilizadas perceptivamente equivalentes al contorno original (lsquot Hart et al 1990) Esta teoriacutea hallevado tambieacuten a la formalizacioacuten de un sistema de representacioacuten de la curva meloacutedica definidacomo un conjunto de movimientos tonales que se agrupan en secuencias de configuracionestonales la agrupacioacuten de estas configuraciones da lugar a su vez a contornos meloacutedicosdefinieacutendose los patrones entonativos en funcioacuten de agrupaciones similares de contornosmeloacutedicos Un sistema jerarquizado de esta naturaleza permite una representacioacuten de la curvameloacutedica adecuada para la transcripcioacuten prosoacutedica aunque que inicialmente no haya sido disentildeadopara tales fines

El objetivo de INTSINT (International Transcription System for Intonation) en cambio esproporcionar un sistema para la comparacioacuten interlinguumliacutestica de sistemas prosoacutedicosDesarrollado por Hirst (1991 Hirst y Di Cristo en prensa Hirst Di Cristo y Espesser enprensa) en el marco de un proyecto de anaacutelisis automaacutetico de la entonacioacuten INTSINT se basa en

la estilizacioacuten de la curva meloacutedica realizada a partir de una interpolacioacuten entre puntos en los quese da un cambio significativo en el valor de la frecuencia fundamental (target points) Estospuntos que podriacuteamos denominar ldquode inflexioacutenrdquo - definidos como la combinacioacuten de un valortemporal y un valor frecuencial - son susceptibles de codificarse automaacuteticamente mediante lossiacutembolos de INTSINT previa introduccioacuten de marcas de frontera entre las unidades entonativasCon ello se obtiene una representacioacuten fonoloacutegica del contorno meloacutedico simbolizando losdiferentes niveles tonales de la curva original El sistema se basa en la representacioacuten desecuencias tonales consideradas tanto desde una perspectiva global en funcioacuten del rango devariacioacuten tonal del hablante como desde un punto de vista local en relacioacuten con la altura de puntosde inflexioacuten anteriores En el primer caso se definen tres niveles T (Top) M (Mid) y B (Bottom)mientras que en el segundo se marcan cinco posibilidades H (Higher) L (Lower) S (Same) U(Upstep) o D (Downstep) El proceso de modelizacioacuten necesario para transcribir medianteINTSINT ha sido aplicado a varias lenguas (Hirst et al 1993) y se emplea tambieacuten para laanotacioacuten prosoacutedica de parte del corpus EUROM en franceacutes ingleacutes alemaacuten sueco y espantildeol(Hirst et al 1994 Llisterri ed 1996) llevada a cabo en el marco del proyecto LRE 62-050MULTEXT - Multilingual Text Tools and Corpora Es posible tambieacuten aplicar INTSINT aniveles maacutes altos como el paacuterrafo tal como se muestra en Nicolas y Hirst (1995)

5- ETIQUETADO FONEacuteTICO DE CORPUS ORALES

Al igual que en el caso de los corpus textuales una vez recogidos los materiales de base deun corpus oral debe llevarse a cabo un tratamiento de los mismos que permita su utilizacioacutenposterior El primer paso suele ser la transcripcioacuten ortograacutefica que en determinado tipo de corpusse acompantildea de una transcripcioacuten foneacutetica o fonoloacutegica A continuacioacuten a cada segmento de laonda sonora se le asocia una etiqueta (labelling) que lo define en teacuterminos foneacuteticos o fonoloacutegicosy se lleva a cabo la alineacioacuten (alignment) entre la sentildeal sonora y las etiquetas obteniendo unarepresentacioacuten que puede compararse a la partitura musical de una obra para voz y orquesta Elproceso de etiquetado segmental puede llevarse a cabo a varios niveles como veremos en esteapartado y completarse con una anotacioacuten de las caracteriacutesticas suprasegmentales codificadasseguacuten los diversos sistemas que hemos expuesto anteriormente Si se cumplen las etapasmencionadas se llega a disponer de un corpus que contiene la sentildeal sonora sincronizada con latranscripcioacuten ortograacutefica y con la transcripcioacuten foneacutetica o fonoloacutegica de modo que una vezdefinida una estructura de base de datos es posible consultar el corpus partiendo de etiquetasfoneacuteticas de marcas prosoacutedicas o de la transcripcioacuten ortograacutefica al tiempo que se accede a lagrabacioacuten correspondiente

Los corpus de lengua oral que consisten uacutenicamente en transcripciones ortograacuteficas - ya queno suele ser factible realizar una transcripcioacuten foneacutetica completa de un nuacutemero elevado de horasde grabacioacuten - conllevan un procesamiento menos complejo aunque en algunos casos contienenmarcas prosoacutedicas uacutetiles para el anaacutelisis del discurso o de la conversacioacuten como veremos en elapartado 6

51- Niveles de etiquetado foneacutetico de corpus orales

Una cuestioacuten que se plantea inevitablemente a la hora de introducir informacioacuten adicionalsobre los datos recogidos es el nivel de etiquetado del corpus Se han realizado varias propuestassobre los distintos niveles en los que se puede realizar el etiquetado foneacutetico de un corpusalgunas de ellas ligadas al proyecto SAM como la de Barry y Fourcin (1992) en la que seplantean cinco niveles posibles de etiquetado foneacutetico de un corpus

bull Nivel fiacutesico en el que se etiquetan las propiedades acuacutesticas presentes en la sentildealsonora

bull Nivel acuacutestico-foneacutetico en el que se marcan las propiedades de los segmentos enteacuterminos de categoriacuteas foneacuteticas como oclusioacuten friccioacuten sonoridad nasalizacioacuten etc

bull Nivel de transcripcioacuten estrecha en el que se caracterizan los segmentos utilizandolos siacutembolos del AFI o de sus equivalentes computacionales

bull Nivel de transcripcioacuten fonoloacutegica (o foneacutemica) sentildealando uacutenicamente aquelloselementos funcionalmente distintivos que se encuentran en la palabra pronunciadaaisladamente en un estilo cuidado (citation form)

bull Nivel de transcripcioacuten ancha en el que se utilizan los siacutembolos correspondientes alos elementos fonoloacutegicos en una lengua dada para transcribir realizaciones alofoacutenicascondicionadas por el contexto3

A estos cinco niveles debe antildeadirse auacuten la anotacioacuten prosoacutedica considerada de formaindependiente por los autores de la propuesta

Una propuesta similar de etiquetado tambieacuten en cinco niveles - caracteriacutesticas acuacutesticas denaturaleza subfoneacutemica caracteriacutesticas segmentales realizaciones foneacuteticas forma canoacutenica de laspalabras y transcripcioacuten ortograacutefica - se presenta en Tillmann y Pompino-Marschall (1993) y hasido utilizada con eacutexito en el proyecto alemaacuten PhonDat Igualmente pueden verse las propuestasde Autesserre et al (1989) enmarcadas en el contexto del proyecto SAM y los trabajos deMarchal et al (1995) o Roach et al (1990)

La transcripcioacuten y el etiquetado de corpus orales se ha abordado en el marco del proyectoEAGLES desde una doble perspectiva la de la foneacutetica y las tecnologiacuteas del habla en el Grupo deTrabajo sobre Lengua Oral y desde la de la linguumliacutestica de corpus en el marco de las actividades delGrupo de Trabajo sobre Corpus Textuales El trabajo llevado a cabo en el grupo dedicado a lalengua hablada en EAGLES recoge esencialmente las propuestas desarrolladas en el marco deSAM y de PhonDat Los niveles de etiquetado propuesto son los siguientes (Gibbon Moore yWinski eds 1997)

bull Nivel ortograacutefico en el que se utiliza la representacioacuten ortograacutefica convencional

3 La distincioacuten entre los dos uacuteltimos niveles puede ejemplificarse con el caso de las asimilaciones mientras que enla transcripcioacuten ancha encontrariacuteamos [um poko] (un poco) en el caso de una transcripcioacuten fonoloacutegica apareceriacutea [unpoko] si se opta por no simbolizar archifonemas en la transcripcioacuten En cambio [mismo] se representariacutea de lamisma forma en ambos niveles encontraacutendose la transcripioacuten [mizmo] en el nivel de transcripcioacuten estrecha

bull Nivel de formas canoacutenicas (citation form) representando la forma depronunciacioacuten aislada de las palabra en estilo cuidado

bull Nivel de transcripcioacuten ancha o fonotiacutepica en este nivel se utilizan los siacutembolosque representan elementos fonoloacutegicos en una lengua dada pero al igual que en lapropuesta de Barry y Fourcin se transcriben aquellos fenoacutemenos predictibles propios dela foneacutetica sintaacutectica SAMPA seriacutea pues un alfabeto foneacutetico adecuado para este nivelde transcripcioacuten

bull Nivel de transcripcioacuten estrecha basado en una representacioacuten alofoacutenica de lasrealizaciones foneacuteticas de los hablantes para el cual puede utilizarse un alfabeto foneacuteticocomo X-SAMPA

bull Nivel acuacutestico-foneacutetico en el que se distinguen caracteriacutesticas acuacutesticas de lossegmentos observables en una representacioacuten de la onda sonora

bull Nivel fiacutesico representado en teacuterminos de paraacutemetros acuacutesticos o articulatoriosbull Fenoacutemenos no linguumliacutesticos la inclusioacuten de este nivel permite representar sonidos

de naturaleza comunicativa o no introducidos por el hablante asiacute como toda aquellainformacioacuten paralinguumliacutestica que se considere de intereacutes tambieacuten permite sentildealas los ruidosexternos en la grabacioacuten

Vale la pena detenerse brevemente en el nivel de las formas canoacutenicas y en el concepto deldquotranscripcioacuten fonotiacutepicardquo que como puede verse aparecen de forma recurrente en diversaspropuestas La inclusioacuten de forma canoacutenicas en el etiquetado de un corpus responde a un doblemotivo especialmente ligado a necesidades tecnoloacutegicas en primer lugar estas formas permitenderivar automaacuteticamente mediante un conjunto de reglas una transcripcioacuten ancha o fonotiacutepica enla que se incluyen los elementos alofoacutenicos cuya aparicioacuten esta condicionada por el contextofoneacutetico en segundo lugar a partir de las formas canoacutenicas puede crearse de forma automaacutetica undiccionario foneacutetico partiendo de un corpus transcrito (Wesenick y Schiel 1995 Senia y vanVelden 1997) lo que tiene utilidad para el desarrollo de sistemas de siacutentesis y reconocimiento delhabla y tambieacuten para la descripcioacuten linguumliacutestica La transcripcioacuten denominada ldquofonotiacutepicardquo en lostrabajos de SAM constituye un nivel intermedio entre la realizacioacuten foneacutetica y la transcripcioacutenpuramente fonoloacutegica Por otra parte el nivel de transcripcioacuten de formas canoacutenicas estaacutedirectamente relacionado con la representacioacuten ortograacutefica facilitando asiacute la transcripcioacuten foneacuteticaautomaacutetica de corpus en este nivel mediante el desarrollo de los correspondientes sistemas dereglas

En el informe del Grupo de Trabajo de Corpus Textuales de EAGLES (EAGLES 1996) seintenta realizar una siacutentesis entre las necesidades de diversos campos de estudio Se sugieren porello tres niveles de representacioacuten

bull S1 representacioacuten ortograacutefica del textobull S2 representacioacuten fonoloacutegica de las palabras en su forma canoacutenicabull S3 transcripcioacuten foneacutetica consistente en una representacioacuten simboacutelica discreta de

la realizacioacuten del enunciado tal como es percibido por el transcriptor

Como puede observarse estos tres niveles encuentran su equivalente en los nivelespropuesto por Barry y Fourcin (1992) y en los definidos por el Grupo de Trabajo de Lengua

Oral Para la transcripcioacuten del nivel S2 puede utilizarse SAMPA mientras que la del nivel S3requiere el uso de un alfabeto foneacutetico como X-SAMPA

52- La transcripcioacuten y el etiquetado automaacutetico de corpus orales

La tarea de transcribir y etiquetar foneacuteticamente un corpus oral representa un considerableesfuerzo tanto en teacuterminos de tiempo como de los recursos econoacutemicos necesarios para llevar acabo esta labor El etiquetado manual requiere por otro lado el desarrollo de convencionesdetalladas para asegurar la consistencia entre diversos transcriptores (Keating et al 1994 Krot yTaylor 1995 Lander 1997) ademaacutes del establecimiento de un proceso de validacioacutencomprobando la fiabilidad de los resultados obtenidos (Eisen 1993 Cole et al 1994 Strangert yHeldener 1995) Por estos motivos uno de los intereses principales de los investigadores en elcampo de las tecnologiacuteas del habla ha sido llevar a cabo el etiquetado de forma semi-automaacutetica oidealmente automaacutetica Un primer nivel de transcripcioacuten - tanto de formas canoacutenicas comofonotiacutepica - puede obtenerse automaacuteticamente como acabamos de mencionar a partir de larepresentacioacuten ortograacutefica si se dispone de un conjunto de reglas que establezcan lascorrespondencias entre la representacioacuten ortograacutefica y la foneacutetica

Sin embargo un etiquetado foneacutetico en los niveles de transcripcioacuten maacutes detallada requiere laposibilidad de acceder a la onda sonora y un procedimiento de anaacutelisis de la sentildeal La primeraoperacioacuten que debe realizar un sistema de etiquetado automaacutetico es la segmentacioacuten del continuumsonoro en unidades menores - segmentos o caracteriacutesticas acuacutesticas en funcioacuten del nivel detranscripcioacuten deseado - para pasar despueacutes a la asignacioacuten de etiquetas - siacutembolos detranscripcioacuten - que describan sus caracteriacutesticas Este es el proceso conocido propiamente comoetiquetado (labelling) que cuando se realiza de forma automaacutetica debe superar los obstaacuteculosderivados de la naturaleza no discreta de la sentildeal sonora - resultado de mecanismos como lacoarticulacioacuten - y de la variabilidad de realizaciones foneacuteticas entre hablantes o incluso en unmismo hablante

Para que el corpus sea uacutetil el etiquetado foneacutetico debe estar temporalmente sincronizadocon la sentildeal sonora y con la representacioacuten ortograacutefica operacioacuten que se realiza en el procesoconocido como alineacioacuten temporal (time alignment) llevado a cabo tambieacuten de forma automaacuteticaEsta alineacioacuten puede hacerse de un modo global sentildealando en la onda sonora las fronteras entrepalabras ortograacuteficas - para facilitar el acceso a la grabacioacuten a partir de este nivel de representacioacuten(Lander 1997) - o los puntos en los que se encuentran siacutelabas acentuadas tal como sucede porejemplo en el proyecto MULTEXT

En el campo de las tecnologiacuteas del habla se han llevado a cabo numerosiacutesimos trabajosencaminados al disentildeo de sistemas de segmentacioacuten etiquetado y alineacioacuten temporal automaacuteticasde corpus orales utilizando las teacutecnicas propias del reconocimiento del habla como los Modelosde Markov o las redes neuronales Cabe destacar que tales teacutecnicas no soacutelo son uacutetiles en eldesarrollo de corpus en este aacutembito sino que constituyen una herramienta importante en otrostipos de corpus sin embargo es preciso reconocer que el habla espontaacutenea - especialmente si seha recogido mediante grabaciones realizadas en un entorno natural - plantea auacuten problemas en lo

que se refiere a su transcripcioacuten y etiquetado automaacuteticos pese a los notabiliacutesimos avances quetienen lugar en este campo

6- TRANSCRIPCIOacuteN Y CODIFICACIOacuteN DE CORPUS PARA EL ANAacuteLISIS DE LA LENGUA ORAL

En este uacuteltimo apartado incidiremos en las cuestiones relacionadas con la transcripcioacuten ycodificacioacuten de corpus orales que pueden presentar un mayor intereacutes para aacutembitos como elanaacutelisis de discurso o de la conversacioacuten y para el estudio de la lengua oral en todos los niveles dela descripcioacuten linguumliacutestica Como indicaacutebamos al principio la transcripcioacuten y la codificacioacuten de loselementos transcritos son en principio dos operaciones conceptualmente diferentes Sinembargo en la praacutectica habitual en las disciplinas a las que se refiere este apartado suelen ser dosoperaciones que se realizan simultaacuteneamente ya que al mismo tiempo que se realiza latransliteracioacuten se introducen las marcas necesarias para la codificacioacuten de los elementos que se hadecidido introducir en el corpus Por ello en muchos casos la discusioacuten sobre la transcripcioacuten y lacodificacioacuten se realiza conjuntamente en la bibliografiacutea sobre el tema

61- Los requisitos de una transcripcioacuten

El investigador que decide constituir un corpus de lengua oral se encuentra en estosmomentos con una gran variedad de criterios en lo que se refiere a la transcripcioacuten y a la seleccioacutende los elementos que apareceraacuten codificados en el corpus Hemos hecho ya referencia en elapartado 3 a las diversas convenciones para la representacioacuten ortograacutefica y cintildeeacutendonos al aacutembitodel anaacutelisis del discurso y la conversacioacuten constatamos igualmente la existencia una grandiversidad de propuestas En una revisioacuten de las mismas Payratoacute (1995) hace por ejemploreferencia a los sistemas de transcripcioacuten y codificacioacuten procedentes de la etnometodologiacuteainteresados en reflejar la interaccioacuten verbal a los meacutetodos desarrollados en el marco de laetnografiacutea de la comunicacioacuten y de la sociolinguumliacutestica interaccional4 o a propuestas utilizadas en elestudio del lenguaje infantil Ante tal situacioacuten parece conveniente plantearse cuaacuteles son losrequisitos que debe cumplir una transcripcioacuten de la lengua oral tema que ha sido abordado pordiversos autores (DuBois 1991 Elich 1993 Edwards 1993 OrsquoConnell y Kowal 1994) Trasrevisar aportaciones anteriores Payratoacute (1995) resume los requisitos que teoacutericamente deberiacuteanexigirse a toda transcripcioacuten

bull Neutralidad o fidelidad de modo que la transcripcioacuten no sea interpretativabull Globalidad o complejidad recogiendo la totalidad de los fenoacutemenos que aparecen

en el discurso oralbull Omnifuncionalidad permitiendo diversos usos y aplicacionesbull Claridad tanto desde el punto de vista del aprendizaje del sistema como de la

legibilidad de la representacioacutenbull Universalidad y compatibilidad entre sistemas informaacuteticos

4 Estos sistemas se comparan en OrsquoConnell y Kowal (1994) Pueden encontrarse consideraciones generales sobre latranscripcioacuten y codificacioacuten de la lengua oral en el anaacutelisis del discurso y la conversacioacuten en 1995Ochs (1979) DuBois (1991) Edwards (1992 1993 1995) Du Bois et al (1993) Gumperz y Berenz (1993) Cook (1995) Chafe(1995) y en Sinclair (1995)

Sin embargo puesto que en la praacutectica se transcribe en funcioacuten de los objetivos para losque se ha definido el corpus Payratoacute (1995) considera que un sistema de transcripcioacuten debe serante todo interpretativo de los datos selectivo en cuanto a los fenoacutemenos que se transcribenpertinente para el objeto de investigacioacuten coherente con la base teoacuterica adoptada por elinvestigador fiel en cuanto a la representacioacuten de los datos y flexible para que sea posible suutilizacioacuten en diversos estudios Por otra parte en opinioacuten de este autor la simbologiacutea utilizadadebe ser clara econoacutemica sencilla exenta de ambiguumledad y compatible con sistemas internacionesestandarizados Este uacuteltimo aspecto nos parece especialmente importante ya que como sentildeala elmismo Payratoacute (1995 58)

[] en ninguacuten caso puede olvidarse que los datos de una investigacioacuten no deberiacutean sertratados nunca de forma tan parcial o idiosincraacutesica que se impidiera o dificultara el uso por partede otros investigadores La transcripcioacuten del discurso oral es una actividad suficientementecostosa y conflictiva para tomar precauciones en este sentido y ninguna comunidad cientiacuteficapuede permitirse el lujo de particularismos (en aspectos tan elementales) que obstruyan el debateo conviertan en inaprovechables una fuente de informacioacuten

62- Propuestas de estandarizacioacuten para la transcripcioacuten y codificacioacuten de corpus orales

Ante la diversidad de propuestas para la transcripcioacuten y codificacioacuten de la lengua oral queacabamos de constatar el surgimiento de la linguumliacutestica de corpus y muy especialmente lasnecesidades derivadas del intercambio electroacutenico de textos propiciaron la aparicioacuten de proyectose iniciativas centrados en la creacioacuten de estaacutendares tanto en lo que se refiere a la transcripcioacutencomo a la codificacioacuten En los proacuteximos apartados revisamos sucintamente algunos de ellos

Uno de los capiacutetulos de las Guiacuteas desarrolladas por la TEI estaacute dedicado a la transcripcioacutende corpus orales (Johansson 1995a b) En eacutel se describe la estructura baacutesica de la representacioacutende un texto oral - cabecera texto y divisiones - y se definen los procedimientos basados enSGML para la representacioacuten de los elementos estructurales baacutesicos informacioacuten contextualinformacioacuten temporal enunciados pausas elementos vocalizados semi-leacutexicos o no leacutexicoselementos kineacutesicos otros tipos de eventos comunicativos y texto presentado en forma escrita alhablante Tambieacuten se ofrecen en este capiacutetulo indicaciones para la segmentacioacuten y el alineamientoasiacute como recomendaciones para la transcripcioacuten de superposiciones entre hablantes de formas depalabras prosodia elementos paralinguumliacutesticos - tempo intensidad rango tonal tensioacuten ritmo ycalidad de voz - y alteraciones en el decurso foacutenico Para la representacioacuten de la informacioacutenfoneacutetica se recomienda el uso del AFI En la siguiente tabla se resumen los principales elementospropuestos por la TEI para la codificacioacuten de corpus orales considerados especiacuteficos de este tipode texto (Sperberg-McQueen y Burnard eds 1994)

Elemento codificado Marca decodificacioacutenen SGML

Definicioacuten

Divisiones (division) ltdivgt Unidades intermedias entre el texto y el enunciado que permitendelimitar partes diferenciadas en un texto

Enunciado (utterance) ltugt Segmento de habla comprendido entre dos pausas o delimitado porun cambio en el turno de palabra puede incluir ademaacutesinformacioacuten sobre la superposicioacuten (ltoverlapgt) de turnos cuando

interviene simultaacuteneamente maacutes de un hablantePausa (pause) ltpausegt Interrupcioacuten de la fonacioacuten percibida entre dos enunciados o en el

interior de los mismos puede describirse en teacuterminos relativos oindicando su duracioacuten

Vocal (vocal) ltvocalgt Elemento vocalizado semi-leacutexico o no leacutexico (pej pausas llenas otoses)

Kineacutesico (kinesic) ltkinesicgt Cualquier fenoacutemeno comunicativo no vocal (p ej gestos)Acontecimiento (event) lteventgt Cualquier fenoacutemeno identificado en la grabacioacuten no necesariamente

vocalizado ni con valor comunicativo (p ej ruidos de fondo)Texto escrito (writing) ltwritinggt Texto escrito que se presenta al hablante durante su intervencioacutenCambio (shift) ltshiftgt Momento en el que se produce un cambio en alguno de los rasgos

paralinguumliacutesticos - calidad de voz intensidad rango tonal ritmo yvelocidad de elocucioacuten - cada uno de los rasgos puede describirsemediante una lista de caracteriacutesticas

Tabla 1 Elementos codificados en las transcripciones de lengua oral seguacuten los estaacutendares de la TEI(Adaptada de Sperberg-McQueen y Burnard eds1994)

Por otra parte la TEI ofrece mecanismos para indicar el comienzo y el final de unfenoacutemeno su duracioacuten y su sincronizacioacuten temporal con otros elementos presenta tambieacuten laposibilidad de marcar unidades inferiores al enunciado - segmentos ltseggt - que permitendelimitar por ejemplo unidades prosoacutedicas e incluye tambieacuten entre sus propuestas las marcasnecesarias para sentildealar fenoacutemenos propios de la lengua hablada como palabras truncadasrepeticiones falsos principios - marcados como ltdelgt (deletion) y especificando el fenoacutemeno -Las partes de la grabacioacuten que el transcriptor no llega a interpretar correctamente - ltuncleargt - ono puede escuchar - ltgapgt - o las correcciones de errores de produccioacuten realizadas por eltranscriptor - ltsicgt para delimitar el error y ltcorrgt para indicar la correccioacuten - son tambieacutenelementos para los cuales la TEI establece marcas de codificacioacuten

Aunque las Guiacuteas de la TEI pueden considerarse un sistema adecuado para la transcripcioacuteny codificacioacuten de gran variedad de materiales los autores propios autores reconocen que

[] the present proposals are not intended to support unmodified every variety of researchundertaken upon spoken material now or in the future some discourse analysts phonologistsand doubtless other may wish to extend the scheme presented here to express more precisely theset of distinctions they wish to draw in their transcriptions Speech regarded as a purely acousticphenomenon may well require different methods from those outlined here as may speechregarded solely as a process of social interaction (Sperberg-McQueen y Burnard eds 1994 cap11)

El proyecto NERC - Network of European Reference Corpora (NERC 1994) se planteoacutecomo uno de sus objetivos la viabilidad de desarrollar una serie de recomendaciones para laconstitucioacuten de corpus y por tanto incluye entre sus resultados indicaciones sobre el tratamientode los corpus orales tanto en lo que se refiere a su codificacioacuten como a la transcripcioacuten de loselementos segmentales y suprasegmentales (Sinclair 1994) El sistema adoptado para latranscripcioacuten y codificacioacuten de corpus se basa como hemos indicado anteriormente en eldesarrollado por French (1991 1992) para la transcripcioacuten del corpus oral desarrollado en elproyecto COBUILD La transcripcioacuten se plantea como una operacioacuten que puede desarrollarse envarios niveles

bull Nivel I consiste en la representacioacuten ortograacutefica introduciendo los miacutenimossignos de puntuacioacuten necesarios sin informacioacuten sobre la interaccioacuten entre hablantes Eneste nivel se contemplan convenciones desarrolladas para la representacioacuten ortograacutefica ypara precisar el uso de la puntuacioacuten

bull Nivel II consiste en una representacioacuten ortograacutefica enriquecida con informacioacutenbaacutesica sobre la identidad de los hablantes el turno de palabra y los elementos no verbales

bull Nivel III contiene toda la informacioacuten presente en el nivel II ademaacutes deinformacioacuten sobre la interaccioacuten entre hablantes - marcando el principio y el final de lossolapamientos - y sobre la entonacioacuten - sentildealando las fronteras entre unidades tonales ylas siacutelabas acentuadas- En opinioacuten de French (1992) la transcripcioacuten a este nivel requiereuna formacioacuten especiacutefica en foneacutetica

bull Nivel IV constituye el nivel maacutes detallado de representacioacuten incluyendo lainformacioacuten propia del nivel III junto con marcas de tonos siacutelabas nucleares y con unatranscripcioacuten fonoloacutegica alineada con una representacioacuten acuacutestica - espectrograma y curvameloacutedica - del enunciado

La recomendacioacuten del proyecto NERC es que la transcripcioacuten de un corpus para el estudiode la lengua oral se lleve a cabo seguacuten las especificaciones del Nivel II adecuado seguacuten Frenchpara todas aquellas investigaciones que no requieran informacioacuten prosoacutedica

En el marco de NERC se llevoacute tambieacuten a cabo una evaluacioacuten de las Guiacuteas de la TEI para latranscripcioacuten de corpus orales de la que se concluye que ldquoThe TEI proposals are broadlycompatible with current practice in the user community as represented by JP Frenchconventions Furthermore in the majority of cases it will be a straightforward matter to link themachine-friendly TEI codes to the more user-friendly encoding systems such as JP Frenchconventions by means of a simple conversion programmerdquo (Payne 199260) La idea de unaconversioacuten automaacutetica entre las transcripciones realizadas seguacuten las propuestas de NERC y de laTEI es naturalmente interesante y refuerza la idea de que existe una compatibilidad general entreambos sistemas (Payne 1992 Johansson 1995a EAGLES 1996) prueba de ello es que en elinforme final de NERC se recomienda el uso de las normas de la TEI

Uno de los objetivos del Grupo de Trabajo sobre Textos Orales de EAGLES fue proponerun conjunto miacutenimo de fenoacutemenos que deberiacutean codificarse en cualquier texto oral La propuestarealizada se describe en EAGLES (1996) y toma elementos del proyecto NERC de la TEI y delGrupo de Trabajo sobre Lengua Oral de EAGLES Considerando los elementos comunes a lossistemas que sirven de base se sugiere que la codificacioacuten de un texto oral debe contener almenos informacioacuten sobre los siguientes aspectos

(1) Elementos vocales y no vocalesbull Elementos vocales semi-leacutexicos

Pertenecen a esta categoriacutea los elementos utilizados principalmente en elhabla espontaacutenea durante los momentos en que el hablante planifica lacontinuacioacuten de su discurso como las llamadas ldquopausas llenasrdquo o ldquosonorasrdquo y los

elementos que marcan dudas en el momento de la produccioacuten del hablaCorresponden a los elementos que en la TEI se marcan con la etiqueta ltvocalgtbull Elementos vocales no leacutexicos

Se incluyen aquiacute todo tipo de sonidos producidos por el hablante - tosesrisas bostezos estornudos etc - que no constituyen formas leacutexicas de la lenguaCorresponden igualmente a los codificados con la marca ltvocalgt en la TEIbull Acontecimientos no vocales y no comunicativos

Comprenden los ruidos producidos por otros hablantes o procedentes delentorno de grabacioacuten Estos acontecimientos se codifican en la TEI mediante lamarca lteventgt

(2) Elementos necesarios en la transcripcioacuten de interacciones verbalesbull Identidad del hablante

Este es un elemento imprescindible en la transcripcioacuten de interaccionesverbales La TEI dispone de los mecanismos para documentar informacioacuten sobrelos hablantes en la cabecera de los textos asiacute como de un sistema para marcar laidentidad de cada participante en el interior del texto aunque pueden utilizarsetambieacuten otros procedimientosbull Turnos de palabra

La finalidad del marcado de los turnos de palabra es indicar un cambio dehablante Ademaacutes de las convenciones de la TEI pueden emplearse otrosprocedimientos mientras se mantenga esta informacioacuten esencial en el estudio de lainteraccioacuten verbalbull Superposicioacuten de turnos de palabra

Existen igualmente diferentes procedimientos para marcar la superposicioacutende emisiones de dos hablantes ademaacutes de las propuestas de la TEI que los tratacomo parte de las estrategias para codificar acontecimientos simultaacuteneos

(3) Elementos relacionados con la actuacioacuten del hablantebull Omisiones en un texto leiacutedo

Si se transcribe un texto leiacutedo y se dispone del original es recomendableanotar las palabras o segmentos omitidos por el locutorbull Autocorrecciones

Es propio del habla espontaacutenea aunque tambieacuten de la lectura que loshablantes realicen correcciones de su propia produccioacuten linguumliacutestica (self-repairs)Parece conveniente marcarlas en la transcripcioacuten de un corpus oralbull Fragmentos de palabras

Los fragmentos de palabras corresponden a uno o maacutes segmentospertenecientes a una palabra que no ha sido totalmente pronunciada por el hablanteen un primer intento y que suelen repetirse cuando eacuteste consigue producir lapalabra completa Es importante indicar este fenoacutemeno en la transcripcioacuten

bull Fragmentos ininteligiblesSe trata de partes de la grabacioacuten que no son comprendidas por el

transcriptor y en la TEI se codifican con la etiqueta ltuncleargt aunque si se desease pueden utilizar marcas maacutes detalladas distinguiendo entre transcripcionescompletamente ininteligibles y entre una posible interpretacioacuten ofrecida por eltranscriptor

Un aspecto conflictivo sigue siendo la identificacioacuten de los enunciados que conforman untexto oral (Schuetze-Coburn 1991) Mientras que en un texto escrito los signos de puntuacioacutenconstituyen un criterio de delimitacioacuten en el habla disponemos de indicios como las pausas laentonacioacuten o el cambio de turno de palabra que nos permiten al menos convencionalmentedefinir un enunciado Sin embargo hasta el momento no se han desarrollado auacuten criteriosobjetivos y consistentes para resolver este problema

7- CONCLUSIONES

La revisioacuten - sin pretensiones de exhaustividad - de los principales sistemas detranscripcioacuten etiquetado y codificacioacuten de corpus orales expuesta en este trabajo pone demanifiesto en primer lugar la multiplicidad de propuestas desarrolladas frente a los intentos deestandarizacioacuten algunos de los cuales auacuten no se han consolidado plenamente pese a su crecienteaceptacioacuten En segundo lugar destaca tambieacuten la heterogeneidad de tradiciones que confluyen enel estudio de la lengua hablada desde la foneacutetica y las tecnologiacuteas del habla hasta el anaacutelisis deldiscurso y de la conversacioacuten diversidad que lleva a la creacioacuten de convenciones especiacuteficas pararesponder a las necesidades de diversas comunidades cientiacuteficas Ante esta situacioacuten la distincioacutenpropuesta por Sinclair (1995107) entre ldquoconformidadrdquo y ldquocompatibilidadrdquo adquiere todo susentido ya que si en ciertos casos la conformidad a un estaacutendar determinado es problemaacutetica porlas limitaciones inherentes a todo sistema comuacuten la compatibilidad - entendida como la facilidadde conversioacuten entre sistemas - deberiacutea ser en cambio un requisito imprescindible en el desarrollode los recursos linguumliacutesticos De esta manera puede tal alcanzarse el equilibrio entre lasnecesidades de un proyecto y las indudables ventajas cientiacuteficas y econoacutemicas que resultan de lareutilizacioacuten de los datos disponibles

BIBLIOGRAFIacuteA

Allen GD 1988 The PHONASCII System Journal of the International PhoneticAssociation 181 9-25

Anderson AH M Badger EG Bard E Boyle G Doherty S Garrod S Isard JKowtko J Mcallister J Miller C Sotillo HS Thompson y R Weinert 1991 The HCRCMap Task corpus Language and Speech 344 351-366

Autesserre D G Peacuterennou y M Rossi 1989 Methodology for the transcription andlabeling of a speech corpus Journal of the International Phonetic Association 191 2-15

Barry WJ y AJ Fourcin 1992 Levels of Labelling Computer Speech and Language 61-14

Beckman ME y GM Ayers GM 1994 Guidelines for ToBI Labelling Version 20February 1994[Documento de Internet disponible en httplingohio-stateeduPhoneticsToBIToBI0html]

Beckman ME y J Hirschberg J 1994 The ToBI Annotation Conventions Apeacutendice A deME Beckman y GM Ayers 1994 Guidelines for ToBI Labelling Version 20 February 1994[Documento de Internet disponible en httplingohio-stateeduPhoneticsToBIToBI0html]

Bruce G 1988 23 Supasegmental categories and 24 The symbolization of temporalevents Journal of the International Phonetic Association 182 75-76

Bruce G 1989 Report from the IPA working group on suprasegmental categories LundUniversity Department of Linguistics General Linguistics Phonetics Working Papers 35 25-40

Burnard L 1995 What is SGML and how does it help Computers and the Humanities291 41-50 The Text Encoding Initiative Background and Context Eds N Ide y J VeacuteronisDordrecht Kluwer Academic Publishers

Burnard L 1995a Text Encoding for Information Exchange An Introduction to the TextEncoding Initiaive TEI Document TEI J31 [Documento de Internet disponible enhttpwwwuiceduorgsteiinfoteij31]

Burnard L 1995b The Text Encoding Initiative an overviewrdquo Spoken English onComputer Transcription Markup and Applications Eds G LEECH G MYERS y JTHOMAS Harlow Longman 69-81

Chafe W 1995 Adequacy user-friendliness and practicality in transcribingrdquo English onComputer Transcription Markup and Applications Eds G Leech G Myers y J ThomasHarlow Longman 54-61

Chan D A Fourcin D Gibbon B Granstroumlm M Huckvale G Kokkinakis K KvaleL Lamel B Lindberg A Moreno J Mouropoulos F Senia I Trancoso C Veld y J Zeiliger1995 EUROM - A Spoken Language Resource for the EU Eurospeech95 Proceedings of the4th European Conference on Speech Communication and Speech Technology Madrid Spain 18-21 September 1995 Vol 1 867-870

Cole RA BT Oshika M Noel T Lander y M Fanty 1994 Labeler Agreement inPhonetic Labeling of Continuous Speech Proceedings of the 1994 International Conference onSpoken Language Processing Yokohama Japan 18-22 September 1994[Documento de Internet disponible en httpwwwcseogieduCSLUcorporapapershtml]

Cook G 1995 Theoretical issues transcribing the untranscribablerdquo Spoken English onComputer Transcription Markup and Applications Eds G Leech G Myers y J ThomasHarlow Longman 35-53

Du Bois JW 1991 Transcription design principles for spoken discourse researchPragmatics 1 71-106

Du Bois JW S Schuetze-Coburn S Cumming y D Paolino 1993 Outline of discoursetranscriptionrdquo Talking Data Transcription and Coding in Discourse Research Eds JAEdwards y MD Lampert Hillsdale NJ Lawrence Erlbaum Associates 45-90

EAGLES 1996 Preliminary Recommendations on Spoken Texts EAGLES DocumentEAG-TCWG-STPP May 1996[Documento de Internet disponible enhttpwwwilcpicnritEAGLES96spokentxspokentxhtml]

Edwards JA 1992 Design principles in the transcription of spoken discourserdquoDirections in Corpus Linguistics Proceedings of Nobel Symposium 82 Stockholm 4-8 August1991 Ed J Svartvik Berlin Mouton de Gruyter 129-147

Edwards JA 1993 Principles and Contrasting Systems of Discourse TranscriptionrdquoTalking Data Transcription and Coding in Discourse Research Eds JA Edwards y MDLampert Hillsdale Hillsdale NJ Lawrence Erlbaum Associates 3-32

Edwards JA 1995 Principles and alternative systems in the transcription coding andmark-up of spoken discourserdquo Spoken English on Computer Transcription Markup andApplications Eds G Leech G Myers y J Thomas Harlow Longman 19-34

Ehlich K 1993 HIAT A Transcription System for Discourse Datardquo Talking DataTranscription and Coding in Discourse Research Eds JA Edwards y MD Lampert HillsdaleNJ Lawrence Erlbaum Associates 123-148

Eisen B 1993 Reliability of speech segmentation and labelling at different levels oftranscription Eurospeech93 3rd European Conference on Speech Communication andTechnology Berlin Germany 21-23 September 1993 Vol 1 673-676

Esling JH y H Gaylord 1993 Computer Codes for Phonetic Symbols Journal of theInternational Phonetic Association 232 77-82

Esling JH 1988 Computer coding of IPA symbols and detailed phonetic representationsof computer databases Journal of the International Phonetic Association 182 99-106

Esling JH 1990 Computer Coding of the IPA Supplementary Report Journal of theInternational Phonetic Association 201 22-26

Fourcin A y JM Dolmazon (on behalf of the SAM Project) 1991 Speech knowledgestandards and assessment Actes du XIIegraveme Congregraves International des Sciences Phoneacutetiques 19-24 aoucirct 1991 Aix-en-Provence France Aix-en-Provence Universiteacute de Provence Service desPublications Vol 5 430-433

Fourcin A G Harland W Barry y V Hazan eds 1989 Speech Input and OutputAssessment Multilingual Methods and Standards Chichester Ellis Horwood Ltd

French JP 1991 Updated notes for soundprint transcribers Working paper Universityof Birmingham October 1991 NERC-WP4-47

French JP 1992 Transcription proposals multilevel system Working paper Universityof Birmingham October 1992 NERC-WP4-50

Gibbon D 1989 Survey of Prosodic Labelling for EC Languages SAM-UBI-190 12February 1989 Report e6 in ESPRIT 2589 (SAM) Interim Report Year 1 Ref SAM-UCLG002 University College London February 1990

Gibbon D R Moore y R Winski eds 1997 Handbook on Standards and Resources forSpoken Language Systems Berlin Mouton De Gruyter [Documento de Internet disponible en httpcoralliliuni-bielefelddeEAGLESeagbookeagbookhtml]

Groslashnnum Thorsen N 1987 Suprasegmental transcription ARIPUC - Annual Report ofthe Institute of Phonetics University of Copenhagen 21 1-27

Gumperz JJ y J Berenz 1993 Transcribing Conversational Exchangesrdquo Talking DataTranscription and Coding in Discourse Research Eds JA Ewards y M D Lampert HillsdaleNJ Lawrence Erlbaum Associates 91-122

Hart J lsquoT R Collier y A Cohen 1990 A Perceptual Study of Intonation An Experimental- Phonetic Approach to Intonation Cambridge Cambridge University Press (Cambridge Studiesin Speech Science and Communication)

Hess W K Kohler y HG Tillmann 1995 The PhonDat-Verbmobil Speech CorpusEurospeech95 Proceedings of the 4th European Conference on Speech Communication andSpeech Technology Madrid Spain 18-21 September 1995 Vol 1 863-866

Hieronymus JL 1994 ASCII phonetic symbols for the worlds languages WorldbetATampT Bell Laboratories Technical Memo [Documento de Internet disponible enhttpwwwcseogieduCSLUcorporapapershtml]

Hirst D A Di Cristo y R Espesser en prensaLevels of representation and levels ofanalysis for intonation Prosody Theory and Experiments Ed M Horne Dordrecht Kluwer

Hirst DJ y A Di Cristo en prensa A survey of intonation systemsrdquo IntonationSystems A Survey of 20 Languages Eds D Hirst y A Di Cristo Cambridge CambridgeUniversity Press

Hirst DJ 1991 Intonation models towards a third generation Actes du XIIegraveme CongregravesInternational des Sciences Phoneacutetiques 19-24 aoucirct 1991 Aix-en-Provence France Aix-en-Provence Universiteacute de Provence Service des Publications Vol 1 305-310

Hirst DJ A Di Cristo M Le Besnerais Z Najim P Nicolas y P Romeacuteas 1993Multilingual modelling of intonation patternsrdquo Proceedings of an ESCA Workshop on ProsodySeptember 27-29 1993 Lund Sweden Eds D House y P Touati Lund University Departmentof Linguistics and Phonetics Working Papers 41 204-207

Hirst DJ N Ide y J Veacuteronis 1994 Coding fundamental frequency patterns for multi-lingual synthesis with INTSINT in the MULTEXT project Conference Proceedings of theSecond ESCAIEEE Workshop on Speech Synthesis September 12-15 1994 Mohonk MountainHouse New Paltz New York USA 77-80

Ide N y J Veacuteronis eds 1995 The Text Encoding Initiative Background and ContextsComputers and the Humanities 29 1-3 Publicado en forma de libro en Dordrecht KluwerAcademic Publishers

IPA 1989 The IPA 1989 Kiel Convention Workgroup 9 report Computer Coding of IPAsymbols and Computer Representation of Individual Languages Journal of the InternationalPhonetic Association 192 81-92

IPA 1993 IPA Chart revised to 1993 Journal of the International Phonetic Association231 [Documento de Internet disponible en httpwwwartsglaacukIPAipacharthtml]

IPA 1995 Preview of the IPA Handbook Journal of the International Phonetic Association251

ISO 8879 1986 Information Processing Text and Office Systems Standard GeneralizedMarkup Language (SGML) Geneva International Organization for Standardization

Johansson S 1995a The approach of the Text Encoding Initiative to the encoding ofspoken discourse Spoken English on Computer Transcription Markup and Applications EdsG Leech G Myers y J Thomas Harlow Longman 82-98

Johansson S 1995b The Encoding of Spoken Texts Computers and the Humanities291 149-158 The Text Encoding Initiative Background and Context Eds N Ide y J VeacuteronisDordrecht Kluwer Academic Publishers 149-158

Keating P P MacEachern A Shryock y S Domiacutenguez 1994 A manual for phonetictranscription Segmentation and labelling of words in spontaneous speech UCLA WorkingPapers in Phonetics 88 91-120

Kluger-Kruse M 1987 Computer Phonetic Alphabet ESPRIT Linguistic Analysis of theEuropean Languages Report BU-CPA0267 July 1987

Krot C y B Taylor 1995 Criteria for Acoustic-Phonetic Segmentation and WordLabelling in the Australian National Database of Spoken Language[Documento de Internet disponible en httpwwwshlrcmqeduaucriteriahtml]

Lander T 1997 The CSLU Labeling Guide Center for Spoken Language UnderstandingOregon Graduate Institute[Documento de Internet disponible en httpwwwcseogieduCSLUcorporapapershtml]

Llisterri J 1994 Prosody Encoding Survey WP 1 Specifications and Standards T15Markup Specifications Deliverable 153 Final version 15 September 1994 LRE Project 62-050MULTEXT

Llisterri J ed 1996 Prosody Tools Efficiency and Failures WP 4 Corpus T46 SpeechMarkup and Validation Deliverable 452 Final version 15 October 1996 LRE Project 62-050MULTEXT

MacWhinney B 1991The CHILDES Project Tools for Analyzing Talk Hillsdale NJLawrence Erlbaum

Marchal A N Nguyen y W Hardcastle 1995 Multitiered phonetic approach to speechlabelling Levels in Speech Communication Relations and Interactions A Tribute to MaxWajskop Hommage agrave Max Wajskop Eds C Sorin J Mariani H Meloni y J SchoengenAmsterdam Elsevier Science BV 149-158

NERC 1994 NERC-1 Network of European Reference Corpora Final Report PisaInstituto di Linguistica Computazionale - CNR January 1994 versioacuten en curso de publicacioacutenTowards a Network of European Reference Corpora Eds N Calzolari M Baker y PG KruytPisa Giardini

Nicolas P y D Hirst 1995 Symbolic coding of Higher-Level Characteristics ofFundamental Frequency Curvesrdquo Eurospeech95 Proceedings of the 4th European Conferenceon Speech Communication and Technology Madrid Spain 18-21 September 1995 Vol 2 989-992

OConnell DC y S Kowal 1994 Some Current Transcription Systems for SpokenDiscourse A critical Analysis Pragmatics 4 81-107

Ochs E 1979 Transcription as Theory Developmental Pragmatics Eds E Ochs E yBB Schieffelin New York Academic Press 43-72

Payne J 1992 Report on the compatibility of JP Frenchs spoken corpus transcriptionconventions with the TEI guidelines for transcription of spoken texts Working paper COBUILDBirmingham and IDS Mannheim December 1992 NERC-WP8WP4-122

Payne J 1995 The COBUILD spoken corpus transcription conventions SpokenEnglish on Computer Transcription Markup and Applications Eds G Leech G Myers y JThomas Harlow Longman 203-207

Payratoacute Ll 1995 Transcripcioacuten del discurso coloquialrdquo El espantildeol coloquial Actas del ISimposio sobre Anaacutelisis del Discurso Oral Almeriacutea 23-25 de noviembre de 1994 Ed L CorteacutesRodriacuteguez Almeriacutea Universidad de Almeriacutea Servicio de Publicaciones 43-70

Pierrehumbert J B 1897 (1980) The Phonology and Phonetics of English IntonationPhD Thesis Department of Linguistics MIT Bloomington Indiana University Linguistics Club

Pitrelli J M Beckman y J Hirschberg 1994 Evaluation of prosodic transcriptionlabelling reliability in the ToBI frameworkrdquo Proceedings of the Third International Conference onSpoken Language Processing Yokohama ICSLP Vol 2 123-126

Pullum GK y WA Ladusaw 1996 (1986) Phonetic Symbol Guide Chicago TheUniversity of Chicago Press 2nd edition

Roach P H Roach A Dew y P Rowlands 1990 Phonetic analysis and the automaticsegmentation and labeling of speech sounds Journal of the International Phonetic Association201 15-21

Schmidt MS C Scott y MA Jack 1993 Phonetic transcription standards for Europeannames (ONOMASTICA) Eurospeech93 3rd European Conference on Speech Communicationand Technology Berlin Germany 21-23 September 1993 Vol 1 279-282

Schuetze-Coburn S 1991Units of intonation in discourse a comparison of acoustic andauditory analysis Language and Speech 343 207-234

Selting M 1987 Descriptive categories for the auditive analysis of intonation inconversation Journal of Pragmatics 11 777-791

Selting M 1988 The role of intonation in the organisation of repair and problem handlingsequences in conversation Journal of Pragmatics 12 293-322

Senia F y JG Van Velden 1997 Specifications of orthographic transcription and lexiconconventions LRE-4001 SpeechDat Technical Report SD132 Final version 10 January 1997[Documento de Internet disponible en httpwwwphonetikuni-muenchendeSpeechDathtml]

Silverman K M Beckman J Pitrelli M Ostendorf C Wightman P Price JPierrehumbert y J Hirschberg 1992 TOBI A standard for labelling English prosodyProceedings of the Second International Conference on Spoken Language Processing ICSLP-92Banff October 1992 867-870

Sinclair J 1994 Spoken Language [3B] PhoneticPhonemic and Prosodic Annotation[52] NERC 1994 NERC-1 Network of European Reference Corpora Final Report PisaVersioacuten en curso de publicacioacuten Towards a Network of European Reference Corpora Eds NCalzolari M Baker y PG Kruyt Pisa Giardini

Sinclair J 1995 From theory to practicerdquo Spoken English on Computer TranscriptionMarkup and Applications Eds G Leech G Myers Y J Thomas Harlow Longman 99- 112

Sperberg-McQueen CM y L Burnard eds 1994 Guidelines for Electronic Text Encodingand Interchange TEI P3 Chicago and Oxford Association for Computational Linguistics Association for Computers and the Humanities Association for Literary and LinguisticComputing [Cap 11 Transcriptions of Speech] [Documento de Internet disponible enhttpetextvirginiaeduTEIhtml]

Strangert E y M Heldner 1995 Labelling of boundaries and prominences byphonetically experienced and non-experienced transcribers Phonum 3 Reports from theDepartment of Phonetics Umearing University 85-109 [Documento de Internet disponible enhttpwwwlingumusefonphonum3html]

Teubert W 1993 Phonetic Phonemic and Prosodic Annotation Final Report IDSMannheim February 1993 NERC-WP8-171

Tillmann HG y B Pompino-Marschall 1993 Theoretical Principles ConcerningSegmentation Labelling Strategies and Levels of Categorical Annotation for Spoken LanguageDatabase Systems Eurospeech93 3rd European Conference on Speech Communication andTechnology Berlin Germany 21-23 September 1993 Vol 3 1691-1694

Trancoso I 1995 The ONOMASTICA Interlanguage Pronunciation LexiconrdquoEurospeech95 Proceedings of the 4th European Conference on Speech Communication andTechnology Madrid Spain 18-21 September 1995 Vol 1 829-832

Wells JC 1987 Computer Coded Phonetic Transcription Journal of the InternationalPhonetic Association 172 94-114

Wells JC 1989 Computer-coded phonemic notation of individual languages of theEuropean Community Journal of the International Phonetic Association 191 31-54

Wells JC 1994 Computer-coding the IPA a proposed extension of SAMPA SpeechHearing and Language Work in Progress 1994 (University College London Department ofPhonetics and Linguistics) 8 271-289

Wells JC 1995 SAMPROSA (SAM Prosodic Transcription [Documento de Internetdisponible en httpwwwphonuclacukhomesampasamprosahtm]

Wells JC W Barry M Grice A Fourcin y D Gibbon 1992 Standard Computer-Compatible Transcription SAM Stage Report Sen3 SAM UCL-037 28 February 1992 SAM(1992) Esprit Project 2589 (SAM) Multilingual Speech InputOutput AssessmentMethodologyand Standardisation Final Report Year Three 1III91-28II1992 London University CollegeLondon

Wesenick M-B y F Schiel 1995 Feasibility of Automatic Annotation and BuildingPronunciation Lexica from Corpus Material LRE-63314 SpeechDat Report D3123 Finalversion 10 October 1995[Documento de Internet disponible en httpwwwicpgrenetfrSpeechDathomehtml]

Winski R R Moore y D Gibbon 1995 EAGLES Spoken Language Working GroupOverview and Resultsrdquo Eurospeech95 Proceedings of the 4th European Conference on SpeechCommunication and Speech Technology Madrid Spain 18-21 September 1995 Vol 1 841-844[Documento de Internet disponible en httpcoralliliuni-bielefeldde~gibbonEAGLESrwpaperrwpaperhtml]

  • 1- INTRODUCCIOacuteN
  • 2- NIVELES DE REPRESENTACIOacuteN ETIQUETADO Y CODIFICACIOacuteN
  • 3- REPRESENTACIOacuteN ORTOGRAacuteFICA DE CORPUS ORALES
  • 31- Propuestas para la representacioacuten ortograacutefica de corpus orales en el aacutembito de la linguumliacutestica de corpus
  • 32- Propuestas para la representacioacuten ortograacutefica de corpus orales en el aacutembito de las tecnologiacuteas del habla
  • 4- REPRESENTACIOacuteN FONEacuteTICA DE CORPUS ORALES
  • 41- La representacioacuten foneacutetica de los elementos segmentales
  • 42- La representacioacuten foneacutetica de los elementos suprasegmentales
  • 5- ETIQUETADO FONEacuteTICO DE CORPUS ORALES
  • 51- Niveles de etiquetado foneacutetico de corpus orales
  • 52- La transcripcioacuten y el etiquetado automaacutetico de corpus orales
  • 6- TRANSCRIPCIOacuteN Y CODIFICACIOacuteN DE CORPUS PARA EL ANAacuteLISIS DE LA LENGUA ORAL
  • 61- Los requisitos de una transcripcioacuten
  • 62- Propuestas de estandarizacioacuten para la transcripcioacuten y codificacioacuten de corpus orales
  • 7- CONCLUSIONES
  • BIBLIOGRAFIacuteA
Page 7: Transcripción, etiquetado y codificación de corpus orales

el que se preveacuten equivalencias en coacutedigos ASCII para la totalidad de siacutembolos del AFI en surevisioacuten de 1993 incluyendo diacriacuteticos y marcas tonales Una de las aplicaciones propuestaspara este sistema es el enviacuteo de textos en transcripcioacuten foneacutetica a traveacutes del correo electroacutenico

Por otra parte Worldbet constituye una propuesta maacutes ambiciosa que SAMPA y que suextensioacuten X-SAMPA pues parte de la base de que ldquoany spectrally and temporally distinct speechsound (not including pitch) which is phonemic in some language should have a separate basesymbolrdquo (Hieronymus 1994 ) los siacutembolos de base consisten normalmente en la concatenacioacuten deun siacutembolo del AFI con una serie de diacriacuteticos de modo que puede representarse una granvariedad de aloacutefonos hallados en las lenguas del mundo incluyendo siacutembolos inexistentes en elAFI Uno de los objetivos de Wordlbet - que en su versioacuten actual usa 299 siacutembolos compuestosde dos caracteres ASCII - es facilitar la transcripcioacuten de bases de datos multilinguumles que incluyanlenguas indias asiaacuteticas y africanas ademaacutes de las europeas Este sistema se ha utilizado porejemplo en la transcripcioacuten de los corpus distribuidos por el CSLU (Center for Spoken LanguageUnderstanding Oregon Graduate Institute) (Lander 1997)

Existen otros sistemas de transcripcioacuten foneacutetica concebidos para el intercambio electroacutenicode textos tanto desarrollados desde la perspectiva de las tecnologiacuteas del habla - por ejemplo elCPA (Computer Phonetic Alphabet) surgido en el marco del proyecto ESPRIT Linguistic Analysisof European Languages (Kluger-Kruse 1987) - como disentildeados para otros fines En el aacutembito delestudio del lenguaje infantil el proyecto CHILDES - Child Language Data Exchange System(MacWhinney 1991utiliza el sistema conocido como PHONASCII (Allen 1988) consistente enun conjunto de siacutembolos fonoloacutegicos - UNIBET - y un alfabeto foneacutetico que permite latranscripcioacuten estrecha

42- La representacioacuten foneacutetica de los elementos suprasegmentales

La incorporacioacuten de informacioacuten sobre los elementos suprasegmentales - informacioacutenprosoacutedica - en un corpus oral plantea diversos problemas derivados precisamente de la propianaturaleza de estos elementos que se manifiestan en variaciones continuas en los dominios de lafrecuencia la intensidad y el tiempo Por tanto es preciso llevar a cabo una abstraccioacuten paradeterminar en primer lugar cuaacuteles de estas variaciones son linguumliacutesticamente significativas y ensegundo lugar coacutemo se relacionan con categoriacuteas discretas Finalmente estas categoriacuteas debenrepresentarse en un sistema de notacioacuten No es pues extrantildeo que se hayan desarrollado diversasconvenciones para la simbolizacioacuten de los elementos suprasegmentales (Groslashnnum-Thorsen 1987Llisterri 1994) algunas de las cuales se presentan en los apartados siguientes

En el momento de plantearse la seleccioacuten de un sistema de transcripcioacuten prosoacutedicaadecuado a un corpus oral el investigador se enfrenta nuevamente a la diversidad de sistemas aligual que sucede en el caso de la transcripcioacuten segmental Aunque como veremos maacutes adelanteToBI parece que se estaacute convirtiendo raacutepidamente en un estaacutendar a pesar de su orientacioacuten haciala transcripcioacuten del ingleacutes y al modelo fonoloacutegico subyacente SAMPROSA ofrece la ventaja dehaberse desarrollado teniendo en cuenta las necesidades de las tecnologiacuteas del habla ademaacutesSAMPROSA se enmarca en el contexto de estaacutendares extendidos en Europa como los delproyecto SAM recomendados por ejemplo por NERC (Teubert 1993 Sinclair 1994) Enconjunto el sistema ideal de transcripcioacuten prosoacutedica deberiacutea permitir una representacioacuten en varios

niveles ser compatible con el intercambio electroacutenico de datos y cubrir las necesidades del mayornuacutemero de lenguas posible pudiendo aplicarse automaacuteticamente en lugar de basarse en lasimpresiones intuitivas del transcriptor con vistas a la transcripcioacuten de grandes corpus Enausencia de un sistema que reuacutena tales caracteriacutesticas parece adecuado establecer mecanismos decompatibilidad entre los existentes a fin de facilitar la reutilizacioacuten de los datos

El AFI ofrece ademaacutes de la posibilidades de transcripcioacuten segmental un conjunto desiacutembolos para la representacioacuten de los elementos suprasegmentales Con motivo del congresopara la revisioacuten del AFI celebrado en Kiel en 1989 se creoacute un grupo de trabajo sobre categoriacuteassuprasegmentales (Bruce 1988 1989) concluyeacutendose la necesidad de representar las categoriacuteassuprasegmentales de un modo maacutes adecuado especialmente en lo que se refiere la entonacioacuten Elconjunto actual de siacutembolos del AFI para los elementos suprasegmentales permite transcribir eltono asiacute como la duracioacuten y el acento

Las necesidades derivadas de una descripcioacuten detallada de la entonacioacuten tanto en el campode la foneacutetica como en el de las tecnologiacuteas del habla han propiciado la creacioacuten de diversossistemas de transcripcioacuten prosoacutedica algunos de los cuales se presentan a continuacioacuten

En el marco del proyecto ESPRIT SAM anteriormente mencionado se llevoacute tambieacuten a caboel desarrollo de sistemas de transcripcioacuten prosoacutedica compatibles con las necesidades de anotacioacutende bases de datos en soporte electroacutenico resultando de ello propuestas como PROSPASAMSINT o SAMPROSA (Gibbon 1989 Wells et al 1992) PROSPA fue originalmenteconcebido por Selting y Gibbon (Selting 1987 1988) para el anaacutelisis de la conversacioacuten y deldiscurso y por tal motivo se basa en criterios auditivos recogiendo uacutenicamente los elementosnecesarios para este fin Por su parte SAMSINT (SAM System for Intonation Transcription) seplantea como objetivo la transcripcioacuten de contornos meloacutedicos en el interior de unidadesentonativas basaacutendose en INTSINT - presentado maacutes adelante - con algunas modificacionesadicionales

A pesar de la coexistencia de los sistemas anteriormente mencionados en el proyecto SAMprobablemente el conjunto de siacutembolos maacutes extendido actualmente para la transcripcioacutenprosoacutedica sea SAMPROSA (SAM Prosodic Alphabet) propuesto inicialmente por Gibbon(1989) y desarrollado por Wells et al (1992) hasta llegar a su forma actual (Wells 1995)SAMPROSA ofrece al igual que SAMPA un conjunto de caracteres correspondientes a coacutedigosASCII mediante los cuales es posible transcribir tonos globales locales terminales y nucleares laduracioacuten el acento la pausas y las fronteras entre unidades prosoacutedicas Aunque presenta rasgoscaracteriacutesticos de la tradicioacuten britaacutenica de anaacutelisis de la entonacioacuten como por ejemplo lacodificacioacuten de tonos nucleares es un sistema que se plantea como adecuado para la transcripcioacutende diversas lenguas

En el aacutembito americano ToBI (Tone and Break Index) se desarrolloacute para cubrir al mismotiempo las necesidades de la descripcioacuten foneacutetica y de la anotacioacuten de corpus adecuados aldesarrollo de sistemas de tecnologiacuteas del habla (Silverman et al 1992 Beckman y Hirschberg1994 Beckman y Ayers 1994) Basado en el ingleacutes americano ToBI permite principalmente latranscripcioacuten de patrones entonativos partiendo de un anaacutelisis de la curva meloacutedica representadacomo evolucioacuten temporal de la frecuencia fundamental mediante herramientas de anaacutelisis y

etiquetado como el programa Wavestrade Sin embargo se han definido tambieacuten convenciones parala anotacioacuten de textos representados ortograacuteficamente Una transcripcioacuten utilizando ToBI constade cuatro niveles

bull Representacioacuten ortograacutefica del enunciadobull Nivel de iacutendices de ruptura (break index) en el que se introducen los indicadores

de liacutemite que marcan las fronteras entre las unidades meloacutedicas estableciendo cuatro gradosde cohesioacuten entre las mismas

bull Nivel tonal en el que se marcan los denominados ldquoeventos tonalesrdquo (pitch events)divididos en tonos de frase al principio y al final de las unidades meloacutedicas y en acentostonales (pitch accent) en las siacutelabas en las que se produce un movimiento de la frecuenciafundamental

bull Nivel miscelaacuteneo que facilita por ejemplo introducir los comentarios deltranscriptor

Para cada uno de los niveles se define un conjunto de siacutembolos alineados temporalmentecon los fenoacutemenos entonativos transcritos si se dispone de una herramienta adecuada comoWavestrade

Las criacuteticas que se realizan maacutes frecuentemente a ToBI son por una parte su dependenciadel modelo fonoloacutegico desarrollado por Pierrehumbert (1980) y por otra su mejor adaptacioacuten alingleacutes que a otras lenguas lo que explicariacutea su amplia utilizacioacuten en Estados Unidos Sin embargose han realizado trabajos en italiano alemaacuten huacutengaro y espantildeol entre otras lenguas usando ToBIcomo sistema de representacioacuten Un inconveniente maacutes importante es que la anotacioacuten medianteToBI requiere un cierto conocimiento previo de los patrones entonativos de la lengua Aun asiacute esun sistema que ofrece indudables ventajas como pueden ser su estructura jeraacuterquica que permiteseleccionar entre subconjuntos o conjuntos mayores de siacutembolos la posibilidad de representarproblemas que aparecen en la transcripcioacuten y el hecho de que existan experimentos demostrandoun alto grado de acuerdo entre transcriptores diferentes (Pitrelli et al 1994)

En el Institute for Perception Research (IPO Eindhoven) se ha desarrollado una teoriacutea sobrela entonacioacuten basada en el modelado de contornos entonativos consistentes en representacionesestilizadas perceptivamente equivalentes al contorno original (lsquot Hart et al 1990) Esta teoriacutea hallevado tambieacuten a la formalizacioacuten de un sistema de representacioacuten de la curva meloacutedica definidacomo un conjunto de movimientos tonales que se agrupan en secuencias de configuracionestonales la agrupacioacuten de estas configuraciones da lugar a su vez a contornos meloacutedicosdefinieacutendose los patrones entonativos en funcioacuten de agrupaciones similares de contornosmeloacutedicos Un sistema jerarquizado de esta naturaleza permite una representacioacuten de la curvameloacutedica adecuada para la transcripcioacuten prosoacutedica aunque que inicialmente no haya sido disentildeadopara tales fines

El objetivo de INTSINT (International Transcription System for Intonation) en cambio esproporcionar un sistema para la comparacioacuten interlinguumliacutestica de sistemas prosoacutedicosDesarrollado por Hirst (1991 Hirst y Di Cristo en prensa Hirst Di Cristo y Espesser enprensa) en el marco de un proyecto de anaacutelisis automaacutetico de la entonacioacuten INTSINT se basa en

la estilizacioacuten de la curva meloacutedica realizada a partir de una interpolacioacuten entre puntos en los quese da un cambio significativo en el valor de la frecuencia fundamental (target points) Estospuntos que podriacuteamos denominar ldquode inflexioacutenrdquo - definidos como la combinacioacuten de un valortemporal y un valor frecuencial - son susceptibles de codificarse automaacuteticamente mediante lossiacutembolos de INTSINT previa introduccioacuten de marcas de frontera entre las unidades entonativasCon ello se obtiene una representacioacuten fonoloacutegica del contorno meloacutedico simbolizando losdiferentes niveles tonales de la curva original El sistema se basa en la representacioacuten desecuencias tonales consideradas tanto desde una perspectiva global en funcioacuten del rango devariacioacuten tonal del hablante como desde un punto de vista local en relacioacuten con la altura de puntosde inflexioacuten anteriores En el primer caso se definen tres niveles T (Top) M (Mid) y B (Bottom)mientras que en el segundo se marcan cinco posibilidades H (Higher) L (Lower) S (Same) U(Upstep) o D (Downstep) El proceso de modelizacioacuten necesario para transcribir medianteINTSINT ha sido aplicado a varias lenguas (Hirst et al 1993) y se emplea tambieacuten para laanotacioacuten prosoacutedica de parte del corpus EUROM en franceacutes ingleacutes alemaacuten sueco y espantildeol(Hirst et al 1994 Llisterri ed 1996) llevada a cabo en el marco del proyecto LRE 62-050MULTEXT - Multilingual Text Tools and Corpora Es posible tambieacuten aplicar INTSINT aniveles maacutes altos como el paacuterrafo tal como se muestra en Nicolas y Hirst (1995)

5- ETIQUETADO FONEacuteTICO DE CORPUS ORALES

Al igual que en el caso de los corpus textuales una vez recogidos los materiales de base deun corpus oral debe llevarse a cabo un tratamiento de los mismos que permita su utilizacioacutenposterior El primer paso suele ser la transcripcioacuten ortograacutefica que en determinado tipo de corpusse acompantildea de una transcripcioacuten foneacutetica o fonoloacutegica A continuacioacuten a cada segmento de laonda sonora se le asocia una etiqueta (labelling) que lo define en teacuterminos foneacuteticos o fonoloacutegicosy se lleva a cabo la alineacioacuten (alignment) entre la sentildeal sonora y las etiquetas obteniendo unarepresentacioacuten que puede compararse a la partitura musical de una obra para voz y orquesta Elproceso de etiquetado segmental puede llevarse a cabo a varios niveles como veremos en esteapartado y completarse con una anotacioacuten de las caracteriacutesticas suprasegmentales codificadasseguacuten los diversos sistemas que hemos expuesto anteriormente Si se cumplen las etapasmencionadas se llega a disponer de un corpus que contiene la sentildeal sonora sincronizada con latranscripcioacuten ortograacutefica y con la transcripcioacuten foneacutetica o fonoloacutegica de modo que una vezdefinida una estructura de base de datos es posible consultar el corpus partiendo de etiquetasfoneacuteticas de marcas prosoacutedicas o de la transcripcioacuten ortograacutefica al tiempo que se accede a lagrabacioacuten correspondiente

Los corpus de lengua oral que consisten uacutenicamente en transcripciones ortograacuteficas - ya queno suele ser factible realizar una transcripcioacuten foneacutetica completa de un nuacutemero elevado de horasde grabacioacuten - conllevan un procesamiento menos complejo aunque en algunos casos contienenmarcas prosoacutedicas uacutetiles para el anaacutelisis del discurso o de la conversacioacuten como veremos en elapartado 6

51- Niveles de etiquetado foneacutetico de corpus orales

Una cuestioacuten que se plantea inevitablemente a la hora de introducir informacioacuten adicionalsobre los datos recogidos es el nivel de etiquetado del corpus Se han realizado varias propuestassobre los distintos niveles en los que se puede realizar el etiquetado foneacutetico de un corpusalgunas de ellas ligadas al proyecto SAM como la de Barry y Fourcin (1992) en la que seplantean cinco niveles posibles de etiquetado foneacutetico de un corpus

bull Nivel fiacutesico en el que se etiquetan las propiedades acuacutesticas presentes en la sentildealsonora

bull Nivel acuacutestico-foneacutetico en el que se marcan las propiedades de los segmentos enteacuterminos de categoriacuteas foneacuteticas como oclusioacuten friccioacuten sonoridad nasalizacioacuten etc

bull Nivel de transcripcioacuten estrecha en el que se caracterizan los segmentos utilizandolos siacutembolos del AFI o de sus equivalentes computacionales

bull Nivel de transcripcioacuten fonoloacutegica (o foneacutemica) sentildealando uacutenicamente aquelloselementos funcionalmente distintivos que se encuentran en la palabra pronunciadaaisladamente en un estilo cuidado (citation form)

bull Nivel de transcripcioacuten ancha en el que se utilizan los siacutembolos correspondientes alos elementos fonoloacutegicos en una lengua dada para transcribir realizaciones alofoacutenicascondicionadas por el contexto3

A estos cinco niveles debe antildeadirse auacuten la anotacioacuten prosoacutedica considerada de formaindependiente por los autores de la propuesta

Una propuesta similar de etiquetado tambieacuten en cinco niveles - caracteriacutesticas acuacutesticas denaturaleza subfoneacutemica caracteriacutesticas segmentales realizaciones foneacuteticas forma canoacutenica de laspalabras y transcripcioacuten ortograacutefica - se presenta en Tillmann y Pompino-Marschall (1993) y hasido utilizada con eacutexito en el proyecto alemaacuten PhonDat Igualmente pueden verse las propuestasde Autesserre et al (1989) enmarcadas en el contexto del proyecto SAM y los trabajos deMarchal et al (1995) o Roach et al (1990)

La transcripcioacuten y el etiquetado de corpus orales se ha abordado en el marco del proyectoEAGLES desde una doble perspectiva la de la foneacutetica y las tecnologiacuteas del habla en el Grupo deTrabajo sobre Lengua Oral y desde la de la linguumliacutestica de corpus en el marco de las actividades delGrupo de Trabajo sobre Corpus Textuales El trabajo llevado a cabo en el grupo dedicado a lalengua hablada en EAGLES recoge esencialmente las propuestas desarrolladas en el marco deSAM y de PhonDat Los niveles de etiquetado propuesto son los siguientes (Gibbon Moore yWinski eds 1997)

bull Nivel ortograacutefico en el que se utiliza la representacioacuten ortograacutefica convencional

3 La distincioacuten entre los dos uacuteltimos niveles puede ejemplificarse con el caso de las asimilaciones mientras que enla transcripcioacuten ancha encontrariacuteamos [um poko] (un poco) en el caso de una transcripcioacuten fonoloacutegica apareceriacutea [unpoko] si se opta por no simbolizar archifonemas en la transcripcioacuten En cambio [mismo] se representariacutea de lamisma forma en ambos niveles encontraacutendose la transcripioacuten [mizmo] en el nivel de transcripcioacuten estrecha

bull Nivel de formas canoacutenicas (citation form) representando la forma depronunciacioacuten aislada de las palabra en estilo cuidado

bull Nivel de transcripcioacuten ancha o fonotiacutepica en este nivel se utilizan los siacutembolosque representan elementos fonoloacutegicos en una lengua dada pero al igual que en lapropuesta de Barry y Fourcin se transcriben aquellos fenoacutemenos predictibles propios dela foneacutetica sintaacutectica SAMPA seriacutea pues un alfabeto foneacutetico adecuado para este nivelde transcripcioacuten

bull Nivel de transcripcioacuten estrecha basado en una representacioacuten alofoacutenica de lasrealizaciones foneacuteticas de los hablantes para el cual puede utilizarse un alfabeto foneacuteticocomo X-SAMPA

bull Nivel acuacutestico-foneacutetico en el que se distinguen caracteriacutesticas acuacutesticas de lossegmentos observables en una representacioacuten de la onda sonora

bull Nivel fiacutesico representado en teacuterminos de paraacutemetros acuacutesticos o articulatoriosbull Fenoacutemenos no linguumliacutesticos la inclusioacuten de este nivel permite representar sonidos

de naturaleza comunicativa o no introducidos por el hablante asiacute como toda aquellainformacioacuten paralinguumliacutestica que se considere de intereacutes tambieacuten permite sentildealas los ruidosexternos en la grabacioacuten

Vale la pena detenerse brevemente en el nivel de las formas canoacutenicas y en el concepto deldquotranscripcioacuten fonotiacutepicardquo que como puede verse aparecen de forma recurrente en diversaspropuestas La inclusioacuten de forma canoacutenicas en el etiquetado de un corpus responde a un doblemotivo especialmente ligado a necesidades tecnoloacutegicas en primer lugar estas formas permitenderivar automaacuteticamente mediante un conjunto de reglas una transcripcioacuten ancha o fonotiacutepica enla que se incluyen los elementos alofoacutenicos cuya aparicioacuten esta condicionada por el contextofoneacutetico en segundo lugar a partir de las formas canoacutenicas puede crearse de forma automaacutetica undiccionario foneacutetico partiendo de un corpus transcrito (Wesenick y Schiel 1995 Senia y vanVelden 1997) lo que tiene utilidad para el desarrollo de sistemas de siacutentesis y reconocimiento delhabla y tambieacuten para la descripcioacuten linguumliacutestica La transcripcioacuten denominada ldquofonotiacutepicardquo en lostrabajos de SAM constituye un nivel intermedio entre la realizacioacuten foneacutetica y la transcripcioacutenpuramente fonoloacutegica Por otra parte el nivel de transcripcioacuten de formas canoacutenicas estaacutedirectamente relacionado con la representacioacuten ortograacutefica facilitando asiacute la transcripcioacuten foneacuteticaautomaacutetica de corpus en este nivel mediante el desarrollo de los correspondientes sistemas dereglas

En el informe del Grupo de Trabajo de Corpus Textuales de EAGLES (EAGLES 1996) seintenta realizar una siacutentesis entre las necesidades de diversos campos de estudio Se sugieren porello tres niveles de representacioacuten

bull S1 representacioacuten ortograacutefica del textobull S2 representacioacuten fonoloacutegica de las palabras en su forma canoacutenicabull S3 transcripcioacuten foneacutetica consistente en una representacioacuten simboacutelica discreta de

la realizacioacuten del enunciado tal como es percibido por el transcriptor

Como puede observarse estos tres niveles encuentran su equivalente en los nivelespropuesto por Barry y Fourcin (1992) y en los definidos por el Grupo de Trabajo de Lengua

Oral Para la transcripcioacuten del nivel S2 puede utilizarse SAMPA mientras que la del nivel S3requiere el uso de un alfabeto foneacutetico como X-SAMPA

52- La transcripcioacuten y el etiquetado automaacutetico de corpus orales

La tarea de transcribir y etiquetar foneacuteticamente un corpus oral representa un considerableesfuerzo tanto en teacuterminos de tiempo como de los recursos econoacutemicos necesarios para llevar acabo esta labor El etiquetado manual requiere por otro lado el desarrollo de convencionesdetalladas para asegurar la consistencia entre diversos transcriptores (Keating et al 1994 Krot yTaylor 1995 Lander 1997) ademaacutes del establecimiento de un proceso de validacioacutencomprobando la fiabilidad de los resultados obtenidos (Eisen 1993 Cole et al 1994 Strangert yHeldener 1995) Por estos motivos uno de los intereses principales de los investigadores en elcampo de las tecnologiacuteas del habla ha sido llevar a cabo el etiquetado de forma semi-automaacutetica oidealmente automaacutetica Un primer nivel de transcripcioacuten - tanto de formas canoacutenicas comofonotiacutepica - puede obtenerse automaacuteticamente como acabamos de mencionar a partir de larepresentacioacuten ortograacutefica si se dispone de un conjunto de reglas que establezcan lascorrespondencias entre la representacioacuten ortograacutefica y la foneacutetica

Sin embargo un etiquetado foneacutetico en los niveles de transcripcioacuten maacutes detallada requiere laposibilidad de acceder a la onda sonora y un procedimiento de anaacutelisis de la sentildeal La primeraoperacioacuten que debe realizar un sistema de etiquetado automaacutetico es la segmentacioacuten del continuumsonoro en unidades menores - segmentos o caracteriacutesticas acuacutesticas en funcioacuten del nivel detranscripcioacuten deseado - para pasar despueacutes a la asignacioacuten de etiquetas - siacutembolos detranscripcioacuten - que describan sus caracteriacutesticas Este es el proceso conocido propiamente comoetiquetado (labelling) que cuando se realiza de forma automaacutetica debe superar los obstaacuteculosderivados de la naturaleza no discreta de la sentildeal sonora - resultado de mecanismos como lacoarticulacioacuten - y de la variabilidad de realizaciones foneacuteticas entre hablantes o incluso en unmismo hablante

Para que el corpus sea uacutetil el etiquetado foneacutetico debe estar temporalmente sincronizadocon la sentildeal sonora y con la representacioacuten ortograacutefica operacioacuten que se realiza en el procesoconocido como alineacioacuten temporal (time alignment) llevado a cabo tambieacuten de forma automaacuteticaEsta alineacioacuten puede hacerse de un modo global sentildealando en la onda sonora las fronteras entrepalabras ortograacuteficas - para facilitar el acceso a la grabacioacuten a partir de este nivel de representacioacuten(Lander 1997) - o los puntos en los que se encuentran siacutelabas acentuadas tal como sucede porejemplo en el proyecto MULTEXT

En el campo de las tecnologiacuteas del habla se han llevado a cabo numerosiacutesimos trabajosencaminados al disentildeo de sistemas de segmentacioacuten etiquetado y alineacioacuten temporal automaacuteticasde corpus orales utilizando las teacutecnicas propias del reconocimiento del habla como los Modelosde Markov o las redes neuronales Cabe destacar que tales teacutecnicas no soacutelo son uacutetiles en eldesarrollo de corpus en este aacutembito sino que constituyen una herramienta importante en otrostipos de corpus sin embargo es preciso reconocer que el habla espontaacutenea - especialmente si seha recogido mediante grabaciones realizadas en un entorno natural - plantea auacuten problemas en lo

que se refiere a su transcripcioacuten y etiquetado automaacuteticos pese a los notabiliacutesimos avances quetienen lugar en este campo

6- TRANSCRIPCIOacuteN Y CODIFICACIOacuteN DE CORPUS PARA EL ANAacuteLISIS DE LA LENGUA ORAL

En este uacuteltimo apartado incidiremos en las cuestiones relacionadas con la transcripcioacuten ycodificacioacuten de corpus orales que pueden presentar un mayor intereacutes para aacutembitos como elanaacutelisis de discurso o de la conversacioacuten y para el estudio de la lengua oral en todos los niveles dela descripcioacuten linguumliacutestica Como indicaacutebamos al principio la transcripcioacuten y la codificacioacuten de loselementos transcritos son en principio dos operaciones conceptualmente diferentes Sinembargo en la praacutectica habitual en las disciplinas a las que se refiere este apartado suelen ser dosoperaciones que se realizan simultaacuteneamente ya que al mismo tiempo que se realiza latransliteracioacuten se introducen las marcas necesarias para la codificacioacuten de los elementos que se hadecidido introducir en el corpus Por ello en muchos casos la discusioacuten sobre la transcripcioacuten y lacodificacioacuten se realiza conjuntamente en la bibliografiacutea sobre el tema

61- Los requisitos de una transcripcioacuten

El investigador que decide constituir un corpus de lengua oral se encuentra en estosmomentos con una gran variedad de criterios en lo que se refiere a la transcripcioacuten y a la seleccioacutende los elementos que apareceraacuten codificados en el corpus Hemos hecho ya referencia en elapartado 3 a las diversas convenciones para la representacioacuten ortograacutefica y cintildeeacutendonos al aacutembitodel anaacutelisis del discurso y la conversacioacuten constatamos igualmente la existencia una grandiversidad de propuestas En una revisioacuten de las mismas Payratoacute (1995) hace por ejemploreferencia a los sistemas de transcripcioacuten y codificacioacuten procedentes de la etnometodologiacuteainteresados en reflejar la interaccioacuten verbal a los meacutetodos desarrollados en el marco de laetnografiacutea de la comunicacioacuten y de la sociolinguumliacutestica interaccional4 o a propuestas utilizadas en elestudio del lenguaje infantil Ante tal situacioacuten parece conveniente plantearse cuaacuteles son losrequisitos que debe cumplir una transcripcioacuten de la lengua oral tema que ha sido abordado pordiversos autores (DuBois 1991 Elich 1993 Edwards 1993 OrsquoConnell y Kowal 1994) Trasrevisar aportaciones anteriores Payratoacute (1995) resume los requisitos que teoacutericamente deberiacuteanexigirse a toda transcripcioacuten

bull Neutralidad o fidelidad de modo que la transcripcioacuten no sea interpretativabull Globalidad o complejidad recogiendo la totalidad de los fenoacutemenos que aparecen

en el discurso oralbull Omnifuncionalidad permitiendo diversos usos y aplicacionesbull Claridad tanto desde el punto de vista del aprendizaje del sistema como de la

legibilidad de la representacioacutenbull Universalidad y compatibilidad entre sistemas informaacuteticos

4 Estos sistemas se comparan en OrsquoConnell y Kowal (1994) Pueden encontrarse consideraciones generales sobre latranscripcioacuten y codificacioacuten de la lengua oral en el anaacutelisis del discurso y la conversacioacuten en 1995Ochs (1979) DuBois (1991) Edwards (1992 1993 1995) Du Bois et al (1993) Gumperz y Berenz (1993) Cook (1995) Chafe(1995) y en Sinclair (1995)

Sin embargo puesto que en la praacutectica se transcribe en funcioacuten de los objetivos para losque se ha definido el corpus Payratoacute (1995) considera que un sistema de transcripcioacuten debe serante todo interpretativo de los datos selectivo en cuanto a los fenoacutemenos que se transcribenpertinente para el objeto de investigacioacuten coherente con la base teoacuterica adoptada por elinvestigador fiel en cuanto a la representacioacuten de los datos y flexible para que sea posible suutilizacioacuten en diversos estudios Por otra parte en opinioacuten de este autor la simbologiacutea utilizadadebe ser clara econoacutemica sencilla exenta de ambiguumledad y compatible con sistemas internacionesestandarizados Este uacuteltimo aspecto nos parece especialmente importante ya que como sentildeala elmismo Payratoacute (1995 58)

[] en ninguacuten caso puede olvidarse que los datos de una investigacioacuten no deberiacutean sertratados nunca de forma tan parcial o idiosincraacutesica que se impidiera o dificultara el uso por partede otros investigadores La transcripcioacuten del discurso oral es una actividad suficientementecostosa y conflictiva para tomar precauciones en este sentido y ninguna comunidad cientiacuteficapuede permitirse el lujo de particularismos (en aspectos tan elementales) que obstruyan el debateo conviertan en inaprovechables una fuente de informacioacuten

62- Propuestas de estandarizacioacuten para la transcripcioacuten y codificacioacuten de corpus orales

Ante la diversidad de propuestas para la transcripcioacuten y codificacioacuten de la lengua oral queacabamos de constatar el surgimiento de la linguumliacutestica de corpus y muy especialmente lasnecesidades derivadas del intercambio electroacutenico de textos propiciaron la aparicioacuten de proyectose iniciativas centrados en la creacioacuten de estaacutendares tanto en lo que se refiere a la transcripcioacutencomo a la codificacioacuten En los proacuteximos apartados revisamos sucintamente algunos de ellos

Uno de los capiacutetulos de las Guiacuteas desarrolladas por la TEI estaacute dedicado a la transcripcioacutende corpus orales (Johansson 1995a b) En eacutel se describe la estructura baacutesica de la representacioacutende un texto oral - cabecera texto y divisiones - y se definen los procedimientos basados enSGML para la representacioacuten de los elementos estructurales baacutesicos informacioacuten contextualinformacioacuten temporal enunciados pausas elementos vocalizados semi-leacutexicos o no leacutexicoselementos kineacutesicos otros tipos de eventos comunicativos y texto presentado en forma escrita alhablante Tambieacuten se ofrecen en este capiacutetulo indicaciones para la segmentacioacuten y el alineamientoasiacute como recomendaciones para la transcripcioacuten de superposiciones entre hablantes de formas depalabras prosodia elementos paralinguumliacutesticos - tempo intensidad rango tonal tensioacuten ritmo ycalidad de voz - y alteraciones en el decurso foacutenico Para la representacioacuten de la informacioacutenfoneacutetica se recomienda el uso del AFI En la siguiente tabla se resumen los principales elementospropuestos por la TEI para la codificacioacuten de corpus orales considerados especiacuteficos de este tipode texto (Sperberg-McQueen y Burnard eds 1994)

Elemento codificado Marca decodificacioacutenen SGML

Definicioacuten

Divisiones (division) ltdivgt Unidades intermedias entre el texto y el enunciado que permitendelimitar partes diferenciadas en un texto

Enunciado (utterance) ltugt Segmento de habla comprendido entre dos pausas o delimitado porun cambio en el turno de palabra puede incluir ademaacutesinformacioacuten sobre la superposicioacuten (ltoverlapgt) de turnos cuando

interviene simultaacuteneamente maacutes de un hablantePausa (pause) ltpausegt Interrupcioacuten de la fonacioacuten percibida entre dos enunciados o en el

interior de los mismos puede describirse en teacuterminos relativos oindicando su duracioacuten

Vocal (vocal) ltvocalgt Elemento vocalizado semi-leacutexico o no leacutexico (pej pausas llenas otoses)

Kineacutesico (kinesic) ltkinesicgt Cualquier fenoacutemeno comunicativo no vocal (p ej gestos)Acontecimiento (event) lteventgt Cualquier fenoacutemeno identificado en la grabacioacuten no necesariamente

vocalizado ni con valor comunicativo (p ej ruidos de fondo)Texto escrito (writing) ltwritinggt Texto escrito que se presenta al hablante durante su intervencioacutenCambio (shift) ltshiftgt Momento en el que se produce un cambio en alguno de los rasgos

paralinguumliacutesticos - calidad de voz intensidad rango tonal ritmo yvelocidad de elocucioacuten - cada uno de los rasgos puede describirsemediante una lista de caracteriacutesticas

Tabla 1 Elementos codificados en las transcripciones de lengua oral seguacuten los estaacutendares de la TEI(Adaptada de Sperberg-McQueen y Burnard eds1994)

Por otra parte la TEI ofrece mecanismos para indicar el comienzo y el final de unfenoacutemeno su duracioacuten y su sincronizacioacuten temporal con otros elementos presenta tambieacuten laposibilidad de marcar unidades inferiores al enunciado - segmentos ltseggt - que permitendelimitar por ejemplo unidades prosoacutedicas e incluye tambieacuten entre sus propuestas las marcasnecesarias para sentildealar fenoacutemenos propios de la lengua hablada como palabras truncadasrepeticiones falsos principios - marcados como ltdelgt (deletion) y especificando el fenoacutemeno -Las partes de la grabacioacuten que el transcriptor no llega a interpretar correctamente - ltuncleargt - ono puede escuchar - ltgapgt - o las correcciones de errores de produccioacuten realizadas por eltranscriptor - ltsicgt para delimitar el error y ltcorrgt para indicar la correccioacuten - son tambieacutenelementos para los cuales la TEI establece marcas de codificacioacuten

Aunque las Guiacuteas de la TEI pueden considerarse un sistema adecuado para la transcripcioacuteny codificacioacuten de gran variedad de materiales los autores propios autores reconocen que

[] the present proposals are not intended to support unmodified every variety of researchundertaken upon spoken material now or in the future some discourse analysts phonologistsand doubtless other may wish to extend the scheme presented here to express more precisely theset of distinctions they wish to draw in their transcriptions Speech regarded as a purely acousticphenomenon may well require different methods from those outlined here as may speechregarded solely as a process of social interaction (Sperberg-McQueen y Burnard eds 1994 cap11)

El proyecto NERC - Network of European Reference Corpora (NERC 1994) se planteoacutecomo uno de sus objetivos la viabilidad de desarrollar una serie de recomendaciones para laconstitucioacuten de corpus y por tanto incluye entre sus resultados indicaciones sobre el tratamientode los corpus orales tanto en lo que se refiere a su codificacioacuten como a la transcripcioacuten de loselementos segmentales y suprasegmentales (Sinclair 1994) El sistema adoptado para latranscripcioacuten y codificacioacuten de corpus se basa como hemos indicado anteriormente en eldesarrollado por French (1991 1992) para la transcripcioacuten del corpus oral desarrollado en elproyecto COBUILD La transcripcioacuten se plantea como una operacioacuten que puede desarrollarse envarios niveles

bull Nivel I consiste en la representacioacuten ortograacutefica introduciendo los miacutenimossignos de puntuacioacuten necesarios sin informacioacuten sobre la interaccioacuten entre hablantes Eneste nivel se contemplan convenciones desarrolladas para la representacioacuten ortograacutefica ypara precisar el uso de la puntuacioacuten

bull Nivel II consiste en una representacioacuten ortograacutefica enriquecida con informacioacutenbaacutesica sobre la identidad de los hablantes el turno de palabra y los elementos no verbales

bull Nivel III contiene toda la informacioacuten presente en el nivel II ademaacutes deinformacioacuten sobre la interaccioacuten entre hablantes - marcando el principio y el final de lossolapamientos - y sobre la entonacioacuten - sentildealando las fronteras entre unidades tonales ylas siacutelabas acentuadas- En opinioacuten de French (1992) la transcripcioacuten a este nivel requiereuna formacioacuten especiacutefica en foneacutetica

bull Nivel IV constituye el nivel maacutes detallado de representacioacuten incluyendo lainformacioacuten propia del nivel III junto con marcas de tonos siacutelabas nucleares y con unatranscripcioacuten fonoloacutegica alineada con una representacioacuten acuacutestica - espectrograma y curvameloacutedica - del enunciado

La recomendacioacuten del proyecto NERC es que la transcripcioacuten de un corpus para el estudiode la lengua oral se lleve a cabo seguacuten las especificaciones del Nivel II adecuado seguacuten Frenchpara todas aquellas investigaciones que no requieran informacioacuten prosoacutedica

En el marco de NERC se llevoacute tambieacuten a cabo una evaluacioacuten de las Guiacuteas de la TEI para latranscripcioacuten de corpus orales de la que se concluye que ldquoThe TEI proposals are broadlycompatible with current practice in the user community as represented by JP Frenchconventions Furthermore in the majority of cases it will be a straightforward matter to link themachine-friendly TEI codes to the more user-friendly encoding systems such as JP Frenchconventions by means of a simple conversion programmerdquo (Payne 199260) La idea de unaconversioacuten automaacutetica entre las transcripciones realizadas seguacuten las propuestas de NERC y de laTEI es naturalmente interesante y refuerza la idea de que existe una compatibilidad general entreambos sistemas (Payne 1992 Johansson 1995a EAGLES 1996) prueba de ello es que en elinforme final de NERC se recomienda el uso de las normas de la TEI

Uno de los objetivos del Grupo de Trabajo sobre Textos Orales de EAGLES fue proponerun conjunto miacutenimo de fenoacutemenos que deberiacutean codificarse en cualquier texto oral La propuestarealizada se describe en EAGLES (1996) y toma elementos del proyecto NERC de la TEI y delGrupo de Trabajo sobre Lengua Oral de EAGLES Considerando los elementos comunes a lossistemas que sirven de base se sugiere que la codificacioacuten de un texto oral debe contener almenos informacioacuten sobre los siguientes aspectos

(1) Elementos vocales y no vocalesbull Elementos vocales semi-leacutexicos

Pertenecen a esta categoriacutea los elementos utilizados principalmente en elhabla espontaacutenea durante los momentos en que el hablante planifica lacontinuacioacuten de su discurso como las llamadas ldquopausas llenasrdquo o ldquosonorasrdquo y los

elementos que marcan dudas en el momento de la produccioacuten del hablaCorresponden a los elementos que en la TEI se marcan con la etiqueta ltvocalgtbull Elementos vocales no leacutexicos

Se incluyen aquiacute todo tipo de sonidos producidos por el hablante - tosesrisas bostezos estornudos etc - que no constituyen formas leacutexicas de la lenguaCorresponden igualmente a los codificados con la marca ltvocalgt en la TEIbull Acontecimientos no vocales y no comunicativos

Comprenden los ruidos producidos por otros hablantes o procedentes delentorno de grabacioacuten Estos acontecimientos se codifican en la TEI mediante lamarca lteventgt

(2) Elementos necesarios en la transcripcioacuten de interacciones verbalesbull Identidad del hablante

Este es un elemento imprescindible en la transcripcioacuten de interaccionesverbales La TEI dispone de los mecanismos para documentar informacioacuten sobrelos hablantes en la cabecera de los textos asiacute como de un sistema para marcar laidentidad de cada participante en el interior del texto aunque pueden utilizarsetambieacuten otros procedimientosbull Turnos de palabra

La finalidad del marcado de los turnos de palabra es indicar un cambio dehablante Ademaacutes de las convenciones de la TEI pueden emplearse otrosprocedimientos mientras se mantenga esta informacioacuten esencial en el estudio de lainteraccioacuten verbalbull Superposicioacuten de turnos de palabra

Existen igualmente diferentes procedimientos para marcar la superposicioacutende emisiones de dos hablantes ademaacutes de las propuestas de la TEI que los tratacomo parte de las estrategias para codificar acontecimientos simultaacuteneos

(3) Elementos relacionados con la actuacioacuten del hablantebull Omisiones en un texto leiacutedo

Si se transcribe un texto leiacutedo y se dispone del original es recomendableanotar las palabras o segmentos omitidos por el locutorbull Autocorrecciones

Es propio del habla espontaacutenea aunque tambieacuten de la lectura que loshablantes realicen correcciones de su propia produccioacuten linguumliacutestica (self-repairs)Parece conveniente marcarlas en la transcripcioacuten de un corpus oralbull Fragmentos de palabras

Los fragmentos de palabras corresponden a uno o maacutes segmentospertenecientes a una palabra que no ha sido totalmente pronunciada por el hablanteen un primer intento y que suelen repetirse cuando eacuteste consigue producir lapalabra completa Es importante indicar este fenoacutemeno en la transcripcioacuten

bull Fragmentos ininteligiblesSe trata de partes de la grabacioacuten que no son comprendidas por el

transcriptor y en la TEI se codifican con la etiqueta ltuncleargt aunque si se desease pueden utilizar marcas maacutes detalladas distinguiendo entre transcripcionescompletamente ininteligibles y entre una posible interpretacioacuten ofrecida por eltranscriptor

Un aspecto conflictivo sigue siendo la identificacioacuten de los enunciados que conforman untexto oral (Schuetze-Coburn 1991) Mientras que en un texto escrito los signos de puntuacioacutenconstituyen un criterio de delimitacioacuten en el habla disponemos de indicios como las pausas laentonacioacuten o el cambio de turno de palabra que nos permiten al menos convencionalmentedefinir un enunciado Sin embargo hasta el momento no se han desarrollado auacuten criteriosobjetivos y consistentes para resolver este problema

7- CONCLUSIONES

La revisioacuten - sin pretensiones de exhaustividad - de los principales sistemas detranscripcioacuten etiquetado y codificacioacuten de corpus orales expuesta en este trabajo pone demanifiesto en primer lugar la multiplicidad de propuestas desarrolladas frente a los intentos deestandarizacioacuten algunos de los cuales auacuten no se han consolidado plenamente pese a su crecienteaceptacioacuten En segundo lugar destaca tambieacuten la heterogeneidad de tradiciones que confluyen enel estudio de la lengua hablada desde la foneacutetica y las tecnologiacuteas del habla hasta el anaacutelisis deldiscurso y de la conversacioacuten diversidad que lleva a la creacioacuten de convenciones especiacuteficas pararesponder a las necesidades de diversas comunidades cientiacuteficas Ante esta situacioacuten la distincioacutenpropuesta por Sinclair (1995107) entre ldquoconformidadrdquo y ldquocompatibilidadrdquo adquiere todo susentido ya que si en ciertos casos la conformidad a un estaacutendar determinado es problemaacutetica porlas limitaciones inherentes a todo sistema comuacuten la compatibilidad - entendida como la facilidadde conversioacuten entre sistemas - deberiacutea ser en cambio un requisito imprescindible en el desarrollode los recursos linguumliacutesticos De esta manera puede tal alcanzarse el equilibrio entre lasnecesidades de un proyecto y las indudables ventajas cientiacuteficas y econoacutemicas que resultan de lareutilizacioacuten de los datos disponibles

BIBLIOGRAFIacuteA

Allen GD 1988 The PHONASCII System Journal of the International PhoneticAssociation 181 9-25

Anderson AH M Badger EG Bard E Boyle G Doherty S Garrod S Isard JKowtko J Mcallister J Miller C Sotillo HS Thompson y R Weinert 1991 The HCRCMap Task corpus Language and Speech 344 351-366

Autesserre D G Peacuterennou y M Rossi 1989 Methodology for the transcription andlabeling of a speech corpus Journal of the International Phonetic Association 191 2-15

Barry WJ y AJ Fourcin 1992 Levels of Labelling Computer Speech and Language 61-14

Beckman ME y GM Ayers GM 1994 Guidelines for ToBI Labelling Version 20February 1994[Documento de Internet disponible en httplingohio-stateeduPhoneticsToBIToBI0html]

Beckman ME y J Hirschberg J 1994 The ToBI Annotation Conventions Apeacutendice A deME Beckman y GM Ayers 1994 Guidelines for ToBI Labelling Version 20 February 1994[Documento de Internet disponible en httplingohio-stateeduPhoneticsToBIToBI0html]

Bruce G 1988 23 Supasegmental categories and 24 The symbolization of temporalevents Journal of the International Phonetic Association 182 75-76

Bruce G 1989 Report from the IPA working group on suprasegmental categories LundUniversity Department of Linguistics General Linguistics Phonetics Working Papers 35 25-40

Burnard L 1995 What is SGML and how does it help Computers and the Humanities291 41-50 The Text Encoding Initiative Background and Context Eds N Ide y J VeacuteronisDordrecht Kluwer Academic Publishers

Burnard L 1995a Text Encoding for Information Exchange An Introduction to the TextEncoding Initiaive TEI Document TEI J31 [Documento de Internet disponible enhttpwwwuiceduorgsteiinfoteij31]

Burnard L 1995b The Text Encoding Initiative an overviewrdquo Spoken English onComputer Transcription Markup and Applications Eds G LEECH G MYERS y JTHOMAS Harlow Longman 69-81

Chafe W 1995 Adequacy user-friendliness and practicality in transcribingrdquo English onComputer Transcription Markup and Applications Eds G Leech G Myers y J ThomasHarlow Longman 54-61

Chan D A Fourcin D Gibbon B Granstroumlm M Huckvale G Kokkinakis K KvaleL Lamel B Lindberg A Moreno J Mouropoulos F Senia I Trancoso C Veld y J Zeiliger1995 EUROM - A Spoken Language Resource for the EU Eurospeech95 Proceedings of the4th European Conference on Speech Communication and Speech Technology Madrid Spain 18-21 September 1995 Vol 1 867-870

Cole RA BT Oshika M Noel T Lander y M Fanty 1994 Labeler Agreement inPhonetic Labeling of Continuous Speech Proceedings of the 1994 International Conference onSpoken Language Processing Yokohama Japan 18-22 September 1994[Documento de Internet disponible en httpwwwcseogieduCSLUcorporapapershtml]

Cook G 1995 Theoretical issues transcribing the untranscribablerdquo Spoken English onComputer Transcription Markup and Applications Eds G Leech G Myers y J ThomasHarlow Longman 35-53

Du Bois JW 1991 Transcription design principles for spoken discourse researchPragmatics 1 71-106

Du Bois JW S Schuetze-Coburn S Cumming y D Paolino 1993 Outline of discoursetranscriptionrdquo Talking Data Transcription and Coding in Discourse Research Eds JAEdwards y MD Lampert Hillsdale NJ Lawrence Erlbaum Associates 45-90

EAGLES 1996 Preliminary Recommendations on Spoken Texts EAGLES DocumentEAG-TCWG-STPP May 1996[Documento de Internet disponible enhttpwwwilcpicnritEAGLES96spokentxspokentxhtml]

Edwards JA 1992 Design principles in the transcription of spoken discourserdquoDirections in Corpus Linguistics Proceedings of Nobel Symposium 82 Stockholm 4-8 August1991 Ed J Svartvik Berlin Mouton de Gruyter 129-147

Edwards JA 1993 Principles and Contrasting Systems of Discourse TranscriptionrdquoTalking Data Transcription and Coding in Discourse Research Eds JA Edwards y MDLampert Hillsdale Hillsdale NJ Lawrence Erlbaum Associates 3-32

Edwards JA 1995 Principles and alternative systems in the transcription coding andmark-up of spoken discourserdquo Spoken English on Computer Transcription Markup andApplications Eds G Leech G Myers y J Thomas Harlow Longman 19-34

Ehlich K 1993 HIAT A Transcription System for Discourse Datardquo Talking DataTranscription and Coding in Discourse Research Eds JA Edwards y MD Lampert HillsdaleNJ Lawrence Erlbaum Associates 123-148

Eisen B 1993 Reliability of speech segmentation and labelling at different levels oftranscription Eurospeech93 3rd European Conference on Speech Communication andTechnology Berlin Germany 21-23 September 1993 Vol 1 673-676

Esling JH y H Gaylord 1993 Computer Codes for Phonetic Symbols Journal of theInternational Phonetic Association 232 77-82

Esling JH 1988 Computer coding of IPA symbols and detailed phonetic representationsof computer databases Journal of the International Phonetic Association 182 99-106

Esling JH 1990 Computer Coding of the IPA Supplementary Report Journal of theInternational Phonetic Association 201 22-26

Fourcin A y JM Dolmazon (on behalf of the SAM Project) 1991 Speech knowledgestandards and assessment Actes du XIIegraveme Congregraves International des Sciences Phoneacutetiques 19-24 aoucirct 1991 Aix-en-Provence France Aix-en-Provence Universiteacute de Provence Service desPublications Vol 5 430-433

Fourcin A G Harland W Barry y V Hazan eds 1989 Speech Input and OutputAssessment Multilingual Methods and Standards Chichester Ellis Horwood Ltd

French JP 1991 Updated notes for soundprint transcribers Working paper Universityof Birmingham October 1991 NERC-WP4-47

French JP 1992 Transcription proposals multilevel system Working paper Universityof Birmingham October 1992 NERC-WP4-50

Gibbon D 1989 Survey of Prosodic Labelling for EC Languages SAM-UBI-190 12February 1989 Report e6 in ESPRIT 2589 (SAM) Interim Report Year 1 Ref SAM-UCLG002 University College London February 1990

Gibbon D R Moore y R Winski eds 1997 Handbook on Standards and Resources forSpoken Language Systems Berlin Mouton De Gruyter [Documento de Internet disponible en httpcoralliliuni-bielefelddeEAGLESeagbookeagbookhtml]

Groslashnnum Thorsen N 1987 Suprasegmental transcription ARIPUC - Annual Report ofthe Institute of Phonetics University of Copenhagen 21 1-27

Gumperz JJ y J Berenz 1993 Transcribing Conversational Exchangesrdquo Talking DataTranscription and Coding in Discourse Research Eds JA Ewards y M D Lampert HillsdaleNJ Lawrence Erlbaum Associates 91-122

Hart J lsquoT R Collier y A Cohen 1990 A Perceptual Study of Intonation An Experimental- Phonetic Approach to Intonation Cambridge Cambridge University Press (Cambridge Studiesin Speech Science and Communication)

Hess W K Kohler y HG Tillmann 1995 The PhonDat-Verbmobil Speech CorpusEurospeech95 Proceedings of the 4th European Conference on Speech Communication andSpeech Technology Madrid Spain 18-21 September 1995 Vol 1 863-866

Hieronymus JL 1994 ASCII phonetic symbols for the worlds languages WorldbetATampT Bell Laboratories Technical Memo [Documento de Internet disponible enhttpwwwcseogieduCSLUcorporapapershtml]

Hirst D A Di Cristo y R Espesser en prensaLevels of representation and levels ofanalysis for intonation Prosody Theory and Experiments Ed M Horne Dordrecht Kluwer

Hirst DJ y A Di Cristo en prensa A survey of intonation systemsrdquo IntonationSystems A Survey of 20 Languages Eds D Hirst y A Di Cristo Cambridge CambridgeUniversity Press

Hirst DJ 1991 Intonation models towards a third generation Actes du XIIegraveme CongregravesInternational des Sciences Phoneacutetiques 19-24 aoucirct 1991 Aix-en-Provence France Aix-en-Provence Universiteacute de Provence Service des Publications Vol 1 305-310

Hirst DJ A Di Cristo M Le Besnerais Z Najim P Nicolas y P Romeacuteas 1993Multilingual modelling of intonation patternsrdquo Proceedings of an ESCA Workshop on ProsodySeptember 27-29 1993 Lund Sweden Eds D House y P Touati Lund University Departmentof Linguistics and Phonetics Working Papers 41 204-207

Hirst DJ N Ide y J Veacuteronis 1994 Coding fundamental frequency patterns for multi-lingual synthesis with INTSINT in the MULTEXT project Conference Proceedings of theSecond ESCAIEEE Workshop on Speech Synthesis September 12-15 1994 Mohonk MountainHouse New Paltz New York USA 77-80

Ide N y J Veacuteronis eds 1995 The Text Encoding Initiative Background and ContextsComputers and the Humanities 29 1-3 Publicado en forma de libro en Dordrecht KluwerAcademic Publishers

IPA 1989 The IPA 1989 Kiel Convention Workgroup 9 report Computer Coding of IPAsymbols and Computer Representation of Individual Languages Journal of the InternationalPhonetic Association 192 81-92

IPA 1993 IPA Chart revised to 1993 Journal of the International Phonetic Association231 [Documento de Internet disponible en httpwwwartsglaacukIPAipacharthtml]

IPA 1995 Preview of the IPA Handbook Journal of the International Phonetic Association251

ISO 8879 1986 Information Processing Text and Office Systems Standard GeneralizedMarkup Language (SGML) Geneva International Organization for Standardization

Johansson S 1995a The approach of the Text Encoding Initiative to the encoding ofspoken discourse Spoken English on Computer Transcription Markup and Applications EdsG Leech G Myers y J Thomas Harlow Longman 82-98

Johansson S 1995b The Encoding of Spoken Texts Computers and the Humanities291 149-158 The Text Encoding Initiative Background and Context Eds N Ide y J VeacuteronisDordrecht Kluwer Academic Publishers 149-158

Keating P P MacEachern A Shryock y S Domiacutenguez 1994 A manual for phonetictranscription Segmentation and labelling of words in spontaneous speech UCLA WorkingPapers in Phonetics 88 91-120

Kluger-Kruse M 1987 Computer Phonetic Alphabet ESPRIT Linguistic Analysis of theEuropean Languages Report BU-CPA0267 July 1987

Krot C y B Taylor 1995 Criteria for Acoustic-Phonetic Segmentation and WordLabelling in the Australian National Database of Spoken Language[Documento de Internet disponible en httpwwwshlrcmqeduaucriteriahtml]

Lander T 1997 The CSLU Labeling Guide Center for Spoken Language UnderstandingOregon Graduate Institute[Documento de Internet disponible en httpwwwcseogieduCSLUcorporapapershtml]

Llisterri J 1994 Prosody Encoding Survey WP 1 Specifications and Standards T15Markup Specifications Deliverable 153 Final version 15 September 1994 LRE Project 62-050MULTEXT

Llisterri J ed 1996 Prosody Tools Efficiency and Failures WP 4 Corpus T46 SpeechMarkup and Validation Deliverable 452 Final version 15 October 1996 LRE Project 62-050MULTEXT

MacWhinney B 1991The CHILDES Project Tools for Analyzing Talk Hillsdale NJLawrence Erlbaum

Marchal A N Nguyen y W Hardcastle 1995 Multitiered phonetic approach to speechlabelling Levels in Speech Communication Relations and Interactions A Tribute to MaxWajskop Hommage agrave Max Wajskop Eds C Sorin J Mariani H Meloni y J SchoengenAmsterdam Elsevier Science BV 149-158

NERC 1994 NERC-1 Network of European Reference Corpora Final Report PisaInstituto di Linguistica Computazionale - CNR January 1994 versioacuten en curso de publicacioacutenTowards a Network of European Reference Corpora Eds N Calzolari M Baker y PG KruytPisa Giardini

Nicolas P y D Hirst 1995 Symbolic coding of Higher-Level Characteristics ofFundamental Frequency Curvesrdquo Eurospeech95 Proceedings of the 4th European Conferenceon Speech Communication and Technology Madrid Spain 18-21 September 1995 Vol 2 989-992

OConnell DC y S Kowal 1994 Some Current Transcription Systems for SpokenDiscourse A critical Analysis Pragmatics 4 81-107

Ochs E 1979 Transcription as Theory Developmental Pragmatics Eds E Ochs E yBB Schieffelin New York Academic Press 43-72

Payne J 1992 Report on the compatibility of JP Frenchs spoken corpus transcriptionconventions with the TEI guidelines for transcription of spoken texts Working paper COBUILDBirmingham and IDS Mannheim December 1992 NERC-WP8WP4-122

Payne J 1995 The COBUILD spoken corpus transcription conventions SpokenEnglish on Computer Transcription Markup and Applications Eds G Leech G Myers y JThomas Harlow Longman 203-207

Payratoacute Ll 1995 Transcripcioacuten del discurso coloquialrdquo El espantildeol coloquial Actas del ISimposio sobre Anaacutelisis del Discurso Oral Almeriacutea 23-25 de noviembre de 1994 Ed L CorteacutesRodriacuteguez Almeriacutea Universidad de Almeriacutea Servicio de Publicaciones 43-70

Pierrehumbert J B 1897 (1980) The Phonology and Phonetics of English IntonationPhD Thesis Department of Linguistics MIT Bloomington Indiana University Linguistics Club

Pitrelli J M Beckman y J Hirschberg 1994 Evaluation of prosodic transcriptionlabelling reliability in the ToBI frameworkrdquo Proceedings of the Third International Conference onSpoken Language Processing Yokohama ICSLP Vol 2 123-126

Pullum GK y WA Ladusaw 1996 (1986) Phonetic Symbol Guide Chicago TheUniversity of Chicago Press 2nd edition

Roach P H Roach A Dew y P Rowlands 1990 Phonetic analysis and the automaticsegmentation and labeling of speech sounds Journal of the International Phonetic Association201 15-21

Schmidt MS C Scott y MA Jack 1993 Phonetic transcription standards for Europeannames (ONOMASTICA) Eurospeech93 3rd European Conference on Speech Communicationand Technology Berlin Germany 21-23 September 1993 Vol 1 279-282

Schuetze-Coburn S 1991Units of intonation in discourse a comparison of acoustic andauditory analysis Language and Speech 343 207-234

Selting M 1987 Descriptive categories for the auditive analysis of intonation inconversation Journal of Pragmatics 11 777-791

Selting M 1988 The role of intonation in the organisation of repair and problem handlingsequences in conversation Journal of Pragmatics 12 293-322

Senia F y JG Van Velden 1997 Specifications of orthographic transcription and lexiconconventions LRE-4001 SpeechDat Technical Report SD132 Final version 10 January 1997[Documento de Internet disponible en httpwwwphonetikuni-muenchendeSpeechDathtml]

Silverman K M Beckman J Pitrelli M Ostendorf C Wightman P Price JPierrehumbert y J Hirschberg 1992 TOBI A standard for labelling English prosodyProceedings of the Second International Conference on Spoken Language Processing ICSLP-92Banff October 1992 867-870

Sinclair J 1994 Spoken Language [3B] PhoneticPhonemic and Prosodic Annotation[52] NERC 1994 NERC-1 Network of European Reference Corpora Final Report PisaVersioacuten en curso de publicacioacuten Towards a Network of European Reference Corpora Eds NCalzolari M Baker y PG Kruyt Pisa Giardini

Sinclair J 1995 From theory to practicerdquo Spoken English on Computer TranscriptionMarkup and Applications Eds G Leech G Myers Y J Thomas Harlow Longman 99- 112

Sperberg-McQueen CM y L Burnard eds 1994 Guidelines for Electronic Text Encodingand Interchange TEI P3 Chicago and Oxford Association for Computational Linguistics Association for Computers and the Humanities Association for Literary and LinguisticComputing [Cap 11 Transcriptions of Speech] [Documento de Internet disponible enhttpetextvirginiaeduTEIhtml]

Strangert E y M Heldner 1995 Labelling of boundaries and prominences byphonetically experienced and non-experienced transcribers Phonum 3 Reports from theDepartment of Phonetics Umearing University 85-109 [Documento de Internet disponible enhttpwwwlingumusefonphonum3html]

Teubert W 1993 Phonetic Phonemic and Prosodic Annotation Final Report IDSMannheim February 1993 NERC-WP8-171

Tillmann HG y B Pompino-Marschall 1993 Theoretical Principles ConcerningSegmentation Labelling Strategies and Levels of Categorical Annotation for Spoken LanguageDatabase Systems Eurospeech93 3rd European Conference on Speech Communication andTechnology Berlin Germany 21-23 September 1993 Vol 3 1691-1694

Trancoso I 1995 The ONOMASTICA Interlanguage Pronunciation LexiconrdquoEurospeech95 Proceedings of the 4th European Conference on Speech Communication andTechnology Madrid Spain 18-21 September 1995 Vol 1 829-832

Wells JC 1987 Computer Coded Phonetic Transcription Journal of the InternationalPhonetic Association 172 94-114

Wells JC 1989 Computer-coded phonemic notation of individual languages of theEuropean Community Journal of the International Phonetic Association 191 31-54

Wells JC 1994 Computer-coding the IPA a proposed extension of SAMPA SpeechHearing and Language Work in Progress 1994 (University College London Department ofPhonetics and Linguistics) 8 271-289

Wells JC 1995 SAMPROSA (SAM Prosodic Transcription [Documento de Internetdisponible en httpwwwphonuclacukhomesampasamprosahtm]

Wells JC W Barry M Grice A Fourcin y D Gibbon 1992 Standard Computer-Compatible Transcription SAM Stage Report Sen3 SAM UCL-037 28 February 1992 SAM(1992) Esprit Project 2589 (SAM) Multilingual Speech InputOutput AssessmentMethodologyand Standardisation Final Report Year Three 1III91-28II1992 London University CollegeLondon

Wesenick M-B y F Schiel 1995 Feasibility of Automatic Annotation and BuildingPronunciation Lexica from Corpus Material LRE-63314 SpeechDat Report D3123 Finalversion 10 October 1995[Documento de Internet disponible en httpwwwicpgrenetfrSpeechDathomehtml]

Winski R R Moore y D Gibbon 1995 EAGLES Spoken Language Working GroupOverview and Resultsrdquo Eurospeech95 Proceedings of the 4th European Conference on SpeechCommunication and Speech Technology Madrid Spain 18-21 September 1995 Vol 1 841-844[Documento de Internet disponible en httpcoralliliuni-bielefeldde~gibbonEAGLESrwpaperrwpaperhtml]

  • 1- INTRODUCCIOacuteN
  • 2- NIVELES DE REPRESENTACIOacuteN ETIQUETADO Y CODIFICACIOacuteN
  • 3- REPRESENTACIOacuteN ORTOGRAacuteFICA DE CORPUS ORALES
  • 31- Propuestas para la representacioacuten ortograacutefica de corpus orales en el aacutembito de la linguumliacutestica de corpus
  • 32- Propuestas para la representacioacuten ortograacutefica de corpus orales en el aacutembito de las tecnologiacuteas del habla
  • 4- REPRESENTACIOacuteN FONEacuteTICA DE CORPUS ORALES
  • 41- La representacioacuten foneacutetica de los elementos segmentales
  • 42- La representacioacuten foneacutetica de los elementos suprasegmentales
  • 5- ETIQUETADO FONEacuteTICO DE CORPUS ORALES
  • 51- Niveles de etiquetado foneacutetico de corpus orales
  • 52- La transcripcioacuten y el etiquetado automaacutetico de corpus orales
  • 6- TRANSCRIPCIOacuteN Y CODIFICACIOacuteN DE CORPUS PARA EL ANAacuteLISIS DE LA LENGUA ORAL
  • 61- Los requisitos de una transcripcioacuten
  • 62- Propuestas de estandarizacioacuten para la transcripcioacuten y codificacioacuten de corpus orales
  • 7- CONCLUSIONES
  • BIBLIOGRAFIacuteA
Page 8: Transcripción, etiquetado y codificación de corpus orales

niveles ser compatible con el intercambio electroacutenico de datos y cubrir las necesidades del mayornuacutemero de lenguas posible pudiendo aplicarse automaacuteticamente en lugar de basarse en lasimpresiones intuitivas del transcriptor con vistas a la transcripcioacuten de grandes corpus Enausencia de un sistema que reuacutena tales caracteriacutesticas parece adecuado establecer mecanismos decompatibilidad entre los existentes a fin de facilitar la reutilizacioacuten de los datos

El AFI ofrece ademaacutes de la posibilidades de transcripcioacuten segmental un conjunto desiacutembolos para la representacioacuten de los elementos suprasegmentales Con motivo del congresopara la revisioacuten del AFI celebrado en Kiel en 1989 se creoacute un grupo de trabajo sobre categoriacuteassuprasegmentales (Bruce 1988 1989) concluyeacutendose la necesidad de representar las categoriacuteassuprasegmentales de un modo maacutes adecuado especialmente en lo que se refiere la entonacioacuten Elconjunto actual de siacutembolos del AFI para los elementos suprasegmentales permite transcribir eltono asiacute como la duracioacuten y el acento

Las necesidades derivadas de una descripcioacuten detallada de la entonacioacuten tanto en el campode la foneacutetica como en el de las tecnologiacuteas del habla han propiciado la creacioacuten de diversossistemas de transcripcioacuten prosoacutedica algunos de los cuales se presentan a continuacioacuten

En el marco del proyecto ESPRIT SAM anteriormente mencionado se llevoacute tambieacuten a caboel desarrollo de sistemas de transcripcioacuten prosoacutedica compatibles con las necesidades de anotacioacutende bases de datos en soporte electroacutenico resultando de ello propuestas como PROSPASAMSINT o SAMPROSA (Gibbon 1989 Wells et al 1992) PROSPA fue originalmenteconcebido por Selting y Gibbon (Selting 1987 1988) para el anaacutelisis de la conversacioacuten y deldiscurso y por tal motivo se basa en criterios auditivos recogiendo uacutenicamente los elementosnecesarios para este fin Por su parte SAMSINT (SAM System for Intonation Transcription) seplantea como objetivo la transcripcioacuten de contornos meloacutedicos en el interior de unidadesentonativas basaacutendose en INTSINT - presentado maacutes adelante - con algunas modificacionesadicionales

A pesar de la coexistencia de los sistemas anteriormente mencionados en el proyecto SAMprobablemente el conjunto de siacutembolos maacutes extendido actualmente para la transcripcioacutenprosoacutedica sea SAMPROSA (SAM Prosodic Alphabet) propuesto inicialmente por Gibbon(1989) y desarrollado por Wells et al (1992) hasta llegar a su forma actual (Wells 1995)SAMPROSA ofrece al igual que SAMPA un conjunto de caracteres correspondientes a coacutedigosASCII mediante los cuales es posible transcribir tonos globales locales terminales y nucleares laduracioacuten el acento la pausas y las fronteras entre unidades prosoacutedicas Aunque presenta rasgoscaracteriacutesticos de la tradicioacuten britaacutenica de anaacutelisis de la entonacioacuten como por ejemplo lacodificacioacuten de tonos nucleares es un sistema que se plantea como adecuado para la transcripcioacutende diversas lenguas

En el aacutembito americano ToBI (Tone and Break Index) se desarrolloacute para cubrir al mismotiempo las necesidades de la descripcioacuten foneacutetica y de la anotacioacuten de corpus adecuados aldesarrollo de sistemas de tecnologiacuteas del habla (Silverman et al 1992 Beckman y Hirschberg1994 Beckman y Ayers 1994) Basado en el ingleacutes americano ToBI permite principalmente latranscripcioacuten de patrones entonativos partiendo de un anaacutelisis de la curva meloacutedica representadacomo evolucioacuten temporal de la frecuencia fundamental mediante herramientas de anaacutelisis y

etiquetado como el programa Wavestrade Sin embargo se han definido tambieacuten convenciones parala anotacioacuten de textos representados ortograacuteficamente Una transcripcioacuten utilizando ToBI constade cuatro niveles

bull Representacioacuten ortograacutefica del enunciadobull Nivel de iacutendices de ruptura (break index) en el que se introducen los indicadores

de liacutemite que marcan las fronteras entre las unidades meloacutedicas estableciendo cuatro gradosde cohesioacuten entre las mismas

bull Nivel tonal en el que se marcan los denominados ldquoeventos tonalesrdquo (pitch events)divididos en tonos de frase al principio y al final de las unidades meloacutedicas y en acentostonales (pitch accent) en las siacutelabas en las que se produce un movimiento de la frecuenciafundamental

bull Nivel miscelaacuteneo que facilita por ejemplo introducir los comentarios deltranscriptor

Para cada uno de los niveles se define un conjunto de siacutembolos alineados temporalmentecon los fenoacutemenos entonativos transcritos si se dispone de una herramienta adecuada comoWavestrade

Las criacuteticas que se realizan maacutes frecuentemente a ToBI son por una parte su dependenciadel modelo fonoloacutegico desarrollado por Pierrehumbert (1980) y por otra su mejor adaptacioacuten alingleacutes que a otras lenguas lo que explicariacutea su amplia utilizacioacuten en Estados Unidos Sin embargose han realizado trabajos en italiano alemaacuten huacutengaro y espantildeol entre otras lenguas usando ToBIcomo sistema de representacioacuten Un inconveniente maacutes importante es que la anotacioacuten medianteToBI requiere un cierto conocimiento previo de los patrones entonativos de la lengua Aun asiacute esun sistema que ofrece indudables ventajas como pueden ser su estructura jeraacuterquica que permiteseleccionar entre subconjuntos o conjuntos mayores de siacutembolos la posibilidad de representarproblemas que aparecen en la transcripcioacuten y el hecho de que existan experimentos demostrandoun alto grado de acuerdo entre transcriptores diferentes (Pitrelli et al 1994)

En el Institute for Perception Research (IPO Eindhoven) se ha desarrollado una teoriacutea sobrela entonacioacuten basada en el modelado de contornos entonativos consistentes en representacionesestilizadas perceptivamente equivalentes al contorno original (lsquot Hart et al 1990) Esta teoriacutea hallevado tambieacuten a la formalizacioacuten de un sistema de representacioacuten de la curva meloacutedica definidacomo un conjunto de movimientos tonales que se agrupan en secuencias de configuracionestonales la agrupacioacuten de estas configuraciones da lugar a su vez a contornos meloacutedicosdefinieacutendose los patrones entonativos en funcioacuten de agrupaciones similares de contornosmeloacutedicos Un sistema jerarquizado de esta naturaleza permite una representacioacuten de la curvameloacutedica adecuada para la transcripcioacuten prosoacutedica aunque que inicialmente no haya sido disentildeadopara tales fines

El objetivo de INTSINT (International Transcription System for Intonation) en cambio esproporcionar un sistema para la comparacioacuten interlinguumliacutestica de sistemas prosoacutedicosDesarrollado por Hirst (1991 Hirst y Di Cristo en prensa Hirst Di Cristo y Espesser enprensa) en el marco de un proyecto de anaacutelisis automaacutetico de la entonacioacuten INTSINT se basa en

la estilizacioacuten de la curva meloacutedica realizada a partir de una interpolacioacuten entre puntos en los quese da un cambio significativo en el valor de la frecuencia fundamental (target points) Estospuntos que podriacuteamos denominar ldquode inflexioacutenrdquo - definidos como la combinacioacuten de un valortemporal y un valor frecuencial - son susceptibles de codificarse automaacuteticamente mediante lossiacutembolos de INTSINT previa introduccioacuten de marcas de frontera entre las unidades entonativasCon ello se obtiene una representacioacuten fonoloacutegica del contorno meloacutedico simbolizando losdiferentes niveles tonales de la curva original El sistema se basa en la representacioacuten desecuencias tonales consideradas tanto desde una perspectiva global en funcioacuten del rango devariacioacuten tonal del hablante como desde un punto de vista local en relacioacuten con la altura de puntosde inflexioacuten anteriores En el primer caso se definen tres niveles T (Top) M (Mid) y B (Bottom)mientras que en el segundo se marcan cinco posibilidades H (Higher) L (Lower) S (Same) U(Upstep) o D (Downstep) El proceso de modelizacioacuten necesario para transcribir medianteINTSINT ha sido aplicado a varias lenguas (Hirst et al 1993) y se emplea tambieacuten para laanotacioacuten prosoacutedica de parte del corpus EUROM en franceacutes ingleacutes alemaacuten sueco y espantildeol(Hirst et al 1994 Llisterri ed 1996) llevada a cabo en el marco del proyecto LRE 62-050MULTEXT - Multilingual Text Tools and Corpora Es posible tambieacuten aplicar INTSINT aniveles maacutes altos como el paacuterrafo tal como se muestra en Nicolas y Hirst (1995)

5- ETIQUETADO FONEacuteTICO DE CORPUS ORALES

Al igual que en el caso de los corpus textuales una vez recogidos los materiales de base deun corpus oral debe llevarse a cabo un tratamiento de los mismos que permita su utilizacioacutenposterior El primer paso suele ser la transcripcioacuten ortograacutefica que en determinado tipo de corpusse acompantildea de una transcripcioacuten foneacutetica o fonoloacutegica A continuacioacuten a cada segmento de laonda sonora se le asocia una etiqueta (labelling) que lo define en teacuterminos foneacuteticos o fonoloacutegicosy se lleva a cabo la alineacioacuten (alignment) entre la sentildeal sonora y las etiquetas obteniendo unarepresentacioacuten que puede compararse a la partitura musical de una obra para voz y orquesta Elproceso de etiquetado segmental puede llevarse a cabo a varios niveles como veremos en esteapartado y completarse con una anotacioacuten de las caracteriacutesticas suprasegmentales codificadasseguacuten los diversos sistemas que hemos expuesto anteriormente Si se cumplen las etapasmencionadas se llega a disponer de un corpus que contiene la sentildeal sonora sincronizada con latranscripcioacuten ortograacutefica y con la transcripcioacuten foneacutetica o fonoloacutegica de modo que una vezdefinida una estructura de base de datos es posible consultar el corpus partiendo de etiquetasfoneacuteticas de marcas prosoacutedicas o de la transcripcioacuten ortograacutefica al tiempo que se accede a lagrabacioacuten correspondiente

Los corpus de lengua oral que consisten uacutenicamente en transcripciones ortograacuteficas - ya queno suele ser factible realizar una transcripcioacuten foneacutetica completa de un nuacutemero elevado de horasde grabacioacuten - conllevan un procesamiento menos complejo aunque en algunos casos contienenmarcas prosoacutedicas uacutetiles para el anaacutelisis del discurso o de la conversacioacuten como veremos en elapartado 6

51- Niveles de etiquetado foneacutetico de corpus orales

Una cuestioacuten que se plantea inevitablemente a la hora de introducir informacioacuten adicionalsobre los datos recogidos es el nivel de etiquetado del corpus Se han realizado varias propuestassobre los distintos niveles en los que se puede realizar el etiquetado foneacutetico de un corpusalgunas de ellas ligadas al proyecto SAM como la de Barry y Fourcin (1992) en la que seplantean cinco niveles posibles de etiquetado foneacutetico de un corpus

bull Nivel fiacutesico en el que se etiquetan las propiedades acuacutesticas presentes en la sentildealsonora

bull Nivel acuacutestico-foneacutetico en el que se marcan las propiedades de los segmentos enteacuterminos de categoriacuteas foneacuteticas como oclusioacuten friccioacuten sonoridad nasalizacioacuten etc

bull Nivel de transcripcioacuten estrecha en el que se caracterizan los segmentos utilizandolos siacutembolos del AFI o de sus equivalentes computacionales

bull Nivel de transcripcioacuten fonoloacutegica (o foneacutemica) sentildealando uacutenicamente aquelloselementos funcionalmente distintivos que se encuentran en la palabra pronunciadaaisladamente en un estilo cuidado (citation form)

bull Nivel de transcripcioacuten ancha en el que se utilizan los siacutembolos correspondientes alos elementos fonoloacutegicos en una lengua dada para transcribir realizaciones alofoacutenicascondicionadas por el contexto3

A estos cinco niveles debe antildeadirse auacuten la anotacioacuten prosoacutedica considerada de formaindependiente por los autores de la propuesta

Una propuesta similar de etiquetado tambieacuten en cinco niveles - caracteriacutesticas acuacutesticas denaturaleza subfoneacutemica caracteriacutesticas segmentales realizaciones foneacuteticas forma canoacutenica de laspalabras y transcripcioacuten ortograacutefica - se presenta en Tillmann y Pompino-Marschall (1993) y hasido utilizada con eacutexito en el proyecto alemaacuten PhonDat Igualmente pueden verse las propuestasde Autesserre et al (1989) enmarcadas en el contexto del proyecto SAM y los trabajos deMarchal et al (1995) o Roach et al (1990)

La transcripcioacuten y el etiquetado de corpus orales se ha abordado en el marco del proyectoEAGLES desde una doble perspectiva la de la foneacutetica y las tecnologiacuteas del habla en el Grupo deTrabajo sobre Lengua Oral y desde la de la linguumliacutestica de corpus en el marco de las actividades delGrupo de Trabajo sobre Corpus Textuales El trabajo llevado a cabo en el grupo dedicado a lalengua hablada en EAGLES recoge esencialmente las propuestas desarrolladas en el marco deSAM y de PhonDat Los niveles de etiquetado propuesto son los siguientes (Gibbon Moore yWinski eds 1997)

bull Nivel ortograacutefico en el que se utiliza la representacioacuten ortograacutefica convencional

3 La distincioacuten entre los dos uacuteltimos niveles puede ejemplificarse con el caso de las asimilaciones mientras que enla transcripcioacuten ancha encontrariacuteamos [um poko] (un poco) en el caso de una transcripcioacuten fonoloacutegica apareceriacutea [unpoko] si se opta por no simbolizar archifonemas en la transcripcioacuten En cambio [mismo] se representariacutea de lamisma forma en ambos niveles encontraacutendose la transcripioacuten [mizmo] en el nivel de transcripcioacuten estrecha

bull Nivel de formas canoacutenicas (citation form) representando la forma depronunciacioacuten aislada de las palabra en estilo cuidado

bull Nivel de transcripcioacuten ancha o fonotiacutepica en este nivel se utilizan los siacutembolosque representan elementos fonoloacutegicos en una lengua dada pero al igual que en lapropuesta de Barry y Fourcin se transcriben aquellos fenoacutemenos predictibles propios dela foneacutetica sintaacutectica SAMPA seriacutea pues un alfabeto foneacutetico adecuado para este nivelde transcripcioacuten

bull Nivel de transcripcioacuten estrecha basado en una representacioacuten alofoacutenica de lasrealizaciones foneacuteticas de los hablantes para el cual puede utilizarse un alfabeto foneacuteticocomo X-SAMPA

bull Nivel acuacutestico-foneacutetico en el que se distinguen caracteriacutesticas acuacutesticas de lossegmentos observables en una representacioacuten de la onda sonora

bull Nivel fiacutesico representado en teacuterminos de paraacutemetros acuacutesticos o articulatoriosbull Fenoacutemenos no linguumliacutesticos la inclusioacuten de este nivel permite representar sonidos

de naturaleza comunicativa o no introducidos por el hablante asiacute como toda aquellainformacioacuten paralinguumliacutestica que se considere de intereacutes tambieacuten permite sentildealas los ruidosexternos en la grabacioacuten

Vale la pena detenerse brevemente en el nivel de las formas canoacutenicas y en el concepto deldquotranscripcioacuten fonotiacutepicardquo que como puede verse aparecen de forma recurrente en diversaspropuestas La inclusioacuten de forma canoacutenicas en el etiquetado de un corpus responde a un doblemotivo especialmente ligado a necesidades tecnoloacutegicas en primer lugar estas formas permitenderivar automaacuteticamente mediante un conjunto de reglas una transcripcioacuten ancha o fonotiacutepica enla que se incluyen los elementos alofoacutenicos cuya aparicioacuten esta condicionada por el contextofoneacutetico en segundo lugar a partir de las formas canoacutenicas puede crearse de forma automaacutetica undiccionario foneacutetico partiendo de un corpus transcrito (Wesenick y Schiel 1995 Senia y vanVelden 1997) lo que tiene utilidad para el desarrollo de sistemas de siacutentesis y reconocimiento delhabla y tambieacuten para la descripcioacuten linguumliacutestica La transcripcioacuten denominada ldquofonotiacutepicardquo en lostrabajos de SAM constituye un nivel intermedio entre la realizacioacuten foneacutetica y la transcripcioacutenpuramente fonoloacutegica Por otra parte el nivel de transcripcioacuten de formas canoacutenicas estaacutedirectamente relacionado con la representacioacuten ortograacutefica facilitando asiacute la transcripcioacuten foneacuteticaautomaacutetica de corpus en este nivel mediante el desarrollo de los correspondientes sistemas dereglas

En el informe del Grupo de Trabajo de Corpus Textuales de EAGLES (EAGLES 1996) seintenta realizar una siacutentesis entre las necesidades de diversos campos de estudio Se sugieren porello tres niveles de representacioacuten

bull S1 representacioacuten ortograacutefica del textobull S2 representacioacuten fonoloacutegica de las palabras en su forma canoacutenicabull S3 transcripcioacuten foneacutetica consistente en una representacioacuten simboacutelica discreta de

la realizacioacuten del enunciado tal como es percibido por el transcriptor

Como puede observarse estos tres niveles encuentran su equivalente en los nivelespropuesto por Barry y Fourcin (1992) y en los definidos por el Grupo de Trabajo de Lengua

Oral Para la transcripcioacuten del nivel S2 puede utilizarse SAMPA mientras que la del nivel S3requiere el uso de un alfabeto foneacutetico como X-SAMPA

52- La transcripcioacuten y el etiquetado automaacutetico de corpus orales

La tarea de transcribir y etiquetar foneacuteticamente un corpus oral representa un considerableesfuerzo tanto en teacuterminos de tiempo como de los recursos econoacutemicos necesarios para llevar acabo esta labor El etiquetado manual requiere por otro lado el desarrollo de convencionesdetalladas para asegurar la consistencia entre diversos transcriptores (Keating et al 1994 Krot yTaylor 1995 Lander 1997) ademaacutes del establecimiento de un proceso de validacioacutencomprobando la fiabilidad de los resultados obtenidos (Eisen 1993 Cole et al 1994 Strangert yHeldener 1995) Por estos motivos uno de los intereses principales de los investigadores en elcampo de las tecnologiacuteas del habla ha sido llevar a cabo el etiquetado de forma semi-automaacutetica oidealmente automaacutetica Un primer nivel de transcripcioacuten - tanto de formas canoacutenicas comofonotiacutepica - puede obtenerse automaacuteticamente como acabamos de mencionar a partir de larepresentacioacuten ortograacutefica si se dispone de un conjunto de reglas que establezcan lascorrespondencias entre la representacioacuten ortograacutefica y la foneacutetica

Sin embargo un etiquetado foneacutetico en los niveles de transcripcioacuten maacutes detallada requiere laposibilidad de acceder a la onda sonora y un procedimiento de anaacutelisis de la sentildeal La primeraoperacioacuten que debe realizar un sistema de etiquetado automaacutetico es la segmentacioacuten del continuumsonoro en unidades menores - segmentos o caracteriacutesticas acuacutesticas en funcioacuten del nivel detranscripcioacuten deseado - para pasar despueacutes a la asignacioacuten de etiquetas - siacutembolos detranscripcioacuten - que describan sus caracteriacutesticas Este es el proceso conocido propiamente comoetiquetado (labelling) que cuando se realiza de forma automaacutetica debe superar los obstaacuteculosderivados de la naturaleza no discreta de la sentildeal sonora - resultado de mecanismos como lacoarticulacioacuten - y de la variabilidad de realizaciones foneacuteticas entre hablantes o incluso en unmismo hablante

Para que el corpus sea uacutetil el etiquetado foneacutetico debe estar temporalmente sincronizadocon la sentildeal sonora y con la representacioacuten ortograacutefica operacioacuten que se realiza en el procesoconocido como alineacioacuten temporal (time alignment) llevado a cabo tambieacuten de forma automaacuteticaEsta alineacioacuten puede hacerse de un modo global sentildealando en la onda sonora las fronteras entrepalabras ortograacuteficas - para facilitar el acceso a la grabacioacuten a partir de este nivel de representacioacuten(Lander 1997) - o los puntos en los que se encuentran siacutelabas acentuadas tal como sucede porejemplo en el proyecto MULTEXT

En el campo de las tecnologiacuteas del habla se han llevado a cabo numerosiacutesimos trabajosencaminados al disentildeo de sistemas de segmentacioacuten etiquetado y alineacioacuten temporal automaacuteticasde corpus orales utilizando las teacutecnicas propias del reconocimiento del habla como los Modelosde Markov o las redes neuronales Cabe destacar que tales teacutecnicas no soacutelo son uacutetiles en eldesarrollo de corpus en este aacutembito sino que constituyen una herramienta importante en otrostipos de corpus sin embargo es preciso reconocer que el habla espontaacutenea - especialmente si seha recogido mediante grabaciones realizadas en un entorno natural - plantea auacuten problemas en lo

que se refiere a su transcripcioacuten y etiquetado automaacuteticos pese a los notabiliacutesimos avances quetienen lugar en este campo

6- TRANSCRIPCIOacuteN Y CODIFICACIOacuteN DE CORPUS PARA EL ANAacuteLISIS DE LA LENGUA ORAL

En este uacuteltimo apartado incidiremos en las cuestiones relacionadas con la transcripcioacuten ycodificacioacuten de corpus orales que pueden presentar un mayor intereacutes para aacutembitos como elanaacutelisis de discurso o de la conversacioacuten y para el estudio de la lengua oral en todos los niveles dela descripcioacuten linguumliacutestica Como indicaacutebamos al principio la transcripcioacuten y la codificacioacuten de loselementos transcritos son en principio dos operaciones conceptualmente diferentes Sinembargo en la praacutectica habitual en las disciplinas a las que se refiere este apartado suelen ser dosoperaciones que se realizan simultaacuteneamente ya que al mismo tiempo que se realiza latransliteracioacuten se introducen las marcas necesarias para la codificacioacuten de los elementos que se hadecidido introducir en el corpus Por ello en muchos casos la discusioacuten sobre la transcripcioacuten y lacodificacioacuten se realiza conjuntamente en la bibliografiacutea sobre el tema

61- Los requisitos de una transcripcioacuten

El investigador que decide constituir un corpus de lengua oral se encuentra en estosmomentos con una gran variedad de criterios en lo que se refiere a la transcripcioacuten y a la seleccioacutende los elementos que apareceraacuten codificados en el corpus Hemos hecho ya referencia en elapartado 3 a las diversas convenciones para la representacioacuten ortograacutefica y cintildeeacutendonos al aacutembitodel anaacutelisis del discurso y la conversacioacuten constatamos igualmente la existencia una grandiversidad de propuestas En una revisioacuten de las mismas Payratoacute (1995) hace por ejemploreferencia a los sistemas de transcripcioacuten y codificacioacuten procedentes de la etnometodologiacuteainteresados en reflejar la interaccioacuten verbal a los meacutetodos desarrollados en el marco de laetnografiacutea de la comunicacioacuten y de la sociolinguumliacutestica interaccional4 o a propuestas utilizadas en elestudio del lenguaje infantil Ante tal situacioacuten parece conveniente plantearse cuaacuteles son losrequisitos que debe cumplir una transcripcioacuten de la lengua oral tema que ha sido abordado pordiversos autores (DuBois 1991 Elich 1993 Edwards 1993 OrsquoConnell y Kowal 1994) Trasrevisar aportaciones anteriores Payratoacute (1995) resume los requisitos que teoacutericamente deberiacuteanexigirse a toda transcripcioacuten

bull Neutralidad o fidelidad de modo que la transcripcioacuten no sea interpretativabull Globalidad o complejidad recogiendo la totalidad de los fenoacutemenos que aparecen

en el discurso oralbull Omnifuncionalidad permitiendo diversos usos y aplicacionesbull Claridad tanto desde el punto de vista del aprendizaje del sistema como de la

legibilidad de la representacioacutenbull Universalidad y compatibilidad entre sistemas informaacuteticos

4 Estos sistemas se comparan en OrsquoConnell y Kowal (1994) Pueden encontrarse consideraciones generales sobre latranscripcioacuten y codificacioacuten de la lengua oral en el anaacutelisis del discurso y la conversacioacuten en 1995Ochs (1979) DuBois (1991) Edwards (1992 1993 1995) Du Bois et al (1993) Gumperz y Berenz (1993) Cook (1995) Chafe(1995) y en Sinclair (1995)

Sin embargo puesto que en la praacutectica se transcribe en funcioacuten de los objetivos para losque se ha definido el corpus Payratoacute (1995) considera que un sistema de transcripcioacuten debe serante todo interpretativo de los datos selectivo en cuanto a los fenoacutemenos que se transcribenpertinente para el objeto de investigacioacuten coherente con la base teoacuterica adoptada por elinvestigador fiel en cuanto a la representacioacuten de los datos y flexible para que sea posible suutilizacioacuten en diversos estudios Por otra parte en opinioacuten de este autor la simbologiacutea utilizadadebe ser clara econoacutemica sencilla exenta de ambiguumledad y compatible con sistemas internacionesestandarizados Este uacuteltimo aspecto nos parece especialmente importante ya que como sentildeala elmismo Payratoacute (1995 58)

[] en ninguacuten caso puede olvidarse que los datos de una investigacioacuten no deberiacutean sertratados nunca de forma tan parcial o idiosincraacutesica que se impidiera o dificultara el uso por partede otros investigadores La transcripcioacuten del discurso oral es una actividad suficientementecostosa y conflictiva para tomar precauciones en este sentido y ninguna comunidad cientiacuteficapuede permitirse el lujo de particularismos (en aspectos tan elementales) que obstruyan el debateo conviertan en inaprovechables una fuente de informacioacuten

62- Propuestas de estandarizacioacuten para la transcripcioacuten y codificacioacuten de corpus orales

Ante la diversidad de propuestas para la transcripcioacuten y codificacioacuten de la lengua oral queacabamos de constatar el surgimiento de la linguumliacutestica de corpus y muy especialmente lasnecesidades derivadas del intercambio electroacutenico de textos propiciaron la aparicioacuten de proyectose iniciativas centrados en la creacioacuten de estaacutendares tanto en lo que se refiere a la transcripcioacutencomo a la codificacioacuten En los proacuteximos apartados revisamos sucintamente algunos de ellos

Uno de los capiacutetulos de las Guiacuteas desarrolladas por la TEI estaacute dedicado a la transcripcioacutende corpus orales (Johansson 1995a b) En eacutel se describe la estructura baacutesica de la representacioacutende un texto oral - cabecera texto y divisiones - y se definen los procedimientos basados enSGML para la representacioacuten de los elementos estructurales baacutesicos informacioacuten contextualinformacioacuten temporal enunciados pausas elementos vocalizados semi-leacutexicos o no leacutexicoselementos kineacutesicos otros tipos de eventos comunicativos y texto presentado en forma escrita alhablante Tambieacuten se ofrecen en este capiacutetulo indicaciones para la segmentacioacuten y el alineamientoasiacute como recomendaciones para la transcripcioacuten de superposiciones entre hablantes de formas depalabras prosodia elementos paralinguumliacutesticos - tempo intensidad rango tonal tensioacuten ritmo ycalidad de voz - y alteraciones en el decurso foacutenico Para la representacioacuten de la informacioacutenfoneacutetica se recomienda el uso del AFI En la siguiente tabla se resumen los principales elementospropuestos por la TEI para la codificacioacuten de corpus orales considerados especiacuteficos de este tipode texto (Sperberg-McQueen y Burnard eds 1994)

Elemento codificado Marca decodificacioacutenen SGML

Definicioacuten

Divisiones (division) ltdivgt Unidades intermedias entre el texto y el enunciado que permitendelimitar partes diferenciadas en un texto

Enunciado (utterance) ltugt Segmento de habla comprendido entre dos pausas o delimitado porun cambio en el turno de palabra puede incluir ademaacutesinformacioacuten sobre la superposicioacuten (ltoverlapgt) de turnos cuando

interviene simultaacuteneamente maacutes de un hablantePausa (pause) ltpausegt Interrupcioacuten de la fonacioacuten percibida entre dos enunciados o en el

interior de los mismos puede describirse en teacuterminos relativos oindicando su duracioacuten

Vocal (vocal) ltvocalgt Elemento vocalizado semi-leacutexico o no leacutexico (pej pausas llenas otoses)

Kineacutesico (kinesic) ltkinesicgt Cualquier fenoacutemeno comunicativo no vocal (p ej gestos)Acontecimiento (event) lteventgt Cualquier fenoacutemeno identificado en la grabacioacuten no necesariamente

vocalizado ni con valor comunicativo (p ej ruidos de fondo)Texto escrito (writing) ltwritinggt Texto escrito que se presenta al hablante durante su intervencioacutenCambio (shift) ltshiftgt Momento en el que se produce un cambio en alguno de los rasgos

paralinguumliacutesticos - calidad de voz intensidad rango tonal ritmo yvelocidad de elocucioacuten - cada uno de los rasgos puede describirsemediante una lista de caracteriacutesticas

Tabla 1 Elementos codificados en las transcripciones de lengua oral seguacuten los estaacutendares de la TEI(Adaptada de Sperberg-McQueen y Burnard eds1994)

Por otra parte la TEI ofrece mecanismos para indicar el comienzo y el final de unfenoacutemeno su duracioacuten y su sincronizacioacuten temporal con otros elementos presenta tambieacuten laposibilidad de marcar unidades inferiores al enunciado - segmentos ltseggt - que permitendelimitar por ejemplo unidades prosoacutedicas e incluye tambieacuten entre sus propuestas las marcasnecesarias para sentildealar fenoacutemenos propios de la lengua hablada como palabras truncadasrepeticiones falsos principios - marcados como ltdelgt (deletion) y especificando el fenoacutemeno -Las partes de la grabacioacuten que el transcriptor no llega a interpretar correctamente - ltuncleargt - ono puede escuchar - ltgapgt - o las correcciones de errores de produccioacuten realizadas por eltranscriptor - ltsicgt para delimitar el error y ltcorrgt para indicar la correccioacuten - son tambieacutenelementos para los cuales la TEI establece marcas de codificacioacuten

Aunque las Guiacuteas de la TEI pueden considerarse un sistema adecuado para la transcripcioacuteny codificacioacuten de gran variedad de materiales los autores propios autores reconocen que

[] the present proposals are not intended to support unmodified every variety of researchundertaken upon spoken material now or in the future some discourse analysts phonologistsand doubtless other may wish to extend the scheme presented here to express more precisely theset of distinctions they wish to draw in their transcriptions Speech regarded as a purely acousticphenomenon may well require different methods from those outlined here as may speechregarded solely as a process of social interaction (Sperberg-McQueen y Burnard eds 1994 cap11)

El proyecto NERC - Network of European Reference Corpora (NERC 1994) se planteoacutecomo uno de sus objetivos la viabilidad de desarrollar una serie de recomendaciones para laconstitucioacuten de corpus y por tanto incluye entre sus resultados indicaciones sobre el tratamientode los corpus orales tanto en lo que se refiere a su codificacioacuten como a la transcripcioacuten de loselementos segmentales y suprasegmentales (Sinclair 1994) El sistema adoptado para latranscripcioacuten y codificacioacuten de corpus se basa como hemos indicado anteriormente en eldesarrollado por French (1991 1992) para la transcripcioacuten del corpus oral desarrollado en elproyecto COBUILD La transcripcioacuten se plantea como una operacioacuten que puede desarrollarse envarios niveles

bull Nivel I consiste en la representacioacuten ortograacutefica introduciendo los miacutenimossignos de puntuacioacuten necesarios sin informacioacuten sobre la interaccioacuten entre hablantes Eneste nivel se contemplan convenciones desarrolladas para la representacioacuten ortograacutefica ypara precisar el uso de la puntuacioacuten

bull Nivel II consiste en una representacioacuten ortograacutefica enriquecida con informacioacutenbaacutesica sobre la identidad de los hablantes el turno de palabra y los elementos no verbales

bull Nivel III contiene toda la informacioacuten presente en el nivel II ademaacutes deinformacioacuten sobre la interaccioacuten entre hablantes - marcando el principio y el final de lossolapamientos - y sobre la entonacioacuten - sentildealando las fronteras entre unidades tonales ylas siacutelabas acentuadas- En opinioacuten de French (1992) la transcripcioacuten a este nivel requiereuna formacioacuten especiacutefica en foneacutetica

bull Nivel IV constituye el nivel maacutes detallado de representacioacuten incluyendo lainformacioacuten propia del nivel III junto con marcas de tonos siacutelabas nucleares y con unatranscripcioacuten fonoloacutegica alineada con una representacioacuten acuacutestica - espectrograma y curvameloacutedica - del enunciado

La recomendacioacuten del proyecto NERC es que la transcripcioacuten de un corpus para el estudiode la lengua oral se lleve a cabo seguacuten las especificaciones del Nivel II adecuado seguacuten Frenchpara todas aquellas investigaciones que no requieran informacioacuten prosoacutedica

En el marco de NERC se llevoacute tambieacuten a cabo una evaluacioacuten de las Guiacuteas de la TEI para latranscripcioacuten de corpus orales de la que se concluye que ldquoThe TEI proposals are broadlycompatible with current practice in the user community as represented by JP Frenchconventions Furthermore in the majority of cases it will be a straightforward matter to link themachine-friendly TEI codes to the more user-friendly encoding systems such as JP Frenchconventions by means of a simple conversion programmerdquo (Payne 199260) La idea de unaconversioacuten automaacutetica entre las transcripciones realizadas seguacuten las propuestas de NERC y de laTEI es naturalmente interesante y refuerza la idea de que existe una compatibilidad general entreambos sistemas (Payne 1992 Johansson 1995a EAGLES 1996) prueba de ello es que en elinforme final de NERC se recomienda el uso de las normas de la TEI

Uno de los objetivos del Grupo de Trabajo sobre Textos Orales de EAGLES fue proponerun conjunto miacutenimo de fenoacutemenos que deberiacutean codificarse en cualquier texto oral La propuestarealizada se describe en EAGLES (1996) y toma elementos del proyecto NERC de la TEI y delGrupo de Trabajo sobre Lengua Oral de EAGLES Considerando los elementos comunes a lossistemas que sirven de base se sugiere que la codificacioacuten de un texto oral debe contener almenos informacioacuten sobre los siguientes aspectos

(1) Elementos vocales y no vocalesbull Elementos vocales semi-leacutexicos

Pertenecen a esta categoriacutea los elementos utilizados principalmente en elhabla espontaacutenea durante los momentos en que el hablante planifica lacontinuacioacuten de su discurso como las llamadas ldquopausas llenasrdquo o ldquosonorasrdquo y los

elementos que marcan dudas en el momento de la produccioacuten del hablaCorresponden a los elementos que en la TEI se marcan con la etiqueta ltvocalgtbull Elementos vocales no leacutexicos

Se incluyen aquiacute todo tipo de sonidos producidos por el hablante - tosesrisas bostezos estornudos etc - que no constituyen formas leacutexicas de la lenguaCorresponden igualmente a los codificados con la marca ltvocalgt en la TEIbull Acontecimientos no vocales y no comunicativos

Comprenden los ruidos producidos por otros hablantes o procedentes delentorno de grabacioacuten Estos acontecimientos se codifican en la TEI mediante lamarca lteventgt

(2) Elementos necesarios en la transcripcioacuten de interacciones verbalesbull Identidad del hablante

Este es un elemento imprescindible en la transcripcioacuten de interaccionesverbales La TEI dispone de los mecanismos para documentar informacioacuten sobrelos hablantes en la cabecera de los textos asiacute como de un sistema para marcar laidentidad de cada participante en el interior del texto aunque pueden utilizarsetambieacuten otros procedimientosbull Turnos de palabra

La finalidad del marcado de los turnos de palabra es indicar un cambio dehablante Ademaacutes de las convenciones de la TEI pueden emplearse otrosprocedimientos mientras se mantenga esta informacioacuten esencial en el estudio de lainteraccioacuten verbalbull Superposicioacuten de turnos de palabra

Existen igualmente diferentes procedimientos para marcar la superposicioacutende emisiones de dos hablantes ademaacutes de las propuestas de la TEI que los tratacomo parte de las estrategias para codificar acontecimientos simultaacuteneos

(3) Elementos relacionados con la actuacioacuten del hablantebull Omisiones en un texto leiacutedo

Si se transcribe un texto leiacutedo y se dispone del original es recomendableanotar las palabras o segmentos omitidos por el locutorbull Autocorrecciones

Es propio del habla espontaacutenea aunque tambieacuten de la lectura que loshablantes realicen correcciones de su propia produccioacuten linguumliacutestica (self-repairs)Parece conveniente marcarlas en la transcripcioacuten de un corpus oralbull Fragmentos de palabras

Los fragmentos de palabras corresponden a uno o maacutes segmentospertenecientes a una palabra que no ha sido totalmente pronunciada por el hablanteen un primer intento y que suelen repetirse cuando eacuteste consigue producir lapalabra completa Es importante indicar este fenoacutemeno en la transcripcioacuten

bull Fragmentos ininteligiblesSe trata de partes de la grabacioacuten que no son comprendidas por el

transcriptor y en la TEI se codifican con la etiqueta ltuncleargt aunque si se desease pueden utilizar marcas maacutes detalladas distinguiendo entre transcripcionescompletamente ininteligibles y entre una posible interpretacioacuten ofrecida por eltranscriptor

Un aspecto conflictivo sigue siendo la identificacioacuten de los enunciados que conforman untexto oral (Schuetze-Coburn 1991) Mientras que en un texto escrito los signos de puntuacioacutenconstituyen un criterio de delimitacioacuten en el habla disponemos de indicios como las pausas laentonacioacuten o el cambio de turno de palabra que nos permiten al menos convencionalmentedefinir un enunciado Sin embargo hasta el momento no se han desarrollado auacuten criteriosobjetivos y consistentes para resolver este problema

7- CONCLUSIONES

La revisioacuten - sin pretensiones de exhaustividad - de los principales sistemas detranscripcioacuten etiquetado y codificacioacuten de corpus orales expuesta en este trabajo pone demanifiesto en primer lugar la multiplicidad de propuestas desarrolladas frente a los intentos deestandarizacioacuten algunos de los cuales auacuten no se han consolidado plenamente pese a su crecienteaceptacioacuten En segundo lugar destaca tambieacuten la heterogeneidad de tradiciones que confluyen enel estudio de la lengua hablada desde la foneacutetica y las tecnologiacuteas del habla hasta el anaacutelisis deldiscurso y de la conversacioacuten diversidad que lleva a la creacioacuten de convenciones especiacuteficas pararesponder a las necesidades de diversas comunidades cientiacuteficas Ante esta situacioacuten la distincioacutenpropuesta por Sinclair (1995107) entre ldquoconformidadrdquo y ldquocompatibilidadrdquo adquiere todo susentido ya que si en ciertos casos la conformidad a un estaacutendar determinado es problemaacutetica porlas limitaciones inherentes a todo sistema comuacuten la compatibilidad - entendida como la facilidadde conversioacuten entre sistemas - deberiacutea ser en cambio un requisito imprescindible en el desarrollode los recursos linguumliacutesticos De esta manera puede tal alcanzarse el equilibrio entre lasnecesidades de un proyecto y las indudables ventajas cientiacuteficas y econoacutemicas que resultan de lareutilizacioacuten de los datos disponibles

BIBLIOGRAFIacuteA

Allen GD 1988 The PHONASCII System Journal of the International PhoneticAssociation 181 9-25

Anderson AH M Badger EG Bard E Boyle G Doherty S Garrod S Isard JKowtko J Mcallister J Miller C Sotillo HS Thompson y R Weinert 1991 The HCRCMap Task corpus Language and Speech 344 351-366

Autesserre D G Peacuterennou y M Rossi 1989 Methodology for the transcription andlabeling of a speech corpus Journal of the International Phonetic Association 191 2-15

Barry WJ y AJ Fourcin 1992 Levels of Labelling Computer Speech and Language 61-14

Beckman ME y GM Ayers GM 1994 Guidelines for ToBI Labelling Version 20February 1994[Documento de Internet disponible en httplingohio-stateeduPhoneticsToBIToBI0html]

Beckman ME y J Hirschberg J 1994 The ToBI Annotation Conventions Apeacutendice A deME Beckman y GM Ayers 1994 Guidelines for ToBI Labelling Version 20 February 1994[Documento de Internet disponible en httplingohio-stateeduPhoneticsToBIToBI0html]

Bruce G 1988 23 Supasegmental categories and 24 The symbolization of temporalevents Journal of the International Phonetic Association 182 75-76

Bruce G 1989 Report from the IPA working group on suprasegmental categories LundUniversity Department of Linguistics General Linguistics Phonetics Working Papers 35 25-40

Burnard L 1995 What is SGML and how does it help Computers and the Humanities291 41-50 The Text Encoding Initiative Background and Context Eds N Ide y J VeacuteronisDordrecht Kluwer Academic Publishers

Burnard L 1995a Text Encoding for Information Exchange An Introduction to the TextEncoding Initiaive TEI Document TEI J31 [Documento de Internet disponible enhttpwwwuiceduorgsteiinfoteij31]

Burnard L 1995b The Text Encoding Initiative an overviewrdquo Spoken English onComputer Transcription Markup and Applications Eds G LEECH G MYERS y JTHOMAS Harlow Longman 69-81

Chafe W 1995 Adequacy user-friendliness and practicality in transcribingrdquo English onComputer Transcription Markup and Applications Eds G Leech G Myers y J ThomasHarlow Longman 54-61

Chan D A Fourcin D Gibbon B Granstroumlm M Huckvale G Kokkinakis K KvaleL Lamel B Lindberg A Moreno J Mouropoulos F Senia I Trancoso C Veld y J Zeiliger1995 EUROM - A Spoken Language Resource for the EU Eurospeech95 Proceedings of the4th European Conference on Speech Communication and Speech Technology Madrid Spain 18-21 September 1995 Vol 1 867-870

Cole RA BT Oshika M Noel T Lander y M Fanty 1994 Labeler Agreement inPhonetic Labeling of Continuous Speech Proceedings of the 1994 International Conference onSpoken Language Processing Yokohama Japan 18-22 September 1994[Documento de Internet disponible en httpwwwcseogieduCSLUcorporapapershtml]

Cook G 1995 Theoretical issues transcribing the untranscribablerdquo Spoken English onComputer Transcription Markup and Applications Eds G Leech G Myers y J ThomasHarlow Longman 35-53

Du Bois JW 1991 Transcription design principles for spoken discourse researchPragmatics 1 71-106

Du Bois JW S Schuetze-Coburn S Cumming y D Paolino 1993 Outline of discoursetranscriptionrdquo Talking Data Transcription and Coding in Discourse Research Eds JAEdwards y MD Lampert Hillsdale NJ Lawrence Erlbaum Associates 45-90

EAGLES 1996 Preliminary Recommendations on Spoken Texts EAGLES DocumentEAG-TCWG-STPP May 1996[Documento de Internet disponible enhttpwwwilcpicnritEAGLES96spokentxspokentxhtml]

Edwards JA 1992 Design principles in the transcription of spoken discourserdquoDirections in Corpus Linguistics Proceedings of Nobel Symposium 82 Stockholm 4-8 August1991 Ed J Svartvik Berlin Mouton de Gruyter 129-147

Edwards JA 1993 Principles and Contrasting Systems of Discourse TranscriptionrdquoTalking Data Transcription and Coding in Discourse Research Eds JA Edwards y MDLampert Hillsdale Hillsdale NJ Lawrence Erlbaum Associates 3-32

Edwards JA 1995 Principles and alternative systems in the transcription coding andmark-up of spoken discourserdquo Spoken English on Computer Transcription Markup andApplications Eds G Leech G Myers y J Thomas Harlow Longman 19-34

Ehlich K 1993 HIAT A Transcription System for Discourse Datardquo Talking DataTranscription and Coding in Discourse Research Eds JA Edwards y MD Lampert HillsdaleNJ Lawrence Erlbaum Associates 123-148

Eisen B 1993 Reliability of speech segmentation and labelling at different levels oftranscription Eurospeech93 3rd European Conference on Speech Communication andTechnology Berlin Germany 21-23 September 1993 Vol 1 673-676

Esling JH y H Gaylord 1993 Computer Codes for Phonetic Symbols Journal of theInternational Phonetic Association 232 77-82

Esling JH 1988 Computer coding of IPA symbols and detailed phonetic representationsof computer databases Journal of the International Phonetic Association 182 99-106

Esling JH 1990 Computer Coding of the IPA Supplementary Report Journal of theInternational Phonetic Association 201 22-26

Fourcin A y JM Dolmazon (on behalf of the SAM Project) 1991 Speech knowledgestandards and assessment Actes du XIIegraveme Congregraves International des Sciences Phoneacutetiques 19-24 aoucirct 1991 Aix-en-Provence France Aix-en-Provence Universiteacute de Provence Service desPublications Vol 5 430-433

Fourcin A G Harland W Barry y V Hazan eds 1989 Speech Input and OutputAssessment Multilingual Methods and Standards Chichester Ellis Horwood Ltd

French JP 1991 Updated notes for soundprint transcribers Working paper Universityof Birmingham October 1991 NERC-WP4-47

French JP 1992 Transcription proposals multilevel system Working paper Universityof Birmingham October 1992 NERC-WP4-50

Gibbon D 1989 Survey of Prosodic Labelling for EC Languages SAM-UBI-190 12February 1989 Report e6 in ESPRIT 2589 (SAM) Interim Report Year 1 Ref SAM-UCLG002 University College London February 1990

Gibbon D R Moore y R Winski eds 1997 Handbook on Standards and Resources forSpoken Language Systems Berlin Mouton De Gruyter [Documento de Internet disponible en httpcoralliliuni-bielefelddeEAGLESeagbookeagbookhtml]

Groslashnnum Thorsen N 1987 Suprasegmental transcription ARIPUC - Annual Report ofthe Institute of Phonetics University of Copenhagen 21 1-27

Gumperz JJ y J Berenz 1993 Transcribing Conversational Exchangesrdquo Talking DataTranscription and Coding in Discourse Research Eds JA Ewards y M D Lampert HillsdaleNJ Lawrence Erlbaum Associates 91-122

Hart J lsquoT R Collier y A Cohen 1990 A Perceptual Study of Intonation An Experimental- Phonetic Approach to Intonation Cambridge Cambridge University Press (Cambridge Studiesin Speech Science and Communication)

Hess W K Kohler y HG Tillmann 1995 The PhonDat-Verbmobil Speech CorpusEurospeech95 Proceedings of the 4th European Conference on Speech Communication andSpeech Technology Madrid Spain 18-21 September 1995 Vol 1 863-866

Hieronymus JL 1994 ASCII phonetic symbols for the worlds languages WorldbetATampT Bell Laboratories Technical Memo [Documento de Internet disponible enhttpwwwcseogieduCSLUcorporapapershtml]

Hirst D A Di Cristo y R Espesser en prensaLevels of representation and levels ofanalysis for intonation Prosody Theory and Experiments Ed M Horne Dordrecht Kluwer

Hirst DJ y A Di Cristo en prensa A survey of intonation systemsrdquo IntonationSystems A Survey of 20 Languages Eds D Hirst y A Di Cristo Cambridge CambridgeUniversity Press

Hirst DJ 1991 Intonation models towards a third generation Actes du XIIegraveme CongregravesInternational des Sciences Phoneacutetiques 19-24 aoucirct 1991 Aix-en-Provence France Aix-en-Provence Universiteacute de Provence Service des Publications Vol 1 305-310

Hirst DJ A Di Cristo M Le Besnerais Z Najim P Nicolas y P Romeacuteas 1993Multilingual modelling of intonation patternsrdquo Proceedings of an ESCA Workshop on ProsodySeptember 27-29 1993 Lund Sweden Eds D House y P Touati Lund University Departmentof Linguistics and Phonetics Working Papers 41 204-207

Hirst DJ N Ide y J Veacuteronis 1994 Coding fundamental frequency patterns for multi-lingual synthesis with INTSINT in the MULTEXT project Conference Proceedings of theSecond ESCAIEEE Workshop on Speech Synthesis September 12-15 1994 Mohonk MountainHouse New Paltz New York USA 77-80

Ide N y J Veacuteronis eds 1995 The Text Encoding Initiative Background and ContextsComputers and the Humanities 29 1-3 Publicado en forma de libro en Dordrecht KluwerAcademic Publishers

IPA 1989 The IPA 1989 Kiel Convention Workgroup 9 report Computer Coding of IPAsymbols and Computer Representation of Individual Languages Journal of the InternationalPhonetic Association 192 81-92

IPA 1993 IPA Chart revised to 1993 Journal of the International Phonetic Association231 [Documento de Internet disponible en httpwwwartsglaacukIPAipacharthtml]

IPA 1995 Preview of the IPA Handbook Journal of the International Phonetic Association251

ISO 8879 1986 Information Processing Text and Office Systems Standard GeneralizedMarkup Language (SGML) Geneva International Organization for Standardization

Johansson S 1995a The approach of the Text Encoding Initiative to the encoding ofspoken discourse Spoken English on Computer Transcription Markup and Applications EdsG Leech G Myers y J Thomas Harlow Longman 82-98

Johansson S 1995b The Encoding of Spoken Texts Computers and the Humanities291 149-158 The Text Encoding Initiative Background and Context Eds N Ide y J VeacuteronisDordrecht Kluwer Academic Publishers 149-158

Keating P P MacEachern A Shryock y S Domiacutenguez 1994 A manual for phonetictranscription Segmentation and labelling of words in spontaneous speech UCLA WorkingPapers in Phonetics 88 91-120

Kluger-Kruse M 1987 Computer Phonetic Alphabet ESPRIT Linguistic Analysis of theEuropean Languages Report BU-CPA0267 July 1987

Krot C y B Taylor 1995 Criteria for Acoustic-Phonetic Segmentation and WordLabelling in the Australian National Database of Spoken Language[Documento de Internet disponible en httpwwwshlrcmqeduaucriteriahtml]

Lander T 1997 The CSLU Labeling Guide Center for Spoken Language UnderstandingOregon Graduate Institute[Documento de Internet disponible en httpwwwcseogieduCSLUcorporapapershtml]

Llisterri J 1994 Prosody Encoding Survey WP 1 Specifications and Standards T15Markup Specifications Deliverable 153 Final version 15 September 1994 LRE Project 62-050MULTEXT

Llisterri J ed 1996 Prosody Tools Efficiency and Failures WP 4 Corpus T46 SpeechMarkup and Validation Deliverable 452 Final version 15 October 1996 LRE Project 62-050MULTEXT

MacWhinney B 1991The CHILDES Project Tools for Analyzing Talk Hillsdale NJLawrence Erlbaum

Marchal A N Nguyen y W Hardcastle 1995 Multitiered phonetic approach to speechlabelling Levels in Speech Communication Relations and Interactions A Tribute to MaxWajskop Hommage agrave Max Wajskop Eds C Sorin J Mariani H Meloni y J SchoengenAmsterdam Elsevier Science BV 149-158

NERC 1994 NERC-1 Network of European Reference Corpora Final Report PisaInstituto di Linguistica Computazionale - CNR January 1994 versioacuten en curso de publicacioacutenTowards a Network of European Reference Corpora Eds N Calzolari M Baker y PG KruytPisa Giardini

Nicolas P y D Hirst 1995 Symbolic coding of Higher-Level Characteristics ofFundamental Frequency Curvesrdquo Eurospeech95 Proceedings of the 4th European Conferenceon Speech Communication and Technology Madrid Spain 18-21 September 1995 Vol 2 989-992

OConnell DC y S Kowal 1994 Some Current Transcription Systems for SpokenDiscourse A critical Analysis Pragmatics 4 81-107

Ochs E 1979 Transcription as Theory Developmental Pragmatics Eds E Ochs E yBB Schieffelin New York Academic Press 43-72

Payne J 1992 Report on the compatibility of JP Frenchs spoken corpus transcriptionconventions with the TEI guidelines for transcription of spoken texts Working paper COBUILDBirmingham and IDS Mannheim December 1992 NERC-WP8WP4-122

Payne J 1995 The COBUILD spoken corpus transcription conventions SpokenEnglish on Computer Transcription Markup and Applications Eds G Leech G Myers y JThomas Harlow Longman 203-207

Payratoacute Ll 1995 Transcripcioacuten del discurso coloquialrdquo El espantildeol coloquial Actas del ISimposio sobre Anaacutelisis del Discurso Oral Almeriacutea 23-25 de noviembre de 1994 Ed L CorteacutesRodriacuteguez Almeriacutea Universidad de Almeriacutea Servicio de Publicaciones 43-70

Pierrehumbert J B 1897 (1980) The Phonology and Phonetics of English IntonationPhD Thesis Department of Linguistics MIT Bloomington Indiana University Linguistics Club

Pitrelli J M Beckman y J Hirschberg 1994 Evaluation of prosodic transcriptionlabelling reliability in the ToBI frameworkrdquo Proceedings of the Third International Conference onSpoken Language Processing Yokohama ICSLP Vol 2 123-126

Pullum GK y WA Ladusaw 1996 (1986) Phonetic Symbol Guide Chicago TheUniversity of Chicago Press 2nd edition

Roach P H Roach A Dew y P Rowlands 1990 Phonetic analysis and the automaticsegmentation and labeling of speech sounds Journal of the International Phonetic Association201 15-21

Schmidt MS C Scott y MA Jack 1993 Phonetic transcription standards for Europeannames (ONOMASTICA) Eurospeech93 3rd European Conference on Speech Communicationand Technology Berlin Germany 21-23 September 1993 Vol 1 279-282

Schuetze-Coburn S 1991Units of intonation in discourse a comparison of acoustic andauditory analysis Language and Speech 343 207-234

Selting M 1987 Descriptive categories for the auditive analysis of intonation inconversation Journal of Pragmatics 11 777-791

Selting M 1988 The role of intonation in the organisation of repair and problem handlingsequences in conversation Journal of Pragmatics 12 293-322

Senia F y JG Van Velden 1997 Specifications of orthographic transcription and lexiconconventions LRE-4001 SpeechDat Technical Report SD132 Final version 10 January 1997[Documento de Internet disponible en httpwwwphonetikuni-muenchendeSpeechDathtml]

Silverman K M Beckman J Pitrelli M Ostendorf C Wightman P Price JPierrehumbert y J Hirschberg 1992 TOBI A standard for labelling English prosodyProceedings of the Second International Conference on Spoken Language Processing ICSLP-92Banff October 1992 867-870

Sinclair J 1994 Spoken Language [3B] PhoneticPhonemic and Prosodic Annotation[52] NERC 1994 NERC-1 Network of European Reference Corpora Final Report PisaVersioacuten en curso de publicacioacuten Towards a Network of European Reference Corpora Eds NCalzolari M Baker y PG Kruyt Pisa Giardini

Sinclair J 1995 From theory to practicerdquo Spoken English on Computer TranscriptionMarkup and Applications Eds G Leech G Myers Y J Thomas Harlow Longman 99- 112

Sperberg-McQueen CM y L Burnard eds 1994 Guidelines for Electronic Text Encodingand Interchange TEI P3 Chicago and Oxford Association for Computational Linguistics Association for Computers and the Humanities Association for Literary and LinguisticComputing [Cap 11 Transcriptions of Speech] [Documento de Internet disponible enhttpetextvirginiaeduTEIhtml]

Strangert E y M Heldner 1995 Labelling of boundaries and prominences byphonetically experienced and non-experienced transcribers Phonum 3 Reports from theDepartment of Phonetics Umearing University 85-109 [Documento de Internet disponible enhttpwwwlingumusefonphonum3html]

Teubert W 1993 Phonetic Phonemic and Prosodic Annotation Final Report IDSMannheim February 1993 NERC-WP8-171

Tillmann HG y B Pompino-Marschall 1993 Theoretical Principles ConcerningSegmentation Labelling Strategies and Levels of Categorical Annotation for Spoken LanguageDatabase Systems Eurospeech93 3rd European Conference on Speech Communication andTechnology Berlin Germany 21-23 September 1993 Vol 3 1691-1694

Trancoso I 1995 The ONOMASTICA Interlanguage Pronunciation LexiconrdquoEurospeech95 Proceedings of the 4th European Conference on Speech Communication andTechnology Madrid Spain 18-21 September 1995 Vol 1 829-832

Wells JC 1987 Computer Coded Phonetic Transcription Journal of the InternationalPhonetic Association 172 94-114

Wells JC 1989 Computer-coded phonemic notation of individual languages of theEuropean Community Journal of the International Phonetic Association 191 31-54

Wells JC 1994 Computer-coding the IPA a proposed extension of SAMPA SpeechHearing and Language Work in Progress 1994 (University College London Department ofPhonetics and Linguistics) 8 271-289

Wells JC 1995 SAMPROSA (SAM Prosodic Transcription [Documento de Internetdisponible en httpwwwphonuclacukhomesampasamprosahtm]

Wells JC W Barry M Grice A Fourcin y D Gibbon 1992 Standard Computer-Compatible Transcription SAM Stage Report Sen3 SAM UCL-037 28 February 1992 SAM(1992) Esprit Project 2589 (SAM) Multilingual Speech InputOutput AssessmentMethodologyand Standardisation Final Report Year Three 1III91-28II1992 London University CollegeLondon

Wesenick M-B y F Schiel 1995 Feasibility of Automatic Annotation and BuildingPronunciation Lexica from Corpus Material LRE-63314 SpeechDat Report D3123 Finalversion 10 October 1995[Documento de Internet disponible en httpwwwicpgrenetfrSpeechDathomehtml]

Winski R R Moore y D Gibbon 1995 EAGLES Spoken Language Working GroupOverview and Resultsrdquo Eurospeech95 Proceedings of the 4th European Conference on SpeechCommunication and Speech Technology Madrid Spain 18-21 September 1995 Vol 1 841-844[Documento de Internet disponible en httpcoralliliuni-bielefeldde~gibbonEAGLESrwpaperrwpaperhtml]

  • 1- INTRODUCCIOacuteN
  • 2- NIVELES DE REPRESENTACIOacuteN ETIQUETADO Y CODIFICACIOacuteN
  • 3- REPRESENTACIOacuteN ORTOGRAacuteFICA DE CORPUS ORALES
  • 31- Propuestas para la representacioacuten ortograacutefica de corpus orales en el aacutembito de la linguumliacutestica de corpus
  • 32- Propuestas para la representacioacuten ortograacutefica de corpus orales en el aacutembito de las tecnologiacuteas del habla
  • 4- REPRESENTACIOacuteN FONEacuteTICA DE CORPUS ORALES
  • 41- La representacioacuten foneacutetica de los elementos segmentales
  • 42- La representacioacuten foneacutetica de los elementos suprasegmentales
  • 5- ETIQUETADO FONEacuteTICO DE CORPUS ORALES
  • 51- Niveles de etiquetado foneacutetico de corpus orales
  • 52- La transcripcioacuten y el etiquetado automaacutetico de corpus orales
  • 6- TRANSCRIPCIOacuteN Y CODIFICACIOacuteN DE CORPUS PARA EL ANAacuteLISIS DE LA LENGUA ORAL
  • 61- Los requisitos de una transcripcioacuten
  • 62- Propuestas de estandarizacioacuten para la transcripcioacuten y codificacioacuten de corpus orales
  • 7- CONCLUSIONES
  • BIBLIOGRAFIacuteA
Page 9: Transcripción, etiquetado y codificación de corpus orales

etiquetado como el programa Wavestrade Sin embargo se han definido tambieacuten convenciones parala anotacioacuten de textos representados ortograacuteficamente Una transcripcioacuten utilizando ToBI constade cuatro niveles

bull Representacioacuten ortograacutefica del enunciadobull Nivel de iacutendices de ruptura (break index) en el que se introducen los indicadores

de liacutemite que marcan las fronteras entre las unidades meloacutedicas estableciendo cuatro gradosde cohesioacuten entre las mismas

bull Nivel tonal en el que se marcan los denominados ldquoeventos tonalesrdquo (pitch events)divididos en tonos de frase al principio y al final de las unidades meloacutedicas y en acentostonales (pitch accent) en las siacutelabas en las que se produce un movimiento de la frecuenciafundamental

bull Nivel miscelaacuteneo que facilita por ejemplo introducir los comentarios deltranscriptor

Para cada uno de los niveles se define un conjunto de siacutembolos alineados temporalmentecon los fenoacutemenos entonativos transcritos si se dispone de una herramienta adecuada comoWavestrade

Las criacuteticas que se realizan maacutes frecuentemente a ToBI son por una parte su dependenciadel modelo fonoloacutegico desarrollado por Pierrehumbert (1980) y por otra su mejor adaptacioacuten alingleacutes que a otras lenguas lo que explicariacutea su amplia utilizacioacuten en Estados Unidos Sin embargose han realizado trabajos en italiano alemaacuten huacutengaro y espantildeol entre otras lenguas usando ToBIcomo sistema de representacioacuten Un inconveniente maacutes importante es que la anotacioacuten medianteToBI requiere un cierto conocimiento previo de los patrones entonativos de la lengua Aun asiacute esun sistema que ofrece indudables ventajas como pueden ser su estructura jeraacuterquica que permiteseleccionar entre subconjuntos o conjuntos mayores de siacutembolos la posibilidad de representarproblemas que aparecen en la transcripcioacuten y el hecho de que existan experimentos demostrandoun alto grado de acuerdo entre transcriptores diferentes (Pitrelli et al 1994)

En el Institute for Perception Research (IPO Eindhoven) se ha desarrollado una teoriacutea sobrela entonacioacuten basada en el modelado de contornos entonativos consistentes en representacionesestilizadas perceptivamente equivalentes al contorno original (lsquot Hart et al 1990) Esta teoriacutea hallevado tambieacuten a la formalizacioacuten de un sistema de representacioacuten de la curva meloacutedica definidacomo un conjunto de movimientos tonales que se agrupan en secuencias de configuracionestonales la agrupacioacuten de estas configuraciones da lugar a su vez a contornos meloacutedicosdefinieacutendose los patrones entonativos en funcioacuten de agrupaciones similares de contornosmeloacutedicos Un sistema jerarquizado de esta naturaleza permite una representacioacuten de la curvameloacutedica adecuada para la transcripcioacuten prosoacutedica aunque que inicialmente no haya sido disentildeadopara tales fines

El objetivo de INTSINT (International Transcription System for Intonation) en cambio esproporcionar un sistema para la comparacioacuten interlinguumliacutestica de sistemas prosoacutedicosDesarrollado por Hirst (1991 Hirst y Di Cristo en prensa Hirst Di Cristo y Espesser enprensa) en el marco de un proyecto de anaacutelisis automaacutetico de la entonacioacuten INTSINT se basa en

la estilizacioacuten de la curva meloacutedica realizada a partir de una interpolacioacuten entre puntos en los quese da un cambio significativo en el valor de la frecuencia fundamental (target points) Estospuntos que podriacuteamos denominar ldquode inflexioacutenrdquo - definidos como la combinacioacuten de un valortemporal y un valor frecuencial - son susceptibles de codificarse automaacuteticamente mediante lossiacutembolos de INTSINT previa introduccioacuten de marcas de frontera entre las unidades entonativasCon ello se obtiene una representacioacuten fonoloacutegica del contorno meloacutedico simbolizando losdiferentes niveles tonales de la curva original El sistema se basa en la representacioacuten desecuencias tonales consideradas tanto desde una perspectiva global en funcioacuten del rango devariacioacuten tonal del hablante como desde un punto de vista local en relacioacuten con la altura de puntosde inflexioacuten anteriores En el primer caso se definen tres niveles T (Top) M (Mid) y B (Bottom)mientras que en el segundo se marcan cinco posibilidades H (Higher) L (Lower) S (Same) U(Upstep) o D (Downstep) El proceso de modelizacioacuten necesario para transcribir medianteINTSINT ha sido aplicado a varias lenguas (Hirst et al 1993) y se emplea tambieacuten para laanotacioacuten prosoacutedica de parte del corpus EUROM en franceacutes ingleacutes alemaacuten sueco y espantildeol(Hirst et al 1994 Llisterri ed 1996) llevada a cabo en el marco del proyecto LRE 62-050MULTEXT - Multilingual Text Tools and Corpora Es posible tambieacuten aplicar INTSINT aniveles maacutes altos como el paacuterrafo tal como se muestra en Nicolas y Hirst (1995)

5- ETIQUETADO FONEacuteTICO DE CORPUS ORALES

Al igual que en el caso de los corpus textuales una vez recogidos los materiales de base deun corpus oral debe llevarse a cabo un tratamiento de los mismos que permita su utilizacioacutenposterior El primer paso suele ser la transcripcioacuten ortograacutefica que en determinado tipo de corpusse acompantildea de una transcripcioacuten foneacutetica o fonoloacutegica A continuacioacuten a cada segmento de laonda sonora se le asocia una etiqueta (labelling) que lo define en teacuterminos foneacuteticos o fonoloacutegicosy se lleva a cabo la alineacioacuten (alignment) entre la sentildeal sonora y las etiquetas obteniendo unarepresentacioacuten que puede compararse a la partitura musical de una obra para voz y orquesta Elproceso de etiquetado segmental puede llevarse a cabo a varios niveles como veremos en esteapartado y completarse con una anotacioacuten de las caracteriacutesticas suprasegmentales codificadasseguacuten los diversos sistemas que hemos expuesto anteriormente Si se cumplen las etapasmencionadas se llega a disponer de un corpus que contiene la sentildeal sonora sincronizada con latranscripcioacuten ortograacutefica y con la transcripcioacuten foneacutetica o fonoloacutegica de modo que una vezdefinida una estructura de base de datos es posible consultar el corpus partiendo de etiquetasfoneacuteticas de marcas prosoacutedicas o de la transcripcioacuten ortograacutefica al tiempo que se accede a lagrabacioacuten correspondiente

Los corpus de lengua oral que consisten uacutenicamente en transcripciones ortograacuteficas - ya queno suele ser factible realizar una transcripcioacuten foneacutetica completa de un nuacutemero elevado de horasde grabacioacuten - conllevan un procesamiento menos complejo aunque en algunos casos contienenmarcas prosoacutedicas uacutetiles para el anaacutelisis del discurso o de la conversacioacuten como veremos en elapartado 6

51- Niveles de etiquetado foneacutetico de corpus orales

Una cuestioacuten que se plantea inevitablemente a la hora de introducir informacioacuten adicionalsobre los datos recogidos es el nivel de etiquetado del corpus Se han realizado varias propuestassobre los distintos niveles en los que se puede realizar el etiquetado foneacutetico de un corpusalgunas de ellas ligadas al proyecto SAM como la de Barry y Fourcin (1992) en la que seplantean cinco niveles posibles de etiquetado foneacutetico de un corpus

bull Nivel fiacutesico en el que se etiquetan las propiedades acuacutesticas presentes en la sentildealsonora

bull Nivel acuacutestico-foneacutetico en el que se marcan las propiedades de los segmentos enteacuterminos de categoriacuteas foneacuteticas como oclusioacuten friccioacuten sonoridad nasalizacioacuten etc

bull Nivel de transcripcioacuten estrecha en el que se caracterizan los segmentos utilizandolos siacutembolos del AFI o de sus equivalentes computacionales

bull Nivel de transcripcioacuten fonoloacutegica (o foneacutemica) sentildealando uacutenicamente aquelloselementos funcionalmente distintivos que se encuentran en la palabra pronunciadaaisladamente en un estilo cuidado (citation form)

bull Nivel de transcripcioacuten ancha en el que se utilizan los siacutembolos correspondientes alos elementos fonoloacutegicos en una lengua dada para transcribir realizaciones alofoacutenicascondicionadas por el contexto3

A estos cinco niveles debe antildeadirse auacuten la anotacioacuten prosoacutedica considerada de formaindependiente por los autores de la propuesta

Una propuesta similar de etiquetado tambieacuten en cinco niveles - caracteriacutesticas acuacutesticas denaturaleza subfoneacutemica caracteriacutesticas segmentales realizaciones foneacuteticas forma canoacutenica de laspalabras y transcripcioacuten ortograacutefica - se presenta en Tillmann y Pompino-Marschall (1993) y hasido utilizada con eacutexito en el proyecto alemaacuten PhonDat Igualmente pueden verse las propuestasde Autesserre et al (1989) enmarcadas en el contexto del proyecto SAM y los trabajos deMarchal et al (1995) o Roach et al (1990)

La transcripcioacuten y el etiquetado de corpus orales se ha abordado en el marco del proyectoEAGLES desde una doble perspectiva la de la foneacutetica y las tecnologiacuteas del habla en el Grupo deTrabajo sobre Lengua Oral y desde la de la linguumliacutestica de corpus en el marco de las actividades delGrupo de Trabajo sobre Corpus Textuales El trabajo llevado a cabo en el grupo dedicado a lalengua hablada en EAGLES recoge esencialmente las propuestas desarrolladas en el marco deSAM y de PhonDat Los niveles de etiquetado propuesto son los siguientes (Gibbon Moore yWinski eds 1997)

bull Nivel ortograacutefico en el que se utiliza la representacioacuten ortograacutefica convencional

3 La distincioacuten entre los dos uacuteltimos niveles puede ejemplificarse con el caso de las asimilaciones mientras que enla transcripcioacuten ancha encontrariacuteamos [um poko] (un poco) en el caso de una transcripcioacuten fonoloacutegica apareceriacutea [unpoko] si se opta por no simbolizar archifonemas en la transcripcioacuten En cambio [mismo] se representariacutea de lamisma forma en ambos niveles encontraacutendose la transcripioacuten [mizmo] en el nivel de transcripcioacuten estrecha

bull Nivel de formas canoacutenicas (citation form) representando la forma depronunciacioacuten aislada de las palabra en estilo cuidado

bull Nivel de transcripcioacuten ancha o fonotiacutepica en este nivel se utilizan los siacutembolosque representan elementos fonoloacutegicos en una lengua dada pero al igual que en lapropuesta de Barry y Fourcin se transcriben aquellos fenoacutemenos predictibles propios dela foneacutetica sintaacutectica SAMPA seriacutea pues un alfabeto foneacutetico adecuado para este nivelde transcripcioacuten

bull Nivel de transcripcioacuten estrecha basado en una representacioacuten alofoacutenica de lasrealizaciones foneacuteticas de los hablantes para el cual puede utilizarse un alfabeto foneacuteticocomo X-SAMPA

bull Nivel acuacutestico-foneacutetico en el que se distinguen caracteriacutesticas acuacutesticas de lossegmentos observables en una representacioacuten de la onda sonora

bull Nivel fiacutesico representado en teacuterminos de paraacutemetros acuacutesticos o articulatoriosbull Fenoacutemenos no linguumliacutesticos la inclusioacuten de este nivel permite representar sonidos

de naturaleza comunicativa o no introducidos por el hablante asiacute como toda aquellainformacioacuten paralinguumliacutestica que se considere de intereacutes tambieacuten permite sentildealas los ruidosexternos en la grabacioacuten

Vale la pena detenerse brevemente en el nivel de las formas canoacutenicas y en el concepto deldquotranscripcioacuten fonotiacutepicardquo que como puede verse aparecen de forma recurrente en diversaspropuestas La inclusioacuten de forma canoacutenicas en el etiquetado de un corpus responde a un doblemotivo especialmente ligado a necesidades tecnoloacutegicas en primer lugar estas formas permitenderivar automaacuteticamente mediante un conjunto de reglas una transcripcioacuten ancha o fonotiacutepica enla que se incluyen los elementos alofoacutenicos cuya aparicioacuten esta condicionada por el contextofoneacutetico en segundo lugar a partir de las formas canoacutenicas puede crearse de forma automaacutetica undiccionario foneacutetico partiendo de un corpus transcrito (Wesenick y Schiel 1995 Senia y vanVelden 1997) lo que tiene utilidad para el desarrollo de sistemas de siacutentesis y reconocimiento delhabla y tambieacuten para la descripcioacuten linguumliacutestica La transcripcioacuten denominada ldquofonotiacutepicardquo en lostrabajos de SAM constituye un nivel intermedio entre la realizacioacuten foneacutetica y la transcripcioacutenpuramente fonoloacutegica Por otra parte el nivel de transcripcioacuten de formas canoacutenicas estaacutedirectamente relacionado con la representacioacuten ortograacutefica facilitando asiacute la transcripcioacuten foneacuteticaautomaacutetica de corpus en este nivel mediante el desarrollo de los correspondientes sistemas dereglas

En el informe del Grupo de Trabajo de Corpus Textuales de EAGLES (EAGLES 1996) seintenta realizar una siacutentesis entre las necesidades de diversos campos de estudio Se sugieren porello tres niveles de representacioacuten

bull S1 representacioacuten ortograacutefica del textobull S2 representacioacuten fonoloacutegica de las palabras en su forma canoacutenicabull S3 transcripcioacuten foneacutetica consistente en una representacioacuten simboacutelica discreta de

la realizacioacuten del enunciado tal como es percibido por el transcriptor

Como puede observarse estos tres niveles encuentran su equivalente en los nivelespropuesto por Barry y Fourcin (1992) y en los definidos por el Grupo de Trabajo de Lengua

Oral Para la transcripcioacuten del nivel S2 puede utilizarse SAMPA mientras que la del nivel S3requiere el uso de un alfabeto foneacutetico como X-SAMPA

52- La transcripcioacuten y el etiquetado automaacutetico de corpus orales

La tarea de transcribir y etiquetar foneacuteticamente un corpus oral representa un considerableesfuerzo tanto en teacuterminos de tiempo como de los recursos econoacutemicos necesarios para llevar acabo esta labor El etiquetado manual requiere por otro lado el desarrollo de convencionesdetalladas para asegurar la consistencia entre diversos transcriptores (Keating et al 1994 Krot yTaylor 1995 Lander 1997) ademaacutes del establecimiento de un proceso de validacioacutencomprobando la fiabilidad de los resultados obtenidos (Eisen 1993 Cole et al 1994 Strangert yHeldener 1995) Por estos motivos uno de los intereses principales de los investigadores en elcampo de las tecnologiacuteas del habla ha sido llevar a cabo el etiquetado de forma semi-automaacutetica oidealmente automaacutetica Un primer nivel de transcripcioacuten - tanto de formas canoacutenicas comofonotiacutepica - puede obtenerse automaacuteticamente como acabamos de mencionar a partir de larepresentacioacuten ortograacutefica si se dispone de un conjunto de reglas que establezcan lascorrespondencias entre la representacioacuten ortograacutefica y la foneacutetica

Sin embargo un etiquetado foneacutetico en los niveles de transcripcioacuten maacutes detallada requiere laposibilidad de acceder a la onda sonora y un procedimiento de anaacutelisis de la sentildeal La primeraoperacioacuten que debe realizar un sistema de etiquetado automaacutetico es la segmentacioacuten del continuumsonoro en unidades menores - segmentos o caracteriacutesticas acuacutesticas en funcioacuten del nivel detranscripcioacuten deseado - para pasar despueacutes a la asignacioacuten de etiquetas - siacutembolos detranscripcioacuten - que describan sus caracteriacutesticas Este es el proceso conocido propiamente comoetiquetado (labelling) que cuando se realiza de forma automaacutetica debe superar los obstaacuteculosderivados de la naturaleza no discreta de la sentildeal sonora - resultado de mecanismos como lacoarticulacioacuten - y de la variabilidad de realizaciones foneacuteticas entre hablantes o incluso en unmismo hablante

Para que el corpus sea uacutetil el etiquetado foneacutetico debe estar temporalmente sincronizadocon la sentildeal sonora y con la representacioacuten ortograacutefica operacioacuten que se realiza en el procesoconocido como alineacioacuten temporal (time alignment) llevado a cabo tambieacuten de forma automaacuteticaEsta alineacioacuten puede hacerse de un modo global sentildealando en la onda sonora las fronteras entrepalabras ortograacuteficas - para facilitar el acceso a la grabacioacuten a partir de este nivel de representacioacuten(Lander 1997) - o los puntos en los que se encuentran siacutelabas acentuadas tal como sucede porejemplo en el proyecto MULTEXT

En el campo de las tecnologiacuteas del habla se han llevado a cabo numerosiacutesimos trabajosencaminados al disentildeo de sistemas de segmentacioacuten etiquetado y alineacioacuten temporal automaacuteticasde corpus orales utilizando las teacutecnicas propias del reconocimiento del habla como los Modelosde Markov o las redes neuronales Cabe destacar que tales teacutecnicas no soacutelo son uacutetiles en eldesarrollo de corpus en este aacutembito sino que constituyen una herramienta importante en otrostipos de corpus sin embargo es preciso reconocer que el habla espontaacutenea - especialmente si seha recogido mediante grabaciones realizadas en un entorno natural - plantea auacuten problemas en lo

que se refiere a su transcripcioacuten y etiquetado automaacuteticos pese a los notabiliacutesimos avances quetienen lugar en este campo

6- TRANSCRIPCIOacuteN Y CODIFICACIOacuteN DE CORPUS PARA EL ANAacuteLISIS DE LA LENGUA ORAL

En este uacuteltimo apartado incidiremos en las cuestiones relacionadas con la transcripcioacuten ycodificacioacuten de corpus orales que pueden presentar un mayor intereacutes para aacutembitos como elanaacutelisis de discurso o de la conversacioacuten y para el estudio de la lengua oral en todos los niveles dela descripcioacuten linguumliacutestica Como indicaacutebamos al principio la transcripcioacuten y la codificacioacuten de loselementos transcritos son en principio dos operaciones conceptualmente diferentes Sinembargo en la praacutectica habitual en las disciplinas a las que se refiere este apartado suelen ser dosoperaciones que se realizan simultaacuteneamente ya que al mismo tiempo que se realiza latransliteracioacuten se introducen las marcas necesarias para la codificacioacuten de los elementos que se hadecidido introducir en el corpus Por ello en muchos casos la discusioacuten sobre la transcripcioacuten y lacodificacioacuten se realiza conjuntamente en la bibliografiacutea sobre el tema

61- Los requisitos de una transcripcioacuten

El investigador que decide constituir un corpus de lengua oral se encuentra en estosmomentos con una gran variedad de criterios en lo que se refiere a la transcripcioacuten y a la seleccioacutende los elementos que apareceraacuten codificados en el corpus Hemos hecho ya referencia en elapartado 3 a las diversas convenciones para la representacioacuten ortograacutefica y cintildeeacutendonos al aacutembitodel anaacutelisis del discurso y la conversacioacuten constatamos igualmente la existencia una grandiversidad de propuestas En una revisioacuten de las mismas Payratoacute (1995) hace por ejemploreferencia a los sistemas de transcripcioacuten y codificacioacuten procedentes de la etnometodologiacuteainteresados en reflejar la interaccioacuten verbal a los meacutetodos desarrollados en el marco de laetnografiacutea de la comunicacioacuten y de la sociolinguumliacutestica interaccional4 o a propuestas utilizadas en elestudio del lenguaje infantil Ante tal situacioacuten parece conveniente plantearse cuaacuteles son losrequisitos que debe cumplir una transcripcioacuten de la lengua oral tema que ha sido abordado pordiversos autores (DuBois 1991 Elich 1993 Edwards 1993 OrsquoConnell y Kowal 1994) Trasrevisar aportaciones anteriores Payratoacute (1995) resume los requisitos que teoacutericamente deberiacuteanexigirse a toda transcripcioacuten

bull Neutralidad o fidelidad de modo que la transcripcioacuten no sea interpretativabull Globalidad o complejidad recogiendo la totalidad de los fenoacutemenos que aparecen

en el discurso oralbull Omnifuncionalidad permitiendo diversos usos y aplicacionesbull Claridad tanto desde el punto de vista del aprendizaje del sistema como de la

legibilidad de la representacioacutenbull Universalidad y compatibilidad entre sistemas informaacuteticos

4 Estos sistemas se comparan en OrsquoConnell y Kowal (1994) Pueden encontrarse consideraciones generales sobre latranscripcioacuten y codificacioacuten de la lengua oral en el anaacutelisis del discurso y la conversacioacuten en 1995Ochs (1979) DuBois (1991) Edwards (1992 1993 1995) Du Bois et al (1993) Gumperz y Berenz (1993) Cook (1995) Chafe(1995) y en Sinclair (1995)

Sin embargo puesto que en la praacutectica se transcribe en funcioacuten de los objetivos para losque se ha definido el corpus Payratoacute (1995) considera que un sistema de transcripcioacuten debe serante todo interpretativo de los datos selectivo en cuanto a los fenoacutemenos que se transcribenpertinente para el objeto de investigacioacuten coherente con la base teoacuterica adoptada por elinvestigador fiel en cuanto a la representacioacuten de los datos y flexible para que sea posible suutilizacioacuten en diversos estudios Por otra parte en opinioacuten de este autor la simbologiacutea utilizadadebe ser clara econoacutemica sencilla exenta de ambiguumledad y compatible con sistemas internacionesestandarizados Este uacuteltimo aspecto nos parece especialmente importante ya que como sentildeala elmismo Payratoacute (1995 58)

[] en ninguacuten caso puede olvidarse que los datos de una investigacioacuten no deberiacutean sertratados nunca de forma tan parcial o idiosincraacutesica que se impidiera o dificultara el uso por partede otros investigadores La transcripcioacuten del discurso oral es una actividad suficientementecostosa y conflictiva para tomar precauciones en este sentido y ninguna comunidad cientiacuteficapuede permitirse el lujo de particularismos (en aspectos tan elementales) que obstruyan el debateo conviertan en inaprovechables una fuente de informacioacuten

62- Propuestas de estandarizacioacuten para la transcripcioacuten y codificacioacuten de corpus orales

Ante la diversidad de propuestas para la transcripcioacuten y codificacioacuten de la lengua oral queacabamos de constatar el surgimiento de la linguumliacutestica de corpus y muy especialmente lasnecesidades derivadas del intercambio electroacutenico de textos propiciaron la aparicioacuten de proyectose iniciativas centrados en la creacioacuten de estaacutendares tanto en lo que se refiere a la transcripcioacutencomo a la codificacioacuten En los proacuteximos apartados revisamos sucintamente algunos de ellos

Uno de los capiacutetulos de las Guiacuteas desarrolladas por la TEI estaacute dedicado a la transcripcioacutende corpus orales (Johansson 1995a b) En eacutel se describe la estructura baacutesica de la representacioacutende un texto oral - cabecera texto y divisiones - y se definen los procedimientos basados enSGML para la representacioacuten de los elementos estructurales baacutesicos informacioacuten contextualinformacioacuten temporal enunciados pausas elementos vocalizados semi-leacutexicos o no leacutexicoselementos kineacutesicos otros tipos de eventos comunicativos y texto presentado en forma escrita alhablante Tambieacuten se ofrecen en este capiacutetulo indicaciones para la segmentacioacuten y el alineamientoasiacute como recomendaciones para la transcripcioacuten de superposiciones entre hablantes de formas depalabras prosodia elementos paralinguumliacutesticos - tempo intensidad rango tonal tensioacuten ritmo ycalidad de voz - y alteraciones en el decurso foacutenico Para la representacioacuten de la informacioacutenfoneacutetica se recomienda el uso del AFI En la siguiente tabla se resumen los principales elementospropuestos por la TEI para la codificacioacuten de corpus orales considerados especiacuteficos de este tipode texto (Sperberg-McQueen y Burnard eds 1994)

Elemento codificado Marca decodificacioacutenen SGML

Definicioacuten

Divisiones (division) ltdivgt Unidades intermedias entre el texto y el enunciado que permitendelimitar partes diferenciadas en un texto

Enunciado (utterance) ltugt Segmento de habla comprendido entre dos pausas o delimitado porun cambio en el turno de palabra puede incluir ademaacutesinformacioacuten sobre la superposicioacuten (ltoverlapgt) de turnos cuando

interviene simultaacuteneamente maacutes de un hablantePausa (pause) ltpausegt Interrupcioacuten de la fonacioacuten percibida entre dos enunciados o en el

interior de los mismos puede describirse en teacuterminos relativos oindicando su duracioacuten

Vocal (vocal) ltvocalgt Elemento vocalizado semi-leacutexico o no leacutexico (pej pausas llenas otoses)

Kineacutesico (kinesic) ltkinesicgt Cualquier fenoacutemeno comunicativo no vocal (p ej gestos)Acontecimiento (event) lteventgt Cualquier fenoacutemeno identificado en la grabacioacuten no necesariamente

vocalizado ni con valor comunicativo (p ej ruidos de fondo)Texto escrito (writing) ltwritinggt Texto escrito que se presenta al hablante durante su intervencioacutenCambio (shift) ltshiftgt Momento en el que se produce un cambio en alguno de los rasgos

paralinguumliacutesticos - calidad de voz intensidad rango tonal ritmo yvelocidad de elocucioacuten - cada uno de los rasgos puede describirsemediante una lista de caracteriacutesticas

Tabla 1 Elementos codificados en las transcripciones de lengua oral seguacuten los estaacutendares de la TEI(Adaptada de Sperberg-McQueen y Burnard eds1994)

Por otra parte la TEI ofrece mecanismos para indicar el comienzo y el final de unfenoacutemeno su duracioacuten y su sincronizacioacuten temporal con otros elementos presenta tambieacuten laposibilidad de marcar unidades inferiores al enunciado - segmentos ltseggt - que permitendelimitar por ejemplo unidades prosoacutedicas e incluye tambieacuten entre sus propuestas las marcasnecesarias para sentildealar fenoacutemenos propios de la lengua hablada como palabras truncadasrepeticiones falsos principios - marcados como ltdelgt (deletion) y especificando el fenoacutemeno -Las partes de la grabacioacuten que el transcriptor no llega a interpretar correctamente - ltuncleargt - ono puede escuchar - ltgapgt - o las correcciones de errores de produccioacuten realizadas por eltranscriptor - ltsicgt para delimitar el error y ltcorrgt para indicar la correccioacuten - son tambieacutenelementos para los cuales la TEI establece marcas de codificacioacuten

Aunque las Guiacuteas de la TEI pueden considerarse un sistema adecuado para la transcripcioacuteny codificacioacuten de gran variedad de materiales los autores propios autores reconocen que

[] the present proposals are not intended to support unmodified every variety of researchundertaken upon spoken material now or in the future some discourse analysts phonologistsand doubtless other may wish to extend the scheme presented here to express more precisely theset of distinctions they wish to draw in their transcriptions Speech regarded as a purely acousticphenomenon may well require different methods from those outlined here as may speechregarded solely as a process of social interaction (Sperberg-McQueen y Burnard eds 1994 cap11)

El proyecto NERC - Network of European Reference Corpora (NERC 1994) se planteoacutecomo uno de sus objetivos la viabilidad de desarrollar una serie de recomendaciones para laconstitucioacuten de corpus y por tanto incluye entre sus resultados indicaciones sobre el tratamientode los corpus orales tanto en lo que se refiere a su codificacioacuten como a la transcripcioacuten de loselementos segmentales y suprasegmentales (Sinclair 1994) El sistema adoptado para latranscripcioacuten y codificacioacuten de corpus se basa como hemos indicado anteriormente en eldesarrollado por French (1991 1992) para la transcripcioacuten del corpus oral desarrollado en elproyecto COBUILD La transcripcioacuten se plantea como una operacioacuten que puede desarrollarse envarios niveles

bull Nivel I consiste en la representacioacuten ortograacutefica introduciendo los miacutenimossignos de puntuacioacuten necesarios sin informacioacuten sobre la interaccioacuten entre hablantes Eneste nivel se contemplan convenciones desarrolladas para la representacioacuten ortograacutefica ypara precisar el uso de la puntuacioacuten

bull Nivel II consiste en una representacioacuten ortograacutefica enriquecida con informacioacutenbaacutesica sobre la identidad de los hablantes el turno de palabra y los elementos no verbales

bull Nivel III contiene toda la informacioacuten presente en el nivel II ademaacutes deinformacioacuten sobre la interaccioacuten entre hablantes - marcando el principio y el final de lossolapamientos - y sobre la entonacioacuten - sentildealando las fronteras entre unidades tonales ylas siacutelabas acentuadas- En opinioacuten de French (1992) la transcripcioacuten a este nivel requiereuna formacioacuten especiacutefica en foneacutetica

bull Nivel IV constituye el nivel maacutes detallado de representacioacuten incluyendo lainformacioacuten propia del nivel III junto con marcas de tonos siacutelabas nucleares y con unatranscripcioacuten fonoloacutegica alineada con una representacioacuten acuacutestica - espectrograma y curvameloacutedica - del enunciado

La recomendacioacuten del proyecto NERC es que la transcripcioacuten de un corpus para el estudiode la lengua oral se lleve a cabo seguacuten las especificaciones del Nivel II adecuado seguacuten Frenchpara todas aquellas investigaciones que no requieran informacioacuten prosoacutedica

En el marco de NERC se llevoacute tambieacuten a cabo una evaluacioacuten de las Guiacuteas de la TEI para latranscripcioacuten de corpus orales de la que se concluye que ldquoThe TEI proposals are broadlycompatible with current practice in the user community as represented by JP Frenchconventions Furthermore in the majority of cases it will be a straightforward matter to link themachine-friendly TEI codes to the more user-friendly encoding systems such as JP Frenchconventions by means of a simple conversion programmerdquo (Payne 199260) La idea de unaconversioacuten automaacutetica entre las transcripciones realizadas seguacuten las propuestas de NERC y de laTEI es naturalmente interesante y refuerza la idea de que existe una compatibilidad general entreambos sistemas (Payne 1992 Johansson 1995a EAGLES 1996) prueba de ello es que en elinforme final de NERC se recomienda el uso de las normas de la TEI

Uno de los objetivos del Grupo de Trabajo sobre Textos Orales de EAGLES fue proponerun conjunto miacutenimo de fenoacutemenos que deberiacutean codificarse en cualquier texto oral La propuestarealizada se describe en EAGLES (1996) y toma elementos del proyecto NERC de la TEI y delGrupo de Trabajo sobre Lengua Oral de EAGLES Considerando los elementos comunes a lossistemas que sirven de base se sugiere que la codificacioacuten de un texto oral debe contener almenos informacioacuten sobre los siguientes aspectos

(1) Elementos vocales y no vocalesbull Elementos vocales semi-leacutexicos

Pertenecen a esta categoriacutea los elementos utilizados principalmente en elhabla espontaacutenea durante los momentos en que el hablante planifica lacontinuacioacuten de su discurso como las llamadas ldquopausas llenasrdquo o ldquosonorasrdquo y los

elementos que marcan dudas en el momento de la produccioacuten del hablaCorresponden a los elementos que en la TEI se marcan con la etiqueta ltvocalgtbull Elementos vocales no leacutexicos

Se incluyen aquiacute todo tipo de sonidos producidos por el hablante - tosesrisas bostezos estornudos etc - que no constituyen formas leacutexicas de la lenguaCorresponden igualmente a los codificados con la marca ltvocalgt en la TEIbull Acontecimientos no vocales y no comunicativos

Comprenden los ruidos producidos por otros hablantes o procedentes delentorno de grabacioacuten Estos acontecimientos se codifican en la TEI mediante lamarca lteventgt

(2) Elementos necesarios en la transcripcioacuten de interacciones verbalesbull Identidad del hablante

Este es un elemento imprescindible en la transcripcioacuten de interaccionesverbales La TEI dispone de los mecanismos para documentar informacioacuten sobrelos hablantes en la cabecera de los textos asiacute como de un sistema para marcar laidentidad de cada participante en el interior del texto aunque pueden utilizarsetambieacuten otros procedimientosbull Turnos de palabra

La finalidad del marcado de los turnos de palabra es indicar un cambio dehablante Ademaacutes de las convenciones de la TEI pueden emplearse otrosprocedimientos mientras se mantenga esta informacioacuten esencial en el estudio de lainteraccioacuten verbalbull Superposicioacuten de turnos de palabra

Existen igualmente diferentes procedimientos para marcar la superposicioacutende emisiones de dos hablantes ademaacutes de las propuestas de la TEI que los tratacomo parte de las estrategias para codificar acontecimientos simultaacuteneos

(3) Elementos relacionados con la actuacioacuten del hablantebull Omisiones en un texto leiacutedo

Si se transcribe un texto leiacutedo y se dispone del original es recomendableanotar las palabras o segmentos omitidos por el locutorbull Autocorrecciones

Es propio del habla espontaacutenea aunque tambieacuten de la lectura que loshablantes realicen correcciones de su propia produccioacuten linguumliacutestica (self-repairs)Parece conveniente marcarlas en la transcripcioacuten de un corpus oralbull Fragmentos de palabras

Los fragmentos de palabras corresponden a uno o maacutes segmentospertenecientes a una palabra que no ha sido totalmente pronunciada por el hablanteen un primer intento y que suelen repetirse cuando eacuteste consigue producir lapalabra completa Es importante indicar este fenoacutemeno en la transcripcioacuten

bull Fragmentos ininteligiblesSe trata de partes de la grabacioacuten que no son comprendidas por el

transcriptor y en la TEI se codifican con la etiqueta ltuncleargt aunque si se desease pueden utilizar marcas maacutes detalladas distinguiendo entre transcripcionescompletamente ininteligibles y entre una posible interpretacioacuten ofrecida por eltranscriptor

Un aspecto conflictivo sigue siendo la identificacioacuten de los enunciados que conforman untexto oral (Schuetze-Coburn 1991) Mientras que en un texto escrito los signos de puntuacioacutenconstituyen un criterio de delimitacioacuten en el habla disponemos de indicios como las pausas laentonacioacuten o el cambio de turno de palabra que nos permiten al menos convencionalmentedefinir un enunciado Sin embargo hasta el momento no se han desarrollado auacuten criteriosobjetivos y consistentes para resolver este problema

7- CONCLUSIONES

La revisioacuten - sin pretensiones de exhaustividad - de los principales sistemas detranscripcioacuten etiquetado y codificacioacuten de corpus orales expuesta en este trabajo pone demanifiesto en primer lugar la multiplicidad de propuestas desarrolladas frente a los intentos deestandarizacioacuten algunos de los cuales auacuten no se han consolidado plenamente pese a su crecienteaceptacioacuten En segundo lugar destaca tambieacuten la heterogeneidad de tradiciones que confluyen enel estudio de la lengua hablada desde la foneacutetica y las tecnologiacuteas del habla hasta el anaacutelisis deldiscurso y de la conversacioacuten diversidad que lleva a la creacioacuten de convenciones especiacuteficas pararesponder a las necesidades de diversas comunidades cientiacuteficas Ante esta situacioacuten la distincioacutenpropuesta por Sinclair (1995107) entre ldquoconformidadrdquo y ldquocompatibilidadrdquo adquiere todo susentido ya que si en ciertos casos la conformidad a un estaacutendar determinado es problemaacutetica porlas limitaciones inherentes a todo sistema comuacuten la compatibilidad - entendida como la facilidadde conversioacuten entre sistemas - deberiacutea ser en cambio un requisito imprescindible en el desarrollode los recursos linguumliacutesticos De esta manera puede tal alcanzarse el equilibrio entre lasnecesidades de un proyecto y las indudables ventajas cientiacuteficas y econoacutemicas que resultan de lareutilizacioacuten de los datos disponibles

BIBLIOGRAFIacuteA

Allen GD 1988 The PHONASCII System Journal of the International PhoneticAssociation 181 9-25

Anderson AH M Badger EG Bard E Boyle G Doherty S Garrod S Isard JKowtko J Mcallister J Miller C Sotillo HS Thompson y R Weinert 1991 The HCRCMap Task corpus Language and Speech 344 351-366

Autesserre D G Peacuterennou y M Rossi 1989 Methodology for the transcription andlabeling of a speech corpus Journal of the International Phonetic Association 191 2-15

Barry WJ y AJ Fourcin 1992 Levels of Labelling Computer Speech and Language 61-14

Beckman ME y GM Ayers GM 1994 Guidelines for ToBI Labelling Version 20February 1994[Documento de Internet disponible en httplingohio-stateeduPhoneticsToBIToBI0html]

Beckman ME y J Hirschberg J 1994 The ToBI Annotation Conventions Apeacutendice A deME Beckman y GM Ayers 1994 Guidelines for ToBI Labelling Version 20 February 1994[Documento de Internet disponible en httplingohio-stateeduPhoneticsToBIToBI0html]

Bruce G 1988 23 Supasegmental categories and 24 The symbolization of temporalevents Journal of the International Phonetic Association 182 75-76

Bruce G 1989 Report from the IPA working group on suprasegmental categories LundUniversity Department of Linguistics General Linguistics Phonetics Working Papers 35 25-40

Burnard L 1995 What is SGML and how does it help Computers and the Humanities291 41-50 The Text Encoding Initiative Background and Context Eds N Ide y J VeacuteronisDordrecht Kluwer Academic Publishers

Burnard L 1995a Text Encoding for Information Exchange An Introduction to the TextEncoding Initiaive TEI Document TEI J31 [Documento de Internet disponible enhttpwwwuiceduorgsteiinfoteij31]

Burnard L 1995b The Text Encoding Initiative an overviewrdquo Spoken English onComputer Transcription Markup and Applications Eds G LEECH G MYERS y JTHOMAS Harlow Longman 69-81

Chafe W 1995 Adequacy user-friendliness and practicality in transcribingrdquo English onComputer Transcription Markup and Applications Eds G Leech G Myers y J ThomasHarlow Longman 54-61

Chan D A Fourcin D Gibbon B Granstroumlm M Huckvale G Kokkinakis K KvaleL Lamel B Lindberg A Moreno J Mouropoulos F Senia I Trancoso C Veld y J Zeiliger1995 EUROM - A Spoken Language Resource for the EU Eurospeech95 Proceedings of the4th European Conference on Speech Communication and Speech Technology Madrid Spain 18-21 September 1995 Vol 1 867-870

Cole RA BT Oshika M Noel T Lander y M Fanty 1994 Labeler Agreement inPhonetic Labeling of Continuous Speech Proceedings of the 1994 International Conference onSpoken Language Processing Yokohama Japan 18-22 September 1994[Documento de Internet disponible en httpwwwcseogieduCSLUcorporapapershtml]

Cook G 1995 Theoretical issues transcribing the untranscribablerdquo Spoken English onComputer Transcription Markup and Applications Eds G Leech G Myers y J ThomasHarlow Longman 35-53

Du Bois JW 1991 Transcription design principles for spoken discourse researchPragmatics 1 71-106

Du Bois JW S Schuetze-Coburn S Cumming y D Paolino 1993 Outline of discoursetranscriptionrdquo Talking Data Transcription and Coding in Discourse Research Eds JAEdwards y MD Lampert Hillsdale NJ Lawrence Erlbaum Associates 45-90

EAGLES 1996 Preliminary Recommendations on Spoken Texts EAGLES DocumentEAG-TCWG-STPP May 1996[Documento de Internet disponible enhttpwwwilcpicnritEAGLES96spokentxspokentxhtml]

Edwards JA 1992 Design principles in the transcription of spoken discourserdquoDirections in Corpus Linguistics Proceedings of Nobel Symposium 82 Stockholm 4-8 August1991 Ed J Svartvik Berlin Mouton de Gruyter 129-147

Edwards JA 1993 Principles and Contrasting Systems of Discourse TranscriptionrdquoTalking Data Transcription and Coding in Discourse Research Eds JA Edwards y MDLampert Hillsdale Hillsdale NJ Lawrence Erlbaum Associates 3-32

Edwards JA 1995 Principles and alternative systems in the transcription coding andmark-up of spoken discourserdquo Spoken English on Computer Transcription Markup andApplications Eds G Leech G Myers y J Thomas Harlow Longman 19-34

Ehlich K 1993 HIAT A Transcription System for Discourse Datardquo Talking DataTranscription and Coding in Discourse Research Eds JA Edwards y MD Lampert HillsdaleNJ Lawrence Erlbaum Associates 123-148

Eisen B 1993 Reliability of speech segmentation and labelling at different levels oftranscription Eurospeech93 3rd European Conference on Speech Communication andTechnology Berlin Germany 21-23 September 1993 Vol 1 673-676

Esling JH y H Gaylord 1993 Computer Codes for Phonetic Symbols Journal of theInternational Phonetic Association 232 77-82

Esling JH 1988 Computer coding of IPA symbols and detailed phonetic representationsof computer databases Journal of the International Phonetic Association 182 99-106

Esling JH 1990 Computer Coding of the IPA Supplementary Report Journal of theInternational Phonetic Association 201 22-26

Fourcin A y JM Dolmazon (on behalf of the SAM Project) 1991 Speech knowledgestandards and assessment Actes du XIIegraveme Congregraves International des Sciences Phoneacutetiques 19-24 aoucirct 1991 Aix-en-Provence France Aix-en-Provence Universiteacute de Provence Service desPublications Vol 5 430-433

Fourcin A G Harland W Barry y V Hazan eds 1989 Speech Input and OutputAssessment Multilingual Methods and Standards Chichester Ellis Horwood Ltd

French JP 1991 Updated notes for soundprint transcribers Working paper Universityof Birmingham October 1991 NERC-WP4-47

French JP 1992 Transcription proposals multilevel system Working paper Universityof Birmingham October 1992 NERC-WP4-50

Gibbon D 1989 Survey of Prosodic Labelling for EC Languages SAM-UBI-190 12February 1989 Report e6 in ESPRIT 2589 (SAM) Interim Report Year 1 Ref SAM-UCLG002 University College London February 1990

Gibbon D R Moore y R Winski eds 1997 Handbook on Standards and Resources forSpoken Language Systems Berlin Mouton De Gruyter [Documento de Internet disponible en httpcoralliliuni-bielefelddeEAGLESeagbookeagbookhtml]

Groslashnnum Thorsen N 1987 Suprasegmental transcription ARIPUC - Annual Report ofthe Institute of Phonetics University of Copenhagen 21 1-27

Gumperz JJ y J Berenz 1993 Transcribing Conversational Exchangesrdquo Talking DataTranscription and Coding in Discourse Research Eds JA Ewards y M D Lampert HillsdaleNJ Lawrence Erlbaum Associates 91-122

Hart J lsquoT R Collier y A Cohen 1990 A Perceptual Study of Intonation An Experimental- Phonetic Approach to Intonation Cambridge Cambridge University Press (Cambridge Studiesin Speech Science and Communication)

Hess W K Kohler y HG Tillmann 1995 The PhonDat-Verbmobil Speech CorpusEurospeech95 Proceedings of the 4th European Conference on Speech Communication andSpeech Technology Madrid Spain 18-21 September 1995 Vol 1 863-866

Hieronymus JL 1994 ASCII phonetic symbols for the worlds languages WorldbetATampT Bell Laboratories Technical Memo [Documento de Internet disponible enhttpwwwcseogieduCSLUcorporapapershtml]

Hirst D A Di Cristo y R Espesser en prensaLevels of representation and levels ofanalysis for intonation Prosody Theory and Experiments Ed M Horne Dordrecht Kluwer

Hirst DJ y A Di Cristo en prensa A survey of intonation systemsrdquo IntonationSystems A Survey of 20 Languages Eds D Hirst y A Di Cristo Cambridge CambridgeUniversity Press

Hirst DJ 1991 Intonation models towards a third generation Actes du XIIegraveme CongregravesInternational des Sciences Phoneacutetiques 19-24 aoucirct 1991 Aix-en-Provence France Aix-en-Provence Universiteacute de Provence Service des Publications Vol 1 305-310

Hirst DJ A Di Cristo M Le Besnerais Z Najim P Nicolas y P Romeacuteas 1993Multilingual modelling of intonation patternsrdquo Proceedings of an ESCA Workshop on ProsodySeptember 27-29 1993 Lund Sweden Eds D House y P Touati Lund University Departmentof Linguistics and Phonetics Working Papers 41 204-207

Hirst DJ N Ide y J Veacuteronis 1994 Coding fundamental frequency patterns for multi-lingual synthesis with INTSINT in the MULTEXT project Conference Proceedings of theSecond ESCAIEEE Workshop on Speech Synthesis September 12-15 1994 Mohonk MountainHouse New Paltz New York USA 77-80

Ide N y J Veacuteronis eds 1995 The Text Encoding Initiative Background and ContextsComputers and the Humanities 29 1-3 Publicado en forma de libro en Dordrecht KluwerAcademic Publishers

IPA 1989 The IPA 1989 Kiel Convention Workgroup 9 report Computer Coding of IPAsymbols and Computer Representation of Individual Languages Journal of the InternationalPhonetic Association 192 81-92

IPA 1993 IPA Chart revised to 1993 Journal of the International Phonetic Association231 [Documento de Internet disponible en httpwwwartsglaacukIPAipacharthtml]

IPA 1995 Preview of the IPA Handbook Journal of the International Phonetic Association251

ISO 8879 1986 Information Processing Text and Office Systems Standard GeneralizedMarkup Language (SGML) Geneva International Organization for Standardization

Johansson S 1995a The approach of the Text Encoding Initiative to the encoding ofspoken discourse Spoken English on Computer Transcription Markup and Applications EdsG Leech G Myers y J Thomas Harlow Longman 82-98

Johansson S 1995b The Encoding of Spoken Texts Computers and the Humanities291 149-158 The Text Encoding Initiative Background and Context Eds N Ide y J VeacuteronisDordrecht Kluwer Academic Publishers 149-158

Keating P P MacEachern A Shryock y S Domiacutenguez 1994 A manual for phonetictranscription Segmentation and labelling of words in spontaneous speech UCLA WorkingPapers in Phonetics 88 91-120

Kluger-Kruse M 1987 Computer Phonetic Alphabet ESPRIT Linguistic Analysis of theEuropean Languages Report BU-CPA0267 July 1987

Krot C y B Taylor 1995 Criteria for Acoustic-Phonetic Segmentation and WordLabelling in the Australian National Database of Spoken Language[Documento de Internet disponible en httpwwwshlrcmqeduaucriteriahtml]

Lander T 1997 The CSLU Labeling Guide Center for Spoken Language UnderstandingOregon Graduate Institute[Documento de Internet disponible en httpwwwcseogieduCSLUcorporapapershtml]

Llisterri J 1994 Prosody Encoding Survey WP 1 Specifications and Standards T15Markup Specifications Deliverable 153 Final version 15 September 1994 LRE Project 62-050MULTEXT

Llisterri J ed 1996 Prosody Tools Efficiency and Failures WP 4 Corpus T46 SpeechMarkup and Validation Deliverable 452 Final version 15 October 1996 LRE Project 62-050MULTEXT

MacWhinney B 1991The CHILDES Project Tools for Analyzing Talk Hillsdale NJLawrence Erlbaum

Marchal A N Nguyen y W Hardcastle 1995 Multitiered phonetic approach to speechlabelling Levels in Speech Communication Relations and Interactions A Tribute to MaxWajskop Hommage agrave Max Wajskop Eds C Sorin J Mariani H Meloni y J SchoengenAmsterdam Elsevier Science BV 149-158

NERC 1994 NERC-1 Network of European Reference Corpora Final Report PisaInstituto di Linguistica Computazionale - CNR January 1994 versioacuten en curso de publicacioacutenTowards a Network of European Reference Corpora Eds N Calzolari M Baker y PG KruytPisa Giardini

Nicolas P y D Hirst 1995 Symbolic coding of Higher-Level Characteristics ofFundamental Frequency Curvesrdquo Eurospeech95 Proceedings of the 4th European Conferenceon Speech Communication and Technology Madrid Spain 18-21 September 1995 Vol 2 989-992

OConnell DC y S Kowal 1994 Some Current Transcription Systems for SpokenDiscourse A critical Analysis Pragmatics 4 81-107

Ochs E 1979 Transcription as Theory Developmental Pragmatics Eds E Ochs E yBB Schieffelin New York Academic Press 43-72

Payne J 1992 Report on the compatibility of JP Frenchs spoken corpus transcriptionconventions with the TEI guidelines for transcription of spoken texts Working paper COBUILDBirmingham and IDS Mannheim December 1992 NERC-WP8WP4-122

Payne J 1995 The COBUILD spoken corpus transcription conventions SpokenEnglish on Computer Transcription Markup and Applications Eds G Leech G Myers y JThomas Harlow Longman 203-207

Payratoacute Ll 1995 Transcripcioacuten del discurso coloquialrdquo El espantildeol coloquial Actas del ISimposio sobre Anaacutelisis del Discurso Oral Almeriacutea 23-25 de noviembre de 1994 Ed L CorteacutesRodriacuteguez Almeriacutea Universidad de Almeriacutea Servicio de Publicaciones 43-70

Pierrehumbert J B 1897 (1980) The Phonology and Phonetics of English IntonationPhD Thesis Department of Linguistics MIT Bloomington Indiana University Linguistics Club

Pitrelli J M Beckman y J Hirschberg 1994 Evaluation of prosodic transcriptionlabelling reliability in the ToBI frameworkrdquo Proceedings of the Third International Conference onSpoken Language Processing Yokohama ICSLP Vol 2 123-126

Pullum GK y WA Ladusaw 1996 (1986) Phonetic Symbol Guide Chicago TheUniversity of Chicago Press 2nd edition

Roach P H Roach A Dew y P Rowlands 1990 Phonetic analysis and the automaticsegmentation and labeling of speech sounds Journal of the International Phonetic Association201 15-21

Schmidt MS C Scott y MA Jack 1993 Phonetic transcription standards for Europeannames (ONOMASTICA) Eurospeech93 3rd European Conference on Speech Communicationand Technology Berlin Germany 21-23 September 1993 Vol 1 279-282

Schuetze-Coburn S 1991Units of intonation in discourse a comparison of acoustic andauditory analysis Language and Speech 343 207-234

Selting M 1987 Descriptive categories for the auditive analysis of intonation inconversation Journal of Pragmatics 11 777-791

Selting M 1988 The role of intonation in the organisation of repair and problem handlingsequences in conversation Journal of Pragmatics 12 293-322

Senia F y JG Van Velden 1997 Specifications of orthographic transcription and lexiconconventions LRE-4001 SpeechDat Technical Report SD132 Final version 10 January 1997[Documento de Internet disponible en httpwwwphonetikuni-muenchendeSpeechDathtml]

Silverman K M Beckman J Pitrelli M Ostendorf C Wightman P Price JPierrehumbert y J Hirschberg 1992 TOBI A standard for labelling English prosodyProceedings of the Second International Conference on Spoken Language Processing ICSLP-92Banff October 1992 867-870

Sinclair J 1994 Spoken Language [3B] PhoneticPhonemic and Prosodic Annotation[52] NERC 1994 NERC-1 Network of European Reference Corpora Final Report PisaVersioacuten en curso de publicacioacuten Towards a Network of European Reference Corpora Eds NCalzolari M Baker y PG Kruyt Pisa Giardini

Sinclair J 1995 From theory to practicerdquo Spoken English on Computer TranscriptionMarkup and Applications Eds G Leech G Myers Y J Thomas Harlow Longman 99- 112

Sperberg-McQueen CM y L Burnard eds 1994 Guidelines for Electronic Text Encodingand Interchange TEI P3 Chicago and Oxford Association for Computational Linguistics Association for Computers and the Humanities Association for Literary and LinguisticComputing [Cap 11 Transcriptions of Speech] [Documento de Internet disponible enhttpetextvirginiaeduTEIhtml]

Strangert E y M Heldner 1995 Labelling of boundaries and prominences byphonetically experienced and non-experienced transcribers Phonum 3 Reports from theDepartment of Phonetics Umearing University 85-109 [Documento de Internet disponible enhttpwwwlingumusefonphonum3html]

Teubert W 1993 Phonetic Phonemic and Prosodic Annotation Final Report IDSMannheim February 1993 NERC-WP8-171

Tillmann HG y B Pompino-Marschall 1993 Theoretical Principles ConcerningSegmentation Labelling Strategies and Levels of Categorical Annotation for Spoken LanguageDatabase Systems Eurospeech93 3rd European Conference on Speech Communication andTechnology Berlin Germany 21-23 September 1993 Vol 3 1691-1694

Trancoso I 1995 The ONOMASTICA Interlanguage Pronunciation LexiconrdquoEurospeech95 Proceedings of the 4th European Conference on Speech Communication andTechnology Madrid Spain 18-21 September 1995 Vol 1 829-832

Wells JC 1987 Computer Coded Phonetic Transcription Journal of the InternationalPhonetic Association 172 94-114

Wells JC 1989 Computer-coded phonemic notation of individual languages of theEuropean Community Journal of the International Phonetic Association 191 31-54

Wells JC 1994 Computer-coding the IPA a proposed extension of SAMPA SpeechHearing and Language Work in Progress 1994 (University College London Department ofPhonetics and Linguistics) 8 271-289

Wells JC 1995 SAMPROSA (SAM Prosodic Transcription [Documento de Internetdisponible en httpwwwphonuclacukhomesampasamprosahtm]

Wells JC W Barry M Grice A Fourcin y D Gibbon 1992 Standard Computer-Compatible Transcription SAM Stage Report Sen3 SAM UCL-037 28 February 1992 SAM(1992) Esprit Project 2589 (SAM) Multilingual Speech InputOutput AssessmentMethodologyand Standardisation Final Report Year Three 1III91-28II1992 London University CollegeLondon

Wesenick M-B y F Schiel 1995 Feasibility of Automatic Annotation and BuildingPronunciation Lexica from Corpus Material LRE-63314 SpeechDat Report D3123 Finalversion 10 October 1995[Documento de Internet disponible en httpwwwicpgrenetfrSpeechDathomehtml]

Winski R R Moore y D Gibbon 1995 EAGLES Spoken Language Working GroupOverview and Resultsrdquo Eurospeech95 Proceedings of the 4th European Conference on SpeechCommunication and Speech Technology Madrid Spain 18-21 September 1995 Vol 1 841-844[Documento de Internet disponible en httpcoralliliuni-bielefeldde~gibbonEAGLESrwpaperrwpaperhtml]

  • 1- INTRODUCCIOacuteN
  • 2- NIVELES DE REPRESENTACIOacuteN ETIQUETADO Y CODIFICACIOacuteN
  • 3- REPRESENTACIOacuteN ORTOGRAacuteFICA DE CORPUS ORALES
  • 31- Propuestas para la representacioacuten ortograacutefica de corpus orales en el aacutembito de la linguumliacutestica de corpus
  • 32- Propuestas para la representacioacuten ortograacutefica de corpus orales en el aacutembito de las tecnologiacuteas del habla
  • 4- REPRESENTACIOacuteN FONEacuteTICA DE CORPUS ORALES
  • 41- La representacioacuten foneacutetica de los elementos segmentales
  • 42- La representacioacuten foneacutetica de los elementos suprasegmentales
  • 5- ETIQUETADO FONEacuteTICO DE CORPUS ORALES
  • 51- Niveles de etiquetado foneacutetico de corpus orales
  • 52- La transcripcioacuten y el etiquetado automaacutetico de corpus orales
  • 6- TRANSCRIPCIOacuteN Y CODIFICACIOacuteN DE CORPUS PARA EL ANAacuteLISIS DE LA LENGUA ORAL
  • 61- Los requisitos de una transcripcioacuten
  • 62- Propuestas de estandarizacioacuten para la transcripcioacuten y codificacioacuten de corpus orales
  • 7- CONCLUSIONES
  • BIBLIOGRAFIacuteA
Page 10: Transcripción, etiquetado y codificación de corpus orales

la estilizacioacuten de la curva meloacutedica realizada a partir de una interpolacioacuten entre puntos en los quese da un cambio significativo en el valor de la frecuencia fundamental (target points) Estospuntos que podriacuteamos denominar ldquode inflexioacutenrdquo - definidos como la combinacioacuten de un valortemporal y un valor frecuencial - son susceptibles de codificarse automaacuteticamente mediante lossiacutembolos de INTSINT previa introduccioacuten de marcas de frontera entre las unidades entonativasCon ello se obtiene una representacioacuten fonoloacutegica del contorno meloacutedico simbolizando losdiferentes niveles tonales de la curva original El sistema se basa en la representacioacuten desecuencias tonales consideradas tanto desde una perspectiva global en funcioacuten del rango devariacioacuten tonal del hablante como desde un punto de vista local en relacioacuten con la altura de puntosde inflexioacuten anteriores En el primer caso se definen tres niveles T (Top) M (Mid) y B (Bottom)mientras que en el segundo se marcan cinco posibilidades H (Higher) L (Lower) S (Same) U(Upstep) o D (Downstep) El proceso de modelizacioacuten necesario para transcribir medianteINTSINT ha sido aplicado a varias lenguas (Hirst et al 1993) y se emplea tambieacuten para laanotacioacuten prosoacutedica de parte del corpus EUROM en franceacutes ingleacutes alemaacuten sueco y espantildeol(Hirst et al 1994 Llisterri ed 1996) llevada a cabo en el marco del proyecto LRE 62-050MULTEXT - Multilingual Text Tools and Corpora Es posible tambieacuten aplicar INTSINT aniveles maacutes altos como el paacuterrafo tal como se muestra en Nicolas y Hirst (1995)

5- ETIQUETADO FONEacuteTICO DE CORPUS ORALES

Al igual que en el caso de los corpus textuales una vez recogidos los materiales de base deun corpus oral debe llevarse a cabo un tratamiento de los mismos que permita su utilizacioacutenposterior El primer paso suele ser la transcripcioacuten ortograacutefica que en determinado tipo de corpusse acompantildea de una transcripcioacuten foneacutetica o fonoloacutegica A continuacioacuten a cada segmento de laonda sonora se le asocia una etiqueta (labelling) que lo define en teacuterminos foneacuteticos o fonoloacutegicosy se lleva a cabo la alineacioacuten (alignment) entre la sentildeal sonora y las etiquetas obteniendo unarepresentacioacuten que puede compararse a la partitura musical de una obra para voz y orquesta Elproceso de etiquetado segmental puede llevarse a cabo a varios niveles como veremos en esteapartado y completarse con una anotacioacuten de las caracteriacutesticas suprasegmentales codificadasseguacuten los diversos sistemas que hemos expuesto anteriormente Si se cumplen las etapasmencionadas se llega a disponer de un corpus que contiene la sentildeal sonora sincronizada con latranscripcioacuten ortograacutefica y con la transcripcioacuten foneacutetica o fonoloacutegica de modo que una vezdefinida una estructura de base de datos es posible consultar el corpus partiendo de etiquetasfoneacuteticas de marcas prosoacutedicas o de la transcripcioacuten ortograacutefica al tiempo que se accede a lagrabacioacuten correspondiente

Los corpus de lengua oral que consisten uacutenicamente en transcripciones ortograacuteficas - ya queno suele ser factible realizar una transcripcioacuten foneacutetica completa de un nuacutemero elevado de horasde grabacioacuten - conllevan un procesamiento menos complejo aunque en algunos casos contienenmarcas prosoacutedicas uacutetiles para el anaacutelisis del discurso o de la conversacioacuten como veremos en elapartado 6

51- Niveles de etiquetado foneacutetico de corpus orales

Una cuestioacuten que se plantea inevitablemente a la hora de introducir informacioacuten adicionalsobre los datos recogidos es el nivel de etiquetado del corpus Se han realizado varias propuestassobre los distintos niveles en los que se puede realizar el etiquetado foneacutetico de un corpusalgunas de ellas ligadas al proyecto SAM como la de Barry y Fourcin (1992) en la que seplantean cinco niveles posibles de etiquetado foneacutetico de un corpus

bull Nivel fiacutesico en el que se etiquetan las propiedades acuacutesticas presentes en la sentildealsonora

bull Nivel acuacutestico-foneacutetico en el que se marcan las propiedades de los segmentos enteacuterminos de categoriacuteas foneacuteticas como oclusioacuten friccioacuten sonoridad nasalizacioacuten etc

bull Nivel de transcripcioacuten estrecha en el que se caracterizan los segmentos utilizandolos siacutembolos del AFI o de sus equivalentes computacionales

bull Nivel de transcripcioacuten fonoloacutegica (o foneacutemica) sentildealando uacutenicamente aquelloselementos funcionalmente distintivos que se encuentran en la palabra pronunciadaaisladamente en un estilo cuidado (citation form)

bull Nivel de transcripcioacuten ancha en el que se utilizan los siacutembolos correspondientes alos elementos fonoloacutegicos en una lengua dada para transcribir realizaciones alofoacutenicascondicionadas por el contexto3

A estos cinco niveles debe antildeadirse auacuten la anotacioacuten prosoacutedica considerada de formaindependiente por los autores de la propuesta

Una propuesta similar de etiquetado tambieacuten en cinco niveles - caracteriacutesticas acuacutesticas denaturaleza subfoneacutemica caracteriacutesticas segmentales realizaciones foneacuteticas forma canoacutenica de laspalabras y transcripcioacuten ortograacutefica - se presenta en Tillmann y Pompino-Marschall (1993) y hasido utilizada con eacutexito en el proyecto alemaacuten PhonDat Igualmente pueden verse las propuestasde Autesserre et al (1989) enmarcadas en el contexto del proyecto SAM y los trabajos deMarchal et al (1995) o Roach et al (1990)

La transcripcioacuten y el etiquetado de corpus orales se ha abordado en el marco del proyectoEAGLES desde una doble perspectiva la de la foneacutetica y las tecnologiacuteas del habla en el Grupo deTrabajo sobre Lengua Oral y desde la de la linguumliacutestica de corpus en el marco de las actividades delGrupo de Trabajo sobre Corpus Textuales El trabajo llevado a cabo en el grupo dedicado a lalengua hablada en EAGLES recoge esencialmente las propuestas desarrolladas en el marco deSAM y de PhonDat Los niveles de etiquetado propuesto son los siguientes (Gibbon Moore yWinski eds 1997)

bull Nivel ortograacutefico en el que se utiliza la representacioacuten ortograacutefica convencional

3 La distincioacuten entre los dos uacuteltimos niveles puede ejemplificarse con el caso de las asimilaciones mientras que enla transcripcioacuten ancha encontrariacuteamos [um poko] (un poco) en el caso de una transcripcioacuten fonoloacutegica apareceriacutea [unpoko] si se opta por no simbolizar archifonemas en la transcripcioacuten En cambio [mismo] se representariacutea de lamisma forma en ambos niveles encontraacutendose la transcripioacuten [mizmo] en el nivel de transcripcioacuten estrecha

bull Nivel de formas canoacutenicas (citation form) representando la forma depronunciacioacuten aislada de las palabra en estilo cuidado

bull Nivel de transcripcioacuten ancha o fonotiacutepica en este nivel se utilizan los siacutembolosque representan elementos fonoloacutegicos en una lengua dada pero al igual que en lapropuesta de Barry y Fourcin se transcriben aquellos fenoacutemenos predictibles propios dela foneacutetica sintaacutectica SAMPA seriacutea pues un alfabeto foneacutetico adecuado para este nivelde transcripcioacuten

bull Nivel de transcripcioacuten estrecha basado en una representacioacuten alofoacutenica de lasrealizaciones foneacuteticas de los hablantes para el cual puede utilizarse un alfabeto foneacuteticocomo X-SAMPA

bull Nivel acuacutestico-foneacutetico en el que se distinguen caracteriacutesticas acuacutesticas de lossegmentos observables en una representacioacuten de la onda sonora

bull Nivel fiacutesico representado en teacuterminos de paraacutemetros acuacutesticos o articulatoriosbull Fenoacutemenos no linguumliacutesticos la inclusioacuten de este nivel permite representar sonidos

de naturaleza comunicativa o no introducidos por el hablante asiacute como toda aquellainformacioacuten paralinguumliacutestica que se considere de intereacutes tambieacuten permite sentildealas los ruidosexternos en la grabacioacuten

Vale la pena detenerse brevemente en el nivel de las formas canoacutenicas y en el concepto deldquotranscripcioacuten fonotiacutepicardquo que como puede verse aparecen de forma recurrente en diversaspropuestas La inclusioacuten de forma canoacutenicas en el etiquetado de un corpus responde a un doblemotivo especialmente ligado a necesidades tecnoloacutegicas en primer lugar estas formas permitenderivar automaacuteticamente mediante un conjunto de reglas una transcripcioacuten ancha o fonotiacutepica enla que se incluyen los elementos alofoacutenicos cuya aparicioacuten esta condicionada por el contextofoneacutetico en segundo lugar a partir de las formas canoacutenicas puede crearse de forma automaacutetica undiccionario foneacutetico partiendo de un corpus transcrito (Wesenick y Schiel 1995 Senia y vanVelden 1997) lo que tiene utilidad para el desarrollo de sistemas de siacutentesis y reconocimiento delhabla y tambieacuten para la descripcioacuten linguumliacutestica La transcripcioacuten denominada ldquofonotiacutepicardquo en lostrabajos de SAM constituye un nivel intermedio entre la realizacioacuten foneacutetica y la transcripcioacutenpuramente fonoloacutegica Por otra parte el nivel de transcripcioacuten de formas canoacutenicas estaacutedirectamente relacionado con la representacioacuten ortograacutefica facilitando asiacute la transcripcioacuten foneacuteticaautomaacutetica de corpus en este nivel mediante el desarrollo de los correspondientes sistemas dereglas

En el informe del Grupo de Trabajo de Corpus Textuales de EAGLES (EAGLES 1996) seintenta realizar una siacutentesis entre las necesidades de diversos campos de estudio Se sugieren porello tres niveles de representacioacuten

bull S1 representacioacuten ortograacutefica del textobull S2 representacioacuten fonoloacutegica de las palabras en su forma canoacutenicabull S3 transcripcioacuten foneacutetica consistente en una representacioacuten simboacutelica discreta de

la realizacioacuten del enunciado tal como es percibido por el transcriptor

Como puede observarse estos tres niveles encuentran su equivalente en los nivelespropuesto por Barry y Fourcin (1992) y en los definidos por el Grupo de Trabajo de Lengua

Oral Para la transcripcioacuten del nivel S2 puede utilizarse SAMPA mientras que la del nivel S3requiere el uso de un alfabeto foneacutetico como X-SAMPA

52- La transcripcioacuten y el etiquetado automaacutetico de corpus orales

La tarea de transcribir y etiquetar foneacuteticamente un corpus oral representa un considerableesfuerzo tanto en teacuterminos de tiempo como de los recursos econoacutemicos necesarios para llevar acabo esta labor El etiquetado manual requiere por otro lado el desarrollo de convencionesdetalladas para asegurar la consistencia entre diversos transcriptores (Keating et al 1994 Krot yTaylor 1995 Lander 1997) ademaacutes del establecimiento de un proceso de validacioacutencomprobando la fiabilidad de los resultados obtenidos (Eisen 1993 Cole et al 1994 Strangert yHeldener 1995) Por estos motivos uno de los intereses principales de los investigadores en elcampo de las tecnologiacuteas del habla ha sido llevar a cabo el etiquetado de forma semi-automaacutetica oidealmente automaacutetica Un primer nivel de transcripcioacuten - tanto de formas canoacutenicas comofonotiacutepica - puede obtenerse automaacuteticamente como acabamos de mencionar a partir de larepresentacioacuten ortograacutefica si se dispone de un conjunto de reglas que establezcan lascorrespondencias entre la representacioacuten ortograacutefica y la foneacutetica

Sin embargo un etiquetado foneacutetico en los niveles de transcripcioacuten maacutes detallada requiere laposibilidad de acceder a la onda sonora y un procedimiento de anaacutelisis de la sentildeal La primeraoperacioacuten que debe realizar un sistema de etiquetado automaacutetico es la segmentacioacuten del continuumsonoro en unidades menores - segmentos o caracteriacutesticas acuacutesticas en funcioacuten del nivel detranscripcioacuten deseado - para pasar despueacutes a la asignacioacuten de etiquetas - siacutembolos detranscripcioacuten - que describan sus caracteriacutesticas Este es el proceso conocido propiamente comoetiquetado (labelling) que cuando se realiza de forma automaacutetica debe superar los obstaacuteculosderivados de la naturaleza no discreta de la sentildeal sonora - resultado de mecanismos como lacoarticulacioacuten - y de la variabilidad de realizaciones foneacuteticas entre hablantes o incluso en unmismo hablante

Para que el corpus sea uacutetil el etiquetado foneacutetico debe estar temporalmente sincronizadocon la sentildeal sonora y con la representacioacuten ortograacutefica operacioacuten que se realiza en el procesoconocido como alineacioacuten temporal (time alignment) llevado a cabo tambieacuten de forma automaacuteticaEsta alineacioacuten puede hacerse de un modo global sentildealando en la onda sonora las fronteras entrepalabras ortograacuteficas - para facilitar el acceso a la grabacioacuten a partir de este nivel de representacioacuten(Lander 1997) - o los puntos en los que se encuentran siacutelabas acentuadas tal como sucede porejemplo en el proyecto MULTEXT

En el campo de las tecnologiacuteas del habla se han llevado a cabo numerosiacutesimos trabajosencaminados al disentildeo de sistemas de segmentacioacuten etiquetado y alineacioacuten temporal automaacuteticasde corpus orales utilizando las teacutecnicas propias del reconocimiento del habla como los Modelosde Markov o las redes neuronales Cabe destacar que tales teacutecnicas no soacutelo son uacutetiles en eldesarrollo de corpus en este aacutembito sino que constituyen una herramienta importante en otrostipos de corpus sin embargo es preciso reconocer que el habla espontaacutenea - especialmente si seha recogido mediante grabaciones realizadas en un entorno natural - plantea auacuten problemas en lo

que se refiere a su transcripcioacuten y etiquetado automaacuteticos pese a los notabiliacutesimos avances quetienen lugar en este campo

6- TRANSCRIPCIOacuteN Y CODIFICACIOacuteN DE CORPUS PARA EL ANAacuteLISIS DE LA LENGUA ORAL

En este uacuteltimo apartado incidiremos en las cuestiones relacionadas con la transcripcioacuten ycodificacioacuten de corpus orales que pueden presentar un mayor intereacutes para aacutembitos como elanaacutelisis de discurso o de la conversacioacuten y para el estudio de la lengua oral en todos los niveles dela descripcioacuten linguumliacutestica Como indicaacutebamos al principio la transcripcioacuten y la codificacioacuten de loselementos transcritos son en principio dos operaciones conceptualmente diferentes Sinembargo en la praacutectica habitual en las disciplinas a las que se refiere este apartado suelen ser dosoperaciones que se realizan simultaacuteneamente ya que al mismo tiempo que se realiza latransliteracioacuten se introducen las marcas necesarias para la codificacioacuten de los elementos que se hadecidido introducir en el corpus Por ello en muchos casos la discusioacuten sobre la transcripcioacuten y lacodificacioacuten se realiza conjuntamente en la bibliografiacutea sobre el tema

61- Los requisitos de una transcripcioacuten

El investigador que decide constituir un corpus de lengua oral se encuentra en estosmomentos con una gran variedad de criterios en lo que se refiere a la transcripcioacuten y a la seleccioacutende los elementos que apareceraacuten codificados en el corpus Hemos hecho ya referencia en elapartado 3 a las diversas convenciones para la representacioacuten ortograacutefica y cintildeeacutendonos al aacutembitodel anaacutelisis del discurso y la conversacioacuten constatamos igualmente la existencia una grandiversidad de propuestas En una revisioacuten de las mismas Payratoacute (1995) hace por ejemploreferencia a los sistemas de transcripcioacuten y codificacioacuten procedentes de la etnometodologiacuteainteresados en reflejar la interaccioacuten verbal a los meacutetodos desarrollados en el marco de laetnografiacutea de la comunicacioacuten y de la sociolinguumliacutestica interaccional4 o a propuestas utilizadas en elestudio del lenguaje infantil Ante tal situacioacuten parece conveniente plantearse cuaacuteles son losrequisitos que debe cumplir una transcripcioacuten de la lengua oral tema que ha sido abordado pordiversos autores (DuBois 1991 Elich 1993 Edwards 1993 OrsquoConnell y Kowal 1994) Trasrevisar aportaciones anteriores Payratoacute (1995) resume los requisitos que teoacutericamente deberiacuteanexigirse a toda transcripcioacuten

bull Neutralidad o fidelidad de modo que la transcripcioacuten no sea interpretativabull Globalidad o complejidad recogiendo la totalidad de los fenoacutemenos que aparecen

en el discurso oralbull Omnifuncionalidad permitiendo diversos usos y aplicacionesbull Claridad tanto desde el punto de vista del aprendizaje del sistema como de la

legibilidad de la representacioacutenbull Universalidad y compatibilidad entre sistemas informaacuteticos

4 Estos sistemas se comparan en OrsquoConnell y Kowal (1994) Pueden encontrarse consideraciones generales sobre latranscripcioacuten y codificacioacuten de la lengua oral en el anaacutelisis del discurso y la conversacioacuten en 1995Ochs (1979) DuBois (1991) Edwards (1992 1993 1995) Du Bois et al (1993) Gumperz y Berenz (1993) Cook (1995) Chafe(1995) y en Sinclair (1995)

Sin embargo puesto que en la praacutectica se transcribe en funcioacuten de los objetivos para losque se ha definido el corpus Payratoacute (1995) considera que un sistema de transcripcioacuten debe serante todo interpretativo de los datos selectivo en cuanto a los fenoacutemenos que se transcribenpertinente para el objeto de investigacioacuten coherente con la base teoacuterica adoptada por elinvestigador fiel en cuanto a la representacioacuten de los datos y flexible para que sea posible suutilizacioacuten en diversos estudios Por otra parte en opinioacuten de este autor la simbologiacutea utilizadadebe ser clara econoacutemica sencilla exenta de ambiguumledad y compatible con sistemas internacionesestandarizados Este uacuteltimo aspecto nos parece especialmente importante ya que como sentildeala elmismo Payratoacute (1995 58)

[] en ninguacuten caso puede olvidarse que los datos de una investigacioacuten no deberiacutean sertratados nunca de forma tan parcial o idiosincraacutesica que se impidiera o dificultara el uso por partede otros investigadores La transcripcioacuten del discurso oral es una actividad suficientementecostosa y conflictiva para tomar precauciones en este sentido y ninguna comunidad cientiacuteficapuede permitirse el lujo de particularismos (en aspectos tan elementales) que obstruyan el debateo conviertan en inaprovechables una fuente de informacioacuten

62- Propuestas de estandarizacioacuten para la transcripcioacuten y codificacioacuten de corpus orales

Ante la diversidad de propuestas para la transcripcioacuten y codificacioacuten de la lengua oral queacabamos de constatar el surgimiento de la linguumliacutestica de corpus y muy especialmente lasnecesidades derivadas del intercambio electroacutenico de textos propiciaron la aparicioacuten de proyectose iniciativas centrados en la creacioacuten de estaacutendares tanto en lo que se refiere a la transcripcioacutencomo a la codificacioacuten En los proacuteximos apartados revisamos sucintamente algunos de ellos

Uno de los capiacutetulos de las Guiacuteas desarrolladas por la TEI estaacute dedicado a la transcripcioacutende corpus orales (Johansson 1995a b) En eacutel se describe la estructura baacutesica de la representacioacutende un texto oral - cabecera texto y divisiones - y se definen los procedimientos basados enSGML para la representacioacuten de los elementos estructurales baacutesicos informacioacuten contextualinformacioacuten temporal enunciados pausas elementos vocalizados semi-leacutexicos o no leacutexicoselementos kineacutesicos otros tipos de eventos comunicativos y texto presentado en forma escrita alhablante Tambieacuten se ofrecen en este capiacutetulo indicaciones para la segmentacioacuten y el alineamientoasiacute como recomendaciones para la transcripcioacuten de superposiciones entre hablantes de formas depalabras prosodia elementos paralinguumliacutesticos - tempo intensidad rango tonal tensioacuten ritmo ycalidad de voz - y alteraciones en el decurso foacutenico Para la representacioacuten de la informacioacutenfoneacutetica se recomienda el uso del AFI En la siguiente tabla se resumen los principales elementospropuestos por la TEI para la codificacioacuten de corpus orales considerados especiacuteficos de este tipode texto (Sperberg-McQueen y Burnard eds 1994)

Elemento codificado Marca decodificacioacutenen SGML

Definicioacuten

Divisiones (division) ltdivgt Unidades intermedias entre el texto y el enunciado que permitendelimitar partes diferenciadas en un texto

Enunciado (utterance) ltugt Segmento de habla comprendido entre dos pausas o delimitado porun cambio en el turno de palabra puede incluir ademaacutesinformacioacuten sobre la superposicioacuten (ltoverlapgt) de turnos cuando

interviene simultaacuteneamente maacutes de un hablantePausa (pause) ltpausegt Interrupcioacuten de la fonacioacuten percibida entre dos enunciados o en el

interior de los mismos puede describirse en teacuterminos relativos oindicando su duracioacuten

Vocal (vocal) ltvocalgt Elemento vocalizado semi-leacutexico o no leacutexico (pej pausas llenas otoses)

Kineacutesico (kinesic) ltkinesicgt Cualquier fenoacutemeno comunicativo no vocal (p ej gestos)Acontecimiento (event) lteventgt Cualquier fenoacutemeno identificado en la grabacioacuten no necesariamente

vocalizado ni con valor comunicativo (p ej ruidos de fondo)Texto escrito (writing) ltwritinggt Texto escrito que se presenta al hablante durante su intervencioacutenCambio (shift) ltshiftgt Momento en el que se produce un cambio en alguno de los rasgos

paralinguumliacutesticos - calidad de voz intensidad rango tonal ritmo yvelocidad de elocucioacuten - cada uno de los rasgos puede describirsemediante una lista de caracteriacutesticas

Tabla 1 Elementos codificados en las transcripciones de lengua oral seguacuten los estaacutendares de la TEI(Adaptada de Sperberg-McQueen y Burnard eds1994)

Por otra parte la TEI ofrece mecanismos para indicar el comienzo y el final de unfenoacutemeno su duracioacuten y su sincronizacioacuten temporal con otros elementos presenta tambieacuten laposibilidad de marcar unidades inferiores al enunciado - segmentos ltseggt - que permitendelimitar por ejemplo unidades prosoacutedicas e incluye tambieacuten entre sus propuestas las marcasnecesarias para sentildealar fenoacutemenos propios de la lengua hablada como palabras truncadasrepeticiones falsos principios - marcados como ltdelgt (deletion) y especificando el fenoacutemeno -Las partes de la grabacioacuten que el transcriptor no llega a interpretar correctamente - ltuncleargt - ono puede escuchar - ltgapgt - o las correcciones de errores de produccioacuten realizadas por eltranscriptor - ltsicgt para delimitar el error y ltcorrgt para indicar la correccioacuten - son tambieacutenelementos para los cuales la TEI establece marcas de codificacioacuten

Aunque las Guiacuteas de la TEI pueden considerarse un sistema adecuado para la transcripcioacuteny codificacioacuten de gran variedad de materiales los autores propios autores reconocen que

[] the present proposals are not intended to support unmodified every variety of researchundertaken upon spoken material now or in the future some discourse analysts phonologistsand doubtless other may wish to extend the scheme presented here to express more precisely theset of distinctions they wish to draw in their transcriptions Speech regarded as a purely acousticphenomenon may well require different methods from those outlined here as may speechregarded solely as a process of social interaction (Sperberg-McQueen y Burnard eds 1994 cap11)

El proyecto NERC - Network of European Reference Corpora (NERC 1994) se planteoacutecomo uno de sus objetivos la viabilidad de desarrollar una serie de recomendaciones para laconstitucioacuten de corpus y por tanto incluye entre sus resultados indicaciones sobre el tratamientode los corpus orales tanto en lo que se refiere a su codificacioacuten como a la transcripcioacuten de loselementos segmentales y suprasegmentales (Sinclair 1994) El sistema adoptado para latranscripcioacuten y codificacioacuten de corpus se basa como hemos indicado anteriormente en eldesarrollado por French (1991 1992) para la transcripcioacuten del corpus oral desarrollado en elproyecto COBUILD La transcripcioacuten se plantea como una operacioacuten que puede desarrollarse envarios niveles

bull Nivel I consiste en la representacioacuten ortograacutefica introduciendo los miacutenimossignos de puntuacioacuten necesarios sin informacioacuten sobre la interaccioacuten entre hablantes Eneste nivel se contemplan convenciones desarrolladas para la representacioacuten ortograacutefica ypara precisar el uso de la puntuacioacuten

bull Nivel II consiste en una representacioacuten ortograacutefica enriquecida con informacioacutenbaacutesica sobre la identidad de los hablantes el turno de palabra y los elementos no verbales

bull Nivel III contiene toda la informacioacuten presente en el nivel II ademaacutes deinformacioacuten sobre la interaccioacuten entre hablantes - marcando el principio y el final de lossolapamientos - y sobre la entonacioacuten - sentildealando las fronteras entre unidades tonales ylas siacutelabas acentuadas- En opinioacuten de French (1992) la transcripcioacuten a este nivel requiereuna formacioacuten especiacutefica en foneacutetica

bull Nivel IV constituye el nivel maacutes detallado de representacioacuten incluyendo lainformacioacuten propia del nivel III junto con marcas de tonos siacutelabas nucleares y con unatranscripcioacuten fonoloacutegica alineada con una representacioacuten acuacutestica - espectrograma y curvameloacutedica - del enunciado

La recomendacioacuten del proyecto NERC es que la transcripcioacuten de un corpus para el estudiode la lengua oral se lleve a cabo seguacuten las especificaciones del Nivel II adecuado seguacuten Frenchpara todas aquellas investigaciones que no requieran informacioacuten prosoacutedica

En el marco de NERC se llevoacute tambieacuten a cabo una evaluacioacuten de las Guiacuteas de la TEI para latranscripcioacuten de corpus orales de la que se concluye que ldquoThe TEI proposals are broadlycompatible with current practice in the user community as represented by JP Frenchconventions Furthermore in the majority of cases it will be a straightforward matter to link themachine-friendly TEI codes to the more user-friendly encoding systems such as JP Frenchconventions by means of a simple conversion programmerdquo (Payne 199260) La idea de unaconversioacuten automaacutetica entre las transcripciones realizadas seguacuten las propuestas de NERC y de laTEI es naturalmente interesante y refuerza la idea de que existe una compatibilidad general entreambos sistemas (Payne 1992 Johansson 1995a EAGLES 1996) prueba de ello es que en elinforme final de NERC se recomienda el uso de las normas de la TEI

Uno de los objetivos del Grupo de Trabajo sobre Textos Orales de EAGLES fue proponerun conjunto miacutenimo de fenoacutemenos que deberiacutean codificarse en cualquier texto oral La propuestarealizada se describe en EAGLES (1996) y toma elementos del proyecto NERC de la TEI y delGrupo de Trabajo sobre Lengua Oral de EAGLES Considerando los elementos comunes a lossistemas que sirven de base se sugiere que la codificacioacuten de un texto oral debe contener almenos informacioacuten sobre los siguientes aspectos

(1) Elementos vocales y no vocalesbull Elementos vocales semi-leacutexicos

Pertenecen a esta categoriacutea los elementos utilizados principalmente en elhabla espontaacutenea durante los momentos en que el hablante planifica lacontinuacioacuten de su discurso como las llamadas ldquopausas llenasrdquo o ldquosonorasrdquo y los

elementos que marcan dudas en el momento de la produccioacuten del hablaCorresponden a los elementos que en la TEI se marcan con la etiqueta ltvocalgtbull Elementos vocales no leacutexicos

Se incluyen aquiacute todo tipo de sonidos producidos por el hablante - tosesrisas bostezos estornudos etc - que no constituyen formas leacutexicas de la lenguaCorresponden igualmente a los codificados con la marca ltvocalgt en la TEIbull Acontecimientos no vocales y no comunicativos

Comprenden los ruidos producidos por otros hablantes o procedentes delentorno de grabacioacuten Estos acontecimientos se codifican en la TEI mediante lamarca lteventgt

(2) Elementos necesarios en la transcripcioacuten de interacciones verbalesbull Identidad del hablante

Este es un elemento imprescindible en la transcripcioacuten de interaccionesverbales La TEI dispone de los mecanismos para documentar informacioacuten sobrelos hablantes en la cabecera de los textos asiacute como de un sistema para marcar laidentidad de cada participante en el interior del texto aunque pueden utilizarsetambieacuten otros procedimientosbull Turnos de palabra

La finalidad del marcado de los turnos de palabra es indicar un cambio dehablante Ademaacutes de las convenciones de la TEI pueden emplearse otrosprocedimientos mientras se mantenga esta informacioacuten esencial en el estudio de lainteraccioacuten verbalbull Superposicioacuten de turnos de palabra

Existen igualmente diferentes procedimientos para marcar la superposicioacutende emisiones de dos hablantes ademaacutes de las propuestas de la TEI que los tratacomo parte de las estrategias para codificar acontecimientos simultaacuteneos

(3) Elementos relacionados con la actuacioacuten del hablantebull Omisiones en un texto leiacutedo

Si se transcribe un texto leiacutedo y se dispone del original es recomendableanotar las palabras o segmentos omitidos por el locutorbull Autocorrecciones

Es propio del habla espontaacutenea aunque tambieacuten de la lectura que loshablantes realicen correcciones de su propia produccioacuten linguumliacutestica (self-repairs)Parece conveniente marcarlas en la transcripcioacuten de un corpus oralbull Fragmentos de palabras

Los fragmentos de palabras corresponden a uno o maacutes segmentospertenecientes a una palabra que no ha sido totalmente pronunciada por el hablanteen un primer intento y que suelen repetirse cuando eacuteste consigue producir lapalabra completa Es importante indicar este fenoacutemeno en la transcripcioacuten

bull Fragmentos ininteligiblesSe trata de partes de la grabacioacuten que no son comprendidas por el

transcriptor y en la TEI se codifican con la etiqueta ltuncleargt aunque si se desease pueden utilizar marcas maacutes detalladas distinguiendo entre transcripcionescompletamente ininteligibles y entre una posible interpretacioacuten ofrecida por eltranscriptor

Un aspecto conflictivo sigue siendo la identificacioacuten de los enunciados que conforman untexto oral (Schuetze-Coburn 1991) Mientras que en un texto escrito los signos de puntuacioacutenconstituyen un criterio de delimitacioacuten en el habla disponemos de indicios como las pausas laentonacioacuten o el cambio de turno de palabra que nos permiten al menos convencionalmentedefinir un enunciado Sin embargo hasta el momento no se han desarrollado auacuten criteriosobjetivos y consistentes para resolver este problema

7- CONCLUSIONES

La revisioacuten - sin pretensiones de exhaustividad - de los principales sistemas detranscripcioacuten etiquetado y codificacioacuten de corpus orales expuesta en este trabajo pone demanifiesto en primer lugar la multiplicidad de propuestas desarrolladas frente a los intentos deestandarizacioacuten algunos de los cuales auacuten no se han consolidado plenamente pese a su crecienteaceptacioacuten En segundo lugar destaca tambieacuten la heterogeneidad de tradiciones que confluyen enel estudio de la lengua hablada desde la foneacutetica y las tecnologiacuteas del habla hasta el anaacutelisis deldiscurso y de la conversacioacuten diversidad que lleva a la creacioacuten de convenciones especiacuteficas pararesponder a las necesidades de diversas comunidades cientiacuteficas Ante esta situacioacuten la distincioacutenpropuesta por Sinclair (1995107) entre ldquoconformidadrdquo y ldquocompatibilidadrdquo adquiere todo susentido ya que si en ciertos casos la conformidad a un estaacutendar determinado es problemaacutetica porlas limitaciones inherentes a todo sistema comuacuten la compatibilidad - entendida como la facilidadde conversioacuten entre sistemas - deberiacutea ser en cambio un requisito imprescindible en el desarrollode los recursos linguumliacutesticos De esta manera puede tal alcanzarse el equilibrio entre lasnecesidades de un proyecto y las indudables ventajas cientiacuteficas y econoacutemicas que resultan de lareutilizacioacuten de los datos disponibles

BIBLIOGRAFIacuteA

Allen GD 1988 The PHONASCII System Journal of the International PhoneticAssociation 181 9-25

Anderson AH M Badger EG Bard E Boyle G Doherty S Garrod S Isard JKowtko J Mcallister J Miller C Sotillo HS Thompson y R Weinert 1991 The HCRCMap Task corpus Language and Speech 344 351-366

Autesserre D G Peacuterennou y M Rossi 1989 Methodology for the transcription andlabeling of a speech corpus Journal of the International Phonetic Association 191 2-15

Barry WJ y AJ Fourcin 1992 Levels of Labelling Computer Speech and Language 61-14

Beckman ME y GM Ayers GM 1994 Guidelines for ToBI Labelling Version 20February 1994[Documento de Internet disponible en httplingohio-stateeduPhoneticsToBIToBI0html]

Beckman ME y J Hirschberg J 1994 The ToBI Annotation Conventions Apeacutendice A deME Beckman y GM Ayers 1994 Guidelines for ToBI Labelling Version 20 February 1994[Documento de Internet disponible en httplingohio-stateeduPhoneticsToBIToBI0html]

Bruce G 1988 23 Supasegmental categories and 24 The symbolization of temporalevents Journal of the International Phonetic Association 182 75-76

Bruce G 1989 Report from the IPA working group on suprasegmental categories LundUniversity Department of Linguistics General Linguistics Phonetics Working Papers 35 25-40

Burnard L 1995 What is SGML and how does it help Computers and the Humanities291 41-50 The Text Encoding Initiative Background and Context Eds N Ide y J VeacuteronisDordrecht Kluwer Academic Publishers

Burnard L 1995a Text Encoding for Information Exchange An Introduction to the TextEncoding Initiaive TEI Document TEI J31 [Documento de Internet disponible enhttpwwwuiceduorgsteiinfoteij31]

Burnard L 1995b The Text Encoding Initiative an overviewrdquo Spoken English onComputer Transcription Markup and Applications Eds G LEECH G MYERS y JTHOMAS Harlow Longman 69-81

Chafe W 1995 Adequacy user-friendliness and practicality in transcribingrdquo English onComputer Transcription Markup and Applications Eds G Leech G Myers y J ThomasHarlow Longman 54-61

Chan D A Fourcin D Gibbon B Granstroumlm M Huckvale G Kokkinakis K KvaleL Lamel B Lindberg A Moreno J Mouropoulos F Senia I Trancoso C Veld y J Zeiliger1995 EUROM - A Spoken Language Resource for the EU Eurospeech95 Proceedings of the4th European Conference on Speech Communication and Speech Technology Madrid Spain 18-21 September 1995 Vol 1 867-870

Cole RA BT Oshika M Noel T Lander y M Fanty 1994 Labeler Agreement inPhonetic Labeling of Continuous Speech Proceedings of the 1994 International Conference onSpoken Language Processing Yokohama Japan 18-22 September 1994[Documento de Internet disponible en httpwwwcseogieduCSLUcorporapapershtml]

Cook G 1995 Theoretical issues transcribing the untranscribablerdquo Spoken English onComputer Transcription Markup and Applications Eds G Leech G Myers y J ThomasHarlow Longman 35-53

Du Bois JW 1991 Transcription design principles for spoken discourse researchPragmatics 1 71-106

Du Bois JW S Schuetze-Coburn S Cumming y D Paolino 1993 Outline of discoursetranscriptionrdquo Talking Data Transcription and Coding in Discourse Research Eds JAEdwards y MD Lampert Hillsdale NJ Lawrence Erlbaum Associates 45-90

EAGLES 1996 Preliminary Recommendations on Spoken Texts EAGLES DocumentEAG-TCWG-STPP May 1996[Documento de Internet disponible enhttpwwwilcpicnritEAGLES96spokentxspokentxhtml]

Edwards JA 1992 Design principles in the transcription of spoken discourserdquoDirections in Corpus Linguistics Proceedings of Nobel Symposium 82 Stockholm 4-8 August1991 Ed J Svartvik Berlin Mouton de Gruyter 129-147

Edwards JA 1993 Principles and Contrasting Systems of Discourse TranscriptionrdquoTalking Data Transcription and Coding in Discourse Research Eds JA Edwards y MDLampert Hillsdale Hillsdale NJ Lawrence Erlbaum Associates 3-32

Edwards JA 1995 Principles and alternative systems in the transcription coding andmark-up of spoken discourserdquo Spoken English on Computer Transcription Markup andApplications Eds G Leech G Myers y J Thomas Harlow Longman 19-34

Ehlich K 1993 HIAT A Transcription System for Discourse Datardquo Talking DataTranscription and Coding in Discourse Research Eds JA Edwards y MD Lampert HillsdaleNJ Lawrence Erlbaum Associates 123-148

Eisen B 1993 Reliability of speech segmentation and labelling at different levels oftranscription Eurospeech93 3rd European Conference on Speech Communication andTechnology Berlin Germany 21-23 September 1993 Vol 1 673-676

Esling JH y H Gaylord 1993 Computer Codes for Phonetic Symbols Journal of theInternational Phonetic Association 232 77-82

Esling JH 1988 Computer coding of IPA symbols and detailed phonetic representationsof computer databases Journal of the International Phonetic Association 182 99-106

Esling JH 1990 Computer Coding of the IPA Supplementary Report Journal of theInternational Phonetic Association 201 22-26

Fourcin A y JM Dolmazon (on behalf of the SAM Project) 1991 Speech knowledgestandards and assessment Actes du XIIegraveme Congregraves International des Sciences Phoneacutetiques 19-24 aoucirct 1991 Aix-en-Provence France Aix-en-Provence Universiteacute de Provence Service desPublications Vol 5 430-433

Fourcin A G Harland W Barry y V Hazan eds 1989 Speech Input and OutputAssessment Multilingual Methods and Standards Chichester Ellis Horwood Ltd

French JP 1991 Updated notes for soundprint transcribers Working paper Universityof Birmingham October 1991 NERC-WP4-47

French JP 1992 Transcription proposals multilevel system Working paper Universityof Birmingham October 1992 NERC-WP4-50

Gibbon D 1989 Survey of Prosodic Labelling for EC Languages SAM-UBI-190 12February 1989 Report e6 in ESPRIT 2589 (SAM) Interim Report Year 1 Ref SAM-UCLG002 University College London February 1990

Gibbon D R Moore y R Winski eds 1997 Handbook on Standards and Resources forSpoken Language Systems Berlin Mouton De Gruyter [Documento de Internet disponible en httpcoralliliuni-bielefelddeEAGLESeagbookeagbookhtml]

Groslashnnum Thorsen N 1987 Suprasegmental transcription ARIPUC - Annual Report ofthe Institute of Phonetics University of Copenhagen 21 1-27

Gumperz JJ y J Berenz 1993 Transcribing Conversational Exchangesrdquo Talking DataTranscription and Coding in Discourse Research Eds JA Ewards y M D Lampert HillsdaleNJ Lawrence Erlbaum Associates 91-122

Hart J lsquoT R Collier y A Cohen 1990 A Perceptual Study of Intonation An Experimental- Phonetic Approach to Intonation Cambridge Cambridge University Press (Cambridge Studiesin Speech Science and Communication)

Hess W K Kohler y HG Tillmann 1995 The PhonDat-Verbmobil Speech CorpusEurospeech95 Proceedings of the 4th European Conference on Speech Communication andSpeech Technology Madrid Spain 18-21 September 1995 Vol 1 863-866

Hieronymus JL 1994 ASCII phonetic symbols for the worlds languages WorldbetATampT Bell Laboratories Technical Memo [Documento de Internet disponible enhttpwwwcseogieduCSLUcorporapapershtml]

Hirst D A Di Cristo y R Espesser en prensaLevels of representation and levels ofanalysis for intonation Prosody Theory and Experiments Ed M Horne Dordrecht Kluwer

Hirst DJ y A Di Cristo en prensa A survey of intonation systemsrdquo IntonationSystems A Survey of 20 Languages Eds D Hirst y A Di Cristo Cambridge CambridgeUniversity Press

Hirst DJ 1991 Intonation models towards a third generation Actes du XIIegraveme CongregravesInternational des Sciences Phoneacutetiques 19-24 aoucirct 1991 Aix-en-Provence France Aix-en-Provence Universiteacute de Provence Service des Publications Vol 1 305-310

Hirst DJ A Di Cristo M Le Besnerais Z Najim P Nicolas y P Romeacuteas 1993Multilingual modelling of intonation patternsrdquo Proceedings of an ESCA Workshop on ProsodySeptember 27-29 1993 Lund Sweden Eds D House y P Touati Lund University Departmentof Linguistics and Phonetics Working Papers 41 204-207

Hirst DJ N Ide y J Veacuteronis 1994 Coding fundamental frequency patterns for multi-lingual synthesis with INTSINT in the MULTEXT project Conference Proceedings of theSecond ESCAIEEE Workshop on Speech Synthesis September 12-15 1994 Mohonk MountainHouse New Paltz New York USA 77-80

Ide N y J Veacuteronis eds 1995 The Text Encoding Initiative Background and ContextsComputers and the Humanities 29 1-3 Publicado en forma de libro en Dordrecht KluwerAcademic Publishers

IPA 1989 The IPA 1989 Kiel Convention Workgroup 9 report Computer Coding of IPAsymbols and Computer Representation of Individual Languages Journal of the InternationalPhonetic Association 192 81-92

IPA 1993 IPA Chart revised to 1993 Journal of the International Phonetic Association231 [Documento de Internet disponible en httpwwwartsglaacukIPAipacharthtml]

IPA 1995 Preview of the IPA Handbook Journal of the International Phonetic Association251

ISO 8879 1986 Information Processing Text and Office Systems Standard GeneralizedMarkup Language (SGML) Geneva International Organization for Standardization

Johansson S 1995a The approach of the Text Encoding Initiative to the encoding ofspoken discourse Spoken English on Computer Transcription Markup and Applications EdsG Leech G Myers y J Thomas Harlow Longman 82-98

Johansson S 1995b The Encoding of Spoken Texts Computers and the Humanities291 149-158 The Text Encoding Initiative Background and Context Eds N Ide y J VeacuteronisDordrecht Kluwer Academic Publishers 149-158

Keating P P MacEachern A Shryock y S Domiacutenguez 1994 A manual for phonetictranscription Segmentation and labelling of words in spontaneous speech UCLA WorkingPapers in Phonetics 88 91-120

Kluger-Kruse M 1987 Computer Phonetic Alphabet ESPRIT Linguistic Analysis of theEuropean Languages Report BU-CPA0267 July 1987

Krot C y B Taylor 1995 Criteria for Acoustic-Phonetic Segmentation and WordLabelling in the Australian National Database of Spoken Language[Documento de Internet disponible en httpwwwshlrcmqeduaucriteriahtml]

Lander T 1997 The CSLU Labeling Guide Center for Spoken Language UnderstandingOregon Graduate Institute[Documento de Internet disponible en httpwwwcseogieduCSLUcorporapapershtml]

Llisterri J 1994 Prosody Encoding Survey WP 1 Specifications and Standards T15Markup Specifications Deliverable 153 Final version 15 September 1994 LRE Project 62-050MULTEXT

Llisterri J ed 1996 Prosody Tools Efficiency and Failures WP 4 Corpus T46 SpeechMarkup and Validation Deliverable 452 Final version 15 October 1996 LRE Project 62-050MULTEXT

MacWhinney B 1991The CHILDES Project Tools for Analyzing Talk Hillsdale NJLawrence Erlbaum

Marchal A N Nguyen y W Hardcastle 1995 Multitiered phonetic approach to speechlabelling Levels in Speech Communication Relations and Interactions A Tribute to MaxWajskop Hommage agrave Max Wajskop Eds C Sorin J Mariani H Meloni y J SchoengenAmsterdam Elsevier Science BV 149-158

NERC 1994 NERC-1 Network of European Reference Corpora Final Report PisaInstituto di Linguistica Computazionale - CNR January 1994 versioacuten en curso de publicacioacutenTowards a Network of European Reference Corpora Eds N Calzolari M Baker y PG KruytPisa Giardini

Nicolas P y D Hirst 1995 Symbolic coding of Higher-Level Characteristics ofFundamental Frequency Curvesrdquo Eurospeech95 Proceedings of the 4th European Conferenceon Speech Communication and Technology Madrid Spain 18-21 September 1995 Vol 2 989-992

OConnell DC y S Kowal 1994 Some Current Transcription Systems for SpokenDiscourse A critical Analysis Pragmatics 4 81-107

Ochs E 1979 Transcription as Theory Developmental Pragmatics Eds E Ochs E yBB Schieffelin New York Academic Press 43-72

Payne J 1992 Report on the compatibility of JP Frenchs spoken corpus transcriptionconventions with the TEI guidelines for transcription of spoken texts Working paper COBUILDBirmingham and IDS Mannheim December 1992 NERC-WP8WP4-122

Payne J 1995 The COBUILD spoken corpus transcription conventions SpokenEnglish on Computer Transcription Markup and Applications Eds G Leech G Myers y JThomas Harlow Longman 203-207

Payratoacute Ll 1995 Transcripcioacuten del discurso coloquialrdquo El espantildeol coloquial Actas del ISimposio sobre Anaacutelisis del Discurso Oral Almeriacutea 23-25 de noviembre de 1994 Ed L CorteacutesRodriacuteguez Almeriacutea Universidad de Almeriacutea Servicio de Publicaciones 43-70

Pierrehumbert J B 1897 (1980) The Phonology and Phonetics of English IntonationPhD Thesis Department of Linguistics MIT Bloomington Indiana University Linguistics Club

Pitrelli J M Beckman y J Hirschberg 1994 Evaluation of prosodic transcriptionlabelling reliability in the ToBI frameworkrdquo Proceedings of the Third International Conference onSpoken Language Processing Yokohama ICSLP Vol 2 123-126

Pullum GK y WA Ladusaw 1996 (1986) Phonetic Symbol Guide Chicago TheUniversity of Chicago Press 2nd edition

Roach P H Roach A Dew y P Rowlands 1990 Phonetic analysis and the automaticsegmentation and labeling of speech sounds Journal of the International Phonetic Association201 15-21

Schmidt MS C Scott y MA Jack 1993 Phonetic transcription standards for Europeannames (ONOMASTICA) Eurospeech93 3rd European Conference on Speech Communicationand Technology Berlin Germany 21-23 September 1993 Vol 1 279-282

Schuetze-Coburn S 1991Units of intonation in discourse a comparison of acoustic andauditory analysis Language and Speech 343 207-234

Selting M 1987 Descriptive categories for the auditive analysis of intonation inconversation Journal of Pragmatics 11 777-791

Selting M 1988 The role of intonation in the organisation of repair and problem handlingsequences in conversation Journal of Pragmatics 12 293-322

Senia F y JG Van Velden 1997 Specifications of orthographic transcription and lexiconconventions LRE-4001 SpeechDat Technical Report SD132 Final version 10 January 1997[Documento de Internet disponible en httpwwwphonetikuni-muenchendeSpeechDathtml]

Silverman K M Beckman J Pitrelli M Ostendorf C Wightman P Price JPierrehumbert y J Hirschberg 1992 TOBI A standard for labelling English prosodyProceedings of the Second International Conference on Spoken Language Processing ICSLP-92Banff October 1992 867-870

Sinclair J 1994 Spoken Language [3B] PhoneticPhonemic and Prosodic Annotation[52] NERC 1994 NERC-1 Network of European Reference Corpora Final Report PisaVersioacuten en curso de publicacioacuten Towards a Network of European Reference Corpora Eds NCalzolari M Baker y PG Kruyt Pisa Giardini

Sinclair J 1995 From theory to practicerdquo Spoken English on Computer TranscriptionMarkup and Applications Eds G Leech G Myers Y J Thomas Harlow Longman 99- 112

Sperberg-McQueen CM y L Burnard eds 1994 Guidelines for Electronic Text Encodingand Interchange TEI P3 Chicago and Oxford Association for Computational Linguistics Association for Computers and the Humanities Association for Literary and LinguisticComputing [Cap 11 Transcriptions of Speech] [Documento de Internet disponible enhttpetextvirginiaeduTEIhtml]

Strangert E y M Heldner 1995 Labelling of boundaries and prominences byphonetically experienced and non-experienced transcribers Phonum 3 Reports from theDepartment of Phonetics Umearing University 85-109 [Documento de Internet disponible enhttpwwwlingumusefonphonum3html]

Teubert W 1993 Phonetic Phonemic and Prosodic Annotation Final Report IDSMannheim February 1993 NERC-WP8-171

Tillmann HG y B Pompino-Marschall 1993 Theoretical Principles ConcerningSegmentation Labelling Strategies and Levels of Categorical Annotation for Spoken LanguageDatabase Systems Eurospeech93 3rd European Conference on Speech Communication andTechnology Berlin Germany 21-23 September 1993 Vol 3 1691-1694

Trancoso I 1995 The ONOMASTICA Interlanguage Pronunciation LexiconrdquoEurospeech95 Proceedings of the 4th European Conference on Speech Communication andTechnology Madrid Spain 18-21 September 1995 Vol 1 829-832

Wells JC 1987 Computer Coded Phonetic Transcription Journal of the InternationalPhonetic Association 172 94-114

Wells JC 1989 Computer-coded phonemic notation of individual languages of theEuropean Community Journal of the International Phonetic Association 191 31-54

Wells JC 1994 Computer-coding the IPA a proposed extension of SAMPA SpeechHearing and Language Work in Progress 1994 (University College London Department ofPhonetics and Linguistics) 8 271-289

Wells JC 1995 SAMPROSA (SAM Prosodic Transcription [Documento de Internetdisponible en httpwwwphonuclacukhomesampasamprosahtm]

Wells JC W Barry M Grice A Fourcin y D Gibbon 1992 Standard Computer-Compatible Transcription SAM Stage Report Sen3 SAM UCL-037 28 February 1992 SAM(1992) Esprit Project 2589 (SAM) Multilingual Speech InputOutput AssessmentMethodologyand Standardisation Final Report Year Three 1III91-28II1992 London University CollegeLondon

Wesenick M-B y F Schiel 1995 Feasibility of Automatic Annotation and BuildingPronunciation Lexica from Corpus Material LRE-63314 SpeechDat Report D3123 Finalversion 10 October 1995[Documento de Internet disponible en httpwwwicpgrenetfrSpeechDathomehtml]

Winski R R Moore y D Gibbon 1995 EAGLES Spoken Language Working GroupOverview and Resultsrdquo Eurospeech95 Proceedings of the 4th European Conference on SpeechCommunication and Speech Technology Madrid Spain 18-21 September 1995 Vol 1 841-844[Documento de Internet disponible en httpcoralliliuni-bielefeldde~gibbonEAGLESrwpaperrwpaperhtml]

  • 1- INTRODUCCIOacuteN
  • 2- NIVELES DE REPRESENTACIOacuteN ETIQUETADO Y CODIFICACIOacuteN
  • 3- REPRESENTACIOacuteN ORTOGRAacuteFICA DE CORPUS ORALES
  • 31- Propuestas para la representacioacuten ortograacutefica de corpus orales en el aacutembito de la linguumliacutestica de corpus
  • 32- Propuestas para la representacioacuten ortograacutefica de corpus orales en el aacutembito de las tecnologiacuteas del habla
  • 4- REPRESENTACIOacuteN FONEacuteTICA DE CORPUS ORALES
  • 41- La representacioacuten foneacutetica de los elementos segmentales
  • 42- La representacioacuten foneacutetica de los elementos suprasegmentales
  • 5- ETIQUETADO FONEacuteTICO DE CORPUS ORALES
  • 51- Niveles de etiquetado foneacutetico de corpus orales
  • 52- La transcripcioacuten y el etiquetado automaacutetico de corpus orales
  • 6- TRANSCRIPCIOacuteN Y CODIFICACIOacuteN DE CORPUS PARA EL ANAacuteLISIS DE LA LENGUA ORAL
  • 61- Los requisitos de una transcripcioacuten
  • 62- Propuestas de estandarizacioacuten para la transcripcioacuten y codificacioacuten de corpus orales
  • 7- CONCLUSIONES
  • BIBLIOGRAFIacuteA
Page 11: Transcripción, etiquetado y codificación de corpus orales

51- Niveles de etiquetado foneacutetico de corpus orales

Una cuestioacuten que se plantea inevitablemente a la hora de introducir informacioacuten adicionalsobre los datos recogidos es el nivel de etiquetado del corpus Se han realizado varias propuestassobre los distintos niveles en los que se puede realizar el etiquetado foneacutetico de un corpusalgunas de ellas ligadas al proyecto SAM como la de Barry y Fourcin (1992) en la que seplantean cinco niveles posibles de etiquetado foneacutetico de un corpus

bull Nivel fiacutesico en el que se etiquetan las propiedades acuacutesticas presentes en la sentildealsonora

bull Nivel acuacutestico-foneacutetico en el que se marcan las propiedades de los segmentos enteacuterminos de categoriacuteas foneacuteticas como oclusioacuten friccioacuten sonoridad nasalizacioacuten etc

bull Nivel de transcripcioacuten estrecha en el que se caracterizan los segmentos utilizandolos siacutembolos del AFI o de sus equivalentes computacionales

bull Nivel de transcripcioacuten fonoloacutegica (o foneacutemica) sentildealando uacutenicamente aquelloselementos funcionalmente distintivos que se encuentran en la palabra pronunciadaaisladamente en un estilo cuidado (citation form)

bull Nivel de transcripcioacuten ancha en el que se utilizan los siacutembolos correspondientes alos elementos fonoloacutegicos en una lengua dada para transcribir realizaciones alofoacutenicascondicionadas por el contexto3

A estos cinco niveles debe antildeadirse auacuten la anotacioacuten prosoacutedica considerada de formaindependiente por los autores de la propuesta

Una propuesta similar de etiquetado tambieacuten en cinco niveles - caracteriacutesticas acuacutesticas denaturaleza subfoneacutemica caracteriacutesticas segmentales realizaciones foneacuteticas forma canoacutenica de laspalabras y transcripcioacuten ortograacutefica - se presenta en Tillmann y Pompino-Marschall (1993) y hasido utilizada con eacutexito en el proyecto alemaacuten PhonDat Igualmente pueden verse las propuestasde Autesserre et al (1989) enmarcadas en el contexto del proyecto SAM y los trabajos deMarchal et al (1995) o Roach et al (1990)

La transcripcioacuten y el etiquetado de corpus orales se ha abordado en el marco del proyectoEAGLES desde una doble perspectiva la de la foneacutetica y las tecnologiacuteas del habla en el Grupo deTrabajo sobre Lengua Oral y desde la de la linguumliacutestica de corpus en el marco de las actividades delGrupo de Trabajo sobre Corpus Textuales El trabajo llevado a cabo en el grupo dedicado a lalengua hablada en EAGLES recoge esencialmente las propuestas desarrolladas en el marco deSAM y de PhonDat Los niveles de etiquetado propuesto son los siguientes (Gibbon Moore yWinski eds 1997)

bull Nivel ortograacutefico en el que se utiliza la representacioacuten ortograacutefica convencional

3 La distincioacuten entre los dos uacuteltimos niveles puede ejemplificarse con el caso de las asimilaciones mientras que enla transcripcioacuten ancha encontrariacuteamos [um poko] (un poco) en el caso de una transcripcioacuten fonoloacutegica apareceriacutea [unpoko] si se opta por no simbolizar archifonemas en la transcripcioacuten En cambio [mismo] se representariacutea de lamisma forma en ambos niveles encontraacutendose la transcripioacuten [mizmo] en el nivel de transcripcioacuten estrecha

bull Nivel de formas canoacutenicas (citation form) representando la forma depronunciacioacuten aislada de las palabra en estilo cuidado

bull Nivel de transcripcioacuten ancha o fonotiacutepica en este nivel se utilizan los siacutembolosque representan elementos fonoloacutegicos en una lengua dada pero al igual que en lapropuesta de Barry y Fourcin se transcriben aquellos fenoacutemenos predictibles propios dela foneacutetica sintaacutectica SAMPA seriacutea pues un alfabeto foneacutetico adecuado para este nivelde transcripcioacuten

bull Nivel de transcripcioacuten estrecha basado en una representacioacuten alofoacutenica de lasrealizaciones foneacuteticas de los hablantes para el cual puede utilizarse un alfabeto foneacuteticocomo X-SAMPA

bull Nivel acuacutestico-foneacutetico en el que se distinguen caracteriacutesticas acuacutesticas de lossegmentos observables en una representacioacuten de la onda sonora

bull Nivel fiacutesico representado en teacuterminos de paraacutemetros acuacutesticos o articulatoriosbull Fenoacutemenos no linguumliacutesticos la inclusioacuten de este nivel permite representar sonidos

de naturaleza comunicativa o no introducidos por el hablante asiacute como toda aquellainformacioacuten paralinguumliacutestica que se considere de intereacutes tambieacuten permite sentildealas los ruidosexternos en la grabacioacuten

Vale la pena detenerse brevemente en el nivel de las formas canoacutenicas y en el concepto deldquotranscripcioacuten fonotiacutepicardquo que como puede verse aparecen de forma recurrente en diversaspropuestas La inclusioacuten de forma canoacutenicas en el etiquetado de un corpus responde a un doblemotivo especialmente ligado a necesidades tecnoloacutegicas en primer lugar estas formas permitenderivar automaacuteticamente mediante un conjunto de reglas una transcripcioacuten ancha o fonotiacutepica enla que se incluyen los elementos alofoacutenicos cuya aparicioacuten esta condicionada por el contextofoneacutetico en segundo lugar a partir de las formas canoacutenicas puede crearse de forma automaacutetica undiccionario foneacutetico partiendo de un corpus transcrito (Wesenick y Schiel 1995 Senia y vanVelden 1997) lo que tiene utilidad para el desarrollo de sistemas de siacutentesis y reconocimiento delhabla y tambieacuten para la descripcioacuten linguumliacutestica La transcripcioacuten denominada ldquofonotiacutepicardquo en lostrabajos de SAM constituye un nivel intermedio entre la realizacioacuten foneacutetica y la transcripcioacutenpuramente fonoloacutegica Por otra parte el nivel de transcripcioacuten de formas canoacutenicas estaacutedirectamente relacionado con la representacioacuten ortograacutefica facilitando asiacute la transcripcioacuten foneacuteticaautomaacutetica de corpus en este nivel mediante el desarrollo de los correspondientes sistemas dereglas

En el informe del Grupo de Trabajo de Corpus Textuales de EAGLES (EAGLES 1996) seintenta realizar una siacutentesis entre las necesidades de diversos campos de estudio Se sugieren porello tres niveles de representacioacuten

bull S1 representacioacuten ortograacutefica del textobull S2 representacioacuten fonoloacutegica de las palabras en su forma canoacutenicabull S3 transcripcioacuten foneacutetica consistente en una representacioacuten simboacutelica discreta de

la realizacioacuten del enunciado tal como es percibido por el transcriptor

Como puede observarse estos tres niveles encuentran su equivalente en los nivelespropuesto por Barry y Fourcin (1992) y en los definidos por el Grupo de Trabajo de Lengua

Oral Para la transcripcioacuten del nivel S2 puede utilizarse SAMPA mientras que la del nivel S3requiere el uso de un alfabeto foneacutetico como X-SAMPA

52- La transcripcioacuten y el etiquetado automaacutetico de corpus orales

La tarea de transcribir y etiquetar foneacuteticamente un corpus oral representa un considerableesfuerzo tanto en teacuterminos de tiempo como de los recursos econoacutemicos necesarios para llevar acabo esta labor El etiquetado manual requiere por otro lado el desarrollo de convencionesdetalladas para asegurar la consistencia entre diversos transcriptores (Keating et al 1994 Krot yTaylor 1995 Lander 1997) ademaacutes del establecimiento de un proceso de validacioacutencomprobando la fiabilidad de los resultados obtenidos (Eisen 1993 Cole et al 1994 Strangert yHeldener 1995) Por estos motivos uno de los intereses principales de los investigadores en elcampo de las tecnologiacuteas del habla ha sido llevar a cabo el etiquetado de forma semi-automaacutetica oidealmente automaacutetica Un primer nivel de transcripcioacuten - tanto de formas canoacutenicas comofonotiacutepica - puede obtenerse automaacuteticamente como acabamos de mencionar a partir de larepresentacioacuten ortograacutefica si se dispone de un conjunto de reglas que establezcan lascorrespondencias entre la representacioacuten ortograacutefica y la foneacutetica

Sin embargo un etiquetado foneacutetico en los niveles de transcripcioacuten maacutes detallada requiere laposibilidad de acceder a la onda sonora y un procedimiento de anaacutelisis de la sentildeal La primeraoperacioacuten que debe realizar un sistema de etiquetado automaacutetico es la segmentacioacuten del continuumsonoro en unidades menores - segmentos o caracteriacutesticas acuacutesticas en funcioacuten del nivel detranscripcioacuten deseado - para pasar despueacutes a la asignacioacuten de etiquetas - siacutembolos detranscripcioacuten - que describan sus caracteriacutesticas Este es el proceso conocido propiamente comoetiquetado (labelling) que cuando se realiza de forma automaacutetica debe superar los obstaacuteculosderivados de la naturaleza no discreta de la sentildeal sonora - resultado de mecanismos como lacoarticulacioacuten - y de la variabilidad de realizaciones foneacuteticas entre hablantes o incluso en unmismo hablante

Para que el corpus sea uacutetil el etiquetado foneacutetico debe estar temporalmente sincronizadocon la sentildeal sonora y con la representacioacuten ortograacutefica operacioacuten que se realiza en el procesoconocido como alineacioacuten temporal (time alignment) llevado a cabo tambieacuten de forma automaacuteticaEsta alineacioacuten puede hacerse de un modo global sentildealando en la onda sonora las fronteras entrepalabras ortograacuteficas - para facilitar el acceso a la grabacioacuten a partir de este nivel de representacioacuten(Lander 1997) - o los puntos en los que se encuentran siacutelabas acentuadas tal como sucede porejemplo en el proyecto MULTEXT

En el campo de las tecnologiacuteas del habla se han llevado a cabo numerosiacutesimos trabajosencaminados al disentildeo de sistemas de segmentacioacuten etiquetado y alineacioacuten temporal automaacuteticasde corpus orales utilizando las teacutecnicas propias del reconocimiento del habla como los Modelosde Markov o las redes neuronales Cabe destacar que tales teacutecnicas no soacutelo son uacutetiles en eldesarrollo de corpus en este aacutembito sino que constituyen una herramienta importante en otrostipos de corpus sin embargo es preciso reconocer que el habla espontaacutenea - especialmente si seha recogido mediante grabaciones realizadas en un entorno natural - plantea auacuten problemas en lo

que se refiere a su transcripcioacuten y etiquetado automaacuteticos pese a los notabiliacutesimos avances quetienen lugar en este campo

6- TRANSCRIPCIOacuteN Y CODIFICACIOacuteN DE CORPUS PARA EL ANAacuteLISIS DE LA LENGUA ORAL

En este uacuteltimo apartado incidiremos en las cuestiones relacionadas con la transcripcioacuten ycodificacioacuten de corpus orales que pueden presentar un mayor intereacutes para aacutembitos como elanaacutelisis de discurso o de la conversacioacuten y para el estudio de la lengua oral en todos los niveles dela descripcioacuten linguumliacutestica Como indicaacutebamos al principio la transcripcioacuten y la codificacioacuten de loselementos transcritos son en principio dos operaciones conceptualmente diferentes Sinembargo en la praacutectica habitual en las disciplinas a las que se refiere este apartado suelen ser dosoperaciones que se realizan simultaacuteneamente ya que al mismo tiempo que se realiza latransliteracioacuten se introducen las marcas necesarias para la codificacioacuten de los elementos que se hadecidido introducir en el corpus Por ello en muchos casos la discusioacuten sobre la transcripcioacuten y lacodificacioacuten se realiza conjuntamente en la bibliografiacutea sobre el tema

61- Los requisitos de una transcripcioacuten

El investigador que decide constituir un corpus de lengua oral se encuentra en estosmomentos con una gran variedad de criterios en lo que se refiere a la transcripcioacuten y a la seleccioacutende los elementos que apareceraacuten codificados en el corpus Hemos hecho ya referencia en elapartado 3 a las diversas convenciones para la representacioacuten ortograacutefica y cintildeeacutendonos al aacutembitodel anaacutelisis del discurso y la conversacioacuten constatamos igualmente la existencia una grandiversidad de propuestas En una revisioacuten de las mismas Payratoacute (1995) hace por ejemploreferencia a los sistemas de transcripcioacuten y codificacioacuten procedentes de la etnometodologiacuteainteresados en reflejar la interaccioacuten verbal a los meacutetodos desarrollados en el marco de laetnografiacutea de la comunicacioacuten y de la sociolinguumliacutestica interaccional4 o a propuestas utilizadas en elestudio del lenguaje infantil Ante tal situacioacuten parece conveniente plantearse cuaacuteles son losrequisitos que debe cumplir una transcripcioacuten de la lengua oral tema que ha sido abordado pordiversos autores (DuBois 1991 Elich 1993 Edwards 1993 OrsquoConnell y Kowal 1994) Trasrevisar aportaciones anteriores Payratoacute (1995) resume los requisitos que teoacutericamente deberiacuteanexigirse a toda transcripcioacuten

bull Neutralidad o fidelidad de modo que la transcripcioacuten no sea interpretativabull Globalidad o complejidad recogiendo la totalidad de los fenoacutemenos que aparecen

en el discurso oralbull Omnifuncionalidad permitiendo diversos usos y aplicacionesbull Claridad tanto desde el punto de vista del aprendizaje del sistema como de la

legibilidad de la representacioacutenbull Universalidad y compatibilidad entre sistemas informaacuteticos

4 Estos sistemas se comparan en OrsquoConnell y Kowal (1994) Pueden encontrarse consideraciones generales sobre latranscripcioacuten y codificacioacuten de la lengua oral en el anaacutelisis del discurso y la conversacioacuten en 1995Ochs (1979) DuBois (1991) Edwards (1992 1993 1995) Du Bois et al (1993) Gumperz y Berenz (1993) Cook (1995) Chafe(1995) y en Sinclair (1995)

Sin embargo puesto que en la praacutectica se transcribe en funcioacuten de los objetivos para losque se ha definido el corpus Payratoacute (1995) considera que un sistema de transcripcioacuten debe serante todo interpretativo de los datos selectivo en cuanto a los fenoacutemenos que se transcribenpertinente para el objeto de investigacioacuten coherente con la base teoacuterica adoptada por elinvestigador fiel en cuanto a la representacioacuten de los datos y flexible para que sea posible suutilizacioacuten en diversos estudios Por otra parte en opinioacuten de este autor la simbologiacutea utilizadadebe ser clara econoacutemica sencilla exenta de ambiguumledad y compatible con sistemas internacionesestandarizados Este uacuteltimo aspecto nos parece especialmente importante ya que como sentildeala elmismo Payratoacute (1995 58)

[] en ninguacuten caso puede olvidarse que los datos de una investigacioacuten no deberiacutean sertratados nunca de forma tan parcial o idiosincraacutesica que se impidiera o dificultara el uso por partede otros investigadores La transcripcioacuten del discurso oral es una actividad suficientementecostosa y conflictiva para tomar precauciones en este sentido y ninguna comunidad cientiacuteficapuede permitirse el lujo de particularismos (en aspectos tan elementales) que obstruyan el debateo conviertan en inaprovechables una fuente de informacioacuten

62- Propuestas de estandarizacioacuten para la transcripcioacuten y codificacioacuten de corpus orales

Ante la diversidad de propuestas para la transcripcioacuten y codificacioacuten de la lengua oral queacabamos de constatar el surgimiento de la linguumliacutestica de corpus y muy especialmente lasnecesidades derivadas del intercambio electroacutenico de textos propiciaron la aparicioacuten de proyectose iniciativas centrados en la creacioacuten de estaacutendares tanto en lo que se refiere a la transcripcioacutencomo a la codificacioacuten En los proacuteximos apartados revisamos sucintamente algunos de ellos

Uno de los capiacutetulos de las Guiacuteas desarrolladas por la TEI estaacute dedicado a la transcripcioacutende corpus orales (Johansson 1995a b) En eacutel se describe la estructura baacutesica de la representacioacutende un texto oral - cabecera texto y divisiones - y se definen los procedimientos basados enSGML para la representacioacuten de los elementos estructurales baacutesicos informacioacuten contextualinformacioacuten temporal enunciados pausas elementos vocalizados semi-leacutexicos o no leacutexicoselementos kineacutesicos otros tipos de eventos comunicativos y texto presentado en forma escrita alhablante Tambieacuten se ofrecen en este capiacutetulo indicaciones para la segmentacioacuten y el alineamientoasiacute como recomendaciones para la transcripcioacuten de superposiciones entre hablantes de formas depalabras prosodia elementos paralinguumliacutesticos - tempo intensidad rango tonal tensioacuten ritmo ycalidad de voz - y alteraciones en el decurso foacutenico Para la representacioacuten de la informacioacutenfoneacutetica se recomienda el uso del AFI En la siguiente tabla se resumen los principales elementospropuestos por la TEI para la codificacioacuten de corpus orales considerados especiacuteficos de este tipode texto (Sperberg-McQueen y Burnard eds 1994)

Elemento codificado Marca decodificacioacutenen SGML

Definicioacuten

Divisiones (division) ltdivgt Unidades intermedias entre el texto y el enunciado que permitendelimitar partes diferenciadas en un texto

Enunciado (utterance) ltugt Segmento de habla comprendido entre dos pausas o delimitado porun cambio en el turno de palabra puede incluir ademaacutesinformacioacuten sobre la superposicioacuten (ltoverlapgt) de turnos cuando

interviene simultaacuteneamente maacutes de un hablantePausa (pause) ltpausegt Interrupcioacuten de la fonacioacuten percibida entre dos enunciados o en el

interior de los mismos puede describirse en teacuterminos relativos oindicando su duracioacuten

Vocal (vocal) ltvocalgt Elemento vocalizado semi-leacutexico o no leacutexico (pej pausas llenas otoses)

Kineacutesico (kinesic) ltkinesicgt Cualquier fenoacutemeno comunicativo no vocal (p ej gestos)Acontecimiento (event) lteventgt Cualquier fenoacutemeno identificado en la grabacioacuten no necesariamente

vocalizado ni con valor comunicativo (p ej ruidos de fondo)Texto escrito (writing) ltwritinggt Texto escrito que se presenta al hablante durante su intervencioacutenCambio (shift) ltshiftgt Momento en el que se produce un cambio en alguno de los rasgos

paralinguumliacutesticos - calidad de voz intensidad rango tonal ritmo yvelocidad de elocucioacuten - cada uno de los rasgos puede describirsemediante una lista de caracteriacutesticas

Tabla 1 Elementos codificados en las transcripciones de lengua oral seguacuten los estaacutendares de la TEI(Adaptada de Sperberg-McQueen y Burnard eds1994)

Por otra parte la TEI ofrece mecanismos para indicar el comienzo y el final de unfenoacutemeno su duracioacuten y su sincronizacioacuten temporal con otros elementos presenta tambieacuten laposibilidad de marcar unidades inferiores al enunciado - segmentos ltseggt - que permitendelimitar por ejemplo unidades prosoacutedicas e incluye tambieacuten entre sus propuestas las marcasnecesarias para sentildealar fenoacutemenos propios de la lengua hablada como palabras truncadasrepeticiones falsos principios - marcados como ltdelgt (deletion) y especificando el fenoacutemeno -Las partes de la grabacioacuten que el transcriptor no llega a interpretar correctamente - ltuncleargt - ono puede escuchar - ltgapgt - o las correcciones de errores de produccioacuten realizadas por eltranscriptor - ltsicgt para delimitar el error y ltcorrgt para indicar la correccioacuten - son tambieacutenelementos para los cuales la TEI establece marcas de codificacioacuten

Aunque las Guiacuteas de la TEI pueden considerarse un sistema adecuado para la transcripcioacuteny codificacioacuten de gran variedad de materiales los autores propios autores reconocen que

[] the present proposals are not intended to support unmodified every variety of researchundertaken upon spoken material now or in the future some discourse analysts phonologistsand doubtless other may wish to extend the scheme presented here to express more precisely theset of distinctions they wish to draw in their transcriptions Speech regarded as a purely acousticphenomenon may well require different methods from those outlined here as may speechregarded solely as a process of social interaction (Sperberg-McQueen y Burnard eds 1994 cap11)

El proyecto NERC - Network of European Reference Corpora (NERC 1994) se planteoacutecomo uno de sus objetivos la viabilidad de desarrollar una serie de recomendaciones para laconstitucioacuten de corpus y por tanto incluye entre sus resultados indicaciones sobre el tratamientode los corpus orales tanto en lo que se refiere a su codificacioacuten como a la transcripcioacuten de loselementos segmentales y suprasegmentales (Sinclair 1994) El sistema adoptado para latranscripcioacuten y codificacioacuten de corpus se basa como hemos indicado anteriormente en eldesarrollado por French (1991 1992) para la transcripcioacuten del corpus oral desarrollado en elproyecto COBUILD La transcripcioacuten se plantea como una operacioacuten que puede desarrollarse envarios niveles

bull Nivel I consiste en la representacioacuten ortograacutefica introduciendo los miacutenimossignos de puntuacioacuten necesarios sin informacioacuten sobre la interaccioacuten entre hablantes Eneste nivel se contemplan convenciones desarrolladas para la representacioacuten ortograacutefica ypara precisar el uso de la puntuacioacuten

bull Nivel II consiste en una representacioacuten ortograacutefica enriquecida con informacioacutenbaacutesica sobre la identidad de los hablantes el turno de palabra y los elementos no verbales

bull Nivel III contiene toda la informacioacuten presente en el nivel II ademaacutes deinformacioacuten sobre la interaccioacuten entre hablantes - marcando el principio y el final de lossolapamientos - y sobre la entonacioacuten - sentildealando las fronteras entre unidades tonales ylas siacutelabas acentuadas- En opinioacuten de French (1992) la transcripcioacuten a este nivel requiereuna formacioacuten especiacutefica en foneacutetica

bull Nivel IV constituye el nivel maacutes detallado de representacioacuten incluyendo lainformacioacuten propia del nivel III junto con marcas de tonos siacutelabas nucleares y con unatranscripcioacuten fonoloacutegica alineada con una representacioacuten acuacutestica - espectrograma y curvameloacutedica - del enunciado

La recomendacioacuten del proyecto NERC es que la transcripcioacuten de un corpus para el estudiode la lengua oral se lleve a cabo seguacuten las especificaciones del Nivel II adecuado seguacuten Frenchpara todas aquellas investigaciones que no requieran informacioacuten prosoacutedica

En el marco de NERC se llevoacute tambieacuten a cabo una evaluacioacuten de las Guiacuteas de la TEI para latranscripcioacuten de corpus orales de la que se concluye que ldquoThe TEI proposals are broadlycompatible with current practice in the user community as represented by JP Frenchconventions Furthermore in the majority of cases it will be a straightforward matter to link themachine-friendly TEI codes to the more user-friendly encoding systems such as JP Frenchconventions by means of a simple conversion programmerdquo (Payne 199260) La idea de unaconversioacuten automaacutetica entre las transcripciones realizadas seguacuten las propuestas de NERC y de laTEI es naturalmente interesante y refuerza la idea de que existe una compatibilidad general entreambos sistemas (Payne 1992 Johansson 1995a EAGLES 1996) prueba de ello es que en elinforme final de NERC se recomienda el uso de las normas de la TEI

Uno de los objetivos del Grupo de Trabajo sobre Textos Orales de EAGLES fue proponerun conjunto miacutenimo de fenoacutemenos que deberiacutean codificarse en cualquier texto oral La propuestarealizada se describe en EAGLES (1996) y toma elementos del proyecto NERC de la TEI y delGrupo de Trabajo sobre Lengua Oral de EAGLES Considerando los elementos comunes a lossistemas que sirven de base se sugiere que la codificacioacuten de un texto oral debe contener almenos informacioacuten sobre los siguientes aspectos

(1) Elementos vocales y no vocalesbull Elementos vocales semi-leacutexicos

Pertenecen a esta categoriacutea los elementos utilizados principalmente en elhabla espontaacutenea durante los momentos en que el hablante planifica lacontinuacioacuten de su discurso como las llamadas ldquopausas llenasrdquo o ldquosonorasrdquo y los

elementos que marcan dudas en el momento de la produccioacuten del hablaCorresponden a los elementos que en la TEI se marcan con la etiqueta ltvocalgtbull Elementos vocales no leacutexicos

Se incluyen aquiacute todo tipo de sonidos producidos por el hablante - tosesrisas bostezos estornudos etc - que no constituyen formas leacutexicas de la lenguaCorresponden igualmente a los codificados con la marca ltvocalgt en la TEIbull Acontecimientos no vocales y no comunicativos

Comprenden los ruidos producidos por otros hablantes o procedentes delentorno de grabacioacuten Estos acontecimientos se codifican en la TEI mediante lamarca lteventgt

(2) Elementos necesarios en la transcripcioacuten de interacciones verbalesbull Identidad del hablante

Este es un elemento imprescindible en la transcripcioacuten de interaccionesverbales La TEI dispone de los mecanismos para documentar informacioacuten sobrelos hablantes en la cabecera de los textos asiacute como de un sistema para marcar laidentidad de cada participante en el interior del texto aunque pueden utilizarsetambieacuten otros procedimientosbull Turnos de palabra

La finalidad del marcado de los turnos de palabra es indicar un cambio dehablante Ademaacutes de las convenciones de la TEI pueden emplearse otrosprocedimientos mientras se mantenga esta informacioacuten esencial en el estudio de lainteraccioacuten verbalbull Superposicioacuten de turnos de palabra

Existen igualmente diferentes procedimientos para marcar la superposicioacutende emisiones de dos hablantes ademaacutes de las propuestas de la TEI que los tratacomo parte de las estrategias para codificar acontecimientos simultaacuteneos

(3) Elementos relacionados con la actuacioacuten del hablantebull Omisiones en un texto leiacutedo

Si se transcribe un texto leiacutedo y se dispone del original es recomendableanotar las palabras o segmentos omitidos por el locutorbull Autocorrecciones

Es propio del habla espontaacutenea aunque tambieacuten de la lectura que loshablantes realicen correcciones de su propia produccioacuten linguumliacutestica (self-repairs)Parece conveniente marcarlas en la transcripcioacuten de un corpus oralbull Fragmentos de palabras

Los fragmentos de palabras corresponden a uno o maacutes segmentospertenecientes a una palabra que no ha sido totalmente pronunciada por el hablanteen un primer intento y que suelen repetirse cuando eacuteste consigue producir lapalabra completa Es importante indicar este fenoacutemeno en la transcripcioacuten

bull Fragmentos ininteligiblesSe trata de partes de la grabacioacuten que no son comprendidas por el

transcriptor y en la TEI se codifican con la etiqueta ltuncleargt aunque si se desease pueden utilizar marcas maacutes detalladas distinguiendo entre transcripcionescompletamente ininteligibles y entre una posible interpretacioacuten ofrecida por eltranscriptor

Un aspecto conflictivo sigue siendo la identificacioacuten de los enunciados que conforman untexto oral (Schuetze-Coburn 1991) Mientras que en un texto escrito los signos de puntuacioacutenconstituyen un criterio de delimitacioacuten en el habla disponemos de indicios como las pausas laentonacioacuten o el cambio de turno de palabra que nos permiten al menos convencionalmentedefinir un enunciado Sin embargo hasta el momento no se han desarrollado auacuten criteriosobjetivos y consistentes para resolver este problema

7- CONCLUSIONES

La revisioacuten - sin pretensiones de exhaustividad - de los principales sistemas detranscripcioacuten etiquetado y codificacioacuten de corpus orales expuesta en este trabajo pone demanifiesto en primer lugar la multiplicidad de propuestas desarrolladas frente a los intentos deestandarizacioacuten algunos de los cuales auacuten no se han consolidado plenamente pese a su crecienteaceptacioacuten En segundo lugar destaca tambieacuten la heterogeneidad de tradiciones que confluyen enel estudio de la lengua hablada desde la foneacutetica y las tecnologiacuteas del habla hasta el anaacutelisis deldiscurso y de la conversacioacuten diversidad que lleva a la creacioacuten de convenciones especiacuteficas pararesponder a las necesidades de diversas comunidades cientiacuteficas Ante esta situacioacuten la distincioacutenpropuesta por Sinclair (1995107) entre ldquoconformidadrdquo y ldquocompatibilidadrdquo adquiere todo susentido ya que si en ciertos casos la conformidad a un estaacutendar determinado es problemaacutetica porlas limitaciones inherentes a todo sistema comuacuten la compatibilidad - entendida como la facilidadde conversioacuten entre sistemas - deberiacutea ser en cambio un requisito imprescindible en el desarrollode los recursos linguumliacutesticos De esta manera puede tal alcanzarse el equilibrio entre lasnecesidades de un proyecto y las indudables ventajas cientiacuteficas y econoacutemicas que resultan de lareutilizacioacuten de los datos disponibles

BIBLIOGRAFIacuteA

Allen GD 1988 The PHONASCII System Journal of the International PhoneticAssociation 181 9-25

Anderson AH M Badger EG Bard E Boyle G Doherty S Garrod S Isard JKowtko J Mcallister J Miller C Sotillo HS Thompson y R Weinert 1991 The HCRCMap Task corpus Language and Speech 344 351-366

Autesserre D G Peacuterennou y M Rossi 1989 Methodology for the transcription andlabeling of a speech corpus Journal of the International Phonetic Association 191 2-15

Barry WJ y AJ Fourcin 1992 Levels of Labelling Computer Speech and Language 61-14

Beckman ME y GM Ayers GM 1994 Guidelines for ToBI Labelling Version 20February 1994[Documento de Internet disponible en httplingohio-stateeduPhoneticsToBIToBI0html]

Beckman ME y J Hirschberg J 1994 The ToBI Annotation Conventions Apeacutendice A deME Beckman y GM Ayers 1994 Guidelines for ToBI Labelling Version 20 February 1994[Documento de Internet disponible en httplingohio-stateeduPhoneticsToBIToBI0html]

Bruce G 1988 23 Supasegmental categories and 24 The symbolization of temporalevents Journal of the International Phonetic Association 182 75-76

Bruce G 1989 Report from the IPA working group on suprasegmental categories LundUniversity Department of Linguistics General Linguistics Phonetics Working Papers 35 25-40

Burnard L 1995 What is SGML and how does it help Computers and the Humanities291 41-50 The Text Encoding Initiative Background and Context Eds N Ide y J VeacuteronisDordrecht Kluwer Academic Publishers

Burnard L 1995a Text Encoding for Information Exchange An Introduction to the TextEncoding Initiaive TEI Document TEI J31 [Documento de Internet disponible enhttpwwwuiceduorgsteiinfoteij31]

Burnard L 1995b The Text Encoding Initiative an overviewrdquo Spoken English onComputer Transcription Markup and Applications Eds G LEECH G MYERS y JTHOMAS Harlow Longman 69-81

Chafe W 1995 Adequacy user-friendliness and practicality in transcribingrdquo English onComputer Transcription Markup and Applications Eds G Leech G Myers y J ThomasHarlow Longman 54-61

Chan D A Fourcin D Gibbon B Granstroumlm M Huckvale G Kokkinakis K KvaleL Lamel B Lindberg A Moreno J Mouropoulos F Senia I Trancoso C Veld y J Zeiliger1995 EUROM - A Spoken Language Resource for the EU Eurospeech95 Proceedings of the4th European Conference on Speech Communication and Speech Technology Madrid Spain 18-21 September 1995 Vol 1 867-870

Cole RA BT Oshika M Noel T Lander y M Fanty 1994 Labeler Agreement inPhonetic Labeling of Continuous Speech Proceedings of the 1994 International Conference onSpoken Language Processing Yokohama Japan 18-22 September 1994[Documento de Internet disponible en httpwwwcseogieduCSLUcorporapapershtml]

Cook G 1995 Theoretical issues transcribing the untranscribablerdquo Spoken English onComputer Transcription Markup and Applications Eds G Leech G Myers y J ThomasHarlow Longman 35-53

Du Bois JW 1991 Transcription design principles for spoken discourse researchPragmatics 1 71-106

Du Bois JW S Schuetze-Coburn S Cumming y D Paolino 1993 Outline of discoursetranscriptionrdquo Talking Data Transcription and Coding in Discourse Research Eds JAEdwards y MD Lampert Hillsdale NJ Lawrence Erlbaum Associates 45-90

EAGLES 1996 Preliminary Recommendations on Spoken Texts EAGLES DocumentEAG-TCWG-STPP May 1996[Documento de Internet disponible enhttpwwwilcpicnritEAGLES96spokentxspokentxhtml]

Edwards JA 1992 Design principles in the transcription of spoken discourserdquoDirections in Corpus Linguistics Proceedings of Nobel Symposium 82 Stockholm 4-8 August1991 Ed J Svartvik Berlin Mouton de Gruyter 129-147

Edwards JA 1993 Principles and Contrasting Systems of Discourse TranscriptionrdquoTalking Data Transcription and Coding in Discourse Research Eds JA Edwards y MDLampert Hillsdale Hillsdale NJ Lawrence Erlbaum Associates 3-32

Edwards JA 1995 Principles and alternative systems in the transcription coding andmark-up of spoken discourserdquo Spoken English on Computer Transcription Markup andApplications Eds G Leech G Myers y J Thomas Harlow Longman 19-34

Ehlich K 1993 HIAT A Transcription System for Discourse Datardquo Talking DataTranscription and Coding in Discourse Research Eds JA Edwards y MD Lampert HillsdaleNJ Lawrence Erlbaum Associates 123-148

Eisen B 1993 Reliability of speech segmentation and labelling at different levels oftranscription Eurospeech93 3rd European Conference on Speech Communication andTechnology Berlin Germany 21-23 September 1993 Vol 1 673-676

Esling JH y H Gaylord 1993 Computer Codes for Phonetic Symbols Journal of theInternational Phonetic Association 232 77-82

Esling JH 1988 Computer coding of IPA symbols and detailed phonetic representationsof computer databases Journal of the International Phonetic Association 182 99-106

Esling JH 1990 Computer Coding of the IPA Supplementary Report Journal of theInternational Phonetic Association 201 22-26

Fourcin A y JM Dolmazon (on behalf of the SAM Project) 1991 Speech knowledgestandards and assessment Actes du XIIegraveme Congregraves International des Sciences Phoneacutetiques 19-24 aoucirct 1991 Aix-en-Provence France Aix-en-Provence Universiteacute de Provence Service desPublications Vol 5 430-433

Fourcin A G Harland W Barry y V Hazan eds 1989 Speech Input and OutputAssessment Multilingual Methods and Standards Chichester Ellis Horwood Ltd

French JP 1991 Updated notes for soundprint transcribers Working paper Universityof Birmingham October 1991 NERC-WP4-47

French JP 1992 Transcription proposals multilevel system Working paper Universityof Birmingham October 1992 NERC-WP4-50

Gibbon D 1989 Survey of Prosodic Labelling for EC Languages SAM-UBI-190 12February 1989 Report e6 in ESPRIT 2589 (SAM) Interim Report Year 1 Ref SAM-UCLG002 University College London February 1990

Gibbon D R Moore y R Winski eds 1997 Handbook on Standards and Resources forSpoken Language Systems Berlin Mouton De Gruyter [Documento de Internet disponible en httpcoralliliuni-bielefelddeEAGLESeagbookeagbookhtml]

Groslashnnum Thorsen N 1987 Suprasegmental transcription ARIPUC - Annual Report ofthe Institute of Phonetics University of Copenhagen 21 1-27

Gumperz JJ y J Berenz 1993 Transcribing Conversational Exchangesrdquo Talking DataTranscription and Coding in Discourse Research Eds JA Ewards y M D Lampert HillsdaleNJ Lawrence Erlbaum Associates 91-122

Hart J lsquoT R Collier y A Cohen 1990 A Perceptual Study of Intonation An Experimental- Phonetic Approach to Intonation Cambridge Cambridge University Press (Cambridge Studiesin Speech Science and Communication)

Hess W K Kohler y HG Tillmann 1995 The PhonDat-Verbmobil Speech CorpusEurospeech95 Proceedings of the 4th European Conference on Speech Communication andSpeech Technology Madrid Spain 18-21 September 1995 Vol 1 863-866

Hieronymus JL 1994 ASCII phonetic symbols for the worlds languages WorldbetATampT Bell Laboratories Technical Memo [Documento de Internet disponible enhttpwwwcseogieduCSLUcorporapapershtml]

Hirst D A Di Cristo y R Espesser en prensaLevels of representation and levels ofanalysis for intonation Prosody Theory and Experiments Ed M Horne Dordrecht Kluwer

Hirst DJ y A Di Cristo en prensa A survey of intonation systemsrdquo IntonationSystems A Survey of 20 Languages Eds D Hirst y A Di Cristo Cambridge CambridgeUniversity Press

Hirst DJ 1991 Intonation models towards a third generation Actes du XIIegraveme CongregravesInternational des Sciences Phoneacutetiques 19-24 aoucirct 1991 Aix-en-Provence France Aix-en-Provence Universiteacute de Provence Service des Publications Vol 1 305-310

Hirst DJ A Di Cristo M Le Besnerais Z Najim P Nicolas y P Romeacuteas 1993Multilingual modelling of intonation patternsrdquo Proceedings of an ESCA Workshop on ProsodySeptember 27-29 1993 Lund Sweden Eds D House y P Touati Lund University Departmentof Linguistics and Phonetics Working Papers 41 204-207

Hirst DJ N Ide y J Veacuteronis 1994 Coding fundamental frequency patterns for multi-lingual synthesis with INTSINT in the MULTEXT project Conference Proceedings of theSecond ESCAIEEE Workshop on Speech Synthesis September 12-15 1994 Mohonk MountainHouse New Paltz New York USA 77-80

Ide N y J Veacuteronis eds 1995 The Text Encoding Initiative Background and ContextsComputers and the Humanities 29 1-3 Publicado en forma de libro en Dordrecht KluwerAcademic Publishers

IPA 1989 The IPA 1989 Kiel Convention Workgroup 9 report Computer Coding of IPAsymbols and Computer Representation of Individual Languages Journal of the InternationalPhonetic Association 192 81-92

IPA 1993 IPA Chart revised to 1993 Journal of the International Phonetic Association231 [Documento de Internet disponible en httpwwwartsglaacukIPAipacharthtml]

IPA 1995 Preview of the IPA Handbook Journal of the International Phonetic Association251

ISO 8879 1986 Information Processing Text and Office Systems Standard GeneralizedMarkup Language (SGML) Geneva International Organization for Standardization

Johansson S 1995a The approach of the Text Encoding Initiative to the encoding ofspoken discourse Spoken English on Computer Transcription Markup and Applications EdsG Leech G Myers y J Thomas Harlow Longman 82-98

Johansson S 1995b The Encoding of Spoken Texts Computers and the Humanities291 149-158 The Text Encoding Initiative Background and Context Eds N Ide y J VeacuteronisDordrecht Kluwer Academic Publishers 149-158

Keating P P MacEachern A Shryock y S Domiacutenguez 1994 A manual for phonetictranscription Segmentation and labelling of words in spontaneous speech UCLA WorkingPapers in Phonetics 88 91-120

Kluger-Kruse M 1987 Computer Phonetic Alphabet ESPRIT Linguistic Analysis of theEuropean Languages Report BU-CPA0267 July 1987

Krot C y B Taylor 1995 Criteria for Acoustic-Phonetic Segmentation and WordLabelling in the Australian National Database of Spoken Language[Documento de Internet disponible en httpwwwshlrcmqeduaucriteriahtml]

Lander T 1997 The CSLU Labeling Guide Center for Spoken Language UnderstandingOregon Graduate Institute[Documento de Internet disponible en httpwwwcseogieduCSLUcorporapapershtml]

Llisterri J 1994 Prosody Encoding Survey WP 1 Specifications and Standards T15Markup Specifications Deliverable 153 Final version 15 September 1994 LRE Project 62-050MULTEXT

Llisterri J ed 1996 Prosody Tools Efficiency and Failures WP 4 Corpus T46 SpeechMarkup and Validation Deliverable 452 Final version 15 October 1996 LRE Project 62-050MULTEXT

MacWhinney B 1991The CHILDES Project Tools for Analyzing Talk Hillsdale NJLawrence Erlbaum

Marchal A N Nguyen y W Hardcastle 1995 Multitiered phonetic approach to speechlabelling Levels in Speech Communication Relations and Interactions A Tribute to MaxWajskop Hommage agrave Max Wajskop Eds C Sorin J Mariani H Meloni y J SchoengenAmsterdam Elsevier Science BV 149-158

NERC 1994 NERC-1 Network of European Reference Corpora Final Report PisaInstituto di Linguistica Computazionale - CNR January 1994 versioacuten en curso de publicacioacutenTowards a Network of European Reference Corpora Eds N Calzolari M Baker y PG KruytPisa Giardini

Nicolas P y D Hirst 1995 Symbolic coding of Higher-Level Characteristics ofFundamental Frequency Curvesrdquo Eurospeech95 Proceedings of the 4th European Conferenceon Speech Communication and Technology Madrid Spain 18-21 September 1995 Vol 2 989-992

OConnell DC y S Kowal 1994 Some Current Transcription Systems for SpokenDiscourse A critical Analysis Pragmatics 4 81-107

Ochs E 1979 Transcription as Theory Developmental Pragmatics Eds E Ochs E yBB Schieffelin New York Academic Press 43-72

Payne J 1992 Report on the compatibility of JP Frenchs spoken corpus transcriptionconventions with the TEI guidelines for transcription of spoken texts Working paper COBUILDBirmingham and IDS Mannheim December 1992 NERC-WP8WP4-122

Payne J 1995 The COBUILD spoken corpus transcription conventions SpokenEnglish on Computer Transcription Markup and Applications Eds G Leech G Myers y JThomas Harlow Longman 203-207

Payratoacute Ll 1995 Transcripcioacuten del discurso coloquialrdquo El espantildeol coloquial Actas del ISimposio sobre Anaacutelisis del Discurso Oral Almeriacutea 23-25 de noviembre de 1994 Ed L CorteacutesRodriacuteguez Almeriacutea Universidad de Almeriacutea Servicio de Publicaciones 43-70

Pierrehumbert J B 1897 (1980) The Phonology and Phonetics of English IntonationPhD Thesis Department of Linguistics MIT Bloomington Indiana University Linguistics Club

Pitrelli J M Beckman y J Hirschberg 1994 Evaluation of prosodic transcriptionlabelling reliability in the ToBI frameworkrdquo Proceedings of the Third International Conference onSpoken Language Processing Yokohama ICSLP Vol 2 123-126

Pullum GK y WA Ladusaw 1996 (1986) Phonetic Symbol Guide Chicago TheUniversity of Chicago Press 2nd edition

Roach P H Roach A Dew y P Rowlands 1990 Phonetic analysis and the automaticsegmentation and labeling of speech sounds Journal of the International Phonetic Association201 15-21

Schmidt MS C Scott y MA Jack 1993 Phonetic transcription standards for Europeannames (ONOMASTICA) Eurospeech93 3rd European Conference on Speech Communicationand Technology Berlin Germany 21-23 September 1993 Vol 1 279-282

Schuetze-Coburn S 1991Units of intonation in discourse a comparison of acoustic andauditory analysis Language and Speech 343 207-234

Selting M 1987 Descriptive categories for the auditive analysis of intonation inconversation Journal of Pragmatics 11 777-791

Selting M 1988 The role of intonation in the organisation of repair and problem handlingsequences in conversation Journal of Pragmatics 12 293-322

Senia F y JG Van Velden 1997 Specifications of orthographic transcription and lexiconconventions LRE-4001 SpeechDat Technical Report SD132 Final version 10 January 1997[Documento de Internet disponible en httpwwwphonetikuni-muenchendeSpeechDathtml]

Silverman K M Beckman J Pitrelli M Ostendorf C Wightman P Price JPierrehumbert y J Hirschberg 1992 TOBI A standard for labelling English prosodyProceedings of the Second International Conference on Spoken Language Processing ICSLP-92Banff October 1992 867-870

Sinclair J 1994 Spoken Language [3B] PhoneticPhonemic and Prosodic Annotation[52] NERC 1994 NERC-1 Network of European Reference Corpora Final Report PisaVersioacuten en curso de publicacioacuten Towards a Network of European Reference Corpora Eds NCalzolari M Baker y PG Kruyt Pisa Giardini

Sinclair J 1995 From theory to practicerdquo Spoken English on Computer TranscriptionMarkup and Applications Eds G Leech G Myers Y J Thomas Harlow Longman 99- 112

Sperberg-McQueen CM y L Burnard eds 1994 Guidelines for Electronic Text Encodingand Interchange TEI P3 Chicago and Oxford Association for Computational Linguistics Association for Computers and the Humanities Association for Literary and LinguisticComputing [Cap 11 Transcriptions of Speech] [Documento de Internet disponible enhttpetextvirginiaeduTEIhtml]

Strangert E y M Heldner 1995 Labelling of boundaries and prominences byphonetically experienced and non-experienced transcribers Phonum 3 Reports from theDepartment of Phonetics Umearing University 85-109 [Documento de Internet disponible enhttpwwwlingumusefonphonum3html]

Teubert W 1993 Phonetic Phonemic and Prosodic Annotation Final Report IDSMannheim February 1993 NERC-WP8-171

Tillmann HG y B Pompino-Marschall 1993 Theoretical Principles ConcerningSegmentation Labelling Strategies and Levels of Categorical Annotation for Spoken LanguageDatabase Systems Eurospeech93 3rd European Conference on Speech Communication andTechnology Berlin Germany 21-23 September 1993 Vol 3 1691-1694

Trancoso I 1995 The ONOMASTICA Interlanguage Pronunciation LexiconrdquoEurospeech95 Proceedings of the 4th European Conference on Speech Communication andTechnology Madrid Spain 18-21 September 1995 Vol 1 829-832

Wells JC 1987 Computer Coded Phonetic Transcription Journal of the InternationalPhonetic Association 172 94-114

Wells JC 1989 Computer-coded phonemic notation of individual languages of theEuropean Community Journal of the International Phonetic Association 191 31-54

Wells JC 1994 Computer-coding the IPA a proposed extension of SAMPA SpeechHearing and Language Work in Progress 1994 (University College London Department ofPhonetics and Linguistics) 8 271-289

Wells JC 1995 SAMPROSA (SAM Prosodic Transcription [Documento de Internetdisponible en httpwwwphonuclacukhomesampasamprosahtm]

Wells JC W Barry M Grice A Fourcin y D Gibbon 1992 Standard Computer-Compatible Transcription SAM Stage Report Sen3 SAM UCL-037 28 February 1992 SAM(1992) Esprit Project 2589 (SAM) Multilingual Speech InputOutput AssessmentMethodologyand Standardisation Final Report Year Three 1III91-28II1992 London University CollegeLondon

Wesenick M-B y F Schiel 1995 Feasibility of Automatic Annotation and BuildingPronunciation Lexica from Corpus Material LRE-63314 SpeechDat Report D3123 Finalversion 10 October 1995[Documento de Internet disponible en httpwwwicpgrenetfrSpeechDathomehtml]

Winski R R Moore y D Gibbon 1995 EAGLES Spoken Language Working GroupOverview and Resultsrdquo Eurospeech95 Proceedings of the 4th European Conference on SpeechCommunication and Speech Technology Madrid Spain 18-21 September 1995 Vol 1 841-844[Documento de Internet disponible en httpcoralliliuni-bielefeldde~gibbonEAGLESrwpaperrwpaperhtml]

  • 1- INTRODUCCIOacuteN
  • 2- NIVELES DE REPRESENTACIOacuteN ETIQUETADO Y CODIFICACIOacuteN
  • 3- REPRESENTACIOacuteN ORTOGRAacuteFICA DE CORPUS ORALES
  • 31- Propuestas para la representacioacuten ortograacutefica de corpus orales en el aacutembito de la linguumliacutestica de corpus
  • 32- Propuestas para la representacioacuten ortograacutefica de corpus orales en el aacutembito de las tecnologiacuteas del habla
  • 4- REPRESENTACIOacuteN FONEacuteTICA DE CORPUS ORALES
  • 41- La representacioacuten foneacutetica de los elementos segmentales
  • 42- La representacioacuten foneacutetica de los elementos suprasegmentales
  • 5- ETIQUETADO FONEacuteTICO DE CORPUS ORALES
  • 51- Niveles de etiquetado foneacutetico de corpus orales
  • 52- La transcripcioacuten y el etiquetado automaacutetico de corpus orales
  • 6- TRANSCRIPCIOacuteN Y CODIFICACIOacuteN DE CORPUS PARA EL ANAacuteLISIS DE LA LENGUA ORAL
  • 61- Los requisitos de una transcripcioacuten
  • 62- Propuestas de estandarizacioacuten para la transcripcioacuten y codificacioacuten de corpus orales
  • 7- CONCLUSIONES
  • BIBLIOGRAFIacuteA
Page 12: Transcripción, etiquetado y codificación de corpus orales

bull Nivel de formas canoacutenicas (citation form) representando la forma depronunciacioacuten aislada de las palabra en estilo cuidado

bull Nivel de transcripcioacuten ancha o fonotiacutepica en este nivel se utilizan los siacutembolosque representan elementos fonoloacutegicos en una lengua dada pero al igual que en lapropuesta de Barry y Fourcin se transcriben aquellos fenoacutemenos predictibles propios dela foneacutetica sintaacutectica SAMPA seriacutea pues un alfabeto foneacutetico adecuado para este nivelde transcripcioacuten

bull Nivel de transcripcioacuten estrecha basado en una representacioacuten alofoacutenica de lasrealizaciones foneacuteticas de los hablantes para el cual puede utilizarse un alfabeto foneacuteticocomo X-SAMPA

bull Nivel acuacutestico-foneacutetico en el que se distinguen caracteriacutesticas acuacutesticas de lossegmentos observables en una representacioacuten de la onda sonora

bull Nivel fiacutesico representado en teacuterminos de paraacutemetros acuacutesticos o articulatoriosbull Fenoacutemenos no linguumliacutesticos la inclusioacuten de este nivel permite representar sonidos

de naturaleza comunicativa o no introducidos por el hablante asiacute como toda aquellainformacioacuten paralinguumliacutestica que se considere de intereacutes tambieacuten permite sentildealas los ruidosexternos en la grabacioacuten

Vale la pena detenerse brevemente en el nivel de las formas canoacutenicas y en el concepto deldquotranscripcioacuten fonotiacutepicardquo que como puede verse aparecen de forma recurrente en diversaspropuestas La inclusioacuten de forma canoacutenicas en el etiquetado de un corpus responde a un doblemotivo especialmente ligado a necesidades tecnoloacutegicas en primer lugar estas formas permitenderivar automaacuteticamente mediante un conjunto de reglas una transcripcioacuten ancha o fonotiacutepica enla que se incluyen los elementos alofoacutenicos cuya aparicioacuten esta condicionada por el contextofoneacutetico en segundo lugar a partir de las formas canoacutenicas puede crearse de forma automaacutetica undiccionario foneacutetico partiendo de un corpus transcrito (Wesenick y Schiel 1995 Senia y vanVelden 1997) lo que tiene utilidad para el desarrollo de sistemas de siacutentesis y reconocimiento delhabla y tambieacuten para la descripcioacuten linguumliacutestica La transcripcioacuten denominada ldquofonotiacutepicardquo en lostrabajos de SAM constituye un nivel intermedio entre la realizacioacuten foneacutetica y la transcripcioacutenpuramente fonoloacutegica Por otra parte el nivel de transcripcioacuten de formas canoacutenicas estaacutedirectamente relacionado con la representacioacuten ortograacutefica facilitando asiacute la transcripcioacuten foneacuteticaautomaacutetica de corpus en este nivel mediante el desarrollo de los correspondientes sistemas dereglas

En el informe del Grupo de Trabajo de Corpus Textuales de EAGLES (EAGLES 1996) seintenta realizar una siacutentesis entre las necesidades de diversos campos de estudio Se sugieren porello tres niveles de representacioacuten

bull S1 representacioacuten ortograacutefica del textobull S2 representacioacuten fonoloacutegica de las palabras en su forma canoacutenicabull S3 transcripcioacuten foneacutetica consistente en una representacioacuten simboacutelica discreta de

la realizacioacuten del enunciado tal como es percibido por el transcriptor

Como puede observarse estos tres niveles encuentran su equivalente en los nivelespropuesto por Barry y Fourcin (1992) y en los definidos por el Grupo de Trabajo de Lengua

Oral Para la transcripcioacuten del nivel S2 puede utilizarse SAMPA mientras que la del nivel S3requiere el uso de un alfabeto foneacutetico como X-SAMPA

52- La transcripcioacuten y el etiquetado automaacutetico de corpus orales

La tarea de transcribir y etiquetar foneacuteticamente un corpus oral representa un considerableesfuerzo tanto en teacuterminos de tiempo como de los recursos econoacutemicos necesarios para llevar acabo esta labor El etiquetado manual requiere por otro lado el desarrollo de convencionesdetalladas para asegurar la consistencia entre diversos transcriptores (Keating et al 1994 Krot yTaylor 1995 Lander 1997) ademaacutes del establecimiento de un proceso de validacioacutencomprobando la fiabilidad de los resultados obtenidos (Eisen 1993 Cole et al 1994 Strangert yHeldener 1995) Por estos motivos uno de los intereses principales de los investigadores en elcampo de las tecnologiacuteas del habla ha sido llevar a cabo el etiquetado de forma semi-automaacutetica oidealmente automaacutetica Un primer nivel de transcripcioacuten - tanto de formas canoacutenicas comofonotiacutepica - puede obtenerse automaacuteticamente como acabamos de mencionar a partir de larepresentacioacuten ortograacutefica si se dispone de un conjunto de reglas que establezcan lascorrespondencias entre la representacioacuten ortograacutefica y la foneacutetica

Sin embargo un etiquetado foneacutetico en los niveles de transcripcioacuten maacutes detallada requiere laposibilidad de acceder a la onda sonora y un procedimiento de anaacutelisis de la sentildeal La primeraoperacioacuten que debe realizar un sistema de etiquetado automaacutetico es la segmentacioacuten del continuumsonoro en unidades menores - segmentos o caracteriacutesticas acuacutesticas en funcioacuten del nivel detranscripcioacuten deseado - para pasar despueacutes a la asignacioacuten de etiquetas - siacutembolos detranscripcioacuten - que describan sus caracteriacutesticas Este es el proceso conocido propiamente comoetiquetado (labelling) que cuando se realiza de forma automaacutetica debe superar los obstaacuteculosderivados de la naturaleza no discreta de la sentildeal sonora - resultado de mecanismos como lacoarticulacioacuten - y de la variabilidad de realizaciones foneacuteticas entre hablantes o incluso en unmismo hablante

Para que el corpus sea uacutetil el etiquetado foneacutetico debe estar temporalmente sincronizadocon la sentildeal sonora y con la representacioacuten ortograacutefica operacioacuten que se realiza en el procesoconocido como alineacioacuten temporal (time alignment) llevado a cabo tambieacuten de forma automaacuteticaEsta alineacioacuten puede hacerse de un modo global sentildealando en la onda sonora las fronteras entrepalabras ortograacuteficas - para facilitar el acceso a la grabacioacuten a partir de este nivel de representacioacuten(Lander 1997) - o los puntos en los que se encuentran siacutelabas acentuadas tal como sucede porejemplo en el proyecto MULTEXT

En el campo de las tecnologiacuteas del habla se han llevado a cabo numerosiacutesimos trabajosencaminados al disentildeo de sistemas de segmentacioacuten etiquetado y alineacioacuten temporal automaacuteticasde corpus orales utilizando las teacutecnicas propias del reconocimiento del habla como los Modelosde Markov o las redes neuronales Cabe destacar que tales teacutecnicas no soacutelo son uacutetiles en eldesarrollo de corpus en este aacutembito sino que constituyen una herramienta importante en otrostipos de corpus sin embargo es preciso reconocer que el habla espontaacutenea - especialmente si seha recogido mediante grabaciones realizadas en un entorno natural - plantea auacuten problemas en lo

que se refiere a su transcripcioacuten y etiquetado automaacuteticos pese a los notabiliacutesimos avances quetienen lugar en este campo

6- TRANSCRIPCIOacuteN Y CODIFICACIOacuteN DE CORPUS PARA EL ANAacuteLISIS DE LA LENGUA ORAL

En este uacuteltimo apartado incidiremos en las cuestiones relacionadas con la transcripcioacuten ycodificacioacuten de corpus orales que pueden presentar un mayor intereacutes para aacutembitos como elanaacutelisis de discurso o de la conversacioacuten y para el estudio de la lengua oral en todos los niveles dela descripcioacuten linguumliacutestica Como indicaacutebamos al principio la transcripcioacuten y la codificacioacuten de loselementos transcritos son en principio dos operaciones conceptualmente diferentes Sinembargo en la praacutectica habitual en las disciplinas a las que se refiere este apartado suelen ser dosoperaciones que se realizan simultaacuteneamente ya que al mismo tiempo que se realiza latransliteracioacuten se introducen las marcas necesarias para la codificacioacuten de los elementos que se hadecidido introducir en el corpus Por ello en muchos casos la discusioacuten sobre la transcripcioacuten y lacodificacioacuten se realiza conjuntamente en la bibliografiacutea sobre el tema

61- Los requisitos de una transcripcioacuten

El investigador que decide constituir un corpus de lengua oral se encuentra en estosmomentos con una gran variedad de criterios en lo que se refiere a la transcripcioacuten y a la seleccioacutende los elementos que apareceraacuten codificados en el corpus Hemos hecho ya referencia en elapartado 3 a las diversas convenciones para la representacioacuten ortograacutefica y cintildeeacutendonos al aacutembitodel anaacutelisis del discurso y la conversacioacuten constatamos igualmente la existencia una grandiversidad de propuestas En una revisioacuten de las mismas Payratoacute (1995) hace por ejemploreferencia a los sistemas de transcripcioacuten y codificacioacuten procedentes de la etnometodologiacuteainteresados en reflejar la interaccioacuten verbal a los meacutetodos desarrollados en el marco de laetnografiacutea de la comunicacioacuten y de la sociolinguumliacutestica interaccional4 o a propuestas utilizadas en elestudio del lenguaje infantil Ante tal situacioacuten parece conveniente plantearse cuaacuteles son losrequisitos que debe cumplir una transcripcioacuten de la lengua oral tema que ha sido abordado pordiversos autores (DuBois 1991 Elich 1993 Edwards 1993 OrsquoConnell y Kowal 1994) Trasrevisar aportaciones anteriores Payratoacute (1995) resume los requisitos que teoacutericamente deberiacuteanexigirse a toda transcripcioacuten

bull Neutralidad o fidelidad de modo que la transcripcioacuten no sea interpretativabull Globalidad o complejidad recogiendo la totalidad de los fenoacutemenos que aparecen

en el discurso oralbull Omnifuncionalidad permitiendo diversos usos y aplicacionesbull Claridad tanto desde el punto de vista del aprendizaje del sistema como de la

legibilidad de la representacioacutenbull Universalidad y compatibilidad entre sistemas informaacuteticos

4 Estos sistemas se comparan en OrsquoConnell y Kowal (1994) Pueden encontrarse consideraciones generales sobre latranscripcioacuten y codificacioacuten de la lengua oral en el anaacutelisis del discurso y la conversacioacuten en 1995Ochs (1979) DuBois (1991) Edwards (1992 1993 1995) Du Bois et al (1993) Gumperz y Berenz (1993) Cook (1995) Chafe(1995) y en Sinclair (1995)

Sin embargo puesto que en la praacutectica se transcribe en funcioacuten de los objetivos para losque se ha definido el corpus Payratoacute (1995) considera que un sistema de transcripcioacuten debe serante todo interpretativo de los datos selectivo en cuanto a los fenoacutemenos que se transcribenpertinente para el objeto de investigacioacuten coherente con la base teoacuterica adoptada por elinvestigador fiel en cuanto a la representacioacuten de los datos y flexible para que sea posible suutilizacioacuten en diversos estudios Por otra parte en opinioacuten de este autor la simbologiacutea utilizadadebe ser clara econoacutemica sencilla exenta de ambiguumledad y compatible con sistemas internacionesestandarizados Este uacuteltimo aspecto nos parece especialmente importante ya que como sentildeala elmismo Payratoacute (1995 58)

[] en ninguacuten caso puede olvidarse que los datos de una investigacioacuten no deberiacutean sertratados nunca de forma tan parcial o idiosincraacutesica que se impidiera o dificultara el uso por partede otros investigadores La transcripcioacuten del discurso oral es una actividad suficientementecostosa y conflictiva para tomar precauciones en este sentido y ninguna comunidad cientiacuteficapuede permitirse el lujo de particularismos (en aspectos tan elementales) que obstruyan el debateo conviertan en inaprovechables una fuente de informacioacuten

62- Propuestas de estandarizacioacuten para la transcripcioacuten y codificacioacuten de corpus orales

Ante la diversidad de propuestas para la transcripcioacuten y codificacioacuten de la lengua oral queacabamos de constatar el surgimiento de la linguumliacutestica de corpus y muy especialmente lasnecesidades derivadas del intercambio electroacutenico de textos propiciaron la aparicioacuten de proyectose iniciativas centrados en la creacioacuten de estaacutendares tanto en lo que se refiere a la transcripcioacutencomo a la codificacioacuten En los proacuteximos apartados revisamos sucintamente algunos de ellos

Uno de los capiacutetulos de las Guiacuteas desarrolladas por la TEI estaacute dedicado a la transcripcioacutende corpus orales (Johansson 1995a b) En eacutel se describe la estructura baacutesica de la representacioacutende un texto oral - cabecera texto y divisiones - y se definen los procedimientos basados enSGML para la representacioacuten de los elementos estructurales baacutesicos informacioacuten contextualinformacioacuten temporal enunciados pausas elementos vocalizados semi-leacutexicos o no leacutexicoselementos kineacutesicos otros tipos de eventos comunicativos y texto presentado en forma escrita alhablante Tambieacuten se ofrecen en este capiacutetulo indicaciones para la segmentacioacuten y el alineamientoasiacute como recomendaciones para la transcripcioacuten de superposiciones entre hablantes de formas depalabras prosodia elementos paralinguumliacutesticos - tempo intensidad rango tonal tensioacuten ritmo ycalidad de voz - y alteraciones en el decurso foacutenico Para la representacioacuten de la informacioacutenfoneacutetica se recomienda el uso del AFI En la siguiente tabla se resumen los principales elementospropuestos por la TEI para la codificacioacuten de corpus orales considerados especiacuteficos de este tipode texto (Sperberg-McQueen y Burnard eds 1994)

Elemento codificado Marca decodificacioacutenen SGML

Definicioacuten

Divisiones (division) ltdivgt Unidades intermedias entre el texto y el enunciado que permitendelimitar partes diferenciadas en un texto

Enunciado (utterance) ltugt Segmento de habla comprendido entre dos pausas o delimitado porun cambio en el turno de palabra puede incluir ademaacutesinformacioacuten sobre la superposicioacuten (ltoverlapgt) de turnos cuando

interviene simultaacuteneamente maacutes de un hablantePausa (pause) ltpausegt Interrupcioacuten de la fonacioacuten percibida entre dos enunciados o en el

interior de los mismos puede describirse en teacuterminos relativos oindicando su duracioacuten

Vocal (vocal) ltvocalgt Elemento vocalizado semi-leacutexico o no leacutexico (pej pausas llenas otoses)

Kineacutesico (kinesic) ltkinesicgt Cualquier fenoacutemeno comunicativo no vocal (p ej gestos)Acontecimiento (event) lteventgt Cualquier fenoacutemeno identificado en la grabacioacuten no necesariamente

vocalizado ni con valor comunicativo (p ej ruidos de fondo)Texto escrito (writing) ltwritinggt Texto escrito que se presenta al hablante durante su intervencioacutenCambio (shift) ltshiftgt Momento en el que se produce un cambio en alguno de los rasgos

paralinguumliacutesticos - calidad de voz intensidad rango tonal ritmo yvelocidad de elocucioacuten - cada uno de los rasgos puede describirsemediante una lista de caracteriacutesticas

Tabla 1 Elementos codificados en las transcripciones de lengua oral seguacuten los estaacutendares de la TEI(Adaptada de Sperberg-McQueen y Burnard eds1994)

Por otra parte la TEI ofrece mecanismos para indicar el comienzo y el final de unfenoacutemeno su duracioacuten y su sincronizacioacuten temporal con otros elementos presenta tambieacuten laposibilidad de marcar unidades inferiores al enunciado - segmentos ltseggt - que permitendelimitar por ejemplo unidades prosoacutedicas e incluye tambieacuten entre sus propuestas las marcasnecesarias para sentildealar fenoacutemenos propios de la lengua hablada como palabras truncadasrepeticiones falsos principios - marcados como ltdelgt (deletion) y especificando el fenoacutemeno -Las partes de la grabacioacuten que el transcriptor no llega a interpretar correctamente - ltuncleargt - ono puede escuchar - ltgapgt - o las correcciones de errores de produccioacuten realizadas por eltranscriptor - ltsicgt para delimitar el error y ltcorrgt para indicar la correccioacuten - son tambieacutenelementos para los cuales la TEI establece marcas de codificacioacuten

Aunque las Guiacuteas de la TEI pueden considerarse un sistema adecuado para la transcripcioacuteny codificacioacuten de gran variedad de materiales los autores propios autores reconocen que

[] the present proposals are not intended to support unmodified every variety of researchundertaken upon spoken material now or in the future some discourse analysts phonologistsand doubtless other may wish to extend the scheme presented here to express more precisely theset of distinctions they wish to draw in their transcriptions Speech regarded as a purely acousticphenomenon may well require different methods from those outlined here as may speechregarded solely as a process of social interaction (Sperberg-McQueen y Burnard eds 1994 cap11)

El proyecto NERC - Network of European Reference Corpora (NERC 1994) se planteoacutecomo uno de sus objetivos la viabilidad de desarrollar una serie de recomendaciones para laconstitucioacuten de corpus y por tanto incluye entre sus resultados indicaciones sobre el tratamientode los corpus orales tanto en lo que se refiere a su codificacioacuten como a la transcripcioacuten de loselementos segmentales y suprasegmentales (Sinclair 1994) El sistema adoptado para latranscripcioacuten y codificacioacuten de corpus se basa como hemos indicado anteriormente en eldesarrollado por French (1991 1992) para la transcripcioacuten del corpus oral desarrollado en elproyecto COBUILD La transcripcioacuten se plantea como una operacioacuten que puede desarrollarse envarios niveles

bull Nivel I consiste en la representacioacuten ortograacutefica introduciendo los miacutenimossignos de puntuacioacuten necesarios sin informacioacuten sobre la interaccioacuten entre hablantes Eneste nivel se contemplan convenciones desarrolladas para la representacioacuten ortograacutefica ypara precisar el uso de la puntuacioacuten

bull Nivel II consiste en una representacioacuten ortograacutefica enriquecida con informacioacutenbaacutesica sobre la identidad de los hablantes el turno de palabra y los elementos no verbales

bull Nivel III contiene toda la informacioacuten presente en el nivel II ademaacutes deinformacioacuten sobre la interaccioacuten entre hablantes - marcando el principio y el final de lossolapamientos - y sobre la entonacioacuten - sentildealando las fronteras entre unidades tonales ylas siacutelabas acentuadas- En opinioacuten de French (1992) la transcripcioacuten a este nivel requiereuna formacioacuten especiacutefica en foneacutetica

bull Nivel IV constituye el nivel maacutes detallado de representacioacuten incluyendo lainformacioacuten propia del nivel III junto con marcas de tonos siacutelabas nucleares y con unatranscripcioacuten fonoloacutegica alineada con una representacioacuten acuacutestica - espectrograma y curvameloacutedica - del enunciado

La recomendacioacuten del proyecto NERC es que la transcripcioacuten de un corpus para el estudiode la lengua oral se lleve a cabo seguacuten las especificaciones del Nivel II adecuado seguacuten Frenchpara todas aquellas investigaciones que no requieran informacioacuten prosoacutedica

En el marco de NERC se llevoacute tambieacuten a cabo una evaluacioacuten de las Guiacuteas de la TEI para latranscripcioacuten de corpus orales de la que se concluye que ldquoThe TEI proposals are broadlycompatible with current practice in the user community as represented by JP Frenchconventions Furthermore in the majority of cases it will be a straightforward matter to link themachine-friendly TEI codes to the more user-friendly encoding systems such as JP Frenchconventions by means of a simple conversion programmerdquo (Payne 199260) La idea de unaconversioacuten automaacutetica entre las transcripciones realizadas seguacuten las propuestas de NERC y de laTEI es naturalmente interesante y refuerza la idea de que existe una compatibilidad general entreambos sistemas (Payne 1992 Johansson 1995a EAGLES 1996) prueba de ello es que en elinforme final de NERC se recomienda el uso de las normas de la TEI

Uno de los objetivos del Grupo de Trabajo sobre Textos Orales de EAGLES fue proponerun conjunto miacutenimo de fenoacutemenos que deberiacutean codificarse en cualquier texto oral La propuestarealizada se describe en EAGLES (1996) y toma elementos del proyecto NERC de la TEI y delGrupo de Trabajo sobre Lengua Oral de EAGLES Considerando los elementos comunes a lossistemas que sirven de base se sugiere que la codificacioacuten de un texto oral debe contener almenos informacioacuten sobre los siguientes aspectos

(1) Elementos vocales y no vocalesbull Elementos vocales semi-leacutexicos

Pertenecen a esta categoriacutea los elementos utilizados principalmente en elhabla espontaacutenea durante los momentos en que el hablante planifica lacontinuacioacuten de su discurso como las llamadas ldquopausas llenasrdquo o ldquosonorasrdquo y los

elementos que marcan dudas en el momento de la produccioacuten del hablaCorresponden a los elementos que en la TEI se marcan con la etiqueta ltvocalgtbull Elementos vocales no leacutexicos

Se incluyen aquiacute todo tipo de sonidos producidos por el hablante - tosesrisas bostezos estornudos etc - que no constituyen formas leacutexicas de la lenguaCorresponden igualmente a los codificados con la marca ltvocalgt en la TEIbull Acontecimientos no vocales y no comunicativos

Comprenden los ruidos producidos por otros hablantes o procedentes delentorno de grabacioacuten Estos acontecimientos se codifican en la TEI mediante lamarca lteventgt

(2) Elementos necesarios en la transcripcioacuten de interacciones verbalesbull Identidad del hablante

Este es un elemento imprescindible en la transcripcioacuten de interaccionesverbales La TEI dispone de los mecanismos para documentar informacioacuten sobrelos hablantes en la cabecera de los textos asiacute como de un sistema para marcar laidentidad de cada participante en el interior del texto aunque pueden utilizarsetambieacuten otros procedimientosbull Turnos de palabra

La finalidad del marcado de los turnos de palabra es indicar un cambio dehablante Ademaacutes de las convenciones de la TEI pueden emplearse otrosprocedimientos mientras se mantenga esta informacioacuten esencial en el estudio de lainteraccioacuten verbalbull Superposicioacuten de turnos de palabra

Existen igualmente diferentes procedimientos para marcar la superposicioacutende emisiones de dos hablantes ademaacutes de las propuestas de la TEI que los tratacomo parte de las estrategias para codificar acontecimientos simultaacuteneos

(3) Elementos relacionados con la actuacioacuten del hablantebull Omisiones en un texto leiacutedo

Si se transcribe un texto leiacutedo y se dispone del original es recomendableanotar las palabras o segmentos omitidos por el locutorbull Autocorrecciones

Es propio del habla espontaacutenea aunque tambieacuten de la lectura que loshablantes realicen correcciones de su propia produccioacuten linguumliacutestica (self-repairs)Parece conveniente marcarlas en la transcripcioacuten de un corpus oralbull Fragmentos de palabras

Los fragmentos de palabras corresponden a uno o maacutes segmentospertenecientes a una palabra que no ha sido totalmente pronunciada por el hablanteen un primer intento y que suelen repetirse cuando eacuteste consigue producir lapalabra completa Es importante indicar este fenoacutemeno en la transcripcioacuten

bull Fragmentos ininteligiblesSe trata de partes de la grabacioacuten que no son comprendidas por el

transcriptor y en la TEI se codifican con la etiqueta ltuncleargt aunque si se desease pueden utilizar marcas maacutes detalladas distinguiendo entre transcripcionescompletamente ininteligibles y entre una posible interpretacioacuten ofrecida por eltranscriptor

Un aspecto conflictivo sigue siendo la identificacioacuten de los enunciados que conforman untexto oral (Schuetze-Coburn 1991) Mientras que en un texto escrito los signos de puntuacioacutenconstituyen un criterio de delimitacioacuten en el habla disponemos de indicios como las pausas laentonacioacuten o el cambio de turno de palabra que nos permiten al menos convencionalmentedefinir un enunciado Sin embargo hasta el momento no se han desarrollado auacuten criteriosobjetivos y consistentes para resolver este problema

7- CONCLUSIONES

La revisioacuten - sin pretensiones de exhaustividad - de los principales sistemas detranscripcioacuten etiquetado y codificacioacuten de corpus orales expuesta en este trabajo pone demanifiesto en primer lugar la multiplicidad de propuestas desarrolladas frente a los intentos deestandarizacioacuten algunos de los cuales auacuten no se han consolidado plenamente pese a su crecienteaceptacioacuten En segundo lugar destaca tambieacuten la heterogeneidad de tradiciones que confluyen enel estudio de la lengua hablada desde la foneacutetica y las tecnologiacuteas del habla hasta el anaacutelisis deldiscurso y de la conversacioacuten diversidad que lleva a la creacioacuten de convenciones especiacuteficas pararesponder a las necesidades de diversas comunidades cientiacuteficas Ante esta situacioacuten la distincioacutenpropuesta por Sinclair (1995107) entre ldquoconformidadrdquo y ldquocompatibilidadrdquo adquiere todo susentido ya que si en ciertos casos la conformidad a un estaacutendar determinado es problemaacutetica porlas limitaciones inherentes a todo sistema comuacuten la compatibilidad - entendida como la facilidadde conversioacuten entre sistemas - deberiacutea ser en cambio un requisito imprescindible en el desarrollode los recursos linguumliacutesticos De esta manera puede tal alcanzarse el equilibrio entre lasnecesidades de un proyecto y las indudables ventajas cientiacuteficas y econoacutemicas que resultan de lareutilizacioacuten de los datos disponibles

BIBLIOGRAFIacuteA

Allen GD 1988 The PHONASCII System Journal of the International PhoneticAssociation 181 9-25

Anderson AH M Badger EG Bard E Boyle G Doherty S Garrod S Isard JKowtko J Mcallister J Miller C Sotillo HS Thompson y R Weinert 1991 The HCRCMap Task corpus Language and Speech 344 351-366

Autesserre D G Peacuterennou y M Rossi 1989 Methodology for the transcription andlabeling of a speech corpus Journal of the International Phonetic Association 191 2-15

Barry WJ y AJ Fourcin 1992 Levels of Labelling Computer Speech and Language 61-14

Beckman ME y GM Ayers GM 1994 Guidelines for ToBI Labelling Version 20February 1994[Documento de Internet disponible en httplingohio-stateeduPhoneticsToBIToBI0html]

Beckman ME y J Hirschberg J 1994 The ToBI Annotation Conventions Apeacutendice A deME Beckman y GM Ayers 1994 Guidelines for ToBI Labelling Version 20 February 1994[Documento de Internet disponible en httplingohio-stateeduPhoneticsToBIToBI0html]

Bruce G 1988 23 Supasegmental categories and 24 The symbolization of temporalevents Journal of the International Phonetic Association 182 75-76

Bruce G 1989 Report from the IPA working group on suprasegmental categories LundUniversity Department of Linguistics General Linguistics Phonetics Working Papers 35 25-40

Burnard L 1995 What is SGML and how does it help Computers and the Humanities291 41-50 The Text Encoding Initiative Background and Context Eds N Ide y J VeacuteronisDordrecht Kluwer Academic Publishers

Burnard L 1995a Text Encoding for Information Exchange An Introduction to the TextEncoding Initiaive TEI Document TEI J31 [Documento de Internet disponible enhttpwwwuiceduorgsteiinfoteij31]

Burnard L 1995b The Text Encoding Initiative an overviewrdquo Spoken English onComputer Transcription Markup and Applications Eds G LEECH G MYERS y JTHOMAS Harlow Longman 69-81

Chafe W 1995 Adequacy user-friendliness and practicality in transcribingrdquo English onComputer Transcription Markup and Applications Eds G Leech G Myers y J ThomasHarlow Longman 54-61

Chan D A Fourcin D Gibbon B Granstroumlm M Huckvale G Kokkinakis K KvaleL Lamel B Lindberg A Moreno J Mouropoulos F Senia I Trancoso C Veld y J Zeiliger1995 EUROM - A Spoken Language Resource for the EU Eurospeech95 Proceedings of the4th European Conference on Speech Communication and Speech Technology Madrid Spain 18-21 September 1995 Vol 1 867-870

Cole RA BT Oshika M Noel T Lander y M Fanty 1994 Labeler Agreement inPhonetic Labeling of Continuous Speech Proceedings of the 1994 International Conference onSpoken Language Processing Yokohama Japan 18-22 September 1994[Documento de Internet disponible en httpwwwcseogieduCSLUcorporapapershtml]

Cook G 1995 Theoretical issues transcribing the untranscribablerdquo Spoken English onComputer Transcription Markup and Applications Eds G Leech G Myers y J ThomasHarlow Longman 35-53

Du Bois JW 1991 Transcription design principles for spoken discourse researchPragmatics 1 71-106

Du Bois JW S Schuetze-Coburn S Cumming y D Paolino 1993 Outline of discoursetranscriptionrdquo Talking Data Transcription and Coding in Discourse Research Eds JAEdwards y MD Lampert Hillsdale NJ Lawrence Erlbaum Associates 45-90

EAGLES 1996 Preliminary Recommendations on Spoken Texts EAGLES DocumentEAG-TCWG-STPP May 1996[Documento de Internet disponible enhttpwwwilcpicnritEAGLES96spokentxspokentxhtml]

Edwards JA 1992 Design principles in the transcription of spoken discourserdquoDirections in Corpus Linguistics Proceedings of Nobel Symposium 82 Stockholm 4-8 August1991 Ed J Svartvik Berlin Mouton de Gruyter 129-147

Edwards JA 1993 Principles and Contrasting Systems of Discourse TranscriptionrdquoTalking Data Transcription and Coding in Discourse Research Eds JA Edwards y MDLampert Hillsdale Hillsdale NJ Lawrence Erlbaum Associates 3-32

Edwards JA 1995 Principles and alternative systems in the transcription coding andmark-up of spoken discourserdquo Spoken English on Computer Transcription Markup andApplications Eds G Leech G Myers y J Thomas Harlow Longman 19-34

Ehlich K 1993 HIAT A Transcription System for Discourse Datardquo Talking DataTranscription and Coding in Discourse Research Eds JA Edwards y MD Lampert HillsdaleNJ Lawrence Erlbaum Associates 123-148

Eisen B 1993 Reliability of speech segmentation and labelling at different levels oftranscription Eurospeech93 3rd European Conference on Speech Communication andTechnology Berlin Germany 21-23 September 1993 Vol 1 673-676

Esling JH y H Gaylord 1993 Computer Codes for Phonetic Symbols Journal of theInternational Phonetic Association 232 77-82

Esling JH 1988 Computer coding of IPA symbols and detailed phonetic representationsof computer databases Journal of the International Phonetic Association 182 99-106

Esling JH 1990 Computer Coding of the IPA Supplementary Report Journal of theInternational Phonetic Association 201 22-26

Fourcin A y JM Dolmazon (on behalf of the SAM Project) 1991 Speech knowledgestandards and assessment Actes du XIIegraveme Congregraves International des Sciences Phoneacutetiques 19-24 aoucirct 1991 Aix-en-Provence France Aix-en-Provence Universiteacute de Provence Service desPublications Vol 5 430-433

Fourcin A G Harland W Barry y V Hazan eds 1989 Speech Input and OutputAssessment Multilingual Methods and Standards Chichester Ellis Horwood Ltd

French JP 1991 Updated notes for soundprint transcribers Working paper Universityof Birmingham October 1991 NERC-WP4-47

French JP 1992 Transcription proposals multilevel system Working paper Universityof Birmingham October 1992 NERC-WP4-50

Gibbon D 1989 Survey of Prosodic Labelling for EC Languages SAM-UBI-190 12February 1989 Report e6 in ESPRIT 2589 (SAM) Interim Report Year 1 Ref SAM-UCLG002 University College London February 1990

Gibbon D R Moore y R Winski eds 1997 Handbook on Standards and Resources forSpoken Language Systems Berlin Mouton De Gruyter [Documento de Internet disponible en httpcoralliliuni-bielefelddeEAGLESeagbookeagbookhtml]

Groslashnnum Thorsen N 1987 Suprasegmental transcription ARIPUC - Annual Report ofthe Institute of Phonetics University of Copenhagen 21 1-27

Gumperz JJ y J Berenz 1993 Transcribing Conversational Exchangesrdquo Talking DataTranscription and Coding in Discourse Research Eds JA Ewards y M D Lampert HillsdaleNJ Lawrence Erlbaum Associates 91-122

Hart J lsquoT R Collier y A Cohen 1990 A Perceptual Study of Intonation An Experimental- Phonetic Approach to Intonation Cambridge Cambridge University Press (Cambridge Studiesin Speech Science and Communication)

Hess W K Kohler y HG Tillmann 1995 The PhonDat-Verbmobil Speech CorpusEurospeech95 Proceedings of the 4th European Conference on Speech Communication andSpeech Technology Madrid Spain 18-21 September 1995 Vol 1 863-866

Hieronymus JL 1994 ASCII phonetic symbols for the worlds languages WorldbetATampT Bell Laboratories Technical Memo [Documento de Internet disponible enhttpwwwcseogieduCSLUcorporapapershtml]

Hirst D A Di Cristo y R Espesser en prensaLevels of representation and levels ofanalysis for intonation Prosody Theory and Experiments Ed M Horne Dordrecht Kluwer

Hirst DJ y A Di Cristo en prensa A survey of intonation systemsrdquo IntonationSystems A Survey of 20 Languages Eds D Hirst y A Di Cristo Cambridge CambridgeUniversity Press

Hirst DJ 1991 Intonation models towards a third generation Actes du XIIegraveme CongregravesInternational des Sciences Phoneacutetiques 19-24 aoucirct 1991 Aix-en-Provence France Aix-en-Provence Universiteacute de Provence Service des Publications Vol 1 305-310

Hirst DJ A Di Cristo M Le Besnerais Z Najim P Nicolas y P Romeacuteas 1993Multilingual modelling of intonation patternsrdquo Proceedings of an ESCA Workshop on ProsodySeptember 27-29 1993 Lund Sweden Eds D House y P Touati Lund University Departmentof Linguistics and Phonetics Working Papers 41 204-207

Hirst DJ N Ide y J Veacuteronis 1994 Coding fundamental frequency patterns for multi-lingual synthesis with INTSINT in the MULTEXT project Conference Proceedings of theSecond ESCAIEEE Workshop on Speech Synthesis September 12-15 1994 Mohonk MountainHouse New Paltz New York USA 77-80

Ide N y J Veacuteronis eds 1995 The Text Encoding Initiative Background and ContextsComputers and the Humanities 29 1-3 Publicado en forma de libro en Dordrecht KluwerAcademic Publishers

IPA 1989 The IPA 1989 Kiel Convention Workgroup 9 report Computer Coding of IPAsymbols and Computer Representation of Individual Languages Journal of the InternationalPhonetic Association 192 81-92

IPA 1993 IPA Chart revised to 1993 Journal of the International Phonetic Association231 [Documento de Internet disponible en httpwwwartsglaacukIPAipacharthtml]

IPA 1995 Preview of the IPA Handbook Journal of the International Phonetic Association251

ISO 8879 1986 Information Processing Text and Office Systems Standard GeneralizedMarkup Language (SGML) Geneva International Organization for Standardization

Johansson S 1995a The approach of the Text Encoding Initiative to the encoding ofspoken discourse Spoken English on Computer Transcription Markup and Applications EdsG Leech G Myers y J Thomas Harlow Longman 82-98

Johansson S 1995b The Encoding of Spoken Texts Computers and the Humanities291 149-158 The Text Encoding Initiative Background and Context Eds N Ide y J VeacuteronisDordrecht Kluwer Academic Publishers 149-158

Keating P P MacEachern A Shryock y S Domiacutenguez 1994 A manual for phonetictranscription Segmentation and labelling of words in spontaneous speech UCLA WorkingPapers in Phonetics 88 91-120

Kluger-Kruse M 1987 Computer Phonetic Alphabet ESPRIT Linguistic Analysis of theEuropean Languages Report BU-CPA0267 July 1987

Krot C y B Taylor 1995 Criteria for Acoustic-Phonetic Segmentation and WordLabelling in the Australian National Database of Spoken Language[Documento de Internet disponible en httpwwwshlrcmqeduaucriteriahtml]

Lander T 1997 The CSLU Labeling Guide Center for Spoken Language UnderstandingOregon Graduate Institute[Documento de Internet disponible en httpwwwcseogieduCSLUcorporapapershtml]

Llisterri J 1994 Prosody Encoding Survey WP 1 Specifications and Standards T15Markup Specifications Deliverable 153 Final version 15 September 1994 LRE Project 62-050MULTEXT

Llisterri J ed 1996 Prosody Tools Efficiency and Failures WP 4 Corpus T46 SpeechMarkup and Validation Deliverable 452 Final version 15 October 1996 LRE Project 62-050MULTEXT

MacWhinney B 1991The CHILDES Project Tools for Analyzing Talk Hillsdale NJLawrence Erlbaum

Marchal A N Nguyen y W Hardcastle 1995 Multitiered phonetic approach to speechlabelling Levels in Speech Communication Relations and Interactions A Tribute to MaxWajskop Hommage agrave Max Wajskop Eds C Sorin J Mariani H Meloni y J SchoengenAmsterdam Elsevier Science BV 149-158

NERC 1994 NERC-1 Network of European Reference Corpora Final Report PisaInstituto di Linguistica Computazionale - CNR January 1994 versioacuten en curso de publicacioacutenTowards a Network of European Reference Corpora Eds N Calzolari M Baker y PG KruytPisa Giardini

Nicolas P y D Hirst 1995 Symbolic coding of Higher-Level Characteristics ofFundamental Frequency Curvesrdquo Eurospeech95 Proceedings of the 4th European Conferenceon Speech Communication and Technology Madrid Spain 18-21 September 1995 Vol 2 989-992

OConnell DC y S Kowal 1994 Some Current Transcription Systems for SpokenDiscourse A critical Analysis Pragmatics 4 81-107

Ochs E 1979 Transcription as Theory Developmental Pragmatics Eds E Ochs E yBB Schieffelin New York Academic Press 43-72

Payne J 1992 Report on the compatibility of JP Frenchs spoken corpus transcriptionconventions with the TEI guidelines for transcription of spoken texts Working paper COBUILDBirmingham and IDS Mannheim December 1992 NERC-WP8WP4-122

Payne J 1995 The COBUILD spoken corpus transcription conventions SpokenEnglish on Computer Transcription Markup and Applications Eds G Leech G Myers y JThomas Harlow Longman 203-207

Payratoacute Ll 1995 Transcripcioacuten del discurso coloquialrdquo El espantildeol coloquial Actas del ISimposio sobre Anaacutelisis del Discurso Oral Almeriacutea 23-25 de noviembre de 1994 Ed L CorteacutesRodriacuteguez Almeriacutea Universidad de Almeriacutea Servicio de Publicaciones 43-70

Pierrehumbert J B 1897 (1980) The Phonology and Phonetics of English IntonationPhD Thesis Department of Linguistics MIT Bloomington Indiana University Linguistics Club

Pitrelli J M Beckman y J Hirschberg 1994 Evaluation of prosodic transcriptionlabelling reliability in the ToBI frameworkrdquo Proceedings of the Third International Conference onSpoken Language Processing Yokohama ICSLP Vol 2 123-126

Pullum GK y WA Ladusaw 1996 (1986) Phonetic Symbol Guide Chicago TheUniversity of Chicago Press 2nd edition

Roach P H Roach A Dew y P Rowlands 1990 Phonetic analysis and the automaticsegmentation and labeling of speech sounds Journal of the International Phonetic Association201 15-21

Schmidt MS C Scott y MA Jack 1993 Phonetic transcription standards for Europeannames (ONOMASTICA) Eurospeech93 3rd European Conference on Speech Communicationand Technology Berlin Germany 21-23 September 1993 Vol 1 279-282

Schuetze-Coburn S 1991Units of intonation in discourse a comparison of acoustic andauditory analysis Language and Speech 343 207-234

Selting M 1987 Descriptive categories for the auditive analysis of intonation inconversation Journal of Pragmatics 11 777-791

Selting M 1988 The role of intonation in the organisation of repair and problem handlingsequences in conversation Journal of Pragmatics 12 293-322

Senia F y JG Van Velden 1997 Specifications of orthographic transcription and lexiconconventions LRE-4001 SpeechDat Technical Report SD132 Final version 10 January 1997[Documento de Internet disponible en httpwwwphonetikuni-muenchendeSpeechDathtml]

Silverman K M Beckman J Pitrelli M Ostendorf C Wightman P Price JPierrehumbert y J Hirschberg 1992 TOBI A standard for labelling English prosodyProceedings of the Second International Conference on Spoken Language Processing ICSLP-92Banff October 1992 867-870

Sinclair J 1994 Spoken Language [3B] PhoneticPhonemic and Prosodic Annotation[52] NERC 1994 NERC-1 Network of European Reference Corpora Final Report PisaVersioacuten en curso de publicacioacuten Towards a Network of European Reference Corpora Eds NCalzolari M Baker y PG Kruyt Pisa Giardini

Sinclair J 1995 From theory to practicerdquo Spoken English on Computer TranscriptionMarkup and Applications Eds G Leech G Myers Y J Thomas Harlow Longman 99- 112

Sperberg-McQueen CM y L Burnard eds 1994 Guidelines for Electronic Text Encodingand Interchange TEI P3 Chicago and Oxford Association for Computational Linguistics Association for Computers and the Humanities Association for Literary and LinguisticComputing [Cap 11 Transcriptions of Speech] [Documento de Internet disponible enhttpetextvirginiaeduTEIhtml]

Strangert E y M Heldner 1995 Labelling of boundaries and prominences byphonetically experienced and non-experienced transcribers Phonum 3 Reports from theDepartment of Phonetics Umearing University 85-109 [Documento de Internet disponible enhttpwwwlingumusefonphonum3html]

Teubert W 1993 Phonetic Phonemic and Prosodic Annotation Final Report IDSMannheim February 1993 NERC-WP8-171

Tillmann HG y B Pompino-Marschall 1993 Theoretical Principles ConcerningSegmentation Labelling Strategies and Levels of Categorical Annotation for Spoken LanguageDatabase Systems Eurospeech93 3rd European Conference on Speech Communication andTechnology Berlin Germany 21-23 September 1993 Vol 3 1691-1694

Trancoso I 1995 The ONOMASTICA Interlanguage Pronunciation LexiconrdquoEurospeech95 Proceedings of the 4th European Conference on Speech Communication andTechnology Madrid Spain 18-21 September 1995 Vol 1 829-832

Wells JC 1987 Computer Coded Phonetic Transcription Journal of the InternationalPhonetic Association 172 94-114

Wells JC 1989 Computer-coded phonemic notation of individual languages of theEuropean Community Journal of the International Phonetic Association 191 31-54

Wells JC 1994 Computer-coding the IPA a proposed extension of SAMPA SpeechHearing and Language Work in Progress 1994 (University College London Department ofPhonetics and Linguistics) 8 271-289

Wells JC 1995 SAMPROSA (SAM Prosodic Transcription [Documento de Internetdisponible en httpwwwphonuclacukhomesampasamprosahtm]

Wells JC W Barry M Grice A Fourcin y D Gibbon 1992 Standard Computer-Compatible Transcription SAM Stage Report Sen3 SAM UCL-037 28 February 1992 SAM(1992) Esprit Project 2589 (SAM) Multilingual Speech InputOutput AssessmentMethodologyand Standardisation Final Report Year Three 1III91-28II1992 London University CollegeLondon

Wesenick M-B y F Schiel 1995 Feasibility of Automatic Annotation and BuildingPronunciation Lexica from Corpus Material LRE-63314 SpeechDat Report D3123 Finalversion 10 October 1995[Documento de Internet disponible en httpwwwicpgrenetfrSpeechDathomehtml]

Winski R R Moore y D Gibbon 1995 EAGLES Spoken Language Working GroupOverview and Resultsrdquo Eurospeech95 Proceedings of the 4th European Conference on SpeechCommunication and Speech Technology Madrid Spain 18-21 September 1995 Vol 1 841-844[Documento de Internet disponible en httpcoralliliuni-bielefeldde~gibbonEAGLESrwpaperrwpaperhtml]

  • 1- INTRODUCCIOacuteN
  • 2- NIVELES DE REPRESENTACIOacuteN ETIQUETADO Y CODIFICACIOacuteN
  • 3- REPRESENTACIOacuteN ORTOGRAacuteFICA DE CORPUS ORALES
  • 31- Propuestas para la representacioacuten ortograacutefica de corpus orales en el aacutembito de la linguumliacutestica de corpus
  • 32- Propuestas para la representacioacuten ortograacutefica de corpus orales en el aacutembito de las tecnologiacuteas del habla
  • 4- REPRESENTACIOacuteN FONEacuteTICA DE CORPUS ORALES
  • 41- La representacioacuten foneacutetica de los elementos segmentales
  • 42- La representacioacuten foneacutetica de los elementos suprasegmentales
  • 5- ETIQUETADO FONEacuteTICO DE CORPUS ORALES
  • 51- Niveles de etiquetado foneacutetico de corpus orales
  • 52- La transcripcioacuten y el etiquetado automaacutetico de corpus orales
  • 6- TRANSCRIPCIOacuteN Y CODIFICACIOacuteN DE CORPUS PARA EL ANAacuteLISIS DE LA LENGUA ORAL
  • 61- Los requisitos de una transcripcioacuten
  • 62- Propuestas de estandarizacioacuten para la transcripcioacuten y codificacioacuten de corpus orales
  • 7- CONCLUSIONES
  • BIBLIOGRAFIacuteA
Page 13: Transcripción, etiquetado y codificación de corpus orales

Oral Para la transcripcioacuten del nivel S2 puede utilizarse SAMPA mientras que la del nivel S3requiere el uso de un alfabeto foneacutetico como X-SAMPA

52- La transcripcioacuten y el etiquetado automaacutetico de corpus orales

La tarea de transcribir y etiquetar foneacuteticamente un corpus oral representa un considerableesfuerzo tanto en teacuterminos de tiempo como de los recursos econoacutemicos necesarios para llevar acabo esta labor El etiquetado manual requiere por otro lado el desarrollo de convencionesdetalladas para asegurar la consistencia entre diversos transcriptores (Keating et al 1994 Krot yTaylor 1995 Lander 1997) ademaacutes del establecimiento de un proceso de validacioacutencomprobando la fiabilidad de los resultados obtenidos (Eisen 1993 Cole et al 1994 Strangert yHeldener 1995) Por estos motivos uno de los intereses principales de los investigadores en elcampo de las tecnologiacuteas del habla ha sido llevar a cabo el etiquetado de forma semi-automaacutetica oidealmente automaacutetica Un primer nivel de transcripcioacuten - tanto de formas canoacutenicas comofonotiacutepica - puede obtenerse automaacuteticamente como acabamos de mencionar a partir de larepresentacioacuten ortograacutefica si se dispone de un conjunto de reglas que establezcan lascorrespondencias entre la representacioacuten ortograacutefica y la foneacutetica

Sin embargo un etiquetado foneacutetico en los niveles de transcripcioacuten maacutes detallada requiere laposibilidad de acceder a la onda sonora y un procedimiento de anaacutelisis de la sentildeal La primeraoperacioacuten que debe realizar un sistema de etiquetado automaacutetico es la segmentacioacuten del continuumsonoro en unidades menores - segmentos o caracteriacutesticas acuacutesticas en funcioacuten del nivel detranscripcioacuten deseado - para pasar despueacutes a la asignacioacuten de etiquetas - siacutembolos detranscripcioacuten - que describan sus caracteriacutesticas Este es el proceso conocido propiamente comoetiquetado (labelling) que cuando se realiza de forma automaacutetica debe superar los obstaacuteculosderivados de la naturaleza no discreta de la sentildeal sonora - resultado de mecanismos como lacoarticulacioacuten - y de la variabilidad de realizaciones foneacuteticas entre hablantes o incluso en unmismo hablante

Para que el corpus sea uacutetil el etiquetado foneacutetico debe estar temporalmente sincronizadocon la sentildeal sonora y con la representacioacuten ortograacutefica operacioacuten que se realiza en el procesoconocido como alineacioacuten temporal (time alignment) llevado a cabo tambieacuten de forma automaacuteticaEsta alineacioacuten puede hacerse de un modo global sentildealando en la onda sonora las fronteras entrepalabras ortograacuteficas - para facilitar el acceso a la grabacioacuten a partir de este nivel de representacioacuten(Lander 1997) - o los puntos en los que se encuentran siacutelabas acentuadas tal como sucede porejemplo en el proyecto MULTEXT

En el campo de las tecnologiacuteas del habla se han llevado a cabo numerosiacutesimos trabajosencaminados al disentildeo de sistemas de segmentacioacuten etiquetado y alineacioacuten temporal automaacuteticasde corpus orales utilizando las teacutecnicas propias del reconocimiento del habla como los Modelosde Markov o las redes neuronales Cabe destacar que tales teacutecnicas no soacutelo son uacutetiles en eldesarrollo de corpus en este aacutembito sino que constituyen una herramienta importante en otrostipos de corpus sin embargo es preciso reconocer que el habla espontaacutenea - especialmente si seha recogido mediante grabaciones realizadas en un entorno natural - plantea auacuten problemas en lo

que se refiere a su transcripcioacuten y etiquetado automaacuteticos pese a los notabiliacutesimos avances quetienen lugar en este campo

6- TRANSCRIPCIOacuteN Y CODIFICACIOacuteN DE CORPUS PARA EL ANAacuteLISIS DE LA LENGUA ORAL

En este uacuteltimo apartado incidiremos en las cuestiones relacionadas con la transcripcioacuten ycodificacioacuten de corpus orales que pueden presentar un mayor intereacutes para aacutembitos como elanaacutelisis de discurso o de la conversacioacuten y para el estudio de la lengua oral en todos los niveles dela descripcioacuten linguumliacutestica Como indicaacutebamos al principio la transcripcioacuten y la codificacioacuten de loselementos transcritos son en principio dos operaciones conceptualmente diferentes Sinembargo en la praacutectica habitual en las disciplinas a las que se refiere este apartado suelen ser dosoperaciones que se realizan simultaacuteneamente ya que al mismo tiempo que se realiza latransliteracioacuten se introducen las marcas necesarias para la codificacioacuten de los elementos que se hadecidido introducir en el corpus Por ello en muchos casos la discusioacuten sobre la transcripcioacuten y lacodificacioacuten se realiza conjuntamente en la bibliografiacutea sobre el tema

61- Los requisitos de una transcripcioacuten

El investigador que decide constituir un corpus de lengua oral se encuentra en estosmomentos con una gran variedad de criterios en lo que se refiere a la transcripcioacuten y a la seleccioacutende los elementos que apareceraacuten codificados en el corpus Hemos hecho ya referencia en elapartado 3 a las diversas convenciones para la representacioacuten ortograacutefica y cintildeeacutendonos al aacutembitodel anaacutelisis del discurso y la conversacioacuten constatamos igualmente la existencia una grandiversidad de propuestas En una revisioacuten de las mismas Payratoacute (1995) hace por ejemploreferencia a los sistemas de transcripcioacuten y codificacioacuten procedentes de la etnometodologiacuteainteresados en reflejar la interaccioacuten verbal a los meacutetodos desarrollados en el marco de laetnografiacutea de la comunicacioacuten y de la sociolinguumliacutestica interaccional4 o a propuestas utilizadas en elestudio del lenguaje infantil Ante tal situacioacuten parece conveniente plantearse cuaacuteles son losrequisitos que debe cumplir una transcripcioacuten de la lengua oral tema que ha sido abordado pordiversos autores (DuBois 1991 Elich 1993 Edwards 1993 OrsquoConnell y Kowal 1994) Trasrevisar aportaciones anteriores Payratoacute (1995) resume los requisitos que teoacutericamente deberiacuteanexigirse a toda transcripcioacuten

bull Neutralidad o fidelidad de modo que la transcripcioacuten no sea interpretativabull Globalidad o complejidad recogiendo la totalidad de los fenoacutemenos que aparecen

en el discurso oralbull Omnifuncionalidad permitiendo diversos usos y aplicacionesbull Claridad tanto desde el punto de vista del aprendizaje del sistema como de la

legibilidad de la representacioacutenbull Universalidad y compatibilidad entre sistemas informaacuteticos

4 Estos sistemas se comparan en OrsquoConnell y Kowal (1994) Pueden encontrarse consideraciones generales sobre latranscripcioacuten y codificacioacuten de la lengua oral en el anaacutelisis del discurso y la conversacioacuten en 1995Ochs (1979) DuBois (1991) Edwards (1992 1993 1995) Du Bois et al (1993) Gumperz y Berenz (1993) Cook (1995) Chafe(1995) y en Sinclair (1995)

Sin embargo puesto que en la praacutectica se transcribe en funcioacuten de los objetivos para losque se ha definido el corpus Payratoacute (1995) considera que un sistema de transcripcioacuten debe serante todo interpretativo de los datos selectivo en cuanto a los fenoacutemenos que se transcribenpertinente para el objeto de investigacioacuten coherente con la base teoacuterica adoptada por elinvestigador fiel en cuanto a la representacioacuten de los datos y flexible para que sea posible suutilizacioacuten en diversos estudios Por otra parte en opinioacuten de este autor la simbologiacutea utilizadadebe ser clara econoacutemica sencilla exenta de ambiguumledad y compatible con sistemas internacionesestandarizados Este uacuteltimo aspecto nos parece especialmente importante ya que como sentildeala elmismo Payratoacute (1995 58)

[] en ninguacuten caso puede olvidarse que los datos de una investigacioacuten no deberiacutean sertratados nunca de forma tan parcial o idiosincraacutesica que se impidiera o dificultara el uso por partede otros investigadores La transcripcioacuten del discurso oral es una actividad suficientementecostosa y conflictiva para tomar precauciones en este sentido y ninguna comunidad cientiacuteficapuede permitirse el lujo de particularismos (en aspectos tan elementales) que obstruyan el debateo conviertan en inaprovechables una fuente de informacioacuten

62- Propuestas de estandarizacioacuten para la transcripcioacuten y codificacioacuten de corpus orales

Ante la diversidad de propuestas para la transcripcioacuten y codificacioacuten de la lengua oral queacabamos de constatar el surgimiento de la linguumliacutestica de corpus y muy especialmente lasnecesidades derivadas del intercambio electroacutenico de textos propiciaron la aparicioacuten de proyectose iniciativas centrados en la creacioacuten de estaacutendares tanto en lo que se refiere a la transcripcioacutencomo a la codificacioacuten En los proacuteximos apartados revisamos sucintamente algunos de ellos

Uno de los capiacutetulos de las Guiacuteas desarrolladas por la TEI estaacute dedicado a la transcripcioacutende corpus orales (Johansson 1995a b) En eacutel se describe la estructura baacutesica de la representacioacutende un texto oral - cabecera texto y divisiones - y se definen los procedimientos basados enSGML para la representacioacuten de los elementos estructurales baacutesicos informacioacuten contextualinformacioacuten temporal enunciados pausas elementos vocalizados semi-leacutexicos o no leacutexicoselementos kineacutesicos otros tipos de eventos comunicativos y texto presentado en forma escrita alhablante Tambieacuten se ofrecen en este capiacutetulo indicaciones para la segmentacioacuten y el alineamientoasiacute como recomendaciones para la transcripcioacuten de superposiciones entre hablantes de formas depalabras prosodia elementos paralinguumliacutesticos - tempo intensidad rango tonal tensioacuten ritmo ycalidad de voz - y alteraciones en el decurso foacutenico Para la representacioacuten de la informacioacutenfoneacutetica se recomienda el uso del AFI En la siguiente tabla se resumen los principales elementospropuestos por la TEI para la codificacioacuten de corpus orales considerados especiacuteficos de este tipode texto (Sperberg-McQueen y Burnard eds 1994)

Elemento codificado Marca decodificacioacutenen SGML

Definicioacuten

Divisiones (division) ltdivgt Unidades intermedias entre el texto y el enunciado que permitendelimitar partes diferenciadas en un texto

Enunciado (utterance) ltugt Segmento de habla comprendido entre dos pausas o delimitado porun cambio en el turno de palabra puede incluir ademaacutesinformacioacuten sobre la superposicioacuten (ltoverlapgt) de turnos cuando

interviene simultaacuteneamente maacutes de un hablantePausa (pause) ltpausegt Interrupcioacuten de la fonacioacuten percibida entre dos enunciados o en el

interior de los mismos puede describirse en teacuterminos relativos oindicando su duracioacuten

Vocal (vocal) ltvocalgt Elemento vocalizado semi-leacutexico o no leacutexico (pej pausas llenas otoses)

Kineacutesico (kinesic) ltkinesicgt Cualquier fenoacutemeno comunicativo no vocal (p ej gestos)Acontecimiento (event) lteventgt Cualquier fenoacutemeno identificado en la grabacioacuten no necesariamente

vocalizado ni con valor comunicativo (p ej ruidos de fondo)Texto escrito (writing) ltwritinggt Texto escrito que se presenta al hablante durante su intervencioacutenCambio (shift) ltshiftgt Momento en el que se produce un cambio en alguno de los rasgos

paralinguumliacutesticos - calidad de voz intensidad rango tonal ritmo yvelocidad de elocucioacuten - cada uno de los rasgos puede describirsemediante una lista de caracteriacutesticas

Tabla 1 Elementos codificados en las transcripciones de lengua oral seguacuten los estaacutendares de la TEI(Adaptada de Sperberg-McQueen y Burnard eds1994)

Por otra parte la TEI ofrece mecanismos para indicar el comienzo y el final de unfenoacutemeno su duracioacuten y su sincronizacioacuten temporal con otros elementos presenta tambieacuten laposibilidad de marcar unidades inferiores al enunciado - segmentos ltseggt - que permitendelimitar por ejemplo unidades prosoacutedicas e incluye tambieacuten entre sus propuestas las marcasnecesarias para sentildealar fenoacutemenos propios de la lengua hablada como palabras truncadasrepeticiones falsos principios - marcados como ltdelgt (deletion) y especificando el fenoacutemeno -Las partes de la grabacioacuten que el transcriptor no llega a interpretar correctamente - ltuncleargt - ono puede escuchar - ltgapgt - o las correcciones de errores de produccioacuten realizadas por eltranscriptor - ltsicgt para delimitar el error y ltcorrgt para indicar la correccioacuten - son tambieacutenelementos para los cuales la TEI establece marcas de codificacioacuten

Aunque las Guiacuteas de la TEI pueden considerarse un sistema adecuado para la transcripcioacuteny codificacioacuten de gran variedad de materiales los autores propios autores reconocen que

[] the present proposals are not intended to support unmodified every variety of researchundertaken upon spoken material now or in the future some discourse analysts phonologistsand doubtless other may wish to extend the scheme presented here to express more precisely theset of distinctions they wish to draw in their transcriptions Speech regarded as a purely acousticphenomenon may well require different methods from those outlined here as may speechregarded solely as a process of social interaction (Sperberg-McQueen y Burnard eds 1994 cap11)

El proyecto NERC - Network of European Reference Corpora (NERC 1994) se planteoacutecomo uno de sus objetivos la viabilidad de desarrollar una serie de recomendaciones para laconstitucioacuten de corpus y por tanto incluye entre sus resultados indicaciones sobre el tratamientode los corpus orales tanto en lo que se refiere a su codificacioacuten como a la transcripcioacuten de loselementos segmentales y suprasegmentales (Sinclair 1994) El sistema adoptado para latranscripcioacuten y codificacioacuten de corpus se basa como hemos indicado anteriormente en eldesarrollado por French (1991 1992) para la transcripcioacuten del corpus oral desarrollado en elproyecto COBUILD La transcripcioacuten se plantea como una operacioacuten que puede desarrollarse envarios niveles

bull Nivel I consiste en la representacioacuten ortograacutefica introduciendo los miacutenimossignos de puntuacioacuten necesarios sin informacioacuten sobre la interaccioacuten entre hablantes Eneste nivel se contemplan convenciones desarrolladas para la representacioacuten ortograacutefica ypara precisar el uso de la puntuacioacuten

bull Nivel II consiste en una representacioacuten ortograacutefica enriquecida con informacioacutenbaacutesica sobre la identidad de los hablantes el turno de palabra y los elementos no verbales

bull Nivel III contiene toda la informacioacuten presente en el nivel II ademaacutes deinformacioacuten sobre la interaccioacuten entre hablantes - marcando el principio y el final de lossolapamientos - y sobre la entonacioacuten - sentildealando las fronteras entre unidades tonales ylas siacutelabas acentuadas- En opinioacuten de French (1992) la transcripcioacuten a este nivel requiereuna formacioacuten especiacutefica en foneacutetica

bull Nivel IV constituye el nivel maacutes detallado de representacioacuten incluyendo lainformacioacuten propia del nivel III junto con marcas de tonos siacutelabas nucleares y con unatranscripcioacuten fonoloacutegica alineada con una representacioacuten acuacutestica - espectrograma y curvameloacutedica - del enunciado

La recomendacioacuten del proyecto NERC es que la transcripcioacuten de un corpus para el estudiode la lengua oral se lleve a cabo seguacuten las especificaciones del Nivel II adecuado seguacuten Frenchpara todas aquellas investigaciones que no requieran informacioacuten prosoacutedica

En el marco de NERC se llevoacute tambieacuten a cabo una evaluacioacuten de las Guiacuteas de la TEI para latranscripcioacuten de corpus orales de la que se concluye que ldquoThe TEI proposals are broadlycompatible with current practice in the user community as represented by JP Frenchconventions Furthermore in the majority of cases it will be a straightforward matter to link themachine-friendly TEI codes to the more user-friendly encoding systems such as JP Frenchconventions by means of a simple conversion programmerdquo (Payne 199260) La idea de unaconversioacuten automaacutetica entre las transcripciones realizadas seguacuten las propuestas de NERC y de laTEI es naturalmente interesante y refuerza la idea de que existe una compatibilidad general entreambos sistemas (Payne 1992 Johansson 1995a EAGLES 1996) prueba de ello es que en elinforme final de NERC se recomienda el uso de las normas de la TEI

Uno de los objetivos del Grupo de Trabajo sobre Textos Orales de EAGLES fue proponerun conjunto miacutenimo de fenoacutemenos que deberiacutean codificarse en cualquier texto oral La propuestarealizada se describe en EAGLES (1996) y toma elementos del proyecto NERC de la TEI y delGrupo de Trabajo sobre Lengua Oral de EAGLES Considerando los elementos comunes a lossistemas que sirven de base se sugiere que la codificacioacuten de un texto oral debe contener almenos informacioacuten sobre los siguientes aspectos

(1) Elementos vocales y no vocalesbull Elementos vocales semi-leacutexicos

Pertenecen a esta categoriacutea los elementos utilizados principalmente en elhabla espontaacutenea durante los momentos en que el hablante planifica lacontinuacioacuten de su discurso como las llamadas ldquopausas llenasrdquo o ldquosonorasrdquo y los

elementos que marcan dudas en el momento de la produccioacuten del hablaCorresponden a los elementos que en la TEI se marcan con la etiqueta ltvocalgtbull Elementos vocales no leacutexicos

Se incluyen aquiacute todo tipo de sonidos producidos por el hablante - tosesrisas bostezos estornudos etc - que no constituyen formas leacutexicas de la lenguaCorresponden igualmente a los codificados con la marca ltvocalgt en la TEIbull Acontecimientos no vocales y no comunicativos

Comprenden los ruidos producidos por otros hablantes o procedentes delentorno de grabacioacuten Estos acontecimientos se codifican en la TEI mediante lamarca lteventgt

(2) Elementos necesarios en la transcripcioacuten de interacciones verbalesbull Identidad del hablante

Este es un elemento imprescindible en la transcripcioacuten de interaccionesverbales La TEI dispone de los mecanismos para documentar informacioacuten sobrelos hablantes en la cabecera de los textos asiacute como de un sistema para marcar laidentidad de cada participante en el interior del texto aunque pueden utilizarsetambieacuten otros procedimientosbull Turnos de palabra

La finalidad del marcado de los turnos de palabra es indicar un cambio dehablante Ademaacutes de las convenciones de la TEI pueden emplearse otrosprocedimientos mientras se mantenga esta informacioacuten esencial en el estudio de lainteraccioacuten verbalbull Superposicioacuten de turnos de palabra

Existen igualmente diferentes procedimientos para marcar la superposicioacutende emisiones de dos hablantes ademaacutes de las propuestas de la TEI que los tratacomo parte de las estrategias para codificar acontecimientos simultaacuteneos

(3) Elementos relacionados con la actuacioacuten del hablantebull Omisiones en un texto leiacutedo

Si se transcribe un texto leiacutedo y se dispone del original es recomendableanotar las palabras o segmentos omitidos por el locutorbull Autocorrecciones

Es propio del habla espontaacutenea aunque tambieacuten de la lectura que loshablantes realicen correcciones de su propia produccioacuten linguumliacutestica (self-repairs)Parece conveniente marcarlas en la transcripcioacuten de un corpus oralbull Fragmentos de palabras

Los fragmentos de palabras corresponden a uno o maacutes segmentospertenecientes a una palabra que no ha sido totalmente pronunciada por el hablanteen un primer intento y que suelen repetirse cuando eacuteste consigue producir lapalabra completa Es importante indicar este fenoacutemeno en la transcripcioacuten

bull Fragmentos ininteligiblesSe trata de partes de la grabacioacuten que no son comprendidas por el

transcriptor y en la TEI se codifican con la etiqueta ltuncleargt aunque si se desease pueden utilizar marcas maacutes detalladas distinguiendo entre transcripcionescompletamente ininteligibles y entre una posible interpretacioacuten ofrecida por eltranscriptor

Un aspecto conflictivo sigue siendo la identificacioacuten de los enunciados que conforman untexto oral (Schuetze-Coburn 1991) Mientras que en un texto escrito los signos de puntuacioacutenconstituyen un criterio de delimitacioacuten en el habla disponemos de indicios como las pausas laentonacioacuten o el cambio de turno de palabra que nos permiten al menos convencionalmentedefinir un enunciado Sin embargo hasta el momento no se han desarrollado auacuten criteriosobjetivos y consistentes para resolver este problema

7- CONCLUSIONES

La revisioacuten - sin pretensiones de exhaustividad - de los principales sistemas detranscripcioacuten etiquetado y codificacioacuten de corpus orales expuesta en este trabajo pone demanifiesto en primer lugar la multiplicidad de propuestas desarrolladas frente a los intentos deestandarizacioacuten algunos de los cuales auacuten no se han consolidado plenamente pese a su crecienteaceptacioacuten En segundo lugar destaca tambieacuten la heterogeneidad de tradiciones que confluyen enel estudio de la lengua hablada desde la foneacutetica y las tecnologiacuteas del habla hasta el anaacutelisis deldiscurso y de la conversacioacuten diversidad que lleva a la creacioacuten de convenciones especiacuteficas pararesponder a las necesidades de diversas comunidades cientiacuteficas Ante esta situacioacuten la distincioacutenpropuesta por Sinclair (1995107) entre ldquoconformidadrdquo y ldquocompatibilidadrdquo adquiere todo susentido ya que si en ciertos casos la conformidad a un estaacutendar determinado es problemaacutetica porlas limitaciones inherentes a todo sistema comuacuten la compatibilidad - entendida como la facilidadde conversioacuten entre sistemas - deberiacutea ser en cambio un requisito imprescindible en el desarrollode los recursos linguumliacutesticos De esta manera puede tal alcanzarse el equilibrio entre lasnecesidades de un proyecto y las indudables ventajas cientiacuteficas y econoacutemicas que resultan de lareutilizacioacuten de los datos disponibles

BIBLIOGRAFIacuteA

Allen GD 1988 The PHONASCII System Journal of the International PhoneticAssociation 181 9-25

Anderson AH M Badger EG Bard E Boyle G Doherty S Garrod S Isard JKowtko J Mcallister J Miller C Sotillo HS Thompson y R Weinert 1991 The HCRCMap Task corpus Language and Speech 344 351-366

Autesserre D G Peacuterennou y M Rossi 1989 Methodology for the transcription andlabeling of a speech corpus Journal of the International Phonetic Association 191 2-15

Barry WJ y AJ Fourcin 1992 Levels of Labelling Computer Speech and Language 61-14

Beckman ME y GM Ayers GM 1994 Guidelines for ToBI Labelling Version 20February 1994[Documento de Internet disponible en httplingohio-stateeduPhoneticsToBIToBI0html]

Beckman ME y J Hirschberg J 1994 The ToBI Annotation Conventions Apeacutendice A deME Beckman y GM Ayers 1994 Guidelines for ToBI Labelling Version 20 February 1994[Documento de Internet disponible en httplingohio-stateeduPhoneticsToBIToBI0html]

Bruce G 1988 23 Supasegmental categories and 24 The symbolization of temporalevents Journal of the International Phonetic Association 182 75-76

Bruce G 1989 Report from the IPA working group on suprasegmental categories LundUniversity Department of Linguistics General Linguistics Phonetics Working Papers 35 25-40

Burnard L 1995 What is SGML and how does it help Computers and the Humanities291 41-50 The Text Encoding Initiative Background and Context Eds N Ide y J VeacuteronisDordrecht Kluwer Academic Publishers

Burnard L 1995a Text Encoding for Information Exchange An Introduction to the TextEncoding Initiaive TEI Document TEI J31 [Documento de Internet disponible enhttpwwwuiceduorgsteiinfoteij31]

Burnard L 1995b The Text Encoding Initiative an overviewrdquo Spoken English onComputer Transcription Markup and Applications Eds G LEECH G MYERS y JTHOMAS Harlow Longman 69-81

Chafe W 1995 Adequacy user-friendliness and practicality in transcribingrdquo English onComputer Transcription Markup and Applications Eds G Leech G Myers y J ThomasHarlow Longman 54-61

Chan D A Fourcin D Gibbon B Granstroumlm M Huckvale G Kokkinakis K KvaleL Lamel B Lindberg A Moreno J Mouropoulos F Senia I Trancoso C Veld y J Zeiliger1995 EUROM - A Spoken Language Resource for the EU Eurospeech95 Proceedings of the4th European Conference on Speech Communication and Speech Technology Madrid Spain 18-21 September 1995 Vol 1 867-870

Cole RA BT Oshika M Noel T Lander y M Fanty 1994 Labeler Agreement inPhonetic Labeling of Continuous Speech Proceedings of the 1994 International Conference onSpoken Language Processing Yokohama Japan 18-22 September 1994[Documento de Internet disponible en httpwwwcseogieduCSLUcorporapapershtml]

Cook G 1995 Theoretical issues transcribing the untranscribablerdquo Spoken English onComputer Transcription Markup and Applications Eds G Leech G Myers y J ThomasHarlow Longman 35-53

Du Bois JW 1991 Transcription design principles for spoken discourse researchPragmatics 1 71-106

Du Bois JW S Schuetze-Coburn S Cumming y D Paolino 1993 Outline of discoursetranscriptionrdquo Talking Data Transcription and Coding in Discourse Research Eds JAEdwards y MD Lampert Hillsdale NJ Lawrence Erlbaum Associates 45-90

EAGLES 1996 Preliminary Recommendations on Spoken Texts EAGLES DocumentEAG-TCWG-STPP May 1996[Documento de Internet disponible enhttpwwwilcpicnritEAGLES96spokentxspokentxhtml]

Edwards JA 1992 Design principles in the transcription of spoken discourserdquoDirections in Corpus Linguistics Proceedings of Nobel Symposium 82 Stockholm 4-8 August1991 Ed J Svartvik Berlin Mouton de Gruyter 129-147

Edwards JA 1993 Principles and Contrasting Systems of Discourse TranscriptionrdquoTalking Data Transcription and Coding in Discourse Research Eds JA Edwards y MDLampert Hillsdale Hillsdale NJ Lawrence Erlbaum Associates 3-32

Edwards JA 1995 Principles and alternative systems in the transcription coding andmark-up of spoken discourserdquo Spoken English on Computer Transcription Markup andApplications Eds G Leech G Myers y J Thomas Harlow Longman 19-34

Ehlich K 1993 HIAT A Transcription System for Discourse Datardquo Talking DataTranscription and Coding in Discourse Research Eds JA Edwards y MD Lampert HillsdaleNJ Lawrence Erlbaum Associates 123-148

Eisen B 1993 Reliability of speech segmentation and labelling at different levels oftranscription Eurospeech93 3rd European Conference on Speech Communication andTechnology Berlin Germany 21-23 September 1993 Vol 1 673-676

Esling JH y H Gaylord 1993 Computer Codes for Phonetic Symbols Journal of theInternational Phonetic Association 232 77-82

Esling JH 1988 Computer coding of IPA symbols and detailed phonetic representationsof computer databases Journal of the International Phonetic Association 182 99-106

Esling JH 1990 Computer Coding of the IPA Supplementary Report Journal of theInternational Phonetic Association 201 22-26

Fourcin A y JM Dolmazon (on behalf of the SAM Project) 1991 Speech knowledgestandards and assessment Actes du XIIegraveme Congregraves International des Sciences Phoneacutetiques 19-24 aoucirct 1991 Aix-en-Provence France Aix-en-Provence Universiteacute de Provence Service desPublications Vol 5 430-433

Fourcin A G Harland W Barry y V Hazan eds 1989 Speech Input and OutputAssessment Multilingual Methods and Standards Chichester Ellis Horwood Ltd

French JP 1991 Updated notes for soundprint transcribers Working paper Universityof Birmingham October 1991 NERC-WP4-47

French JP 1992 Transcription proposals multilevel system Working paper Universityof Birmingham October 1992 NERC-WP4-50

Gibbon D 1989 Survey of Prosodic Labelling for EC Languages SAM-UBI-190 12February 1989 Report e6 in ESPRIT 2589 (SAM) Interim Report Year 1 Ref SAM-UCLG002 University College London February 1990

Gibbon D R Moore y R Winski eds 1997 Handbook on Standards and Resources forSpoken Language Systems Berlin Mouton De Gruyter [Documento de Internet disponible en httpcoralliliuni-bielefelddeEAGLESeagbookeagbookhtml]

Groslashnnum Thorsen N 1987 Suprasegmental transcription ARIPUC - Annual Report ofthe Institute of Phonetics University of Copenhagen 21 1-27

Gumperz JJ y J Berenz 1993 Transcribing Conversational Exchangesrdquo Talking DataTranscription and Coding in Discourse Research Eds JA Ewards y M D Lampert HillsdaleNJ Lawrence Erlbaum Associates 91-122

Hart J lsquoT R Collier y A Cohen 1990 A Perceptual Study of Intonation An Experimental- Phonetic Approach to Intonation Cambridge Cambridge University Press (Cambridge Studiesin Speech Science and Communication)

Hess W K Kohler y HG Tillmann 1995 The PhonDat-Verbmobil Speech CorpusEurospeech95 Proceedings of the 4th European Conference on Speech Communication andSpeech Technology Madrid Spain 18-21 September 1995 Vol 1 863-866

Hieronymus JL 1994 ASCII phonetic symbols for the worlds languages WorldbetATampT Bell Laboratories Technical Memo [Documento de Internet disponible enhttpwwwcseogieduCSLUcorporapapershtml]

Hirst D A Di Cristo y R Espesser en prensaLevels of representation and levels ofanalysis for intonation Prosody Theory and Experiments Ed M Horne Dordrecht Kluwer

Hirst DJ y A Di Cristo en prensa A survey of intonation systemsrdquo IntonationSystems A Survey of 20 Languages Eds D Hirst y A Di Cristo Cambridge CambridgeUniversity Press

Hirst DJ 1991 Intonation models towards a third generation Actes du XIIegraveme CongregravesInternational des Sciences Phoneacutetiques 19-24 aoucirct 1991 Aix-en-Provence France Aix-en-Provence Universiteacute de Provence Service des Publications Vol 1 305-310

Hirst DJ A Di Cristo M Le Besnerais Z Najim P Nicolas y P Romeacuteas 1993Multilingual modelling of intonation patternsrdquo Proceedings of an ESCA Workshop on ProsodySeptember 27-29 1993 Lund Sweden Eds D House y P Touati Lund University Departmentof Linguistics and Phonetics Working Papers 41 204-207

Hirst DJ N Ide y J Veacuteronis 1994 Coding fundamental frequency patterns for multi-lingual synthesis with INTSINT in the MULTEXT project Conference Proceedings of theSecond ESCAIEEE Workshop on Speech Synthesis September 12-15 1994 Mohonk MountainHouse New Paltz New York USA 77-80

Ide N y J Veacuteronis eds 1995 The Text Encoding Initiative Background and ContextsComputers and the Humanities 29 1-3 Publicado en forma de libro en Dordrecht KluwerAcademic Publishers

IPA 1989 The IPA 1989 Kiel Convention Workgroup 9 report Computer Coding of IPAsymbols and Computer Representation of Individual Languages Journal of the InternationalPhonetic Association 192 81-92

IPA 1993 IPA Chart revised to 1993 Journal of the International Phonetic Association231 [Documento de Internet disponible en httpwwwartsglaacukIPAipacharthtml]

IPA 1995 Preview of the IPA Handbook Journal of the International Phonetic Association251

ISO 8879 1986 Information Processing Text and Office Systems Standard GeneralizedMarkup Language (SGML) Geneva International Organization for Standardization

Johansson S 1995a The approach of the Text Encoding Initiative to the encoding ofspoken discourse Spoken English on Computer Transcription Markup and Applications EdsG Leech G Myers y J Thomas Harlow Longman 82-98

Johansson S 1995b The Encoding of Spoken Texts Computers and the Humanities291 149-158 The Text Encoding Initiative Background and Context Eds N Ide y J VeacuteronisDordrecht Kluwer Academic Publishers 149-158

Keating P P MacEachern A Shryock y S Domiacutenguez 1994 A manual for phonetictranscription Segmentation and labelling of words in spontaneous speech UCLA WorkingPapers in Phonetics 88 91-120

Kluger-Kruse M 1987 Computer Phonetic Alphabet ESPRIT Linguistic Analysis of theEuropean Languages Report BU-CPA0267 July 1987

Krot C y B Taylor 1995 Criteria for Acoustic-Phonetic Segmentation and WordLabelling in the Australian National Database of Spoken Language[Documento de Internet disponible en httpwwwshlrcmqeduaucriteriahtml]

Lander T 1997 The CSLU Labeling Guide Center for Spoken Language UnderstandingOregon Graduate Institute[Documento de Internet disponible en httpwwwcseogieduCSLUcorporapapershtml]

Llisterri J 1994 Prosody Encoding Survey WP 1 Specifications and Standards T15Markup Specifications Deliverable 153 Final version 15 September 1994 LRE Project 62-050MULTEXT

Llisterri J ed 1996 Prosody Tools Efficiency and Failures WP 4 Corpus T46 SpeechMarkup and Validation Deliverable 452 Final version 15 October 1996 LRE Project 62-050MULTEXT

MacWhinney B 1991The CHILDES Project Tools for Analyzing Talk Hillsdale NJLawrence Erlbaum

Marchal A N Nguyen y W Hardcastle 1995 Multitiered phonetic approach to speechlabelling Levels in Speech Communication Relations and Interactions A Tribute to MaxWajskop Hommage agrave Max Wajskop Eds C Sorin J Mariani H Meloni y J SchoengenAmsterdam Elsevier Science BV 149-158

NERC 1994 NERC-1 Network of European Reference Corpora Final Report PisaInstituto di Linguistica Computazionale - CNR January 1994 versioacuten en curso de publicacioacutenTowards a Network of European Reference Corpora Eds N Calzolari M Baker y PG KruytPisa Giardini

Nicolas P y D Hirst 1995 Symbolic coding of Higher-Level Characteristics ofFundamental Frequency Curvesrdquo Eurospeech95 Proceedings of the 4th European Conferenceon Speech Communication and Technology Madrid Spain 18-21 September 1995 Vol 2 989-992

OConnell DC y S Kowal 1994 Some Current Transcription Systems for SpokenDiscourse A critical Analysis Pragmatics 4 81-107

Ochs E 1979 Transcription as Theory Developmental Pragmatics Eds E Ochs E yBB Schieffelin New York Academic Press 43-72

Payne J 1992 Report on the compatibility of JP Frenchs spoken corpus transcriptionconventions with the TEI guidelines for transcription of spoken texts Working paper COBUILDBirmingham and IDS Mannheim December 1992 NERC-WP8WP4-122

Payne J 1995 The COBUILD spoken corpus transcription conventions SpokenEnglish on Computer Transcription Markup and Applications Eds G Leech G Myers y JThomas Harlow Longman 203-207

Payratoacute Ll 1995 Transcripcioacuten del discurso coloquialrdquo El espantildeol coloquial Actas del ISimposio sobre Anaacutelisis del Discurso Oral Almeriacutea 23-25 de noviembre de 1994 Ed L CorteacutesRodriacuteguez Almeriacutea Universidad de Almeriacutea Servicio de Publicaciones 43-70

Pierrehumbert J B 1897 (1980) The Phonology and Phonetics of English IntonationPhD Thesis Department of Linguistics MIT Bloomington Indiana University Linguistics Club

Pitrelli J M Beckman y J Hirschberg 1994 Evaluation of prosodic transcriptionlabelling reliability in the ToBI frameworkrdquo Proceedings of the Third International Conference onSpoken Language Processing Yokohama ICSLP Vol 2 123-126

Pullum GK y WA Ladusaw 1996 (1986) Phonetic Symbol Guide Chicago TheUniversity of Chicago Press 2nd edition

Roach P H Roach A Dew y P Rowlands 1990 Phonetic analysis and the automaticsegmentation and labeling of speech sounds Journal of the International Phonetic Association201 15-21

Schmidt MS C Scott y MA Jack 1993 Phonetic transcription standards for Europeannames (ONOMASTICA) Eurospeech93 3rd European Conference on Speech Communicationand Technology Berlin Germany 21-23 September 1993 Vol 1 279-282

Schuetze-Coburn S 1991Units of intonation in discourse a comparison of acoustic andauditory analysis Language and Speech 343 207-234

Selting M 1987 Descriptive categories for the auditive analysis of intonation inconversation Journal of Pragmatics 11 777-791

Selting M 1988 The role of intonation in the organisation of repair and problem handlingsequences in conversation Journal of Pragmatics 12 293-322

Senia F y JG Van Velden 1997 Specifications of orthographic transcription and lexiconconventions LRE-4001 SpeechDat Technical Report SD132 Final version 10 January 1997[Documento de Internet disponible en httpwwwphonetikuni-muenchendeSpeechDathtml]

Silverman K M Beckman J Pitrelli M Ostendorf C Wightman P Price JPierrehumbert y J Hirschberg 1992 TOBI A standard for labelling English prosodyProceedings of the Second International Conference on Spoken Language Processing ICSLP-92Banff October 1992 867-870

Sinclair J 1994 Spoken Language [3B] PhoneticPhonemic and Prosodic Annotation[52] NERC 1994 NERC-1 Network of European Reference Corpora Final Report PisaVersioacuten en curso de publicacioacuten Towards a Network of European Reference Corpora Eds NCalzolari M Baker y PG Kruyt Pisa Giardini

Sinclair J 1995 From theory to practicerdquo Spoken English on Computer TranscriptionMarkup and Applications Eds G Leech G Myers Y J Thomas Harlow Longman 99- 112

Sperberg-McQueen CM y L Burnard eds 1994 Guidelines for Electronic Text Encodingand Interchange TEI P3 Chicago and Oxford Association for Computational Linguistics Association for Computers and the Humanities Association for Literary and LinguisticComputing [Cap 11 Transcriptions of Speech] [Documento de Internet disponible enhttpetextvirginiaeduTEIhtml]

Strangert E y M Heldner 1995 Labelling of boundaries and prominences byphonetically experienced and non-experienced transcribers Phonum 3 Reports from theDepartment of Phonetics Umearing University 85-109 [Documento de Internet disponible enhttpwwwlingumusefonphonum3html]

Teubert W 1993 Phonetic Phonemic and Prosodic Annotation Final Report IDSMannheim February 1993 NERC-WP8-171

Tillmann HG y B Pompino-Marschall 1993 Theoretical Principles ConcerningSegmentation Labelling Strategies and Levels of Categorical Annotation for Spoken LanguageDatabase Systems Eurospeech93 3rd European Conference on Speech Communication andTechnology Berlin Germany 21-23 September 1993 Vol 3 1691-1694

Trancoso I 1995 The ONOMASTICA Interlanguage Pronunciation LexiconrdquoEurospeech95 Proceedings of the 4th European Conference on Speech Communication andTechnology Madrid Spain 18-21 September 1995 Vol 1 829-832

Wells JC 1987 Computer Coded Phonetic Transcription Journal of the InternationalPhonetic Association 172 94-114

Wells JC 1989 Computer-coded phonemic notation of individual languages of theEuropean Community Journal of the International Phonetic Association 191 31-54

Wells JC 1994 Computer-coding the IPA a proposed extension of SAMPA SpeechHearing and Language Work in Progress 1994 (University College London Department ofPhonetics and Linguistics) 8 271-289

Wells JC 1995 SAMPROSA (SAM Prosodic Transcription [Documento de Internetdisponible en httpwwwphonuclacukhomesampasamprosahtm]

Wells JC W Barry M Grice A Fourcin y D Gibbon 1992 Standard Computer-Compatible Transcription SAM Stage Report Sen3 SAM UCL-037 28 February 1992 SAM(1992) Esprit Project 2589 (SAM) Multilingual Speech InputOutput AssessmentMethodologyand Standardisation Final Report Year Three 1III91-28II1992 London University CollegeLondon

Wesenick M-B y F Schiel 1995 Feasibility of Automatic Annotation and BuildingPronunciation Lexica from Corpus Material LRE-63314 SpeechDat Report D3123 Finalversion 10 October 1995[Documento de Internet disponible en httpwwwicpgrenetfrSpeechDathomehtml]

Winski R R Moore y D Gibbon 1995 EAGLES Spoken Language Working GroupOverview and Resultsrdquo Eurospeech95 Proceedings of the 4th European Conference on SpeechCommunication and Speech Technology Madrid Spain 18-21 September 1995 Vol 1 841-844[Documento de Internet disponible en httpcoralliliuni-bielefeldde~gibbonEAGLESrwpaperrwpaperhtml]

  • 1- INTRODUCCIOacuteN
  • 2- NIVELES DE REPRESENTACIOacuteN ETIQUETADO Y CODIFICACIOacuteN
  • 3- REPRESENTACIOacuteN ORTOGRAacuteFICA DE CORPUS ORALES
  • 31- Propuestas para la representacioacuten ortograacutefica de corpus orales en el aacutembito de la linguumliacutestica de corpus
  • 32- Propuestas para la representacioacuten ortograacutefica de corpus orales en el aacutembito de las tecnologiacuteas del habla
  • 4- REPRESENTACIOacuteN FONEacuteTICA DE CORPUS ORALES
  • 41- La representacioacuten foneacutetica de los elementos segmentales
  • 42- La representacioacuten foneacutetica de los elementos suprasegmentales
  • 5- ETIQUETADO FONEacuteTICO DE CORPUS ORALES
  • 51- Niveles de etiquetado foneacutetico de corpus orales
  • 52- La transcripcioacuten y el etiquetado automaacutetico de corpus orales
  • 6- TRANSCRIPCIOacuteN Y CODIFICACIOacuteN DE CORPUS PARA EL ANAacuteLISIS DE LA LENGUA ORAL
  • 61- Los requisitos de una transcripcioacuten
  • 62- Propuestas de estandarizacioacuten para la transcripcioacuten y codificacioacuten de corpus orales
  • 7- CONCLUSIONES
  • BIBLIOGRAFIacuteA
Page 14: Transcripción, etiquetado y codificación de corpus orales

que se refiere a su transcripcioacuten y etiquetado automaacuteticos pese a los notabiliacutesimos avances quetienen lugar en este campo

6- TRANSCRIPCIOacuteN Y CODIFICACIOacuteN DE CORPUS PARA EL ANAacuteLISIS DE LA LENGUA ORAL

En este uacuteltimo apartado incidiremos en las cuestiones relacionadas con la transcripcioacuten ycodificacioacuten de corpus orales que pueden presentar un mayor intereacutes para aacutembitos como elanaacutelisis de discurso o de la conversacioacuten y para el estudio de la lengua oral en todos los niveles dela descripcioacuten linguumliacutestica Como indicaacutebamos al principio la transcripcioacuten y la codificacioacuten de loselementos transcritos son en principio dos operaciones conceptualmente diferentes Sinembargo en la praacutectica habitual en las disciplinas a las que se refiere este apartado suelen ser dosoperaciones que se realizan simultaacuteneamente ya que al mismo tiempo que se realiza latransliteracioacuten se introducen las marcas necesarias para la codificacioacuten de los elementos que se hadecidido introducir en el corpus Por ello en muchos casos la discusioacuten sobre la transcripcioacuten y lacodificacioacuten se realiza conjuntamente en la bibliografiacutea sobre el tema

61- Los requisitos de una transcripcioacuten

El investigador que decide constituir un corpus de lengua oral se encuentra en estosmomentos con una gran variedad de criterios en lo que se refiere a la transcripcioacuten y a la seleccioacutende los elementos que apareceraacuten codificados en el corpus Hemos hecho ya referencia en elapartado 3 a las diversas convenciones para la representacioacuten ortograacutefica y cintildeeacutendonos al aacutembitodel anaacutelisis del discurso y la conversacioacuten constatamos igualmente la existencia una grandiversidad de propuestas En una revisioacuten de las mismas Payratoacute (1995) hace por ejemploreferencia a los sistemas de transcripcioacuten y codificacioacuten procedentes de la etnometodologiacuteainteresados en reflejar la interaccioacuten verbal a los meacutetodos desarrollados en el marco de laetnografiacutea de la comunicacioacuten y de la sociolinguumliacutestica interaccional4 o a propuestas utilizadas en elestudio del lenguaje infantil Ante tal situacioacuten parece conveniente plantearse cuaacuteles son losrequisitos que debe cumplir una transcripcioacuten de la lengua oral tema que ha sido abordado pordiversos autores (DuBois 1991 Elich 1993 Edwards 1993 OrsquoConnell y Kowal 1994) Trasrevisar aportaciones anteriores Payratoacute (1995) resume los requisitos que teoacutericamente deberiacuteanexigirse a toda transcripcioacuten

bull Neutralidad o fidelidad de modo que la transcripcioacuten no sea interpretativabull Globalidad o complejidad recogiendo la totalidad de los fenoacutemenos que aparecen

en el discurso oralbull Omnifuncionalidad permitiendo diversos usos y aplicacionesbull Claridad tanto desde el punto de vista del aprendizaje del sistema como de la

legibilidad de la representacioacutenbull Universalidad y compatibilidad entre sistemas informaacuteticos

4 Estos sistemas se comparan en OrsquoConnell y Kowal (1994) Pueden encontrarse consideraciones generales sobre latranscripcioacuten y codificacioacuten de la lengua oral en el anaacutelisis del discurso y la conversacioacuten en 1995Ochs (1979) DuBois (1991) Edwards (1992 1993 1995) Du Bois et al (1993) Gumperz y Berenz (1993) Cook (1995) Chafe(1995) y en Sinclair (1995)

Sin embargo puesto que en la praacutectica se transcribe en funcioacuten de los objetivos para losque se ha definido el corpus Payratoacute (1995) considera que un sistema de transcripcioacuten debe serante todo interpretativo de los datos selectivo en cuanto a los fenoacutemenos que se transcribenpertinente para el objeto de investigacioacuten coherente con la base teoacuterica adoptada por elinvestigador fiel en cuanto a la representacioacuten de los datos y flexible para que sea posible suutilizacioacuten en diversos estudios Por otra parte en opinioacuten de este autor la simbologiacutea utilizadadebe ser clara econoacutemica sencilla exenta de ambiguumledad y compatible con sistemas internacionesestandarizados Este uacuteltimo aspecto nos parece especialmente importante ya que como sentildeala elmismo Payratoacute (1995 58)

[] en ninguacuten caso puede olvidarse que los datos de una investigacioacuten no deberiacutean sertratados nunca de forma tan parcial o idiosincraacutesica que se impidiera o dificultara el uso por partede otros investigadores La transcripcioacuten del discurso oral es una actividad suficientementecostosa y conflictiva para tomar precauciones en este sentido y ninguna comunidad cientiacuteficapuede permitirse el lujo de particularismos (en aspectos tan elementales) que obstruyan el debateo conviertan en inaprovechables una fuente de informacioacuten

62- Propuestas de estandarizacioacuten para la transcripcioacuten y codificacioacuten de corpus orales

Ante la diversidad de propuestas para la transcripcioacuten y codificacioacuten de la lengua oral queacabamos de constatar el surgimiento de la linguumliacutestica de corpus y muy especialmente lasnecesidades derivadas del intercambio electroacutenico de textos propiciaron la aparicioacuten de proyectose iniciativas centrados en la creacioacuten de estaacutendares tanto en lo que se refiere a la transcripcioacutencomo a la codificacioacuten En los proacuteximos apartados revisamos sucintamente algunos de ellos

Uno de los capiacutetulos de las Guiacuteas desarrolladas por la TEI estaacute dedicado a la transcripcioacutende corpus orales (Johansson 1995a b) En eacutel se describe la estructura baacutesica de la representacioacutende un texto oral - cabecera texto y divisiones - y se definen los procedimientos basados enSGML para la representacioacuten de los elementos estructurales baacutesicos informacioacuten contextualinformacioacuten temporal enunciados pausas elementos vocalizados semi-leacutexicos o no leacutexicoselementos kineacutesicos otros tipos de eventos comunicativos y texto presentado en forma escrita alhablante Tambieacuten se ofrecen en este capiacutetulo indicaciones para la segmentacioacuten y el alineamientoasiacute como recomendaciones para la transcripcioacuten de superposiciones entre hablantes de formas depalabras prosodia elementos paralinguumliacutesticos - tempo intensidad rango tonal tensioacuten ritmo ycalidad de voz - y alteraciones en el decurso foacutenico Para la representacioacuten de la informacioacutenfoneacutetica se recomienda el uso del AFI En la siguiente tabla se resumen los principales elementospropuestos por la TEI para la codificacioacuten de corpus orales considerados especiacuteficos de este tipode texto (Sperberg-McQueen y Burnard eds 1994)

Elemento codificado Marca decodificacioacutenen SGML

Definicioacuten

Divisiones (division) ltdivgt Unidades intermedias entre el texto y el enunciado que permitendelimitar partes diferenciadas en un texto

Enunciado (utterance) ltugt Segmento de habla comprendido entre dos pausas o delimitado porun cambio en el turno de palabra puede incluir ademaacutesinformacioacuten sobre la superposicioacuten (ltoverlapgt) de turnos cuando

interviene simultaacuteneamente maacutes de un hablantePausa (pause) ltpausegt Interrupcioacuten de la fonacioacuten percibida entre dos enunciados o en el

interior de los mismos puede describirse en teacuterminos relativos oindicando su duracioacuten

Vocal (vocal) ltvocalgt Elemento vocalizado semi-leacutexico o no leacutexico (pej pausas llenas otoses)

Kineacutesico (kinesic) ltkinesicgt Cualquier fenoacutemeno comunicativo no vocal (p ej gestos)Acontecimiento (event) lteventgt Cualquier fenoacutemeno identificado en la grabacioacuten no necesariamente

vocalizado ni con valor comunicativo (p ej ruidos de fondo)Texto escrito (writing) ltwritinggt Texto escrito que se presenta al hablante durante su intervencioacutenCambio (shift) ltshiftgt Momento en el que se produce un cambio en alguno de los rasgos

paralinguumliacutesticos - calidad de voz intensidad rango tonal ritmo yvelocidad de elocucioacuten - cada uno de los rasgos puede describirsemediante una lista de caracteriacutesticas

Tabla 1 Elementos codificados en las transcripciones de lengua oral seguacuten los estaacutendares de la TEI(Adaptada de Sperberg-McQueen y Burnard eds1994)

Por otra parte la TEI ofrece mecanismos para indicar el comienzo y el final de unfenoacutemeno su duracioacuten y su sincronizacioacuten temporal con otros elementos presenta tambieacuten laposibilidad de marcar unidades inferiores al enunciado - segmentos ltseggt - que permitendelimitar por ejemplo unidades prosoacutedicas e incluye tambieacuten entre sus propuestas las marcasnecesarias para sentildealar fenoacutemenos propios de la lengua hablada como palabras truncadasrepeticiones falsos principios - marcados como ltdelgt (deletion) y especificando el fenoacutemeno -Las partes de la grabacioacuten que el transcriptor no llega a interpretar correctamente - ltuncleargt - ono puede escuchar - ltgapgt - o las correcciones de errores de produccioacuten realizadas por eltranscriptor - ltsicgt para delimitar el error y ltcorrgt para indicar la correccioacuten - son tambieacutenelementos para los cuales la TEI establece marcas de codificacioacuten

Aunque las Guiacuteas de la TEI pueden considerarse un sistema adecuado para la transcripcioacuteny codificacioacuten de gran variedad de materiales los autores propios autores reconocen que

[] the present proposals are not intended to support unmodified every variety of researchundertaken upon spoken material now or in the future some discourse analysts phonologistsand doubtless other may wish to extend the scheme presented here to express more precisely theset of distinctions they wish to draw in their transcriptions Speech regarded as a purely acousticphenomenon may well require different methods from those outlined here as may speechregarded solely as a process of social interaction (Sperberg-McQueen y Burnard eds 1994 cap11)

El proyecto NERC - Network of European Reference Corpora (NERC 1994) se planteoacutecomo uno de sus objetivos la viabilidad de desarrollar una serie de recomendaciones para laconstitucioacuten de corpus y por tanto incluye entre sus resultados indicaciones sobre el tratamientode los corpus orales tanto en lo que se refiere a su codificacioacuten como a la transcripcioacuten de loselementos segmentales y suprasegmentales (Sinclair 1994) El sistema adoptado para latranscripcioacuten y codificacioacuten de corpus se basa como hemos indicado anteriormente en eldesarrollado por French (1991 1992) para la transcripcioacuten del corpus oral desarrollado en elproyecto COBUILD La transcripcioacuten se plantea como una operacioacuten que puede desarrollarse envarios niveles

bull Nivel I consiste en la representacioacuten ortograacutefica introduciendo los miacutenimossignos de puntuacioacuten necesarios sin informacioacuten sobre la interaccioacuten entre hablantes Eneste nivel se contemplan convenciones desarrolladas para la representacioacuten ortograacutefica ypara precisar el uso de la puntuacioacuten

bull Nivel II consiste en una representacioacuten ortograacutefica enriquecida con informacioacutenbaacutesica sobre la identidad de los hablantes el turno de palabra y los elementos no verbales

bull Nivel III contiene toda la informacioacuten presente en el nivel II ademaacutes deinformacioacuten sobre la interaccioacuten entre hablantes - marcando el principio y el final de lossolapamientos - y sobre la entonacioacuten - sentildealando las fronteras entre unidades tonales ylas siacutelabas acentuadas- En opinioacuten de French (1992) la transcripcioacuten a este nivel requiereuna formacioacuten especiacutefica en foneacutetica

bull Nivel IV constituye el nivel maacutes detallado de representacioacuten incluyendo lainformacioacuten propia del nivel III junto con marcas de tonos siacutelabas nucleares y con unatranscripcioacuten fonoloacutegica alineada con una representacioacuten acuacutestica - espectrograma y curvameloacutedica - del enunciado

La recomendacioacuten del proyecto NERC es que la transcripcioacuten de un corpus para el estudiode la lengua oral se lleve a cabo seguacuten las especificaciones del Nivel II adecuado seguacuten Frenchpara todas aquellas investigaciones que no requieran informacioacuten prosoacutedica

En el marco de NERC se llevoacute tambieacuten a cabo una evaluacioacuten de las Guiacuteas de la TEI para latranscripcioacuten de corpus orales de la que se concluye que ldquoThe TEI proposals are broadlycompatible with current practice in the user community as represented by JP Frenchconventions Furthermore in the majority of cases it will be a straightforward matter to link themachine-friendly TEI codes to the more user-friendly encoding systems such as JP Frenchconventions by means of a simple conversion programmerdquo (Payne 199260) La idea de unaconversioacuten automaacutetica entre las transcripciones realizadas seguacuten las propuestas de NERC y de laTEI es naturalmente interesante y refuerza la idea de que existe una compatibilidad general entreambos sistemas (Payne 1992 Johansson 1995a EAGLES 1996) prueba de ello es que en elinforme final de NERC se recomienda el uso de las normas de la TEI

Uno de los objetivos del Grupo de Trabajo sobre Textos Orales de EAGLES fue proponerun conjunto miacutenimo de fenoacutemenos que deberiacutean codificarse en cualquier texto oral La propuestarealizada se describe en EAGLES (1996) y toma elementos del proyecto NERC de la TEI y delGrupo de Trabajo sobre Lengua Oral de EAGLES Considerando los elementos comunes a lossistemas que sirven de base se sugiere que la codificacioacuten de un texto oral debe contener almenos informacioacuten sobre los siguientes aspectos

(1) Elementos vocales y no vocalesbull Elementos vocales semi-leacutexicos

Pertenecen a esta categoriacutea los elementos utilizados principalmente en elhabla espontaacutenea durante los momentos en que el hablante planifica lacontinuacioacuten de su discurso como las llamadas ldquopausas llenasrdquo o ldquosonorasrdquo y los

elementos que marcan dudas en el momento de la produccioacuten del hablaCorresponden a los elementos que en la TEI se marcan con la etiqueta ltvocalgtbull Elementos vocales no leacutexicos

Se incluyen aquiacute todo tipo de sonidos producidos por el hablante - tosesrisas bostezos estornudos etc - que no constituyen formas leacutexicas de la lenguaCorresponden igualmente a los codificados con la marca ltvocalgt en la TEIbull Acontecimientos no vocales y no comunicativos

Comprenden los ruidos producidos por otros hablantes o procedentes delentorno de grabacioacuten Estos acontecimientos se codifican en la TEI mediante lamarca lteventgt

(2) Elementos necesarios en la transcripcioacuten de interacciones verbalesbull Identidad del hablante

Este es un elemento imprescindible en la transcripcioacuten de interaccionesverbales La TEI dispone de los mecanismos para documentar informacioacuten sobrelos hablantes en la cabecera de los textos asiacute como de un sistema para marcar laidentidad de cada participante en el interior del texto aunque pueden utilizarsetambieacuten otros procedimientosbull Turnos de palabra

La finalidad del marcado de los turnos de palabra es indicar un cambio dehablante Ademaacutes de las convenciones de la TEI pueden emplearse otrosprocedimientos mientras se mantenga esta informacioacuten esencial en el estudio de lainteraccioacuten verbalbull Superposicioacuten de turnos de palabra

Existen igualmente diferentes procedimientos para marcar la superposicioacutende emisiones de dos hablantes ademaacutes de las propuestas de la TEI que los tratacomo parte de las estrategias para codificar acontecimientos simultaacuteneos

(3) Elementos relacionados con la actuacioacuten del hablantebull Omisiones en un texto leiacutedo

Si se transcribe un texto leiacutedo y se dispone del original es recomendableanotar las palabras o segmentos omitidos por el locutorbull Autocorrecciones

Es propio del habla espontaacutenea aunque tambieacuten de la lectura que loshablantes realicen correcciones de su propia produccioacuten linguumliacutestica (self-repairs)Parece conveniente marcarlas en la transcripcioacuten de un corpus oralbull Fragmentos de palabras

Los fragmentos de palabras corresponden a uno o maacutes segmentospertenecientes a una palabra que no ha sido totalmente pronunciada por el hablanteen un primer intento y que suelen repetirse cuando eacuteste consigue producir lapalabra completa Es importante indicar este fenoacutemeno en la transcripcioacuten

bull Fragmentos ininteligiblesSe trata de partes de la grabacioacuten que no son comprendidas por el

transcriptor y en la TEI se codifican con la etiqueta ltuncleargt aunque si se desease pueden utilizar marcas maacutes detalladas distinguiendo entre transcripcionescompletamente ininteligibles y entre una posible interpretacioacuten ofrecida por eltranscriptor

Un aspecto conflictivo sigue siendo la identificacioacuten de los enunciados que conforman untexto oral (Schuetze-Coburn 1991) Mientras que en un texto escrito los signos de puntuacioacutenconstituyen un criterio de delimitacioacuten en el habla disponemos de indicios como las pausas laentonacioacuten o el cambio de turno de palabra que nos permiten al menos convencionalmentedefinir un enunciado Sin embargo hasta el momento no se han desarrollado auacuten criteriosobjetivos y consistentes para resolver este problema

7- CONCLUSIONES

La revisioacuten - sin pretensiones de exhaustividad - de los principales sistemas detranscripcioacuten etiquetado y codificacioacuten de corpus orales expuesta en este trabajo pone demanifiesto en primer lugar la multiplicidad de propuestas desarrolladas frente a los intentos deestandarizacioacuten algunos de los cuales auacuten no se han consolidado plenamente pese a su crecienteaceptacioacuten En segundo lugar destaca tambieacuten la heterogeneidad de tradiciones que confluyen enel estudio de la lengua hablada desde la foneacutetica y las tecnologiacuteas del habla hasta el anaacutelisis deldiscurso y de la conversacioacuten diversidad que lleva a la creacioacuten de convenciones especiacuteficas pararesponder a las necesidades de diversas comunidades cientiacuteficas Ante esta situacioacuten la distincioacutenpropuesta por Sinclair (1995107) entre ldquoconformidadrdquo y ldquocompatibilidadrdquo adquiere todo susentido ya que si en ciertos casos la conformidad a un estaacutendar determinado es problemaacutetica porlas limitaciones inherentes a todo sistema comuacuten la compatibilidad - entendida como la facilidadde conversioacuten entre sistemas - deberiacutea ser en cambio un requisito imprescindible en el desarrollode los recursos linguumliacutesticos De esta manera puede tal alcanzarse el equilibrio entre lasnecesidades de un proyecto y las indudables ventajas cientiacuteficas y econoacutemicas que resultan de lareutilizacioacuten de los datos disponibles

BIBLIOGRAFIacuteA

Allen GD 1988 The PHONASCII System Journal of the International PhoneticAssociation 181 9-25

Anderson AH M Badger EG Bard E Boyle G Doherty S Garrod S Isard JKowtko J Mcallister J Miller C Sotillo HS Thompson y R Weinert 1991 The HCRCMap Task corpus Language and Speech 344 351-366

Autesserre D G Peacuterennou y M Rossi 1989 Methodology for the transcription andlabeling of a speech corpus Journal of the International Phonetic Association 191 2-15

Barry WJ y AJ Fourcin 1992 Levels of Labelling Computer Speech and Language 61-14

Beckman ME y GM Ayers GM 1994 Guidelines for ToBI Labelling Version 20February 1994[Documento de Internet disponible en httplingohio-stateeduPhoneticsToBIToBI0html]

Beckman ME y J Hirschberg J 1994 The ToBI Annotation Conventions Apeacutendice A deME Beckman y GM Ayers 1994 Guidelines for ToBI Labelling Version 20 February 1994[Documento de Internet disponible en httplingohio-stateeduPhoneticsToBIToBI0html]

Bruce G 1988 23 Supasegmental categories and 24 The symbolization of temporalevents Journal of the International Phonetic Association 182 75-76

Bruce G 1989 Report from the IPA working group on suprasegmental categories LundUniversity Department of Linguistics General Linguistics Phonetics Working Papers 35 25-40

Burnard L 1995 What is SGML and how does it help Computers and the Humanities291 41-50 The Text Encoding Initiative Background and Context Eds N Ide y J VeacuteronisDordrecht Kluwer Academic Publishers

Burnard L 1995a Text Encoding for Information Exchange An Introduction to the TextEncoding Initiaive TEI Document TEI J31 [Documento de Internet disponible enhttpwwwuiceduorgsteiinfoteij31]

Burnard L 1995b The Text Encoding Initiative an overviewrdquo Spoken English onComputer Transcription Markup and Applications Eds G LEECH G MYERS y JTHOMAS Harlow Longman 69-81

Chafe W 1995 Adequacy user-friendliness and practicality in transcribingrdquo English onComputer Transcription Markup and Applications Eds G Leech G Myers y J ThomasHarlow Longman 54-61

Chan D A Fourcin D Gibbon B Granstroumlm M Huckvale G Kokkinakis K KvaleL Lamel B Lindberg A Moreno J Mouropoulos F Senia I Trancoso C Veld y J Zeiliger1995 EUROM - A Spoken Language Resource for the EU Eurospeech95 Proceedings of the4th European Conference on Speech Communication and Speech Technology Madrid Spain 18-21 September 1995 Vol 1 867-870

Cole RA BT Oshika M Noel T Lander y M Fanty 1994 Labeler Agreement inPhonetic Labeling of Continuous Speech Proceedings of the 1994 International Conference onSpoken Language Processing Yokohama Japan 18-22 September 1994[Documento de Internet disponible en httpwwwcseogieduCSLUcorporapapershtml]

Cook G 1995 Theoretical issues transcribing the untranscribablerdquo Spoken English onComputer Transcription Markup and Applications Eds G Leech G Myers y J ThomasHarlow Longman 35-53

Du Bois JW 1991 Transcription design principles for spoken discourse researchPragmatics 1 71-106

Du Bois JW S Schuetze-Coburn S Cumming y D Paolino 1993 Outline of discoursetranscriptionrdquo Talking Data Transcription and Coding in Discourse Research Eds JAEdwards y MD Lampert Hillsdale NJ Lawrence Erlbaum Associates 45-90

EAGLES 1996 Preliminary Recommendations on Spoken Texts EAGLES DocumentEAG-TCWG-STPP May 1996[Documento de Internet disponible enhttpwwwilcpicnritEAGLES96spokentxspokentxhtml]

Edwards JA 1992 Design principles in the transcription of spoken discourserdquoDirections in Corpus Linguistics Proceedings of Nobel Symposium 82 Stockholm 4-8 August1991 Ed J Svartvik Berlin Mouton de Gruyter 129-147

Edwards JA 1993 Principles and Contrasting Systems of Discourse TranscriptionrdquoTalking Data Transcription and Coding in Discourse Research Eds JA Edwards y MDLampert Hillsdale Hillsdale NJ Lawrence Erlbaum Associates 3-32

Edwards JA 1995 Principles and alternative systems in the transcription coding andmark-up of spoken discourserdquo Spoken English on Computer Transcription Markup andApplications Eds G Leech G Myers y J Thomas Harlow Longman 19-34

Ehlich K 1993 HIAT A Transcription System for Discourse Datardquo Talking DataTranscription and Coding in Discourse Research Eds JA Edwards y MD Lampert HillsdaleNJ Lawrence Erlbaum Associates 123-148

Eisen B 1993 Reliability of speech segmentation and labelling at different levels oftranscription Eurospeech93 3rd European Conference on Speech Communication andTechnology Berlin Germany 21-23 September 1993 Vol 1 673-676

Esling JH y H Gaylord 1993 Computer Codes for Phonetic Symbols Journal of theInternational Phonetic Association 232 77-82

Esling JH 1988 Computer coding of IPA symbols and detailed phonetic representationsof computer databases Journal of the International Phonetic Association 182 99-106

Esling JH 1990 Computer Coding of the IPA Supplementary Report Journal of theInternational Phonetic Association 201 22-26

Fourcin A y JM Dolmazon (on behalf of the SAM Project) 1991 Speech knowledgestandards and assessment Actes du XIIegraveme Congregraves International des Sciences Phoneacutetiques 19-24 aoucirct 1991 Aix-en-Provence France Aix-en-Provence Universiteacute de Provence Service desPublications Vol 5 430-433

Fourcin A G Harland W Barry y V Hazan eds 1989 Speech Input and OutputAssessment Multilingual Methods and Standards Chichester Ellis Horwood Ltd

French JP 1991 Updated notes for soundprint transcribers Working paper Universityof Birmingham October 1991 NERC-WP4-47

French JP 1992 Transcription proposals multilevel system Working paper Universityof Birmingham October 1992 NERC-WP4-50

Gibbon D 1989 Survey of Prosodic Labelling for EC Languages SAM-UBI-190 12February 1989 Report e6 in ESPRIT 2589 (SAM) Interim Report Year 1 Ref SAM-UCLG002 University College London February 1990

Gibbon D R Moore y R Winski eds 1997 Handbook on Standards and Resources forSpoken Language Systems Berlin Mouton De Gruyter [Documento de Internet disponible en httpcoralliliuni-bielefelddeEAGLESeagbookeagbookhtml]

Groslashnnum Thorsen N 1987 Suprasegmental transcription ARIPUC - Annual Report ofthe Institute of Phonetics University of Copenhagen 21 1-27

Gumperz JJ y J Berenz 1993 Transcribing Conversational Exchangesrdquo Talking DataTranscription and Coding in Discourse Research Eds JA Ewards y M D Lampert HillsdaleNJ Lawrence Erlbaum Associates 91-122

Hart J lsquoT R Collier y A Cohen 1990 A Perceptual Study of Intonation An Experimental- Phonetic Approach to Intonation Cambridge Cambridge University Press (Cambridge Studiesin Speech Science and Communication)

Hess W K Kohler y HG Tillmann 1995 The PhonDat-Verbmobil Speech CorpusEurospeech95 Proceedings of the 4th European Conference on Speech Communication andSpeech Technology Madrid Spain 18-21 September 1995 Vol 1 863-866

Hieronymus JL 1994 ASCII phonetic symbols for the worlds languages WorldbetATampT Bell Laboratories Technical Memo [Documento de Internet disponible enhttpwwwcseogieduCSLUcorporapapershtml]

Hirst D A Di Cristo y R Espesser en prensaLevels of representation and levels ofanalysis for intonation Prosody Theory and Experiments Ed M Horne Dordrecht Kluwer

Hirst DJ y A Di Cristo en prensa A survey of intonation systemsrdquo IntonationSystems A Survey of 20 Languages Eds D Hirst y A Di Cristo Cambridge CambridgeUniversity Press

Hirst DJ 1991 Intonation models towards a third generation Actes du XIIegraveme CongregravesInternational des Sciences Phoneacutetiques 19-24 aoucirct 1991 Aix-en-Provence France Aix-en-Provence Universiteacute de Provence Service des Publications Vol 1 305-310

Hirst DJ A Di Cristo M Le Besnerais Z Najim P Nicolas y P Romeacuteas 1993Multilingual modelling of intonation patternsrdquo Proceedings of an ESCA Workshop on ProsodySeptember 27-29 1993 Lund Sweden Eds D House y P Touati Lund University Departmentof Linguistics and Phonetics Working Papers 41 204-207

Hirst DJ N Ide y J Veacuteronis 1994 Coding fundamental frequency patterns for multi-lingual synthesis with INTSINT in the MULTEXT project Conference Proceedings of theSecond ESCAIEEE Workshop on Speech Synthesis September 12-15 1994 Mohonk MountainHouse New Paltz New York USA 77-80

Ide N y J Veacuteronis eds 1995 The Text Encoding Initiative Background and ContextsComputers and the Humanities 29 1-3 Publicado en forma de libro en Dordrecht KluwerAcademic Publishers

IPA 1989 The IPA 1989 Kiel Convention Workgroup 9 report Computer Coding of IPAsymbols and Computer Representation of Individual Languages Journal of the InternationalPhonetic Association 192 81-92

IPA 1993 IPA Chart revised to 1993 Journal of the International Phonetic Association231 [Documento de Internet disponible en httpwwwartsglaacukIPAipacharthtml]

IPA 1995 Preview of the IPA Handbook Journal of the International Phonetic Association251

ISO 8879 1986 Information Processing Text and Office Systems Standard GeneralizedMarkup Language (SGML) Geneva International Organization for Standardization

Johansson S 1995a The approach of the Text Encoding Initiative to the encoding ofspoken discourse Spoken English on Computer Transcription Markup and Applications EdsG Leech G Myers y J Thomas Harlow Longman 82-98

Johansson S 1995b The Encoding of Spoken Texts Computers and the Humanities291 149-158 The Text Encoding Initiative Background and Context Eds N Ide y J VeacuteronisDordrecht Kluwer Academic Publishers 149-158

Keating P P MacEachern A Shryock y S Domiacutenguez 1994 A manual for phonetictranscription Segmentation and labelling of words in spontaneous speech UCLA WorkingPapers in Phonetics 88 91-120

Kluger-Kruse M 1987 Computer Phonetic Alphabet ESPRIT Linguistic Analysis of theEuropean Languages Report BU-CPA0267 July 1987

Krot C y B Taylor 1995 Criteria for Acoustic-Phonetic Segmentation and WordLabelling in the Australian National Database of Spoken Language[Documento de Internet disponible en httpwwwshlrcmqeduaucriteriahtml]

Lander T 1997 The CSLU Labeling Guide Center for Spoken Language UnderstandingOregon Graduate Institute[Documento de Internet disponible en httpwwwcseogieduCSLUcorporapapershtml]

Llisterri J 1994 Prosody Encoding Survey WP 1 Specifications and Standards T15Markup Specifications Deliverable 153 Final version 15 September 1994 LRE Project 62-050MULTEXT

Llisterri J ed 1996 Prosody Tools Efficiency and Failures WP 4 Corpus T46 SpeechMarkup and Validation Deliverable 452 Final version 15 October 1996 LRE Project 62-050MULTEXT

MacWhinney B 1991The CHILDES Project Tools for Analyzing Talk Hillsdale NJLawrence Erlbaum

Marchal A N Nguyen y W Hardcastle 1995 Multitiered phonetic approach to speechlabelling Levels in Speech Communication Relations and Interactions A Tribute to MaxWajskop Hommage agrave Max Wajskop Eds C Sorin J Mariani H Meloni y J SchoengenAmsterdam Elsevier Science BV 149-158

NERC 1994 NERC-1 Network of European Reference Corpora Final Report PisaInstituto di Linguistica Computazionale - CNR January 1994 versioacuten en curso de publicacioacutenTowards a Network of European Reference Corpora Eds N Calzolari M Baker y PG KruytPisa Giardini

Nicolas P y D Hirst 1995 Symbolic coding of Higher-Level Characteristics ofFundamental Frequency Curvesrdquo Eurospeech95 Proceedings of the 4th European Conferenceon Speech Communication and Technology Madrid Spain 18-21 September 1995 Vol 2 989-992

OConnell DC y S Kowal 1994 Some Current Transcription Systems for SpokenDiscourse A critical Analysis Pragmatics 4 81-107

Ochs E 1979 Transcription as Theory Developmental Pragmatics Eds E Ochs E yBB Schieffelin New York Academic Press 43-72

Payne J 1992 Report on the compatibility of JP Frenchs spoken corpus transcriptionconventions with the TEI guidelines for transcription of spoken texts Working paper COBUILDBirmingham and IDS Mannheim December 1992 NERC-WP8WP4-122

Payne J 1995 The COBUILD spoken corpus transcription conventions SpokenEnglish on Computer Transcription Markup and Applications Eds G Leech G Myers y JThomas Harlow Longman 203-207

Payratoacute Ll 1995 Transcripcioacuten del discurso coloquialrdquo El espantildeol coloquial Actas del ISimposio sobre Anaacutelisis del Discurso Oral Almeriacutea 23-25 de noviembre de 1994 Ed L CorteacutesRodriacuteguez Almeriacutea Universidad de Almeriacutea Servicio de Publicaciones 43-70

Pierrehumbert J B 1897 (1980) The Phonology and Phonetics of English IntonationPhD Thesis Department of Linguistics MIT Bloomington Indiana University Linguistics Club

Pitrelli J M Beckman y J Hirschberg 1994 Evaluation of prosodic transcriptionlabelling reliability in the ToBI frameworkrdquo Proceedings of the Third International Conference onSpoken Language Processing Yokohama ICSLP Vol 2 123-126

Pullum GK y WA Ladusaw 1996 (1986) Phonetic Symbol Guide Chicago TheUniversity of Chicago Press 2nd edition

Roach P H Roach A Dew y P Rowlands 1990 Phonetic analysis and the automaticsegmentation and labeling of speech sounds Journal of the International Phonetic Association201 15-21

Schmidt MS C Scott y MA Jack 1993 Phonetic transcription standards for Europeannames (ONOMASTICA) Eurospeech93 3rd European Conference on Speech Communicationand Technology Berlin Germany 21-23 September 1993 Vol 1 279-282

Schuetze-Coburn S 1991Units of intonation in discourse a comparison of acoustic andauditory analysis Language and Speech 343 207-234

Selting M 1987 Descriptive categories for the auditive analysis of intonation inconversation Journal of Pragmatics 11 777-791

Selting M 1988 The role of intonation in the organisation of repair and problem handlingsequences in conversation Journal of Pragmatics 12 293-322

Senia F y JG Van Velden 1997 Specifications of orthographic transcription and lexiconconventions LRE-4001 SpeechDat Technical Report SD132 Final version 10 January 1997[Documento de Internet disponible en httpwwwphonetikuni-muenchendeSpeechDathtml]

Silverman K M Beckman J Pitrelli M Ostendorf C Wightman P Price JPierrehumbert y J Hirschberg 1992 TOBI A standard for labelling English prosodyProceedings of the Second International Conference on Spoken Language Processing ICSLP-92Banff October 1992 867-870

Sinclair J 1994 Spoken Language [3B] PhoneticPhonemic and Prosodic Annotation[52] NERC 1994 NERC-1 Network of European Reference Corpora Final Report PisaVersioacuten en curso de publicacioacuten Towards a Network of European Reference Corpora Eds NCalzolari M Baker y PG Kruyt Pisa Giardini

Sinclair J 1995 From theory to practicerdquo Spoken English on Computer TranscriptionMarkup and Applications Eds G Leech G Myers Y J Thomas Harlow Longman 99- 112

Sperberg-McQueen CM y L Burnard eds 1994 Guidelines for Electronic Text Encodingand Interchange TEI P3 Chicago and Oxford Association for Computational Linguistics Association for Computers and the Humanities Association for Literary and LinguisticComputing [Cap 11 Transcriptions of Speech] [Documento de Internet disponible enhttpetextvirginiaeduTEIhtml]

Strangert E y M Heldner 1995 Labelling of boundaries and prominences byphonetically experienced and non-experienced transcribers Phonum 3 Reports from theDepartment of Phonetics Umearing University 85-109 [Documento de Internet disponible enhttpwwwlingumusefonphonum3html]

Teubert W 1993 Phonetic Phonemic and Prosodic Annotation Final Report IDSMannheim February 1993 NERC-WP8-171

Tillmann HG y B Pompino-Marschall 1993 Theoretical Principles ConcerningSegmentation Labelling Strategies and Levels of Categorical Annotation for Spoken LanguageDatabase Systems Eurospeech93 3rd European Conference on Speech Communication andTechnology Berlin Germany 21-23 September 1993 Vol 3 1691-1694

Trancoso I 1995 The ONOMASTICA Interlanguage Pronunciation LexiconrdquoEurospeech95 Proceedings of the 4th European Conference on Speech Communication andTechnology Madrid Spain 18-21 September 1995 Vol 1 829-832

Wells JC 1987 Computer Coded Phonetic Transcription Journal of the InternationalPhonetic Association 172 94-114

Wells JC 1989 Computer-coded phonemic notation of individual languages of theEuropean Community Journal of the International Phonetic Association 191 31-54

Wells JC 1994 Computer-coding the IPA a proposed extension of SAMPA SpeechHearing and Language Work in Progress 1994 (University College London Department ofPhonetics and Linguistics) 8 271-289

Wells JC 1995 SAMPROSA (SAM Prosodic Transcription [Documento de Internetdisponible en httpwwwphonuclacukhomesampasamprosahtm]

Wells JC W Barry M Grice A Fourcin y D Gibbon 1992 Standard Computer-Compatible Transcription SAM Stage Report Sen3 SAM UCL-037 28 February 1992 SAM(1992) Esprit Project 2589 (SAM) Multilingual Speech InputOutput AssessmentMethodologyand Standardisation Final Report Year Three 1III91-28II1992 London University CollegeLondon

Wesenick M-B y F Schiel 1995 Feasibility of Automatic Annotation and BuildingPronunciation Lexica from Corpus Material LRE-63314 SpeechDat Report D3123 Finalversion 10 October 1995[Documento de Internet disponible en httpwwwicpgrenetfrSpeechDathomehtml]

Winski R R Moore y D Gibbon 1995 EAGLES Spoken Language Working GroupOverview and Resultsrdquo Eurospeech95 Proceedings of the 4th European Conference on SpeechCommunication and Speech Technology Madrid Spain 18-21 September 1995 Vol 1 841-844[Documento de Internet disponible en httpcoralliliuni-bielefeldde~gibbonEAGLESrwpaperrwpaperhtml]

  • 1- INTRODUCCIOacuteN
  • 2- NIVELES DE REPRESENTACIOacuteN ETIQUETADO Y CODIFICACIOacuteN
  • 3- REPRESENTACIOacuteN ORTOGRAacuteFICA DE CORPUS ORALES
  • 31- Propuestas para la representacioacuten ortograacutefica de corpus orales en el aacutembito de la linguumliacutestica de corpus
  • 32- Propuestas para la representacioacuten ortograacutefica de corpus orales en el aacutembito de las tecnologiacuteas del habla
  • 4- REPRESENTACIOacuteN FONEacuteTICA DE CORPUS ORALES
  • 41- La representacioacuten foneacutetica de los elementos segmentales
  • 42- La representacioacuten foneacutetica de los elementos suprasegmentales
  • 5- ETIQUETADO FONEacuteTICO DE CORPUS ORALES
  • 51- Niveles de etiquetado foneacutetico de corpus orales
  • 52- La transcripcioacuten y el etiquetado automaacutetico de corpus orales
  • 6- TRANSCRIPCIOacuteN Y CODIFICACIOacuteN DE CORPUS PARA EL ANAacuteLISIS DE LA LENGUA ORAL
  • 61- Los requisitos de una transcripcioacuten
  • 62- Propuestas de estandarizacioacuten para la transcripcioacuten y codificacioacuten de corpus orales
  • 7- CONCLUSIONES
  • BIBLIOGRAFIacuteA
Page 15: Transcripción, etiquetado y codificación de corpus orales

Sin embargo puesto que en la praacutectica se transcribe en funcioacuten de los objetivos para losque se ha definido el corpus Payratoacute (1995) considera que un sistema de transcripcioacuten debe serante todo interpretativo de los datos selectivo en cuanto a los fenoacutemenos que se transcribenpertinente para el objeto de investigacioacuten coherente con la base teoacuterica adoptada por elinvestigador fiel en cuanto a la representacioacuten de los datos y flexible para que sea posible suutilizacioacuten en diversos estudios Por otra parte en opinioacuten de este autor la simbologiacutea utilizadadebe ser clara econoacutemica sencilla exenta de ambiguumledad y compatible con sistemas internacionesestandarizados Este uacuteltimo aspecto nos parece especialmente importante ya que como sentildeala elmismo Payratoacute (1995 58)

[] en ninguacuten caso puede olvidarse que los datos de una investigacioacuten no deberiacutean sertratados nunca de forma tan parcial o idiosincraacutesica que se impidiera o dificultara el uso por partede otros investigadores La transcripcioacuten del discurso oral es una actividad suficientementecostosa y conflictiva para tomar precauciones en este sentido y ninguna comunidad cientiacuteficapuede permitirse el lujo de particularismos (en aspectos tan elementales) que obstruyan el debateo conviertan en inaprovechables una fuente de informacioacuten

62- Propuestas de estandarizacioacuten para la transcripcioacuten y codificacioacuten de corpus orales

Ante la diversidad de propuestas para la transcripcioacuten y codificacioacuten de la lengua oral queacabamos de constatar el surgimiento de la linguumliacutestica de corpus y muy especialmente lasnecesidades derivadas del intercambio electroacutenico de textos propiciaron la aparicioacuten de proyectose iniciativas centrados en la creacioacuten de estaacutendares tanto en lo que se refiere a la transcripcioacutencomo a la codificacioacuten En los proacuteximos apartados revisamos sucintamente algunos de ellos

Uno de los capiacutetulos de las Guiacuteas desarrolladas por la TEI estaacute dedicado a la transcripcioacutende corpus orales (Johansson 1995a b) En eacutel se describe la estructura baacutesica de la representacioacutende un texto oral - cabecera texto y divisiones - y se definen los procedimientos basados enSGML para la representacioacuten de los elementos estructurales baacutesicos informacioacuten contextualinformacioacuten temporal enunciados pausas elementos vocalizados semi-leacutexicos o no leacutexicoselementos kineacutesicos otros tipos de eventos comunicativos y texto presentado en forma escrita alhablante Tambieacuten se ofrecen en este capiacutetulo indicaciones para la segmentacioacuten y el alineamientoasiacute como recomendaciones para la transcripcioacuten de superposiciones entre hablantes de formas depalabras prosodia elementos paralinguumliacutesticos - tempo intensidad rango tonal tensioacuten ritmo ycalidad de voz - y alteraciones en el decurso foacutenico Para la representacioacuten de la informacioacutenfoneacutetica se recomienda el uso del AFI En la siguiente tabla se resumen los principales elementospropuestos por la TEI para la codificacioacuten de corpus orales considerados especiacuteficos de este tipode texto (Sperberg-McQueen y Burnard eds 1994)

Elemento codificado Marca decodificacioacutenen SGML

Definicioacuten

Divisiones (division) ltdivgt Unidades intermedias entre el texto y el enunciado que permitendelimitar partes diferenciadas en un texto

Enunciado (utterance) ltugt Segmento de habla comprendido entre dos pausas o delimitado porun cambio en el turno de palabra puede incluir ademaacutesinformacioacuten sobre la superposicioacuten (ltoverlapgt) de turnos cuando

interviene simultaacuteneamente maacutes de un hablantePausa (pause) ltpausegt Interrupcioacuten de la fonacioacuten percibida entre dos enunciados o en el

interior de los mismos puede describirse en teacuterminos relativos oindicando su duracioacuten

Vocal (vocal) ltvocalgt Elemento vocalizado semi-leacutexico o no leacutexico (pej pausas llenas otoses)

Kineacutesico (kinesic) ltkinesicgt Cualquier fenoacutemeno comunicativo no vocal (p ej gestos)Acontecimiento (event) lteventgt Cualquier fenoacutemeno identificado en la grabacioacuten no necesariamente

vocalizado ni con valor comunicativo (p ej ruidos de fondo)Texto escrito (writing) ltwritinggt Texto escrito que se presenta al hablante durante su intervencioacutenCambio (shift) ltshiftgt Momento en el que se produce un cambio en alguno de los rasgos

paralinguumliacutesticos - calidad de voz intensidad rango tonal ritmo yvelocidad de elocucioacuten - cada uno de los rasgos puede describirsemediante una lista de caracteriacutesticas

Tabla 1 Elementos codificados en las transcripciones de lengua oral seguacuten los estaacutendares de la TEI(Adaptada de Sperberg-McQueen y Burnard eds1994)

Por otra parte la TEI ofrece mecanismos para indicar el comienzo y el final de unfenoacutemeno su duracioacuten y su sincronizacioacuten temporal con otros elementos presenta tambieacuten laposibilidad de marcar unidades inferiores al enunciado - segmentos ltseggt - que permitendelimitar por ejemplo unidades prosoacutedicas e incluye tambieacuten entre sus propuestas las marcasnecesarias para sentildealar fenoacutemenos propios de la lengua hablada como palabras truncadasrepeticiones falsos principios - marcados como ltdelgt (deletion) y especificando el fenoacutemeno -Las partes de la grabacioacuten que el transcriptor no llega a interpretar correctamente - ltuncleargt - ono puede escuchar - ltgapgt - o las correcciones de errores de produccioacuten realizadas por eltranscriptor - ltsicgt para delimitar el error y ltcorrgt para indicar la correccioacuten - son tambieacutenelementos para los cuales la TEI establece marcas de codificacioacuten

Aunque las Guiacuteas de la TEI pueden considerarse un sistema adecuado para la transcripcioacuteny codificacioacuten de gran variedad de materiales los autores propios autores reconocen que

[] the present proposals are not intended to support unmodified every variety of researchundertaken upon spoken material now or in the future some discourse analysts phonologistsand doubtless other may wish to extend the scheme presented here to express more precisely theset of distinctions they wish to draw in their transcriptions Speech regarded as a purely acousticphenomenon may well require different methods from those outlined here as may speechregarded solely as a process of social interaction (Sperberg-McQueen y Burnard eds 1994 cap11)

El proyecto NERC - Network of European Reference Corpora (NERC 1994) se planteoacutecomo uno de sus objetivos la viabilidad de desarrollar una serie de recomendaciones para laconstitucioacuten de corpus y por tanto incluye entre sus resultados indicaciones sobre el tratamientode los corpus orales tanto en lo que se refiere a su codificacioacuten como a la transcripcioacuten de loselementos segmentales y suprasegmentales (Sinclair 1994) El sistema adoptado para latranscripcioacuten y codificacioacuten de corpus se basa como hemos indicado anteriormente en eldesarrollado por French (1991 1992) para la transcripcioacuten del corpus oral desarrollado en elproyecto COBUILD La transcripcioacuten se plantea como una operacioacuten que puede desarrollarse envarios niveles

bull Nivel I consiste en la representacioacuten ortograacutefica introduciendo los miacutenimossignos de puntuacioacuten necesarios sin informacioacuten sobre la interaccioacuten entre hablantes Eneste nivel se contemplan convenciones desarrolladas para la representacioacuten ortograacutefica ypara precisar el uso de la puntuacioacuten

bull Nivel II consiste en una representacioacuten ortograacutefica enriquecida con informacioacutenbaacutesica sobre la identidad de los hablantes el turno de palabra y los elementos no verbales

bull Nivel III contiene toda la informacioacuten presente en el nivel II ademaacutes deinformacioacuten sobre la interaccioacuten entre hablantes - marcando el principio y el final de lossolapamientos - y sobre la entonacioacuten - sentildealando las fronteras entre unidades tonales ylas siacutelabas acentuadas- En opinioacuten de French (1992) la transcripcioacuten a este nivel requiereuna formacioacuten especiacutefica en foneacutetica

bull Nivel IV constituye el nivel maacutes detallado de representacioacuten incluyendo lainformacioacuten propia del nivel III junto con marcas de tonos siacutelabas nucleares y con unatranscripcioacuten fonoloacutegica alineada con una representacioacuten acuacutestica - espectrograma y curvameloacutedica - del enunciado

La recomendacioacuten del proyecto NERC es que la transcripcioacuten de un corpus para el estudiode la lengua oral se lleve a cabo seguacuten las especificaciones del Nivel II adecuado seguacuten Frenchpara todas aquellas investigaciones que no requieran informacioacuten prosoacutedica

En el marco de NERC se llevoacute tambieacuten a cabo una evaluacioacuten de las Guiacuteas de la TEI para latranscripcioacuten de corpus orales de la que se concluye que ldquoThe TEI proposals are broadlycompatible with current practice in the user community as represented by JP Frenchconventions Furthermore in the majority of cases it will be a straightforward matter to link themachine-friendly TEI codes to the more user-friendly encoding systems such as JP Frenchconventions by means of a simple conversion programmerdquo (Payne 199260) La idea de unaconversioacuten automaacutetica entre las transcripciones realizadas seguacuten las propuestas de NERC y de laTEI es naturalmente interesante y refuerza la idea de que existe una compatibilidad general entreambos sistemas (Payne 1992 Johansson 1995a EAGLES 1996) prueba de ello es que en elinforme final de NERC se recomienda el uso de las normas de la TEI

Uno de los objetivos del Grupo de Trabajo sobre Textos Orales de EAGLES fue proponerun conjunto miacutenimo de fenoacutemenos que deberiacutean codificarse en cualquier texto oral La propuestarealizada se describe en EAGLES (1996) y toma elementos del proyecto NERC de la TEI y delGrupo de Trabajo sobre Lengua Oral de EAGLES Considerando los elementos comunes a lossistemas que sirven de base se sugiere que la codificacioacuten de un texto oral debe contener almenos informacioacuten sobre los siguientes aspectos

(1) Elementos vocales y no vocalesbull Elementos vocales semi-leacutexicos

Pertenecen a esta categoriacutea los elementos utilizados principalmente en elhabla espontaacutenea durante los momentos en que el hablante planifica lacontinuacioacuten de su discurso como las llamadas ldquopausas llenasrdquo o ldquosonorasrdquo y los

elementos que marcan dudas en el momento de la produccioacuten del hablaCorresponden a los elementos que en la TEI se marcan con la etiqueta ltvocalgtbull Elementos vocales no leacutexicos

Se incluyen aquiacute todo tipo de sonidos producidos por el hablante - tosesrisas bostezos estornudos etc - que no constituyen formas leacutexicas de la lenguaCorresponden igualmente a los codificados con la marca ltvocalgt en la TEIbull Acontecimientos no vocales y no comunicativos

Comprenden los ruidos producidos por otros hablantes o procedentes delentorno de grabacioacuten Estos acontecimientos se codifican en la TEI mediante lamarca lteventgt

(2) Elementos necesarios en la transcripcioacuten de interacciones verbalesbull Identidad del hablante

Este es un elemento imprescindible en la transcripcioacuten de interaccionesverbales La TEI dispone de los mecanismos para documentar informacioacuten sobrelos hablantes en la cabecera de los textos asiacute como de un sistema para marcar laidentidad de cada participante en el interior del texto aunque pueden utilizarsetambieacuten otros procedimientosbull Turnos de palabra

La finalidad del marcado de los turnos de palabra es indicar un cambio dehablante Ademaacutes de las convenciones de la TEI pueden emplearse otrosprocedimientos mientras se mantenga esta informacioacuten esencial en el estudio de lainteraccioacuten verbalbull Superposicioacuten de turnos de palabra

Existen igualmente diferentes procedimientos para marcar la superposicioacutende emisiones de dos hablantes ademaacutes de las propuestas de la TEI que los tratacomo parte de las estrategias para codificar acontecimientos simultaacuteneos

(3) Elementos relacionados con la actuacioacuten del hablantebull Omisiones en un texto leiacutedo

Si se transcribe un texto leiacutedo y se dispone del original es recomendableanotar las palabras o segmentos omitidos por el locutorbull Autocorrecciones

Es propio del habla espontaacutenea aunque tambieacuten de la lectura que loshablantes realicen correcciones de su propia produccioacuten linguumliacutestica (self-repairs)Parece conveniente marcarlas en la transcripcioacuten de un corpus oralbull Fragmentos de palabras

Los fragmentos de palabras corresponden a uno o maacutes segmentospertenecientes a una palabra que no ha sido totalmente pronunciada por el hablanteen un primer intento y que suelen repetirse cuando eacuteste consigue producir lapalabra completa Es importante indicar este fenoacutemeno en la transcripcioacuten

bull Fragmentos ininteligiblesSe trata de partes de la grabacioacuten que no son comprendidas por el

transcriptor y en la TEI se codifican con la etiqueta ltuncleargt aunque si se desease pueden utilizar marcas maacutes detalladas distinguiendo entre transcripcionescompletamente ininteligibles y entre una posible interpretacioacuten ofrecida por eltranscriptor

Un aspecto conflictivo sigue siendo la identificacioacuten de los enunciados que conforman untexto oral (Schuetze-Coburn 1991) Mientras que en un texto escrito los signos de puntuacioacutenconstituyen un criterio de delimitacioacuten en el habla disponemos de indicios como las pausas laentonacioacuten o el cambio de turno de palabra que nos permiten al menos convencionalmentedefinir un enunciado Sin embargo hasta el momento no se han desarrollado auacuten criteriosobjetivos y consistentes para resolver este problema

7- CONCLUSIONES

La revisioacuten - sin pretensiones de exhaustividad - de los principales sistemas detranscripcioacuten etiquetado y codificacioacuten de corpus orales expuesta en este trabajo pone demanifiesto en primer lugar la multiplicidad de propuestas desarrolladas frente a los intentos deestandarizacioacuten algunos de los cuales auacuten no se han consolidado plenamente pese a su crecienteaceptacioacuten En segundo lugar destaca tambieacuten la heterogeneidad de tradiciones que confluyen enel estudio de la lengua hablada desde la foneacutetica y las tecnologiacuteas del habla hasta el anaacutelisis deldiscurso y de la conversacioacuten diversidad que lleva a la creacioacuten de convenciones especiacuteficas pararesponder a las necesidades de diversas comunidades cientiacuteficas Ante esta situacioacuten la distincioacutenpropuesta por Sinclair (1995107) entre ldquoconformidadrdquo y ldquocompatibilidadrdquo adquiere todo susentido ya que si en ciertos casos la conformidad a un estaacutendar determinado es problemaacutetica porlas limitaciones inherentes a todo sistema comuacuten la compatibilidad - entendida como la facilidadde conversioacuten entre sistemas - deberiacutea ser en cambio un requisito imprescindible en el desarrollode los recursos linguumliacutesticos De esta manera puede tal alcanzarse el equilibrio entre lasnecesidades de un proyecto y las indudables ventajas cientiacuteficas y econoacutemicas que resultan de lareutilizacioacuten de los datos disponibles

BIBLIOGRAFIacuteA

Allen GD 1988 The PHONASCII System Journal of the International PhoneticAssociation 181 9-25

Anderson AH M Badger EG Bard E Boyle G Doherty S Garrod S Isard JKowtko J Mcallister J Miller C Sotillo HS Thompson y R Weinert 1991 The HCRCMap Task corpus Language and Speech 344 351-366

Autesserre D G Peacuterennou y M Rossi 1989 Methodology for the transcription andlabeling of a speech corpus Journal of the International Phonetic Association 191 2-15

Barry WJ y AJ Fourcin 1992 Levels of Labelling Computer Speech and Language 61-14

Beckman ME y GM Ayers GM 1994 Guidelines for ToBI Labelling Version 20February 1994[Documento de Internet disponible en httplingohio-stateeduPhoneticsToBIToBI0html]

Beckman ME y J Hirschberg J 1994 The ToBI Annotation Conventions Apeacutendice A deME Beckman y GM Ayers 1994 Guidelines for ToBI Labelling Version 20 February 1994[Documento de Internet disponible en httplingohio-stateeduPhoneticsToBIToBI0html]

Bruce G 1988 23 Supasegmental categories and 24 The symbolization of temporalevents Journal of the International Phonetic Association 182 75-76

Bruce G 1989 Report from the IPA working group on suprasegmental categories LundUniversity Department of Linguistics General Linguistics Phonetics Working Papers 35 25-40

Burnard L 1995 What is SGML and how does it help Computers and the Humanities291 41-50 The Text Encoding Initiative Background and Context Eds N Ide y J VeacuteronisDordrecht Kluwer Academic Publishers

Burnard L 1995a Text Encoding for Information Exchange An Introduction to the TextEncoding Initiaive TEI Document TEI J31 [Documento de Internet disponible enhttpwwwuiceduorgsteiinfoteij31]

Burnard L 1995b The Text Encoding Initiative an overviewrdquo Spoken English onComputer Transcription Markup and Applications Eds G LEECH G MYERS y JTHOMAS Harlow Longman 69-81

Chafe W 1995 Adequacy user-friendliness and practicality in transcribingrdquo English onComputer Transcription Markup and Applications Eds G Leech G Myers y J ThomasHarlow Longman 54-61

Chan D A Fourcin D Gibbon B Granstroumlm M Huckvale G Kokkinakis K KvaleL Lamel B Lindberg A Moreno J Mouropoulos F Senia I Trancoso C Veld y J Zeiliger1995 EUROM - A Spoken Language Resource for the EU Eurospeech95 Proceedings of the4th European Conference on Speech Communication and Speech Technology Madrid Spain 18-21 September 1995 Vol 1 867-870

Cole RA BT Oshika M Noel T Lander y M Fanty 1994 Labeler Agreement inPhonetic Labeling of Continuous Speech Proceedings of the 1994 International Conference onSpoken Language Processing Yokohama Japan 18-22 September 1994[Documento de Internet disponible en httpwwwcseogieduCSLUcorporapapershtml]

Cook G 1995 Theoretical issues transcribing the untranscribablerdquo Spoken English onComputer Transcription Markup and Applications Eds G Leech G Myers y J ThomasHarlow Longman 35-53

Du Bois JW 1991 Transcription design principles for spoken discourse researchPragmatics 1 71-106

Du Bois JW S Schuetze-Coburn S Cumming y D Paolino 1993 Outline of discoursetranscriptionrdquo Talking Data Transcription and Coding in Discourse Research Eds JAEdwards y MD Lampert Hillsdale NJ Lawrence Erlbaum Associates 45-90

EAGLES 1996 Preliminary Recommendations on Spoken Texts EAGLES DocumentEAG-TCWG-STPP May 1996[Documento de Internet disponible enhttpwwwilcpicnritEAGLES96spokentxspokentxhtml]

Edwards JA 1992 Design principles in the transcription of spoken discourserdquoDirections in Corpus Linguistics Proceedings of Nobel Symposium 82 Stockholm 4-8 August1991 Ed J Svartvik Berlin Mouton de Gruyter 129-147

Edwards JA 1993 Principles and Contrasting Systems of Discourse TranscriptionrdquoTalking Data Transcription and Coding in Discourse Research Eds JA Edwards y MDLampert Hillsdale Hillsdale NJ Lawrence Erlbaum Associates 3-32

Edwards JA 1995 Principles and alternative systems in the transcription coding andmark-up of spoken discourserdquo Spoken English on Computer Transcription Markup andApplications Eds G Leech G Myers y J Thomas Harlow Longman 19-34

Ehlich K 1993 HIAT A Transcription System for Discourse Datardquo Talking DataTranscription and Coding in Discourse Research Eds JA Edwards y MD Lampert HillsdaleNJ Lawrence Erlbaum Associates 123-148

Eisen B 1993 Reliability of speech segmentation and labelling at different levels oftranscription Eurospeech93 3rd European Conference on Speech Communication andTechnology Berlin Germany 21-23 September 1993 Vol 1 673-676

Esling JH y H Gaylord 1993 Computer Codes for Phonetic Symbols Journal of theInternational Phonetic Association 232 77-82

Esling JH 1988 Computer coding of IPA symbols and detailed phonetic representationsof computer databases Journal of the International Phonetic Association 182 99-106

Esling JH 1990 Computer Coding of the IPA Supplementary Report Journal of theInternational Phonetic Association 201 22-26

Fourcin A y JM Dolmazon (on behalf of the SAM Project) 1991 Speech knowledgestandards and assessment Actes du XIIegraveme Congregraves International des Sciences Phoneacutetiques 19-24 aoucirct 1991 Aix-en-Provence France Aix-en-Provence Universiteacute de Provence Service desPublications Vol 5 430-433

Fourcin A G Harland W Barry y V Hazan eds 1989 Speech Input and OutputAssessment Multilingual Methods and Standards Chichester Ellis Horwood Ltd

French JP 1991 Updated notes for soundprint transcribers Working paper Universityof Birmingham October 1991 NERC-WP4-47

French JP 1992 Transcription proposals multilevel system Working paper Universityof Birmingham October 1992 NERC-WP4-50

Gibbon D 1989 Survey of Prosodic Labelling for EC Languages SAM-UBI-190 12February 1989 Report e6 in ESPRIT 2589 (SAM) Interim Report Year 1 Ref SAM-UCLG002 University College London February 1990

Gibbon D R Moore y R Winski eds 1997 Handbook on Standards and Resources forSpoken Language Systems Berlin Mouton De Gruyter [Documento de Internet disponible en httpcoralliliuni-bielefelddeEAGLESeagbookeagbookhtml]

Groslashnnum Thorsen N 1987 Suprasegmental transcription ARIPUC - Annual Report ofthe Institute of Phonetics University of Copenhagen 21 1-27

Gumperz JJ y J Berenz 1993 Transcribing Conversational Exchangesrdquo Talking DataTranscription and Coding in Discourse Research Eds JA Ewards y M D Lampert HillsdaleNJ Lawrence Erlbaum Associates 91-122

Hart J lsquoT R Collier y A Cohen 1990 A Perceptual Study of Intonation An Experimental- Phonetic Approach to Intonation Cambridge Cambridge University Press (Cambridge Studiesin Speech Science and Communication)

Hess W K Kohler y HG Tillmann 1995 The PhonDat-Verbmobil Speech CorpusEurospeech95 Proceedings of the 4th European Conference on Speech Communication andSpeech Technology Madrid Spain 18-21 September 1995 Vol 1 863-866

Hieronymus JL 1994 ASCII phonetic symbols for the worlds languages WorldbetATampT Bell Laboratories Technical Memo [Documento de Internet disponible enhttpwwwcseogieduCSLUcorporapapershtml]

Hirst D A Di Cristo y R Espesser en prensaLevels of representation and levels ofanalysis for intonation Prosody Theory and Experiments Ed M Horne Dordrecht Kluwer

Hirst DJ y A Di Cristo en prensa A survey of intonation systemsrdquo IntonationSystems A Survey of 20 Languages Eds D Hirst y A Di Cristo Cambridge CambridgeUniversity Press

Hirst DJ 1991 Intonation models towards a third generation Actes du XIIegraveme CongregravesInternational des Sciences Phoneacutetiques 19-24 aoucirct 1991 Aix-en-Provence France Aix-en-Provence Universiteacute de Provence Service des Publications Vol 1 305-310

Hirst DJ A Di Cristo M Le Besnerais Z Najim P Nicolas y P Romeacuteas 1993Multilingual modelling of intonation patternsrdquo Proceedings of an ESCA Workshop on ProsodySeptember 27-29 1993 Lund Sweden Eds D House y P Touati Lund University Departmentof Linguistics and Phonetics Working Papers 41 204-207

Hirst DJ N Ide y J Veacuteronis 1994 Coding fundamental frequency patterns for multi-lingual synthesis with INTSINT in the MULTEXT project Conference Proceedings of theSecond ESCAIEEE Workshop on Speech Synthesis September 12-15 1994 Mohonk MountainHouse New Paltz New York USA 77-80

Ide N y J Veacuteronis eds 1995 The Text Encoding Initiative Background and ContextsComputers and the Humanities 29 1-3 Publicado en forma de libro en Dordrecht KluwerAcademic Publishers

IPA 1989 The IPA 1989 Kiel Convention Workgroup 9 report Computer Coding of IPAsymbols and Computer Representation of Individual Languages Journal of the InternationalPhonetic Association 192 81-92

IPA 1993 IPA Chart revised to 1993 Journal of the International Phonetic Association231 [Documento de Internet disponible en httpwwwartsglaacukIPAipacharthtml]

IPA 1995 Preview of the IPA Handbook Journal of the International Phonetic Association251

ISO 8879 1986 Information Processing Text and Office Systems Standard GeneralizedMarkup Language (SGML) Geneva International Organization for Standardization

Johansson S 1995a The approach of the Text Encoding Initiative to the encoding ofspoken discourse Spoken English on Computer Transcription Markup and Applications EdsG Leech G Myers y J Thomas Harlow Longman 82-98

Johansson S 1995b The Encoding of Spoken Texts Computers and the Humanities291 149-158 The Text Encoding Initiative Background and Context Eds N Ide y J VeacuteronisDordrecht Kluwer Academic Publishers 149-158

Keating P P MacEachern A Shryock y S Domiacutenguez 1994 A manual for phonetictranscription Segmentation and labelling of words in spontaneous speech UCLA WorkingPapers in Phonetics 88 91-120

Kluger-Kruse M 1987 Computer Phonetic Alphabet ESPRIT Linguistic Analysis of theEuropean Languages Report BU-CPA0267 July 1987

Krot C y B Taylor 1995 Criteria for Acoustic-Phonetic Segmentation and WordLabelling in the Australian National Database of Spoken Language[Documento de Internet disponible en httpwwwshlrcmqeduaucriteriahtml]

Lander T 1997 The CSLU Labeling Guide Center for Spoken Language UnderstandingOregon Graduate Institute[Documento de Internet disponible en httpwwwcseogieduCSLUcorporapapershtml]

Llisterri J 1994 Prosody Encoding Survey WP 1 Specifications and Standards T15Markup Specifications Deliverable 153 Final version 15 September 1994 LRE Project 62-050MULTEXT

Llisterri J ed 1996 Prosody Tools Efficiency and Failures WP 4 Corpus T46 SpeechMarkup and Validation Deliverable 452 Final version 15 October 1996 LRE Project 62-050MULTEXT

MacWhinney B 1991The CHILDES Project Tools for Analyzing Talk Hillsdale NJLawrence Erlbaum

Marchal A N Nguyen y W Hardcastle 1995 Multitiered phonetic approach to speechlabelling Levels in Speech Communication Relations and Interactions A Tribute to MaxWajskop Hommage agrave Max Wajskop Eds C Sorin J Mariani H Meloni y J SchoengenAmsterdam Elsevier Science BV 149-158

NERC 1994 NERC-1 Network of European Reference Corpora Final Report PisaInstituto di Linguistica Computazionale - CNR January 1994 versioacuten en curso de publicacioacutenTowards a Network of European Reference Corpora Eds N Calzolari M Baker y PG KruytPisa Giardini

Nicolas P y D Hirst 1995 Symbolic coding of Higher-Level Characteristics ofFundamental Frequency Curvesrdquo Eurospeech95 Proceedings of the 4th European Conferenceon Speech Communication and Technology Madrid Spain 18-21 September 1995 Vol 2 989-992

OConnell DC y S Kowal 1994 Some Current Transcription Systems for SpokenDiscourse A critical Analysis Pragmatics 4 81-107

Ochs E 1979 Transcription as Theory Developmental Pragmatics Eds E Ochs E yBB Schieffelin New York Academic Press 43-72

Payne J 1992 Report on the compatibility of JP Frenchs spoken corpus transcriptionconventions with the TEI guidelines for transcription of spoken texts Working paper COBUILDBirmingham and IDS Mannheim December 1992 NERC-WP8WP4-122

Payne J 1995 The COBUILD spoken corpus transcription conventions SpokenEnglish on Computer Transcription Markup and Applications Eds G Leech G Myers y JThomas Harlow Longman 203-207

Payratoacute Ll 1995 Transcripcioacuten del discurso coloquialrdquo El espantildeol coloquial Actas del ISimposio sobre Anaacutelisis del Discurso Oral Almeriacutea 23-25 de noviembre de 1994 Ed L CorteacutesRodriacuteguez Almeriacutea Universidad de Almeriacutea Servicio de Publicaciones 43-70

Pierrehumbert J B 1897 (1980) The Phonology and Phonetics of English IntonationPhD Thesis Department of Linguistics MIT Bloomington Indiana University Linguistics Club

Pitrelli J M Beckman y J Hirschberg 1994 Evaluation of prosodic transcriptionlabelling reliability in the ToBI frameworkrdquo Proceedings of the Third International Conference onSpoken Language Processing Yokohama ICSLP Vol 2 123-126

Pullum GK y WA Ladusaw 1996 (1986) Phonetic Symbol Guide Chicago TheUniversity of Chicago Press 2nd edition

Roach P H Roach A Dew y P Rowlands 1990 Phonetic analysis and the automaticsegmentation and labeling of speech sounds Journal of the International Phonetic Association201 15-21

Schmidt MS C Scott y MA Jack 1993 Phonetic transcription standards for Europeannames (ONOMASTICA) Eurospeech93 3rd European Conference on Speech Communicationand Technology Berlin Germany 21-23 September 1993 Vol 1 279-282

Schuetze-Coburn S 1991Units of intonation in discourse a comparison of acoustic andauditory analysis Language and Speech 343 207-234

Selting M 1987 Descriptive categories for the auditive analysis of intonation inconversation Journal of Pragmatics 11 777-791

Selting M 1988 The role of intonation in the organisation of repair and problem handlingsequences in conversation Journal of Pragmatics 12 293-322

Senia F y JG Van Velden 1997 Specifications of orthographic transcription and lexiconconventions LRE-4001 SpeechDat Technical Report SD132 Final version 10 January 1997[Documento de Internet disponible en httpwwwphonetikuni-muenchendeSpeechDathtml]

Silverman K M Beckman J Pitrelli M Ostendorf C Wightman P Price JPierrehumbert y J Hirschberg 1992 TOBI A standard for labelling English prosodyProceedings of the Second International Conference on Spoken Language Processing ICSLP-92Banff October 1992 867-870

Sinclair J 1994 Spoken Language [3B] PhoneticPhonemic and Prosodic Annotation[52] NERC 1994 NERC-1 Network of European Reference Corpora Final Report PisaVersioacuten en curso de publicacioacuten Towards a Network of European Reference Corpora Eds NCalzolari M Baker y PG Kruyt Pisa Giardini

Sinclair J 1995 From theory to practicerdquo Spoken English on Computer TranscriptionMarkup and Applications Eds G Leech G Myers Y J Thomas Harlow Longman 99- 112

Sperberg-McQueen CM y L Burnard eds 1994 Guidelines for Electronic Text Encodingand Interchange TEI P3 Chicago and Oxford Association for Computational Linguistics Association for Computers and the Humanities Association for Literary and LinguisticComputing [Cap 11 Transcriptions of Speech] [Documento de Internet disponible enhttpetextvirginiaeduTEIhtml]

Strangert E y M Heldner 1995 Labelling of boundaries and prominences byphonetically experienced and non-experienced transcribers Phonum 3 Reports from theDepartment of Phonetics Umearing University 85-109 [Documento de Internet disponible enhttpwwwlingumusefonphonum3html]

Teubert W 1993 Phonetic Phonemic and Prosodic Annotation Final Report IDSMannheim February 1993 NERC-WP8-171

Tillmann HG y B Pompino-Marschall 1993 Theoretical Principles ConcerningSegmentation Labelling Strategies and Levels of Categorical Annotation for Spoken LanguageDatabase Systems Eurospeech93 3rd European Conference on Speech Communication andTechnology Berlin Germany 21-23 September 1993 Vol 3 1691-1694

Trancoso I 1995 The ONOMASTICA Interlanguage Pronunciation LexiconrdquoEurospeech95 Proceedings of the 4th European Conference on Speech Communication andTechnology Madrid Spain 18-21 September 1995 Vol 1 829-832

Wells JC 1987 Computer Coded Phonetic Transcription Journal of the InternationalPhonetic Association 172 94-114

Wells JC 1989 Computer-coded phonemic notation of individual languages of theEuropean Community Journal of the International Phonetic Association 191 31-54

Wells JC 1994 Computer-coding the IPA a proposed extension of SAMPA SpeechHearing and Language Work in Progress 1994 (University College London Department ofPhonetics and Linguistics) 8 271-289

Wells JC 1995 SAMPROSA (SAM Prosodic Transcription [Documento de Internetdisponible en httpwwwphonuclacukhomesampasamprosahtm]

Wells JC W Barry M Grice A Fourcin y D Gibbon 1992 Standard Computer-Compatible Transcription SAM Stage Report Sen3 SAM UCL-037 28 February 1992 SAM(1992) Esprit Project 2589 (SAM) Multilingual Speech InputOutput AssessmentMethodologyand Standardisation Final Report Year Three 1III91-28II1992 London University CollegeLondon

Wesenick M-B y F Schiel 1995 Feasibility of Automatic Annotation and BuildingPronunciation Lexica from Corpus Material LRE-63314 SpeechDat Report D3123 Finalversion 10 October 1995[Documento de Internet disponible en httpwwwicpgrenetfrSpeechDathomehtml]

Winski R R Moore y D Gibbon 1995 EAGLES Spoken Language Working GroupOverview and Resultsrdquo Eurospeech95 Proceedings of the 4th European Conference on SpeechCommunication and Speech Technology Madrid Spain 18-21 September 1995 Vol 1 841-844[Documento de Internet disponible en httpcoralliliuni-bielefeldde~gibbonEAGLESrwpaperrwpaperhtml]

  • 1- INTRODUCCIOacuteN
  • 2- NIVELES DE REPRESENTACIOacuteN ETIQUETADO Y CODIFICACIOacuteN
  • 3- REPRESENTACIOacuteN ORTOGRAacuteFICA DE CORPUS ORALES
  • 31- Propuestas para la representacioacuten ortograacutefica de corpus orales en el aacutembito de la linguumliacutestica de corpus
  • 32- Propuestas para la representacioacuten ortograacutefica de corpus orales en el aacutembito de las tecnologiacuteas del habla
  • 4- REPRESENTACIOacuteN FONEacuteTICA DE CORPUS ORALES
  • 41- La representacioacuten foneacutetica de los elementos segmentales
  • 42- La representacioacuten foneacutetica de los elementos suprasegmentales
  • 5- ETIQUETADO FONEacuteTICO DE CORPUS ORALES
  • 51- Niveles de etiquetado foneacutetico de corpus orales
  • 52- La transcripcioacuten y el etiquetado automaacutetico de corpus orales
  • 6- TRANSCRIPCIOacuteN Y CODIFICACIOacuteN DE CORPUS PARA EL ANAacuteLISIS DE LA LENGUA ORAL
  • 61- Los requisitos de una transcripcioacuten
  • 62- Propuestas de estandarizacioacuten para la transcripcioacuten y codificacioacuten de corpus orales
  • 7- CONCLUSIONES
  • BIBLIOGRAFIacuteA
Page 16: Transcripción, etiquetado y codificación de corpus orales

interviene simultaacuteneamente maacutes de un hablantePausa (pause) ltpausegt Interrupcioacuten de la fonacioacuten percibida entre dos enunciados o en el

interior de los mismos puede describirse en teacuterminos relativos oindicando su duracioacuten

Vocal (vocal) ltvocalgt Elemento vocalizado semi-leacutexico o no leacutexico (pej pausas llenas otoses)

Kineacutesico (kinesic) ltkinesicgt Cualquier fenoacutemeno comunicativo no vocal (p ej gestos)Acontecimiento (event) lteventgt Cualquier fenoacutemeno identificado en la grabacioacuten no necesariamente

vocalizado ni con valor comunicativo (p ej ruidos de fondo)Texto escrito (writing) ltwritinggt Texto escrito que se presenta al hablante durante su intervencioacutenCambio (shift) ltshiftgt Momento en el que se produce un cambio en alguno de los rasgos

paralinguumliacutesticos - calidad de voz intensidad rango tonal ritmo yvelocidad de elocucioacuten - cada uno de los rasgos puede describirsemediante una lista de caracteriacutesticas

Tabla 1 Elementos codificados en las transcripciones de lengua oral seguacuten los estaacutendares de la TEI(Adaptada de Sperberg-McQueen y Burnard eds1994)

Por otra parte la TEI ofrece mecanismos para indicar el comienzo y el final de unfenoacutemeno su duracioacuten y su sincronizacioacuten temporal con otros elementos presenta tambieacuten laposibilidad de marcar unidades inferiores al enunciado - segmentos ltseggt - que permitendelimitar por ejemplo unidades prosoacutedicas e incluye tambieacuten entre sus propuestas las marcasnecesarias para sentildealar fenoacutemenos propios de la lengua hablada como palabras truncadasrepeticiones falsos principios - marcados como ltdelgt (deletion) y especificando el fenoacutemeno -Las partes de la grabacioacuten que el transcriptor no llega a interpretar correctamente - ltuncleargt - ono puede escuchar - ltgapgt - o las correcciones de errores de produccioacuten realizadas por eltranscriptor - ltsicgt para delimitar el error y ltcorrgt para indicar la correccioacuten - son tambieacutenelementos para los cuales la TEI establece marcas de codificacioacuten

Aunque las Guiacuteas de la TEI pueden considerarse un sistema adecuado para la transcripcioacuteny codificacioacuten de gran variedad de materiales los autores propios autores reconocen que

[] the present proposals are not intended to support unmodified every variety of researchundertaken upon spoken material now or in the future some discourse analysts phonologistsand doubtless other may wish to extend the scheme presented here to express more precisely theset of distinctions they wish to draw in their transcriptions Speech regarded as a purely acousticphenomenon may well require different methods from those outlined here as may speechregarded solely as a process of social interaction (Sperberg-McQueen y Burnard eds 1994 cap11)

El proyecto NERC - Network of European Reference Corpora (NERC 1994) se planteoacutecomo uno de sus objetivos la viabilidad de desarrollar una serie de recomendaciones para laconstitucioacuten de corpus y por tanto incluye entre sus resultados indicaciones sobre el tratamientode los corpus orales tanto en lo que se refiere a su codificacioacuten como a la transcripcioacuten de loselementos segmentales y suprasegmentales (Sinclair 1994) El sistema adoptado para latranscripcioacuten y codificacioacuten de corpus se basa como hemos indicado anteriormente en eldesarrollado por French (1991 1992) para la transcripcioacuten del corpus oral desarrollado en elproyecto COBUILD La transcripcioacuten se plantea como una operacioacuten que puede desarrollarse envarios niveles

bull Nivel I consiste en la representacioacuten ortograacutefica introduciendo los miacutenimossignos de puntuacioacuten necesarios sin informacioacuten sobre la interaccioacuten entre hablantes Eneste nivel se contemplan convenciones desarrolladas para la representacioacuten ortograacutefica ypara precisar el uso de la puntuacioacuten

bull Nivel II consiste en una representacioacuten ortograacutefica enriquecida con informacioacutenbaacutesica sobre la identidad de los hablantes el turno de palabra y los elementos no verbales

bull Nivel III contiene toda la informacioacuten presente en el nivel II ademaacutes deinformacioacuten sobre la interaccioacuten entre hablantes - marcando el principio y el final de lossolapamientos - y sobre la entonacioacuten - sentildealando las fronteras entre unidades tonales ylas siacutelabas acentuadas- En opinioacuten de French (1992) la transcripcioacuten a este nivel requiereuna formacioacuten especiacutefica en foneacutetica

bull Nivel IV constituye el nivel maacutes detallado de representacioacuten incluyendo lainformacioacuten propia del nivel III junto con marcas de tonos siacutelabas nucleares y con unatranscripcioacuten fonoloacutegica alineada con una representacioacuten acuacutestica - espectrograma y curvameloacutedica - del enunciado

La recomendacioacuten del proyecto NERC es que la transcripcioacuten de un corpus para el estudiode la lengua oral se lleve a cabo seguacuten las especificaciones del Nivel II adecuado seguacuten Frenchpara todas aquellas investigaciones que no requieran informacioacuten prosoacutedica

En el marco de NERC se llevoacute tambieacuten a cabo una evaluacioacuten de las Guiacuteas de la TEI para latranscripcioacuten de corpus orales de la que se concluye que ldquoThe TEI proposals are broadlycompatible with current practice in the user community as represented by JP Frenchconventions Furthermore in the majority of cases it will be a straightforward matter to link themachine-friendly TEI codes to the more user-friendly encoding systems such as JP Frenchconventions by means of a simple conversion programmerdquo (Payne 199260) La idea de unaconversioacuten automaacutetica entre las transcripciones realizadas seguacuten las propuestas de NERC y de laTEI es naturalmente interesante y refuerza la idea de que existe una compatibilidad general entreambos sistemas (Payne 1992 Johansson 1995a EAGLES 1996) prueba de ello es que en elinforme final de NERC se recomienda el uso de las normas de la TEI

Uno de los objetivos del Grupo de Trabajo sobre Textos Orales de EAGLES fue proponerun conjunto miacutenimo de fenoacutemenos que deberiacutean codificarse en cualquier texto oral La propuestarealizada se describe en EAGLES (1996) y toma elementos del proyecto NERC de la TEI y delGrupo de Trabajo sobre Lengua Oral de EAGLES Considerando los elementos comunes a lossistemas que sirven de base se sugiere que la codificacioacuten de un texto oral debe contener almenos informacioacuten sobre los siguientes aspectos

(1) Elementos vocales y no vocalesbull Elementos vocales semi-leacutexicos

Pertenecen a esta categoriacutea los elementos utilizados principalmente en elhabla espontaacutenea durante los momentos en que el hablante planifica lacontinuacioacuten de su discurso como las llamadas ldquopausas llenasrdquo o ldquosonorasrdquo y los

elementos que marcan dudas en el momento de la produccioacuten del hablaCorresponden a los elementos que en la TEI se marcan con la etiqueta ltvocalgtbull Elementos vocales no leacutexicos

Se incluyen aquiacute todo tipo de sonidos producidos por el hablante - tosesrisas bostezos estornudos etc - que no constituyen formas leacutexicas de la lenguaCorresponden igualmente a los codificados con la marca ltvocalgt en la TEIbull Acontecimientos no vocales y no comunicativos

Comprenden los ruidos producidos por otros hablantes o procedentes delentorno de grabacioacuten Estos acontecimientos se codifican en la TEI mediante lamarca lteventgt

(2) Elementos necesarios en la transcripcioacuten de interacciones verbalesbull Identidad del hablante

Este es un elemento imprescindible en la transcripcioacuten de interaccionesverbales La TEI dispone de los mecanismos para documentar informacioacuten sobrelos hablantes en la cabecera de los textos asiacute como de un sistema para marcar laidentidad de cada participante en el interior del texto aunque pueden utilizarsetambieacuten otros procedimientosbull Turnos de palabra

La finalidad del marcado de los turnos de palabra es indicar un cambio dehablante Ademaacutes de las convenciones de la TEI pueden emplearse otrosprocedimientos mientras se mantenga esta informacioacuten esencial en el estudio de lainteraccioacuten verbalbull Superposicioacuten de turnos de palabra

Existen igualmente diferentes procedimientos para marcar la superposicioacutende emisiones de dos hablantes ademaacutes de las propuestas de la TEI que los tratacomo parte de las estrategias para codificar acontecimientos simultaacuteneos

(3) Elementos relacionados con la actuacioacuten del hablantebull Omisiones en un texto leiacutedo

Si se transcribe un texto leiacutedo y se dispone del original es recomendableanotar las palabras o segmentos omitidos por el locutorbull Autocorrecciones

Es propio del habla espontaacutenea aunque tambieacuten de la lectura que loshablantes realicen correcciones de su propia produccioacuten linguumliacutestica (self-repairs)Parece conveniente marcarlas en la transcripcioacuten de un corpus oralbull Fragmentos de palabras

Los fragmentos de palabras corresponden a uno o maacutes segmentospertenecientes a una palabra que no ha sido totalmente pronunciada por el hablanteen un primer intento y que suelen repetirse cuando eacuteste consigue producir lapalabra completa Es importante indicar este fenoacutemeno en la transcripcioacuten

bull Fragmentos ininteligiblesSe trata de partes de la grabacioacuten que no son comprendidas por el

transcriptor y en la TEI se codifican con la etiqueta ltuncleargt aunque si se desease pueden utilizar marcas maacutes detalladas distinguiendo entre transcripcionescompletamente ininteligibles y entre una posible interpretacioacuten ofrecida por eltranscriptor

Un aspecto conflictivo sigue siendo la identificacioacuten de los enunciados que conforman untexto oral (Schuetze-Coburn 1991) Mientras que en un texto escrito los signos de puntuacioacutenconstituyen un criterio de delimitacioacuten en el habla disponemos de indicios como las pausas laentonacioacuten o el cambio de turno de palabra que nos permiten al menos convencionalmentedefinir un enunciado Sin embargo hasta el momento no se han desarrollado auacuten criteriosobjetivos y consistentes para resolver este problema

7- CONCLUSIONES

La revisioacuten - sin pretensiones de exhaustividad - de los principales sistemas detranscripcioacuten etiquetado y codificacioacuten de corpus orales expuesta en este trabajo pone demanifiesto en primer lugar la multiplicidad de propuestas desarrolladas frente a los intentos deestandarizacioacuten algunos de los cuales auacuten no se han consolidado plenamente pese a su crecienteaceptacioacuten En segundo lugar destaca tambieacuten la heterogeneidad de tradiciones que confluyen enel estudio de la lengua hablada desde la foneacutetica y las tecnologiacuteas del habla hasta el anaacutelisis deldiscurso y de la conversacioacuten diversidad que lleva a la creacioacuten de convenciones especiacuteficas pararesponder a las necesidades de diversas comunidades cientiacuteficas Ante esta situacioacuten la distincioacutenpropuesta por Sinclair (1995107) entre ldquoconformidadrdquo y ldquocompatibilidadrdquo adquiere todo susentido ya que si en ciertos casos la conformidad a un estaacutendar determinado es problemaacutetica porlas limitaciones inherentes a todo sistema comuacuten la compatibilidad - entendida como la facilidadde conversioacuten entre sistemas - deberiacutea ser en cambio un requisito imprescindible en el desarrollode los recursos linguumliacutesticos De esta manera puede tal alcanzarse el equilibrio entre lasnecesidades de un proyecto y las indudables ventajas cientiacuteficas y econoacutemicas que resultan de lareutilizacioacuten de los datos disponibles

BIBLIOGRAFIacuteA

Allen GD 1988 The PHONASCII System Journal of the International PhoneticAssociation 181 9-25

Anderson AH M Badger EG Bard E Boyle G Doherty S Garrod S Isard JKowtko J Mcallister J Miller C Sotillo HS Thompson y R Weinert 1991 The HCRCMap Task corpus Language and Speech 344 351-366

Autesserre D G Peacuterennou y M Rossi 1989 Methodology for the transcription andlabeling of a speech corpus Journal of the International Phonetic Association 191 2-15

Barry WJ y AJ Fourcin 1992 Levels of Labelling Computer Speech and Language 61-14

Beckman ME y GM Ayers GM 1994 Guidelines for ToBI Labelling Version 20February 1994[Documento de Internet disponible en httplingohio-stateeduPhoneticsToBIToBI0html]

Beckman ME y J Hirschberg J 1994 The ToBI Annotation Conventions Apeacutendice A deME Beckman y GM Ayers 1994 Guidelines for ToBI Labelling Version 20 February 1994[Documento de Internet disponible en httplingohio-stateeduPhoneticsToBIToBI0html]

Bruce G 1988 23 Supasegmental categories and 24 The symbolization of temporalevents Journal of the International Phonetic Association 182 75-76

Bruce G 1989 Report from the IPA working group on suprasegmental categories LundUniversity Department of Linguistics General Linguistics Phonetics Working Papers 35 25-40

Burnard L 1995 What is SGML and how does it help Computers and the Humanities291 41-50 The Text Encoding Initiative Background and Context Eds N Ide y J VeacuteronisDordrecht Kluwer Academic Publishers

Burnard L 1995a Text Encoding for Information Exchange An Introduction to the TextEncoding Initiaive TEI Document TEI J31 [Documento de Internet disponible enhttpwwwuiceduorgsteiinfoteij31]

Burnard L 1995b The Text Encoding Initiative an overviewrdquo Spoken English onComputer Transcription Markup and Applications Eds G LEECH G MYERS y JTHOMAS Harlow Longman 69-81

Chafe W 1995 Adequacy user-friendliness and practicality in transcribingrdquo English onComputer Transcription Markup and Applications Eds G Leech G Myers y J ThomasHarlow Longman 54-61

Chan D A Fourcin D Gibbon B Granstroumlm M Huckvale G Kokkinakis K KvaleL Lamel B Lindberg A Moreno J Mouropoulos F Senia I Trancoso C Veld y J Zeiliger1995 EUROM - A Spoken Language Resource for the EU Eurospeech95 Proceedings of the4th European Conference on Speech Communication and Speech Technology Madrid Spain 18-21 September 1995 Vol 1 867-870

Cole RA BT Oshika M Noel T Lander y M Fanty 1994 Labeler Agreement inPhonetic Labeling of Continuous Speech Proceedings of the 1994 International Conference onSpoken Language Processing Yokohama Japan 18-22 September 1994[Documento de Internet disponible en httpwwwcseogieduCSLUcorporapapershtml]

Cook G 1995 Theoretical issues transcribing the untranscribablerdquo Spoken English onComputer Transcription Markup and Applications Eds G Leech G Myers y J ThomasHarlow Longman 35-53

Du Bois JW 1991 Transcription design principles for spoken discourse researchPragmatics 1 71-106

Du Bois JW S Schuetze-Coburn S Cumming y D Paolino 1993 Outline of discoursetranscriptionrdquo Talking Data Transcription and Coding in Discourse Research Eds JAEdwards y MD Lampert Hillsdale NJ Lawrence Erlbaum Associates 45-90

EAGLES 1996 Preliminary Recommendations on Spoken Texts EAGLES DocumentEAG-TCWG-STPP May 1996[Documento de Internet disponible enhttpwwwilcpicnritEAGLES96spokentxspokentxhtml]

Edwards JA 1992 Design principles in the transcription of spoken discourserdquoDirections in Corpus Linguistics Proceedings of Nobel Symposium 82 Stockholm 4-8 August1991 Ed J Svartvik Berlin Mouton de Gruyter 129-147

Edwards JA 1993 Principles and Contrasting Systems of Discourse TranscriptionrdquoTalking Data Transcription and Coding in Discourse Research Eds JA Edwards y MDLampert Hillsdale Hillsdale NJ Lawrence Erlbaum Associates 3-32

Edwards JA 1995 Principles and alternative systems in the transcription coding andmark-up of spoken discourserdquo Spoken English on Computer Transcription Markup andApplications Eds G Leech G Myers y J Thomas Harlow Longman 19-34

Ehlich K 1993 HIAT A Transcription System for Discourse Datardquo Talking DataTranscription and Coding in Discourse Research Eds JA Edwards y MD Lampert HillsdaleNJ Lawrence Erlbaum Associates 123-148

Eisen B 1993 Reliability of speech segmentation and labelling at different levels oftranscription Eurospeech93 3rd European Conference on Speech Communication andTechnology Berlin Germany 21-23 September 1993 Vol 1 673-676

Esling JH y H Gaylord 1993 Computer Codes for Phonetic Symbols Journal of theInternational Phonetic Association 232 77-82

Esling JH 1988 Computer coding of IPA symbols and detailed phonetic representationsof computer databases Journal of the International Phonetic Association 182 99-106

Esling JH 1990 Computer Coding of the IPA Supplementary Report Journal of theInternational Phonetic Association 201 22-26

Fourcin A y JM Dolmazon (on behalf of the SAM Project) 1991 Speech knowledgestandards and assessment Actes du XIIegraveme Congregraves International des Sciences Phoneacutetiques 19-24 aoucirct 1991 Aix-en-Provence France Aix-en-Provence Universiteacute de Provence Service desPublications Vol 5 430-433

Fourcin A G Harland W Barry y V Hazan eds 1989 Speech Input and OutputAssessment Multilingual Methods and Standards Chichester Ellis Horwood Ltd

French JP 1991 Updated notes for soundprint transcribers Working paper Universityof Birmingham October 1991 NERC-WP4-47

French JP 1992 Transcription proposals multilevel system Working paper Universityof Birmingham October 1992 NERC-WP4-50

Gibbon D 1989 Survey of Prosodic Labelling for EC Languages SAM-UBI-190 12February 1989 Report e6 in ESPRIT 2589 (SAM) Interim Report Year 1 Ref SAM-UCLG002 University College London February 1990

Gibbon D R Moore y R Winski eds 1997 Handbook on Standards and Resources forSpoken Language Systems Berlin Mouton De Gruyter [Documento de Internet disponible en httpcoralliliuni-bielefelddeEAGLESeagbookeagbookhtml]

Groslashnnum Thorsen N 1987 Suprasegmental transcription ARIPUC - Annual Report ofthe Institute of Phonetics University of Copenhagen 21 1-27

Gumperz JJ y J Berenz 1993 Transcribing Conversational Exchangesrdquo Talking DataTranscription and Coding in Discourse Research Eds JA Ewards y M D Lampert HillsdaleNJ Lawrence Erlbaum Associates 91-122

Hart J lsquoT R Collier y A Cohen 1990 A Perceptual Study of Intonation An Experimental- Phonetic Approach to Intonation Cambridge Cambridge University Press (Cambridge Studiesin Speech Science and Communication)

Hess W K Kohler y HG Tillmann 1995 The PhonDat-Verbmobil Speech CorpusEurospeech95 Proceedings of the 4th European Conference on Speech Communication andSpeech Technology Madrid Spain 18-21 September 1995 Vol 1 863-866

Hieronymus JL 1994 ASCII phonetic symbols for the worlds languages WorldbetATampT Bell Laboratories Technical Memo [Documento de Internet disponible enhttpwwwcseogieduCSLUcorporapapershtml]

Hirst D A Di Cristo y R Espesser en prensaLevels of representation and levels ofanalysis for intonation Prosody Theory and Experiments Ed M Horne Dordrecht Kluwer

Hirst DJ y A Di Cristo en prensa A survey of intonation systemsrdquo IntonationSystems A Survey of 20 Languages Eds D Hirst y A Di Cristo Cambridge CambridgeUniversity Press

Hirst DJ 1991 Intonation models towards a third generation Actes du XIIegraveme CongregravesInternational des Sciences Phoneacutetiques 19-24 aoucirct 1991 Aix-en-Provence France Aix-en-Provence Universiteacute de Provence Service des Publications Vol 1 305-310

Hirst DJ A Di Cristo M Le Besnerais Z Najim P Nicolas y P Romeacuteas 1993Multilingual modelling of intonation patternsrdquo Proceedings of an ESCA Workshop on ProsodySeptember 27-29 1993 Lund Sweden Eds D House y P Touati Lund University Departmentof Linguistics and Phonetics Working Papers 41 204-207

Hirst DJ N Ide y J Veacuteronis 1994 Coding fundamental frequency patterns for multi-lingual synthesis with INTSINT in the MULTEXT project Conference Proceedings of theSecond ESCAIEEE Workshop on Speech Synthesis September 12-15 1994 Mohonk MountainHouse New Paltz New York USA 77-80

Ide N y J Veacuteronis eds 1995 The Text Encoding Initiative Background and ContextsComputers and the Humanities 29 1-3 Publicado en forma de libro en Dordrecht KluwerAcademic Publishers

IPA 1989 The IPA 1989 Kiel Convention Workgroup 9 report Computer Coding of IPAsymbols and Computer Representation of Individual Languages Journal of the InternationalPhonetic Association 192 81-92

IPA 1993 IPA Chart revised to 1993 Journal of the International Phonetic Association231 [Documento de Internet disponible en httpwwwartsglaacukIPAipacharthtml]

IPA 1995 Preview of the IPA Handbook Journal of the International Phonetic Association251

ISO 8879 1986 Information Processing Text and Office Systems Standard GeneralizedMarkup Language (SGML) Geneva International Organization for Standardization

Johansson S 1995a The approach of the Text Encoding Initiative to the encoding ofspoken discourse Spoken English on Computer Transcription Markup and Applications EdsG Leech G Myers y J Thomas Harlow Longman 82-98

Johansson S 1995b The Encoding of Spoken Texts Computers and the Humanities291 149-158 The Text Encoding Initiative Background and Context Eds N Ide y J VeacuteronisDordrecht Kluwer Academic Publishers 149-158

Keating P P MacEachern A Shryock y S Domiacutenguez 1994 A manual for phonetictranscription Segmentation and labelling of words in spontaneous speech UCLA WorkingPapers in Phonetics 88 91-120

Kluger-Kruse M 1987 Computer Phonetic Alphabet ESPRIT Linguistic Analysis of theEuropean Languages Report BU-CPA0267 July 1987

Krot C y B Taylor 1995 Criteria for Acoustic-Phonetic Segmentation and WordLabelling in the Australian National Database of Spoken Language[Documento de Internet disponible en httpwwwshlrcmqeduaucriteriahtml]

Lander T 1997 The CSLU Labeling Guide Center for Spoken Language UnderstandingOregon Graduate Institute[Documento de Internet disponible en httpwwwcseogieduCSLUcorporapapershtml]

Llisterri J 1994 Prosody Encoding Survey WP 1 Specifications and Standards T15Markup Specifications Deliverable 153 Final version 15 September 1994 LRE Project 62-050MULTEXT

Llisterri J ed 1996 Prosody Tools Efficiency and Failures WP 4 Corpus T46 SpeechMarkup and Validation Deliverable 452 Final version 15 October 1996 LRE Project 62-050MULTEXT

MacWhinney B 1991The CHILDES Project Tools for Analyzing Talk Hillsdale NJLawrence Erlbaum

Marchal A N Nguyen y W Hardcastle 1995 Multitiered phonetic approach to speechlabelling Levels in Speech Communication Relations and Interactions A Tribute to MaxWajskop Hommage agrave Max Wajskop Eds C Sorin J Mariani H Meloni y J SchoengenAmsterdam Elsevier Science BV 149-158

NERC 1994 NERC-1 Network of European Reference Corpora Final Report PisaInstituto di Linguistica Computazionale - CNR January 1994 versioacuten en curso de publicacioacutenTowards a Network of European Reference Corpora Eds N Calzolari M Baker y PG KruytPisa Giardini

Nicolas P y D Hirst 1995 Symbolic coding of Higher-Level Characteristics ofFundamental Frequency Curvesrdquo Eurospeech95 Proceedings of the 4th European Conferenceon Speech Communication and Technology Madrid Spain 18-21 September 1995 Vol 2 989-992

OConnell DC y S Kowal 1994 Some Current Transcription Systems for SpokenDiscourse A critical Analysis Pragmatics 4 81-107

Ochs E 1979 Transcription as Theory Developmental Pragmatics Eds E Ochs E yBB Schieffelin New York Academic Press 43-72

Payne J 1992 Report on the compatibility of JP Frenchs spoken corpus transcriptionconventions with the TEI guidelines for transcription of spoken texts Working paper COBUILDBirmingham and IDS Mannheim December 1992 NERC-WP8WP4-122

Payne J 1995 The COBUILD spoken corpus transcription conventions SpokenEnglish on Computer Transcription Markup and Applications Eds G Leech G Myers y JThomas Harlow Longman 203-207

Payratoacute Ll 1995 Transcripcioacuten del discurso coloquialrdquo El espantildeol coloquial Actas del ISimposio sobre Anaacutelisis del Discurso Oral Almeriacutea 23-25 de noviembre de 1994 Ed L CorteacutesRodriacuteguez Almeriacutea Universidad de Almeriacutea Servicio de Publicaciones 43-70

Pierrehumbert J B 1897 (1980) The Phonology and Phonetics of English IntonationPhD Thesis Department of Linguistics MIT Bloomington Indiana University Linguistics Club

Pitrelli J M Beckman y J Hirschberg 1994 Evaluation of prosodic transcriptionlabelling reliability in the ToBI frameworkrdquo Proceedings of the Third International Conference onSpoken Language Processing Yokohama ICSLP Vol 2 123-126

Pullum GK y WA Ladusaw 1996 (1986) Phonetic Symbol Guide Chicago TheUniversity of Chicago Press 2nd edition

Roach P H Roach A Dew y P Rowlands 1990 Phonetic analysis and the automaticsegmentation and labeling of speech sounds Journal of the International Phonetic Association201 15-21

Schmidt MS C Scott y MA Jack 1993 Phonetic transcription standards for Europeannames (ONOMASTICA) Eurospeech93 3rd European Conference on Speech Communicationand Technology Berlin Germany 21-23 September 1993 Vol 1 279-282

Schuetze-Coburn S 1991Units of intonation in discourse a comparison of acoustic andauditory analysis Language and Speech 343 207-234

Selting M 1987 Descriptive categories for the auditive analysis of intonation inconversation Journal of Pragmatics 11 777-791

Selting M 1988 The role of intonation in the organisation of repair and problem handlingsequences in conversation Journal of Pragmatics 12 293-322

Senia F y JG Van Velden 1997 Specifications of orthographic transcription and lexiconconventions LRE-4001 SpeechDat Technical Report SD132 Final version 10 January 1997[Documento de Internet disponible en httpwwwphonetikuni-muenchendeSpeechDathtml]

Silverman K M Beckman J Pitrelli M Ostendorf C Wightman P Price JPierrehumbert y J Hirschberg 1992 TOBI A standard for labelling English prosodyProceedings of the Second International Conference on Spoken Language Processing ICSLP-92Banff October 1992 867-870

Sinclair J 1994 Spoken Language [3B] PhoneticPhonemic and Prosodic Annotation[52] NERC 1994 NERC-1 Network of European Reference Corpora Final Report PisaVersioacuten en curso de publicacioacuten Towards a Network of European Reference Corpora Eds NCalzolari M Baker y PG Kruyt Pisa Giardini

Sinclair J 1995 From theory to practicerdquo Spoken English on Computer TranscriptionMarkup and Applications Eds G Leech G Myers Y J Thomas Harlow Longman 99- 112

Sperberg-McQueen CM y L Burnard eds 1994 Guidelines for Electronic Text Encodingand Interchange TEI P3 Chicago and Oxford Association for Computational Linguistics Association for Computers and the Humanities Association for Literary and LinguisticComputing [Cap 11 Transcriptions of Speech] [Documento de Internet disponible enhttpetextvirginiaeduTEIhtml]

Strangert E y M Heldner 1995 Labelling of boundaries and prominences byphonetically experienced and non-experienced transcribers Phonum 3 Reports from theDepartment of Phonetics Umearing University 85-109 [Documento de Internet disponible enhttpwwwlingumusefonphonum3html]

Teubert W 1993 Phonetic Phonemic and Prosodic Annotation Final Report IDSMannheim February 1993 NERC-WP8-171

Tillmann HG y B Pompino-Marschall 1993 Theoretical Principles ConcerningSegmentation Labelling Strategies and Levels of Categorical Annotation for Spoken LanguageDatabase Systems Eurospeech93 3rd European Conference on Speech Communication andTechnology Berlin Germany 21-23 September 1993 Vol 3 1691-1694

Trancoso I 1995 The ONOMASTICA Interlanguage Pronunciation LexiconrdquoEurospeech95 Proceedings of the 4th European Conference on Speech Communication andTechnology Madrid Spain 18-21 September 1995 Vol 1 829-832

Wells JC 1987 Computer Coded Phonetic Transcription Journal of the InternationalPhonetic Association 172 94-114

Wells JC 1989 Computer-coded phonemic notation of individual languages of theEuropean Community Journal of the International Phonetic Association 191 31-54

Wells JC 1994 Computer-coding the IPA a proposed extension of SAMPA SpeechHearing and Language Work in Progress 1994 (University College London Department ofPhonetics and Linguistics) 8 271-289

Wells JC 1995 SAMPROSA (SAM Prosodic Transcription [Documento de Internetdisponible en httpwwwphonuclacukhomesampasamprosahtm]

Wells JC W Barry M Grice A Fourcin y D Gibbon 1992 Standard Computer-Compatible Transcription SAM Stage Report Sen3 SAM UCL-037 28 February 1992 SAM(1992) Esprit Project 2589 (SAM) Multilingual Speech InputOutput AssessmentMethodologyand Standardisation Final Report Year Three 1III91-28II1992 London University CollegeLondon

Wesenick M-B y F Schiel 1995 Feasibility of Automatic Annotation and BuildingPronunciation Lexica from Corpus Material LRE-63314 SpeechDat Report D3123 Finalversion 10 October 1995[Documento de Internet disponible en httpwwwicpgrenetfrSpeechDathomehtml]

Winski R R Moore y D Gibbon 1995 EAGLES Spoken Language Working GroupOverview and Resultsrdquo Eurospeech95 Proceedings of the 4th European Conference on SpeechCommunication and Speech Technology Madrid Spain 18-21 September 1995 Vol 1 841-844[Documento de Internet disponible en httpcoralliliuni-bielefeldde~gibbonEAGLESrwpaperrwpaperhtml]

  • 1- INTRODUCCIOacuteN
  • 2- NIVELES DE REPRESENTACIOacuteN ETIQUETADO Y CODIFICACIOacuteN
  • 3- REPRESENTACIOacuteN ORTOGRAacuteFICA DE CORPUS ORALES
  • 31- Propuestas para la representacioacuten ortograacutefica de corpus orales en el aacutembito de la linguumliacutestica de corpus
  • 32- Propuestas para la representacioacuten ortograacutefica de corpus orales en el aacutembito de las tecnologiacuteas del habla
  • 4- REPRESENTACIOacuteN FONEacuteTICA DE CORPUS ORALES
  • 41- La representacioacuten foneacutetica de los elementos segmentales
  • 42- La representacioacuten foneacutetica de los elementos suprasegmentales
  • 5- ETIQUETADO FONEacuteTICO DE CORPUS ORALES
  • 51- Niveles de etiquetado foneacutetico de corpus orales
  • 52- La transcripcioacuten y el etiquetado automaacutetico de corpus orales
  • 6- TRANSCRIPCIOacuteN Y CODIFICACIOacuteN DE CORPUS PARA EL ANAacuteLISIS DE LA LENGUA ORAL
  • 61- Los requisitos de una transcripcioacuten
  • 62- Propuestas de estandarizacioacuten para la transcripcioacuten y codificacioacuten de corpus orales
  • 7- CONCLUSIONES
  • BIBLIOGRAFIacuteA
Page 17: Transcripción, etiquetado y codificación de corpus orales

bull Nivel I consiste en la representacioacuten ortograacutefica introduciendo los miacutenimossignos de puntuacioacuten necesarios sin informacioacuten sobre la interaccioacuten entre hablantes Eneste nivel se contemplan convenciones desarrolladas para la representacioacuten ortograacutefica ypara precisar el uso de la puntuacioacuten

bull Nivel II consiste en una representacioacuten ortograacutefica enriquecida con informacioacutenbaacutesica sobre la identidad de los hablantes el turno de palabra y los elementos no verbales

bull Nivel III contiene toda la informacioacuten presente en el nivel II ademaacutes deinformacioacuten sobre la interaccioacuten entre hablantes - marcando el principio y el final de lossolapamientos - y sobre la entonacioacuten - sentildealando las fronteras entre unidades tonales ylas siacutelabas acentuadas- En opinioacuten de French (1992) la transcripcioacuten a este nivel requiereuna formacioacuten especiacutefica en foneacutetica

bull Nivel IV constituye el nivel maacutes detallado de representacioacuten incluyendo lainformacioacuten propia del nivel III junto con marcas de tonos siacutelabas nucleares y con unatranscripcioacuten fonoloacutegica alineada con una representacioacuten acuacutestica - espectrograma y curvameloacutedica - del enunciado

La recomendacioacuten del proyecto NERC es que la transcripcioacuten de un corpus para el estudiode la lengua oral se lleve a cabo seguacuten las especificaciones del Nivel II adecuado seguacuten Frenchpara todas aquellas investigaciones que no requieran informacioacuten prosoacutedica

En el marco de NERC se llevoacute tambieacuten a cabo una evaluacioacuten de las Guiacuteas de la TEI para latranscripcioacuten de corpus orales de la que se concluye que ldquoThe TEI proposals are broadlycompatible with current practice in the user community as represented by JP Frenchconventions Furthermore in the majority of cases it will be a straightforward matter to link themachine-friendly TEI codes to the more user-friendly encoding systems such as JP Frenchconventions by means of a simple conversion programmerdquo (Payne 199260) La idea de unaconversioacuten automaacutetica entre las transcripciones realizadas seguacuten las propuestas de NERC y de laTEI es naturalmente interesante y refuerza la idea de que existe una compatibilidad general entreambos sistemas (Payne 1992 Johansson 1995a EAGLES 1996) prueba de ello es que en elinforme final de NERC se recomienda el uso de las normas de la TEI

Uno de los objetivos del Grupo de Trabajo sobre Textos Orales de EAGLES fue proponerun conjunto miacutenimo de fenoacutemenos que deberiacutean codificarse en cualquier texto oral La propuestarealizada se describe en EAGLES (1996) y toma elementos del proyecto NERC de la TEI y delGrupo de Trabajo sobre Lengua Oral de EAGLES Considerando los elementos comunes a lossistemas que sirven de base se sugiere que la codificacioacuten de un texto oral debe contener almenos informacioacuten sobre los siguientes aspectos

(1) Elementos vocales y no vocalesbull Elementos vocales semi-leacutexicos

Pertenecen a esta categoriacutea los elementos utilizados principalmente en elhabla espontaacutenea durante los momentos en que el hablante planifica lacontinuacioacuten de su discurso como las llamadas ldquopausas llenasrdquo o ldquosonorasrdquo y los

elementos que marcan dudas en el momento de la produccioacuten del hablaCorresponden a los elementos que en la TEI se marcan con la etiqueta ltvocalgtbull Elementos vocales no leacutexicos

Se incluyen aquiacute todo tipo de sonidos producidos por el hablante - tosesrisas bostezos estornudos etc - que no constituyen formas leacutexicas de la lenguaCorresponden igualmente a los codificados con la marca ltvocalgt en la TEIbull Acontecimientos no vocales y no comunicativos

Comprenden los ruidos producidos por otros hablantes o procedentes delentorno de grabacioacuten Estos acontecimientos se codifican en la TEI mediante lamarca lteventgt

(2) Elementos necesarios en la transcripcioacuten de interacciones verbalesbull Identidad del hablante

Este es un elemento imprescindible en la transcripcioacuten de interaccionesverbales La TEI dispone de los mecanismos para documentar informacioacuten sobrelos hablantes en la cabecera de los textos asiacute como de un sistema para marcar laidentidad de cada participante en el interior del texto aunque pueden utilizarsetambieacuten otros procedimientosbull Turnos de palabra

La finalidad del marcado de los turnos de palabra es indicar un cambio dehablante Ademaacutes de las convenciones de la TEI pueden emplearse otrosprocedimientos mientras se mantenga esta informacioacuten esencial en el estudio de lainteraccioacuten verbalbull Superposicioacuten de turnos de palabra

Existen igualmente diferentes procedimientos para marcar la superposicioacutende emisiones de dos hablantes ademaacutes de las propuestas de la TEI que los tratacomo parte de las estrategias para codificar acontecimientos simultaacuteneos

(3) Elementos relacionados con la actuacioacuten del hablantebull Omisiones en un texto leiacutedo

Si se transcribe un texto leiacutedo y se dispone del original es recomendableanotar las palabras o segmentos omitidos por el locutorbull Autocorrecciones

Es propio del habla espontaacutenea aunque tambieacuten de la lectura que loshablantes realicen correcciones de su propia produccioacuten linguumliacutestica (self-repairs)Parece conveniente marcarlas en la transcripcioacuten de un corpus oralbull Fragmentos de palabras

Los fragmentos de palabras corresponden a uno o maacutes segmentospertenecientes a una palabra que no ha sido totalmente pronunciada por el hablanteen un primer intento y que suelen repetirse cuando eacuteste consigue producir lapalabra completa Es importante indicar este fenoacutemeno en la transcripcioacuten

bull Fragmentos ininteligiblesSe trata de partes de la grabacioacuten que no son comprendidas por el

transcriptor y en la TEI se codifican con la etiqueta ltuncleargt aunque si se desease pueden utilizar marcas maacutes detalladas distinguiendo entre transcripcionescompletamente ininteligibles y entre una posible interpretacioacuten ofrecida por eltranscriptor

Un aspecto conflictivo sigue siendo la identificacioacuten de los enunciados que conforman untexto oral (Schuetze-Coburn 1991) Mientras que en un texto escrito los signos de puntuacioacutenconstituyen un criterio de delimitacioacuten en el habla disponemos de indicios como las pausas laentonacioacuten o el cambio de turno de palabra que nos permiten al menos convencionalmentedefinir un enunciado Sin embargo hasta el momento no se han desarrollado auacuten criteriosobjetivos y consistentes para resolver este problema

7- CONCLUSIONES

La revisioacuten - sin pretensiones de exhaustividad - de los principales sistemas detranscripcioacuten etiquetado y codificacioacuten de corpus orales expuesta en este trabajo pone demanifiesto en primer lugar la multiplicidad de propuestas desarrolladas frente a los intentos deestandarizacioacuten algunos de los cuales auacuten no se han consolidado plenamente pese a su crecienteaceptacioacuten En segundo lugar destaca tambieacuten la heterogeneidad de tradiciones que confluyen enel estudio de la lengua hablada desde la foneacutetica y las tecnologiacuteas del habla hasta el anaacutelisis deldiscurso y de la conversacioacuten diversidad que lleva a la creacioacuten de convenciones especiacuteficas pararesponder a las necesidades de diversas comunidades cientiacuteficas Ante esta situacioacuten la distincioacutenpropuesta por Sinclair (1995107) entre ldquoconformidadrdquo y ldquocompatibilidadrdquo adquiere todo susentido ya que si en ciertos casos la conformidad a un estaacutendar determinado es problemaacutetica porlas limitaciones inherentes a todo sistema comuacuten la compatibilidad - entendida como la facilidadde conversioacuten entre sistemas - deberiacutea ser en cambio un requisito imprescindible en el desarrollode los recursos linguumliacutesticos De esta manera puede tal alcanzarse el equilibrio entre lasnecesidades de un proyecto y las indudables ventajas cientiacuteficas y econoacutemicas que resultan de lareutilizacioacuten de los datos disponibles

BIBLIOGRAFIacuteA

Allen GD 1988 The PHONASCII System Journal of the International PhoneticAssociation 181 9-25

Anderson AH M Badger EG Bard E Boyle G Doherty S Garrod S Isard JKowtko J Mcallister J Miller C Sotillo HS Thompson y R Weinert 1991 The HCRCMap Task corpus Language and Speech 344 351-366

Autesserre D G Peacuterennou y M Rossi 1989 Methodology for the transcription andlabeling of a speech corpus Journal of the International Phonetic Association 191 2-15

Barry WJ y AJ Fourcin 1992 Levels of Labelling Computer Speech and Language 61-14

Beckman ME y GM Ayers GM 1994 Guidelines for ToBI Labelling Version 20February 1994[Documento de Internet disponible en httplingohio-stateeduPhoneticsToBIToBI0html]

Beckman ME y J Hirschberg J 1994 The ToBI Annotation Conventions Apeacutendice A deME Beckman y GM Ayers 1994 Guidelines for ToBI Labelling Version 20 February 1994[Documento de Internet disponible en httplingohio-stateeduPhoneticsToBIToBI0html]

Bruce G 1988 23 Supasegmental categories and 24 The symbolization of temporalevents Journal of the International Phonetic Association 182 75-76

Bruce G 1989 Report from the IPA working group on suprasegmental categories LundUniversity Department of Linguistics General Linguistics Phonetics Working Papers 35 25-40

Burnard L 1995 What is SGML and how does it help Computers and the Humanities291 41-50 The Text Encoding Initiative Background and Context Eds N Ide y J VeacuteronisDordrecht Kluwer Academic Publishers

Burnard L 1995a Text Encoding for Information Exchange An Introduction to the TextEncoding Initiaive TEI Document TEI J31 [Documento de Internet disponible enhttpwwwuiceduorgsteiinfoteij31]

Burnard L 1995b The Text Encoding Initiative an overviewrdquo Spoken English onComputer Transcription Markup and Applications Eds G LEECH G MYERS y JTHOMAS Harlow Longman 69-81

Chafe W 1995 Adequacy user-friendliness and practicality in transcribingrdquo English onComputer Transcription Markup and Applications Eds G Leech G Myers y J ThomasHarlow Longman 54-61

Chan D A Fourcin D Gibbon B Granstroumlm M Huckvale G Kokkinakis K KvaleL Lamel B Lindberg A Moreno J Mouropoulos F Senia I Trancoso C Veld y J Zeiliger1995 EUROM - A Spoken Language Resource for the EU Eurospeech95 Proceedings of the4th European Conference on Speech Communication and Speech Technology Madrid Spain 18-21 September 1995 Vol 1 867-870

Cole RA BT Oshika M Noel T Lander y M Fanty 1994 Labeler Agreement inPhonetic Labeling of Continuous Speech Proceedings of the 1994 International Conference onSpoken Language Processing Yokohama Japan 18-22 September 1994[Documento de Internet disponible en httpwwwcseogieduCSLUcorporapapershtml]

Cook G 1995 Theoretical issues transcribing the untranscribablerdquo Spoken English onComputer Transcription Markup and Applications Eds G Leech G Myers y J ThomasHarlow Longman 35-53

Du Bois JW 1991 Transcription design principles for spoken discourse researchPragmatics 1 71-106

Du Bois JW S Schuetze-Coburn S Cumming y D Paolino 1993 Outline of discoursetranscriptionrdquo Talking Data Transcription and Coding in Discourse Research Eds JAEdwards y MD Lampert Hillsdale NJ Lawrence Erlbaum Associates 45-90

EAGLES 1996 Preliminary Recommendations on Spoken Texts EAGLES DocumentEAG-TCWG-STPP May 1996[Documento de Internet disponible enhttpwwwilcpicnritEAGLES96spokentxspokentxhtml]

Edwards JA 1992 Design principles in the transcription of spoken discourserdquoDirections in Corpus Linguistics Proceedings of Nobel Symposium 82 Stockholm 4-8 August1991 Ed J Svartvik Berlin Mouton de Gruyter 129-147

Edwards JA 1993 Principles and Contrasting Systems of Discourse TranscriptionrdquoTalking Data Transcription and Coding in Discourse Research Eds JA Edwards y MDLampert Hillsdale Hillsdale NJ Lawrence Erlbaum Associates 3-32

Edwards JA 1995 Principles and alternative systems in the transcription coding andmark-up of spoken discourserdquo Spoken English on Computer Transcription Markup andApplications Eds G Leech G Myers y J Thomas Harlow Longman 19-34

Ehlich K 1993 HIAT A Transcription System for Discourse Datardquo Talking DataTranscription and Coding in Discourse Research Eds JA Edwards y MD Lampert HillsdaleNJ Lawrence Erlbaum Associates 123-148

Eisen B 1993 Reliability of speech segmentation and labelling at different levels oftranscription Eurospeech93 3rd European Conference on Speech Communication andTechnology Berlin Germany 21-23 September 1993 Vol 1 673-676

Esling JH y H Gaylord 1993 Computer Codes for Phonetic Symbols Journal of theInternational Phonetic Association 232 77-82

Esling JH 1988 Computer coding of IPA symbols and detailed phonetic representationsof computer databases Journal of the International Phonetic Association 182 99-106

Esling JH 1990 Computer Coding of the IPA Supplementary Report Journal of theInternational Phonetic Association 201 22-26

Fourcin A y JM Dolmazon (on behalf of the SAM Project) 1991 Speech knowledgestandards and assessment Actes du XIIegraveme Congregraves International des Sciences Phoneacutetiques 19-24 aoucirct 1991 Aix-en-Provence France Aix-en-Provence Universiteacute de Provence Service desPublications Vol 5 430-433

Fourcin A G Harland W Barry y V Hazan eds 1989 Speech Input and OutputAssessment Multilingual Methods and Standards Chichester Ellis Horwood Ltd

French JP 1991 Updated notes for soundprint transcribers Working paper Universityof Birmingham October 1991 NERC-WP4-47

French JP 1992 Transcription proposals multilevel system Working paper Universityof Birmingham October 1992 NERC-WP4-50

Gibbon D 1989 Survey of Prosodic Labelling for EC Languages SAM-UBI-190 12February 1989 Report e6 in ESPRIT 2589 (SAM) Interim Report Year 1 Ref SAM-UCLG002 University College London February 1990

Gibbon D R Moore y R Winski eds 1997 Handbook on Standards and Resources forSpoken Language Systems Berlin Mouton De Gruyter [Documento de Internet disponible en httpcoralliliuni-bielefelddeEAGLESeagbookeagbookhtml]

Groslashnnum Thorsen N 1987 Suprasegmental transcription ARIPUC - Annual Report ofthe Institute of Phonetics University of Copenhagen 21 1-27

Gumperz JJ y J Berenz 1993 Transcribing Conversational Exchangesrdquo Talking DataTranscription and Coding in Discourse Research Eds JA Ewards y M D Lampert HillsdaleNJ Lawrence Erlbaum Associates 91-122

Hart J lsquoT R Collier y A Cohen 1990 A Perceptual Study of Intonation An Experimental- Phonetic Approach to Intonation Cambridge Cambridge University Press (Cambridge Studiesin Speech Science and Communication)

Hess W K Kohler y HG Tillmann 1995 The PhonDat-Verbmobil Speech CorpusEurospeech95 Proceedings of the 4th European Conference on Speech Communication andSpeech Technology Madrid Spain 18-21 September 1995 Vol 1 863-866

Hieronymus JL 1994 ASCII phonetic symbols for the worlds languages WorldbetATampT Bell Laboratories Technical Memo [Documento de Internet disponible enhttpwwwcseogieduCSLUcorporapapershtml]

Hirst D A Di Cristo y R Espesser en prensaLevels of representation and levels ofanalysis for intonation Prosody Theory and Experiments Ed M Horne Dordrecht Kluwer

Hirst DJ y A Di Cristo en prensa A survey of intonation systemsrdquo IntonationSystems A Survey of 20 Languages Eds D Hirst y A Di Cristo Cambridge CambridgeUniversity Press

Hirst DJ 1991 Intonation models towards a third generation Actes du XIIegraveme CongregravesInternational des Sciences Phoneacutetiques 19-24 aoucirct 1991 Aix-en-Provence France Aix-en-Provence Universiteacute de Provence Service des Publications Vol 1 305-310

Hirst DJ A Di Cristo M Le Besnerais Z Najim P Nicolas y P Romeacuteas 1993Multilingual modelling of intonation patternsrdquo Proceedings of an ESCA Workshop on ProsodySeptember 27-29 1993 Lund Sweden Eds D House y P Touati Lund University Departmentof Linguistics and Phonetics Working Papers 41 204-207

Hirst DJ N Ide y J Veacuteronis 1994 Coding fundamental frequency patterns for multi-lingual synthesis with INTSINT in the MULTEXT project Conference Proceedings of theSecond ESCAIEEE Workshop on Speech Synthesis September 12-15 1994 Mohonk MountainHouse New Paltz New York USA 77-80

Ide N y J Veacuteronis eds 1995 The Text Encoding Initiative Background and ContextsComputers and the Humanities 29 1-3 Publicado en forma de libro en Dordrecht KluwerAcademic Publishers

IPA 1989 The IPA 1989 Kiel Convention Workgroup 9 report Computer Coding of IPAsymbols and Computer Representation of Individual Languages Journal of the InternationalPhonetic Association 192 81-92

IPA 1993 IPA Chart revised to 1993 Journal of the International Phonetic Association231 [Documento de Internet disponible en httpwwwartsglaacukIPAipacharthtml]

IPA 1995 Preview of the IPA Handbook Journal of the International Phonetic Association251

ISO 8879 1986 Information Processing Text and Office Systems Standard GeneralizedMarkup Language (SGML) Geneva International Organization for Standardization

Johansson S 1995a The approach of the Text Encoding Initiative to the encoding ofspoken discourse Spoken English on Computer Transcription Markup and Applications EdsG Leech G Myers y J Thomas Harlow Longman 82-98

Johansson S 1995b The Encoding of Spoken Texts Computers and the Humanities291 149-158 The Text Encoding Initiative Background and Context Eds N Ide y J VeacuteronisDordrecht Kluwer Academic Publishers 149-158

Keating P P MacEachern A Shryock y S Domiacutenguez 1994 A manual for phonetictranscription Segmentation and labelling of words in spontaneous speech UCLA WorkingPapers in Phonetics 88 91-120

Kluger-Kruse M 1987 Computer Phonetic Alphabet ESPRIT Linguistic Analysis of theEuropean Languages Report BU-CPA0267 July 1987

Krot C y B Taylor 1995 Criteria for Acoustic-Phonetic Segmentation and WordLabelling in the Australian National Database of Spoken Language[Documento de Internet disponible en httpwwwshlrcmqeduaucriteriahtml]

Lander T 1997 The CSLU Labeling Guide Center for Spoken Language UnderstandingOregon Graduate Institute[Documento de Internet disponible en httpwwwcseogieduCSLUcorporapapershtml]

Llisterri J 1994 Prosody Encoding Survey WP 1 Specifications and Standards T15Markup Specifications Deliverable 153 Final version 15 September 1994 LRE Project 62-050MULTEXT

Llisterri J ed 1996 Prosody Tools Efficiency and Failures WP 4 Corpus T46 SpeechMarkup and Validation Deliverable 452 Final version 15 October 1996 LRE Project 62-050MULTEXT

MacWhinney B 1991The CHILDES Project Tools for Analyzing Talk Hillsdale NJLawrence Erlbaum

Marchal A N Nguyen y W Hardcastle 1995 Multitiered phonetic approach to speechlabelling Levels in Speech Communication Relations and Interactions A Tribute to MaxWajskop Hommage agrave Max Wajskop Eds C Sorin J Mariani H Meloni y J SchoengenAmsterdam Elsevier Science BV 149-158

NERC 1994 NERC-1 Network of European Reference Corpora Final Report PisaInstituto di Linguistica Computazionale - CNR January 1994 versioacuten en curso de publicacioacutenTowards a Network of European Reference Corpora Eds N Calzolari M Baker y PG KruytPisa Giardini

Nicolas P y D Hirst 1995 Symbolic coding of Higher-Level Characteristics ofFundamental Frequency Curvesrdquo Eurospeech95 Proceedings of the 4th European Conferenceon Speech Communication and Technology Madrid Spain 18-21 September 1995 Vol 2 989-992

OConnell DC y S Kowal 1994 Some Current Transcription Systems for SpokenDiscourse A critical Analysis Pragmatics 4 81-107

Ochs E 1979 Transcription as Theory Developmental Pragmatics Eds E Ochs E yBB Schieffelin New York Academic Press 43-72

Payne J 1992 Report on the compatibility of JP Frenchs spoken corpus transcriptionconventions with the TEI guidelines for transcription of spoken texts Working paper COBUILDBirmingham and IDS Mannheim December 1992 NERC-WP8WP4-122

Payne J 1995 The COBUILD spoken corpus transcription conventions SpokenEnglish on Computer Transcription Markup and Applications Eds G Leech G Myers y JThomas Harlow Longman 203-207

Payratoacute Ll 1995 Transcripcioacuten del discurso coloquialrdquo El espantildeol coloquial Actas del ISimposio sobre Anaacutelisis del Discurso Oral Almeriacutea 23-25 de noviembre de 1994 Ed L CorteacutesRodriacuteguez Almeriacutea Universidad de Almeriacutea Servicio de Publicaciones 43-70

Pierrehumbert J B 1897 (1980) The Phonology and Phonetics of English IntonationPhD Thesis Department of Linguistics MIT Bloomington Indiana University Linguistics Club

Pitrelli J M Beckman y J Hirschberg 1994 Evaluation of prosodic transcriptionlabelling reliability in the ToBI frameworkrdquo Proceedings of the Third International Conference onSpoken Language Processing Yokohama ICSLP Vol 2 123-126

Pullum GK y WA Ladusaw 1996 (1986) Phonetic Symbol Guide Chicago TheUniversity of Chicago Press 2nd edition

Roach P H Roach A Dew y P Rowlands 1990 Phonetic analysis and the automaticsegmentation and labeling of speech sounds Journal of the International Phonetic Association201 15-21

Schmidt MS C Scott y MA Jack 1993 Phonetic transcription standards for Europeannames (ONOMASTICA) Eurospeech93 3rd European Conference on Speech Communicationand Technology Berlin Germany 21-23 September 1993 Vol 1 279-282

Schuetze-Coburn S 1991Units of intonation in discourse a comparison of acoustic andauditory analysis Language and Speech 343 207-234

Selting M 1987 Descriptive categories for the auditive analysis of intonation inconversation Journal of Pragmatics 11 777-791

Selting M 1988 The role of intonation in the organisation of repair and problem handlingsequences in conversation Journal of Pragmatics 12 293-322

Senia F y JG Van Velden 1997 Specifications of orthographic transcription and lexiconconventions LRE-4001 SpeechDat Technical Report SD132 Final version 10 January 1997[Documento de Internet disponible en httpwwwphonetikuni-muenchendeSpeechDathtml]

Silverman K M Beckman J Pitrelli M Ostendorf C Wightman P Price JPierrehumbert y J Hirschberg 1992 TOBI A standard for labelling English prosodyProceedings of the Second International Conference on Spoken Language Processing ICSLP-92Banff October 1992 867-870

Sinclair J 1994 Spoken Language [3B] PhoneticPhonemic and Prosodic Annotation[52] NERC 1994 NERC-1 Network of European Reference Corpora Final Report PisaVersioacuten en curso de publicacioacuten Towards a Network of European Reference Corpora Eds NCalzolari M Baker y PG Kruyt Pisa Giardini

Sinclair J 1995 From theory to practicerdquo Spoken English on Computer TranscriptionMarkup and Applications Eds G Leech G Myers Y J Thomas Harlow Longman 99- 112

Sperberg-McQueen CM y L Burnard eds 1994 Guidelines for Electronic Text Encodingand Interchange TEI P3 Chicago and Oxford Association for Computational Linguistics Association for Computers and the Humanities Association for Literary and LinguisticComputing [Cap 11 Transcriptions of Speech] [Documento de Internet disponible enhttpetextvirginiaeduTEIhtml]

Strangert E y M Heldner 1995 Labelling of boundaries and prominences byphonetically experienced and non-experienced transcribers Phonum 3 Reports from theDepartment of Phonetics Umearing University 85-109 [Documento de Internet disponible enhttpwwwlingumusefonphonum3html]

Teubert W 1993 Phonetic Phonemic and Prosodic Annotation Final Report IDSMannheim February 1993 NERC-WP8-171

Tillmann HG y B Pompino-Marschall 1993 Theoretical Principles ConcerningSegmentation Labelling Strategies and Levels of Categorical Annotation for Spoken LanguageDatabase Systems Eurospeech93 3rd European Conference on Speech Communication andTechnology Berlin Germany 21-23 September 1993 Vol 3 1691-1694

Trancoso I 1995 The ONOMASTICA Interlanguage Pronunciation LexiconrdquoEurospeech95 Proceedings of the 4th European Conference on Speech Communication andTechnology Madrid Spain 18-21 September 1995 Vol 1 829-832

Wells JC 1987 Computer Coded Phonetic Transcription Journal of the InternationalPhonetic Association 172 94-114

Wells JC 1989 Computer-coded phonemic notation of individual languages of theEuropean Community Journal of the International Phonetic Association 191 31-54

Wells JC 1994 Computer-coding the IPA a proposed extension of SAMPA SpeechHearing and Language Work in Progress 1994 (University College London Department ofPhonetics and Linguistics) 8 271-289

Wells JC 1995 SAMPROSA (SAM Prosodic Transcription [Documento de Internetdisponible en httpwwwphonuclacukhomesampasamprosahtm]

Wells JC W Barry M Grice A Fourcin y D Gibbon 1992 Standard Computer-Compatible Transcription SAM Stage Report Sen3 SAM UCL-037 28 February 1992 SAM(1992) Esprit Project 2589 (SAM) Multilingual Speech InputOutput AssessmentMethodologyand Standardisation Final Report Year Three 1III91-28II1992 London University CollegeLondon

Wesenick M-B y F Schiel 1995 Feasibility of Automatic Annotation and BuildingPronunciation Lexica from Corpus Material LRE-63314 SpeechDat Report D3123 Finalversion 10 October 1995[Documento de Internet disponible en httpwwwicpgrenetfrSpeechDathomehtml]

Winski R R Moore y D Gibbon 1995 EAGLES Spoken Language Working GroupOverview and Resultsrdquo Eurospeech95 Proceedings of the 4th European Conference on SpeechCommunication and Speech Technology Madrid Spain 18-21 September 1995 Vol 1 841-844[Documento de Internet disponible en httpcoralliliuni-bielefeldde~gibbonEAGLESrwpaperrwpaperhtml]

  • 1- INTRODUCCIOacuteN
  • 2- NIVELES DE REPRESENTACIOacuteN ETIQUETADO Y CODIFICACIOacuteN
  • 3- REPRESENTACIOacuteN ORTOGRAacuteFICA DE CORPUS ORALES
  • 31- Propuestas para la representacioacuten ortograacutefica de corpus orales en el aacutembito de la linguumliacutestica de corpus
  • 32- Propuestas para la representacioacuten ortograacutefica de corpus orales en el aacutembito de las tecnologiacuteas del habla
  • 4- REPRESENTACIOacuteN FONEacuteTICA DE CORPUS ORALES
  • 41- La representacioacuten foneacutetica de los elementos segmentales
  • 42- La representacioacuten foneacutetica de los elementos suprasegmentales
  • 5- ETIQUETADO FONEacuteTICO DE CORPUS ORALES
  • 51- Niveles de etiquetado foneacutetico de corpus orales
  • 52- La transcripcioacuten y el etiquetado automaacutetico de corpus orales
  • 6- TRANSCRIPCIOacuteN Y CODIFICACIOacuteN DE CORPUS PARA EL ANAacuteLISIS DE LA LENGUA ORAL
  • 61- Los requisitos de una transcripcioacuten
  • 62- Propuestas de estandarizacioacuten para la transcripcioacuten y codificacioacuten de corpus orales
  • 7- CONCLUSIONES
  • BIBLIOGRAFIacuteA
Page 18: Transcripción, etiquetado y codificación de corpus orales

elementos que marcan dudas en el momento de la produccioacuten del hablaCorresponden a los elementos que en la TEI se marcan con la etiqueta ltvocalgtbull Elementos vocales no leacutexicos

Se incluyen aquiacute todo tipo de sonidos producidos por el hablante - tosesrisas bostezos estornudos etc - que no constituyen formas leacutexicas de la lenguaCorresponden igualmente a los codificados con la marca ltvocalgt en la TEIbull Acontecimientos no vocales y no comunicativos

Comprenden los ruidos producidos por otros hablantes o procedentes delentorno de grabacioacuten Estos acontecimientos se codifican en la TEI mediante lamarca lteventgt

(2) Elementos necesarios en la transcripcioacuten de interacciones verbalesbull Identidad del hablante

Este es un elemento imprescindible en la transcripcioacuten de interaccionesverbales La TEI dispone de los mecanismos para documentar informacioacuten sobrelos hablantes en la cabecera de los textos asiacute como de un sistema para marcar laidentidad de cada participante en el interior del texto aunque pueden utilizarsetambieacuten otros procedimientosbull Turnos de palabra

La finalidad del marcado de los turnos de palabra es indicar un cambio dehablante Ademaacutes de las convenciones de la TEI pueden emplearse otrosprocedimientos mientras se mantenga esta informacioacuten esencial en el estudio de lainteraccioacuten verbalbull Superposicioacuten de turnos de palabra

Existen igualmente diferentes procedimientos para marcar la superposicioacutende emisiones de dos hablantes ademaacutes de las propuestas de la TEI que los tratacomo parte de las estrategias para codificar acontecimientos simultaacuteneos

(3) Elementos relacionados con la actuacioacuten del hablantebull Omisiones en un texto leiacutedo

Si se transcribe un texto leiacutedo y se dispone del original es recomendableanotar las palabras o segmentos omitidos por el locutorbull Autocorrecciones

Es propio del habla espontaacutenea aunque tambieacuten de la lectura que loshablantes realicen correcciones de su propia produccioacuten linguumliacutestica (self-repairs)Parece conveniente marcarlas en la transcripcioacuten de un corpus oralbull Fragmentos de palabras

Los fragmentos de palabras corresponden a uno o maacutes segmentospertenecientes a una palabra que no ha sido totalmente pronunciada por el hablanteen un primer intento y que suelen repetirse cuando eacuteste consigue producir lapalabra completa Es importante indicar este fenoacutemeno en la transcripcioacuten

bull Fragmentos ininteligiblesSe trata de partes de la grabacioacuten que no son comprendidas por el

transcriptor y en la TEI se codifican con la etiqueta ltuncleargt aunque si se desease pueden utilizar marcas maacutes detalladas distinguiendo entre transcripcionescompletamente ininteligibles y entre una posible interpretacioacuten ofrecida por eltranscriptor

Un aspecto conflictivo sigue siendo la identificacioacuten de los enunciados que conforman untexto oral (Schuetze-Coburn 1991) Mientras que en un texto escrito los signos de puntuacioacutenconstituyen un criterio de delimitacioacuten en el habla disponemos de indicios como las pausas laentonacioacuten o el cambio de turno de palabra que nos permiten al menos convencionalmentedefinir un enunciado Sin embargo hasta el momento no se han desarrollado auacuten criteriosobjetivos y consistentes para resolver este problema

7- CONCLUSIONES

La revisioacuten - sin pretensiones de exhaustividad - de los principales sistemas detranscripcioacuten etiquetado y codificacioacuten de corpus orales expuesta en este trabajo pone demanifiesto en primer lugar la multiplicidad de propuestas desarrolladas frente a los intentos deestandarizacioacuten algunos de los cuales auacuten no se han consolidado plenamente pese a su crecienteaceptacioacuten En segundo lugar destaca tambieacuten la heterogeneidad de tradiciones que confluyen enel estudio de la lengua hablada desde la foneacutetica y las tecnologiacuteas del habla hasta el anaacutelisis deldiscurso y de la conversacioacuten diversidad que lleva a la creacioacuten de convenciones especiacuteficas pararesponder a las necesidades de diversas comunidades cientiacuteficas Ante esta situacioacuten la distincioacutenpropuesta por Sinclair (1995107) entre ldquoconformidadrdquo y ldquocompatibilidadrdquo adquiere todo susentido ya que si en ciertos casos la conformidad a un estaacutendar determinado es problemaacutetica porlas limitaciones inherentes a todo sistema comuacuten la compatibilidad - entendida como la facilidadde conversioacuten entre sistemas - deberiacutea ser en cambio un requisito imprescindible en el desarrollode los recursos linguumliacutesticos De esta manera puede tal alcanzarse el equilibrio entre lasnecesidades de un proyecto y las indudables ventajas cientiacuteficas y econoacutemicas que resultan de lareutilizacioacuten de los datos disponibles

BIBLIOGRAFIacuteA

Allen GD 1988 The PHONASCII System Journal of the International PhoneticAssociation 181 9-25

Anderson AH M Badger EG Bard E Boyle G Doherty S Garrod S Isard JKowtko J Mcallister J Miller C Sotillo HS Thompson y R Weinert 1991 The HCRCMap Task corpus Language and Speech 344 351-366

Autesserre D G Peacuterennou y M Rossi 1989 Methodology for the transcription andlabeling of a speech corpus Journal of the International Phonetic Association 191 2-15

Barry WJ y AJ Fourcin 1992 Levels of Labelling Computer Speech and Language 61-14

Beckman ME y GM Ayers GM 1994 Guidelines for ToBI Labelling Version 20February 1994[Documento de Internet disponible en httplingohio-stateeduPhoneticsToBIToBI0html]

Beckman ME y J Hirschberg J 1994 The ToBI Annotation Conventions Apeacutendice A deME Beckman y GM Ayers 1994 Guidelines for ToBI Labelling Version 20 February 1994[Documento de Internet disponible en httplingohio-stateeduPhoneticsToBIToBI0html]

Bruce G 1988 23 Supasegmental categories and 24 The symbolization of temporalevents Journal of the International Phonetic Association 182 75-76

Bruce G 1989 Report from the IPA working group on suprasegmental categories LundUniversity Department of Linguistics General Linguistics Phonetics Working Papers 35 25-40

Burnard L 1995 What is SGML and how does it help Computers and the Humanities291 41-50 The Text Encoding Initiative Background and Context Eds N Ide y J VeacuteronisDordrecht Kluwer Academic Publishers

Burnard L 1995a Text Encoding for Information Exchange An Introduction to the TextEncoding Initiaive TEI Document TEI J31 [Documento de Internet disponible enhttpwwwuiceduorgsteiinfoteij31]

Burnard L 1995b The Text Encoding Initiative an overviewrdquo Spoken English onComputer Transcription Markup and Applications Eds G LEECH G MYERS y JTHOMAS Harlow Longman 69-81

Chafe W 1995 Adequacy user-friendliness and practicality in transcribingrdquo English onComputer Transcription Markup and Applications Eds G Leech G Myers y J ThomasHarlow Longman 54-61

Chan D A Fourcin D Gibbon B Granstroumlm M Huckvale G Kokkinakis K KvaleL Lamel B Lindberg A Moreno J Mouropoulos F Senia I Trancoso C Veld y J Zeiliger1995 EUROM - A Spoken Language Resource for the EU Eurospeech95 Proceedings of the4th European Conference on Speech Communication and Speech Technology Madrid Spain 18-21 September 1995 Vol 1 867-870

Cole RA BT Oshika M Noel T Lander y M Fanty 1994 Labeler Agreement inPhonetic Labeling of Continuous Speech Proceedings of the 1994 International Conference onSpoken Language Processing Yokohama Japan 18-22 September 1994[Documento de Internet disponible en httpwwwcseogieduCSLUcorporapapershtml]

Cook G 1995 Theoretical issues transcribing the untranscribablerdquo Spoken English onComputer Transcription Markup and Applications Eds G Leech G Myers y J ThomasHarlow Longman 35-53

Du Bois JW 1991 Transcription design principles for spoken discourse researchPragmatics 1 71-106

Du Bois JW S Schuetze-Coburn S Cumming y D Paolino 1993 Outline of discoursetranscriptionrdquo Talking Data Transcription and Coding in Discourse Research Eds JAEdwards y MD Lampert Hillsdale NJ Lawrence Erlbaum Associates 45-90

EAGLES 1996 Preliminary Recommendations on Spoken Texts EAGLES DocumentEAG-TCWG-STPP May 1996[Documento de Internet disponible enhttpwwwilcpicnritEAGLES96spokentxspokentxhtml]

Edwards JA 1992 Design principles in the transcription of spoken discourserdquoDirections in Corpus Linguistics Proceedings of Nobel Symposium 82 Stockholm 4-8 August1991 Ed J Svartvik Berlin Mouton de Gruyter 129-147

Edwards JA 1993 Principles and Contrasting Systems of Discourse TranscriptionrdquoTalking Data Transcription and Coding in Discourse Research Eds JA Edwards y MDLampert Hillsdale Hillsdale NJ Lawrence Erlbaum Associates 3-32

Edwards JA 1995 Principles and alternative systems in the transcription coding andmark-up of spoken discourserdquo Spoken English on Computer Transcription Markup andApplications Eds G Leech G Myers y J Thomas Harlow Longman 19-34

Ehlich K 1993 HIAT A Transcription System for Discourse Datardquo Talking DataTranscription and Coding in Discourse Research Eds JA Edwards y MD Lampert HillsdaleNJ Lawrence Erlbaum Associates 123-148

Eisen B 1993 Reliability of speech segmentation and labelling at different levels oftranscription Eurospeech93 3rd European Conference on Speech Communication andTechnology Berlin Germany 21-23 September 1993 Vol 1 673-676

Esling JH y H Gaylord 1993 Computer Codes for Phonetic Symbols Journal of theInternational Phonetic Association 232 77-82

Esling JH 1988 Computer coding of IPA symbols and detailed phonetic representationsof computer databases Journal of the International Phonetic Association 182 99-106

Esling JH 1990 Computer Coding of the IPA Supplementary Report Journal of theInternational Phonetic Association 201 22-26

Fourcin A y JM Dolmazon (on behalf of the SAM Project) 1991 Speech knowledgestandards and assessment Actes du XIIegraveme Congregraves International des Sciences Phoneacutetiques 19-24 aoucirct 1991 Aix-en-Provence France Aix-en-Provence Universiteacute de Provence Service desPublications Vol 5 430-433

Fourcin A G Harland W Barry y V Hazan eds 1989 Speech Input and OutputAssessment Multilingual Methods and Standards Chichester Ellis Horwood Ltd

French JP 1991 Updated notes for soundprint transcribers Working paper Universityof Birmingham October 1991 NERC-WP4-47

French JP 1992 Transcription proposals multilevel system Working paper Universityof Birmingham October 1992 NERC-WP4-50

Gibbon D 1989 Survey of Prosodic Labelling for EC Languages SAM-UBI-190 12February 1989 Report e6 in ESPRIT 2589 (SAM) Interim Report Year 1 Ref SAM-UCLG002 University College London February 1990

Gibbon D R Moore y R Winski eds 1997 Handbook on Standards and Resources forSpoken Language Systems Berlin Mouton De Gruyter [Documento de Internet disponible en httpcoralliliuni-bielefelddeEAGLESeagbookeagbookhtml]

Groslashnnum Thorsen N 1987 Suprasegmental transcription ARIPUC - Annual Report ofthe Institute of Phonetics University of Copenhagen 21 1-27

Gumperz JJ y J Berenz 1993 Transcribing Conversational Exchangesrdquo Talking DataTranscription and Coding in Discourse Research Eds JA Ewards y M D Lampert HillsdaleNJ Lawrence Erlbaum Associates 91-122

Hart J lsquoT R Collier y A Cohen 1990 A Perceptual Study of Intonation An Experimental- Phonetic Approach to Intonation Cambridge Cambridge University Press (Cambridge Studiesin Speech Science and Communication)

Hess W K Kohler y HG Tillmann 1995 The PhonDat-Verbmobil Speech CorpusEurospeech95 Proceedings of the 4th European Conference on Speech Communication andSpeech Technology Madrid Spain 18-21 September 1995 Vol 1 863-866

Hieronymus JL 1994 ASCII phonetic symbols for the worlds languages WorldbetATampT Bell Laboratories Technical Memo [Documento de Internet disponible enhttpwwwcseogieduCSLUcorporapapershtml]

Hirst D A Di Cristo y R Espesser en prensaLevels of representation and levels ofanalysis for intonation Prosody Theory and Experiments Ed M Horne Dordrecht Kluwer

Hirst DJ y A Di Cristo en prensa A survey of intonation systemsrdquo IntonationSystems A Survey of 20 Languages Eds D Hirst y A Di Cristo Cambridge CambridgeUniversity Press

Hirst DJ 1991 Intonation models towards a third generation Actes du XIIegraveme CongregravesInternational des Sciences Phoneacutetiques 19-24 aoucirct 1991 Aix-en-Provence France Aix-en-Provence Universiteacute de Provence Service des Publications Vol 1 305-310

Hirst DJ A Di Cristo M Le Besnerais Z Najim P Nicolas y P Romeacuteas 1993Multilingual modelling of intonation patternsrdquo Proceedings of an ESCA Workshop on ProsodySeptember 27-29 1993 Lund Sweden Eds D House y P Touati Lund University Departmentof Linguistics and Phonetics Working Papers 41 204-207

Hirst DJ N Ide y J Veacuteronis 1994 Coding fundamental frequency patterns for multi-lingual synthesis with INTSINT in the MULTEXT project Conference Proceedings of theSecond ESCAIEEE Workshop on Speech Synthesis September 12-15 1994 Mohonk MountainHouse New Paltz New York USA 77-80

Ide N y J Veacuteronis eds 1995 The Text Encoding Initiative Background and ContextsComputers and the Humanities 29 1-3 Publicado en forma de libro en Dordrecht KluwerAcademic Publishers

IPA 1989 The IPA 1989 Kiel Convention Workgroup 9 report Computer Coding of IPAsymbols and Computer Representation of Individual Languages Journal of the InternationalPhonetic Association 192 81-92

IPA 1993 IPA Chart revised to 1993 Journal of the International Phonetic Association231 [Documento de Internet disponible en httpwwwartsglaacukIPAipacharthtml]

IPA 1995 Preview of the IPA Handbook Journal of the International Phonetic Association251

ISO 8879 1986 Information Processing Text and Office Systems Standard GeneralizedMarkup Language (SGML) Geneva International Organization for Standardization

Johansson S 1995a The approach of the Text Encoding Initiative to the encoding ofspoken discourse Spoken English on Computer Transcription Markup and Applications EdsG Leech G Myers y J Thomas Harlow Longman 82-98

Johansson S 1995b The Encoding of Spoken Texts Computers and the Humanities291 149-158 The Text Encoding Initiative Background and Context Eds N Ide y J VeacuteronisDordrecht Kluwer Academic Publishers 149-158

Keating P P MacEachern A Shryock y S Domiacutenguez 1994 A manual for phonetictranscription Segmentation and labelling of words in spontaneous speech UCLA WorkingPapers in Phonetics 88 91-120

Kluger-Kruse M 1987 Computer Phonetic Alphabet ESPRIT Linguistic Analysis of theEuropean Languages Report BU-CPA0267 July 1987

Krot C y B Taylor 1995 Criteria for Acoustic-Phonetic Segmentation and WordLabelling in the Australian National Database of Spoken Language[Documento de Internet disponible en httpwwwshlrcmqeduaucriteriahtml]

Lander T 1997 The CSLU Labeling Guide Center for Spoken Language UnderstandingOregon Graduate Institute[Documento de Internet disponible en httpwwwcseogieduCSLUcorporapapershtml]

Llisterri J 1994 Prosody Encoding Survey WP 1 Specifications and Standards T15Markup Specifications Deliverable 153 Final version 15 September 1994 LRE Project 62-050MULTEXT

Llisterri J ed 1996 Prosody Tools Efficiency and Failures WP 4 Corpus T46 SpeechMarkup and Validation Deliverable 452 Final version 15 October 1996 LRE Project 62-050MULTEXT

MacWhinney B 1991The CHILDES Project Tools for Analyzing Talk Hillsdale NJLawrence Erlbaum

Marchal A N Nguyen y W Hardcastle 1995 Multitiered phonetic approach to speechlabelling Levels in Speech Communication Relations and Interactions A Tribute to MaxWajskop Hommage agrave Max Wajskop Eds C Sorin J Mariani H Meloni y J SchoengenAmsterdam Elsevier Science BV 149-158

NERC 1994 NERC-1 Network of European Reference Corpora Final Report PisaInstituto di Linguistica Computazionale - CNR January 1994 versioacuten en curso de publicacioacutenTowards a Network of European Reference Corpora Eds N Calzolari M Baker y PG KruytPisa Giardini

Nicolas P y D Hirst 1995 Symbolic coding of Higher-Level Characteristics ofFundamental Frequency Curvesrdquo Eurospeech95 Proceedings of the 4th European Conferenceon Speech Communication and Technology Madrid Spain 18-21 September 1995 Vol 2 989-992

OConnell DC y S Kowal 1994 Some Current Transcription Systems for SpokenDiscourse A critical Analysis Pragmatics 4 81-107

Ochs E 1979 Transcription as Theory Developmental Pragmatics Eds E Ochs E yBB Schieffelin New York Academic Press 43-72

Payne J 1992 Report on the compatibility of JP Frenchs spoken corpus transcriptionconventions with the TEI guidelines for transcription of spoken texts Working paper COBUILDBirmingham and IDS Mannheim December 1992 NERC-WP8WP4-122

Payne J 1995 The COBUILD spoken corpus transcription conventions SpokenEnglish on Computer Transcription Markup and Applications Eds G Leech G Myers y JThomas Harlow Longman 203-207

Payratoacute Ll 1995 Transcripcioacuten del discurso coloquialrdquo El espantildeol coloquial Actas del ISimposio sobre Anaacutelisis del Discurso Oral Almeriacutea 23-25 de noviembre de 1994 Ed L CorteacutesRodriacuteguez Almeriacutea Universidad de Almeriacutea Servicio de Publicaciones 43-70

Pierrehumbert J B 1897 (1980) The Phonology and Phonetics of English IntonationPhD Thesis Department of Linguistics MIT Bloomington Indiana University Linguistics Club

Pitrelli J M Beckman y J Hirschberg 1994 Evaluation of prosodic transcriptionlabelling reliability in the ToBI frameworkrdquo Proceedings of the Third International Conference onSpoken Language Processing Yokohama ICSLP Vol 2 123-126

Pullum GK y WA Ladusaw 1996 (1986) Phonetic Symbol Guide Chicago TheUniversity of Chicago Press 2nd edition

Roach P H Roach A Dew y P Rowlands 1990 Phonetic analysis and the automaticsegmentation and labeling of speech sounds Journal of the International Phonetic Association201 15-21

Schmidt MS C Scott y MA Jack 1993 Phonetic transcription standards for Europeannames (ONOMASTICA) Eurospeech93 3rd European Conference on Speech Communicationand Technology Berlin Germany 21-23 September 1993 Vol 1 279-282

Schuetze-Coburn S 1991Units of intonation in discourse a comparison of acoustic andauditory analysis Language and Speech 343 207-234

Selting M 1987 Descriptive categories for the auditive analysis of intonation inconversation Journal of Pragmatics 11 777-791

Selting M 1988 The role of intonation in the organisation of repair and problem handlingsequences in conversation Journal of Pragmatics 12 293-322

Senia F y JG Van Velden 1997 Specifications of orthographic transcription and lexiconconventions LRE-4001 SpeechDat Technical Report SD132 Final version 10 January 1997[Documento de Internet disponible en httpwwwphonetikuni-muenchendeSpeechDathtml]

Silverman K M Beckman J Pitrelli M Ostendorf C Wightman P Price JPierrehumbert y J Hirschberg 1992 TOBI A standard for labelling English prosodyProceedings of the Second International Conference on Spoken Language Processing ICSLP-92Banff October 1992 867-870

Sinclair J 1994 Spoken Language [3B] PhoneticPhonemic and Prosodic Annotation[52] NERC 1994 NERC-1 Network of European Reference Corpora Final Report PisaVersioacuten en curso de publicacioacuten Towards a Network of European Reference Corpora Eds NCalzolari M Baker y PG Kruyt Pisa Giardini

Sinclair J 1995 From theory to practicerdquo Spoken English on Computer TranscriptionMarkup and Applications Eds G Leech G Myers Y J Thomas Harlow Longman 99- 112

Sperberg-McQueen CM y L Burnard eds 1994 Guidelines for Electronic Text Encodingand Interchange TEI P3 Chicago and Oxford Association for Computational Linguistics Association for Computers and the Humanities Association for Literary and LinguisticComputing [Cap 11 Transcriptions of Speech] [Documento de Internet disponible enhttpetextvirginiaeduTEIhtml]

Strangert E y M Heldner 1995 Labelling of boundaries and prominences byphonetically experienced and non-experienced transcribers Phonum 3 Reports from theDepartment of Phonetics Umearing University 85-109 [Documento de Internet disponible enhttpwwwlingumusefonphonum3html]

Teubert W 1993 Phonetic Phonemic and Prosodic Annotation Final Report IDSMannheim February 1993 NERC-WP8-171

Tillmann HG y B Pompino-Marschall 1993 Theoretical Principles ConcerningSegmentation Labelling Strategies and Levels of Categorical Annotation for Spoken LanguageDatabase Systems Eurospeech93 3rd European Conference on Speech Communication andTechnology Berlin Germany 21-23 September 1993 Vol 3 1691-1694

Trancoso I 1995 The ONOMASTICA Interlanguage Pronunciation LexiconrdquoEurospeech95 Proceedings of the 4th European Conference on Speech Communication andTechnology Madrid Spain 18-21 September 1995 Vol 1 829-832

Wells JC 1987 Computer Coded Phonetic Transcription Journal of the InternationalPhonetic Association 172 94-114

Wells JC 1989 Computer-coded phonemic notation of individual languages of theEuropean Community Journal of the International Phonetic Association 191 31-54

Wells JC 1994 Computer-coding the IPA a proposed extension of SAMPA SpeechHearing and Language Work in Progress 1994 (University College London Department ofPhonetics and Linguistics) 8 271-289

Wells JC 1995 SAMPROSA (SAM Prosodic Transcription [Documento de Internetdisponible en httpwwwphonuclacukhomesampasamprosahtm]

Wells JC W Barry M Grice A Fourcin y D Gibbon 1992 Standard Computer-Compatible Transcription SAM Stage Report Sen3 SAM UCL-037 28 February 1992 SAM(1992) Esprit Project 2589 (SAM) Multilingual Speech InputOutput AssessmentMethodologyand Standardisation Final Report Year Three 1III91-28II1992 London University CollegeLondon

Wesenick M-B y F Schiel 1995 Feasibility of Automatic Annotation and BuildingPronunciation Lexica from Corpus Material LRE-63314 SpeechDat Report D3123 Finalversion 10 October 1995[Documento de Internet disponible en httpwwwicpgrenetfrSpeechDathomehtml]

Winski R R Moore y D Gibbon 1995 EAGLES Spoken Language Working GroupOverview and Resultsrdquo Eurospeech95 Proceedings of the 4th European Conference on SpeechCommunication and Speech Technology Madrid Spain 18-21 September 1995 Vol 1 841-844[Documento de Internet disponible en httpcoralliliuni-bielefeldde~gibbonEAGLESrwpaperrwpaperhtml]

  • 1- INTRODUCCIOacuteN
  • 2- NIVELES DE REPRESENTACIOacuteN ETIQUETADO Y CODIFICACIOacuteN
  • 3- REPRESENTACIOacuteN ORTOGRAacuteFICA DE CORPUS ORALES
  • 31- Propuestas para la representacioacuten ortograacutefica de corpus orales en el aacutembito de la linguumliacutestica de corpus
  • 32- Propuestas para la representacioacuten ortograacutefica de corpus orales en el aacutembito de las tecnologiacuteas del habla
  • 4- REPRESENTACIOacuteN FONEacuteTICA DE CORPUS ORALES
  • 41- La representacioacuten foneacutetica de los elementos segmentales
  • 42- La representacioacuten foneacutetica de los elementos suprasegmentales
  • 5- ETIQUETADO FONEacuteTICO DE CORPUS ORALES
  • 51- Niveles de etiquetado foneacutetico de corpus orales
  • 52- La transcripcioacuten y el etiquetado automaacutetico de corpus orales
  • 6- TRANSCRIPCIOacuteN Y CODIFICACIOacuteN DE CORPUS PARA EL ANAacuteLISIS DE LA LENGUA ORAL
  • 61- Los requisitos de una transcripcioacuten
  • 62- Propuestas de estandarizacioacuten para la transcripcioacuten y codificacioacuten de corpus orales
  • 7- CONCLUSIONES
  • BIBLIOGRAFIacuteA
Page 19: Transcripción, etiquetado y codificación de corpus orales

bull Fragmentos ininteligiblesSe trata de partes de la grabacioacuten que no son comprendidas por el

transcriptor y en la TEI se codifican con la etiqueta ltuncleargt aunque si se desease pueden utilizar marcas maacutes detalladas distinguiendo entre transcripcionescompletamente ininteligibles y entre una posible interpretacioacuten ofrecida por eltranscriptor

Un aspecto conflictivo sigue siendo la identificacioacuten de los enunciados que conforman untexto oral (Schuetze-Coburn 1991) Mientras que en un texto escrito los signos de puntuacioacutenconstituyen un criterio de delimitacioacuten en el habla disponemos de indicios como las pausas laentonacioacuten o el cambio de turno de palabra que nos permiten al menos convencionalmentedefinir un enunciado Sin embargo hasta el momento no se han desarrollado auacuten criteriosobjetivos y consistentes para resolver este problema

7- CONCLUSIONES

La revisioacuten - sin pretensiones de exhaustividad - de los principales sistemas detranscripcioacuten etiquetado y codificacioacuten de corpus orales expuesta en este trabajo pone demanifiesto en primer lugar la multiplicidad de propuestas desarrolladas frente a los intentos deestandarizacioacuten algunos de los cuales auacuten no se han consolidado plenamente pese a su crecienteaceptacioacuten En segundo lugar destaca tambieacuten la heterogeneidad de tradiciones que confluyen enel estudio de la lengua hablada desde la foneacutetica y las tecnologiacuteas del habla hasta el anaacutelisis deldiscurso y de la conversacioacuten diversidad que lleva a la creacioacuten de convenciones especiacuteficas pararesponder a las necesidades de diversas comunidades cientiacuteficas Ante esta situacioacuten la distincioacutenpropuesta por Sinclair (1995107) entre ldquoconformidadrdquo y ldquocompatibilidadrdquo adquiere todo susentido ya que si en ciertos casos la conformidad a un estaacutendar determinado es problemaacutetica porlas limitaciones inherentes a todo sistema comuacuten la compatibilidad - entendida como la facilidadde conversioacuten entre sistemas - deberiacutea ser en cambio un requisito imprescindible en el desarrollode los recursos linguumliacutesticos De esta manera puede tal alcanzarse el equilibrio entre lasnecesidades de un proyecto y las indudables ventajas cientiacuteficas y econoacutemicas que resultan de lareutilizacioacuten de los datos disponibles

BIBLIOGRAFIacuteA

Allen GD 1988 The PHONASCII System Journal of the International PhoneticAssociation 181 9-25

Anderson AH M Badger EG Bard E Boyle G Doherty S Garrod S Isard JKowtko J Mcallister J Miller C Sotillo HS Thompson y R Weinert 1991 The HCRCMap Task corpus Language and Speech 344 351-366

Autesserre D G Peacuterennou y M Rossi 1989 Methodology for the transcription andlabeling of a speech corpus Journal of the International Phonetic Association 191 2-15

Barry WJ y AJ Fourcin 1992 Levels of Labelling Computer Speech and Language 61-14

Beckman ME y GM Ayers GM 1994 Guidelines for ToBI Labelling Version 20February 1994[Documento de Internet disponible en httplingohio-stateeduPhoneticsToBIToBI0html]

Beckman ME y J Hirschberg J 1994 The ToBI Annotation Conventions Apeacutendice A deME Beckman y GM Ayers 1994 Guidelines for ToBI Labelling Version 20 February 1994[Documento de Internet disponible en httplingohio-stateeduPhoneticsToBIToBI0html]

Bruce G 1988 23 Supasegmental categories and 24 The symbolization of temporalevents Journal of the International Phonetic Association 182 75-76

Bruce G 1989 Report from the IPA working group on suprasegmental categories LundUniversity Department of Linguistics General Linguistics Phonetics Working Papers 35 25-40

Burnard L 1995 What is SGML and how does it help Computers and the Humanities291 41-50 The Text Encoding Initiative Background and Context Eds N Ide y J VeacuteronisDordrecht Kluwer Academic Publishers

Burnard L 1995a Text Encoding for Information Exchange An Introduction to the TextEncoding Initiaive TEI Document TEI J31 [Documento de Internet disponible enhttpwwwuiceduorgsteiinfoteij31]

Burnard L 1995b The Text Encoding Initiative an overviewrdquo Spoken English onComputer Transcription Markup and Applications Eds G LEECH G MYERS y JTHOMAS Harlow Longman 69-81

Chafe W 1995 Adequacy user-friendliness and practicality in transcribingrdquo English onComputer Transcription Markup and Applications Eds G Leech G Myers y J ThomasHarlow Longman 54-61

Chan D A Fourcin D Gibbon B Granstroumlm M Huckvale G Kokkinakis K KvaleL Lamel B Lindberg A Moreno J Mouropoulos F Senia I Trancoso C Veld y J Zeiliger1995 EUROM - A Spoken Language Resource for the EU Eurospeech95 Proceedings of the4th European Conference on Speech Communication and Speech Technology Madrid Spain 18-21 September 1995 Vol 1 867-870

Cole RA BT Oshika M Noel T Lander y M Fanty 1994 Labeler Agreement inPhonetic Labeling of Continuous Speech Proceedings of the 1994 International Conference onSpoken Language Processing Yokohama Japan 18-22 September 1994[Documento de Internet disponible en httpwwwcseogieduCSLUcorporapapershtml]

Cook G 1995 Theoretical issues transcribing the untranscribablerdquo Spoken English onComputer Transcription Markup and Applications Eds G Leech G Myers y J ThomasHarlow Longman 35-53

Du Bois JW 1991 Transcription design principles for spoken discourse researchPragmatics 1 71-106

Du Bois JW S Schuetze-Coburn S Cumming y D Paolino 1993 Outline of discoursetranscriptionrdquo Talking Data Transcription and Coding in Discourse Research Eds JAEdwards y MD Lampert Hillsdale NJ Lawrence Erlbaum Associates 45-90

EAGLES 1996 Preliminary Recommendations on Spoken Texts EAGLES DocumentEAG-TCWG-STPP May 1996[Documento de Internet disponible enhttpwwwilcpicnritEAGLES96spokentxspokentxhtml]

Edwards JA 1992 Design principles in the transcription of spoken discourserdquoDirections in Corpus Linguistics Proceedings of Nobel Symposium 82 Stockholm 4-8 August1991 Ed J Svartvik Berlin Mouton de Gruyter 129-147

Edwards JA 1993 Principles and Contrasting Systems of Discourse TranscriptionrdquoTalking Data Transcription and Coding in Discourse Research Eds JA Edwards y MDLampert Hillsdale Hillsdale NJ Lawrence Erlbaum Associates 3-32

Edwards JA 1995 Principles and alternative systems in the transcription coding andmark-up of spoken discourserdquo Spoken English on Computer Transcription Markup andApplications Eds G Leech G Myers y J Thomas Harlow Longman 19-34

Ehlich K 1993 HIAT A Transcription System for Discourse Datardquo Talking DataTranscription and Coding in Discourse Research Eds JA Edwards y MD Lampert HillsdaleNJ Lawrence Erlbaum Associates 123-148

Eisen B 1993 Reliability of speech segmentation and labelling at different levels oftranscription Eurospeech93 3rd European Conference on Speech Communication andTechnology Berlin Germany 21-23 September 1993 Vol 1 673-676

Esling JH y H Gaylord 1993 Computer Codes for Phonetic Symbols Journal of theInternational Phonetic Association 232 77-82

Esling JH 1988 Computer coding of IPA symbols and detailed phonetic representationsof computer databases Journal of the International Phonetic Association 182 99-106

Esling JH 1990 Computer Coding of the IPA Supplementary Report Journal of theInternational Phonetic Association 201 22-26

Fourcin A y JM Dolmazon (on behalf of the SAM Project) 1991 Speech knowledgestandards and assessment Actes du XIIegraveme Congregraves International des Sciences Phoneacutetiques 19-24 aoucirct 1991 Aix-en-Provence France Aix-en-Provence Universiteacute de Provence Service desPublications Vol 5 430-433

Fourcin A G Harland W Barry y V Hazan eds 1989 Speech Input and OutputAssessment Multilingual Methods and Standards Chichester Ellis Horwood Ltd

French JP 1991 Updated notes for soundprint transcribers Working paper Universityof Birmingham October 1991 NERC-WP4-47

French JP 1992 Transcription proposals multilevel system Working paper Universityof Birmingham October 1992 NERC-WP4-50

Gibbon D 1989 Survey of Prosodic Labelling for EC Languages SAM-UBI-190 12February 1989 Report e6 in ESPRIT 2589 (SAM) Interim Report Year 1 Ref SAM-UCLG002 University College London February 1990

Gibbon D R Moore y R Winski eds 1997 Handbook on Standards and Resources forSpoken Language Systems Berlin Mouton De Gruyter [Documento de Internet disponible en httpcoralliliuni-bielefelddeEAGLESeagbookeagbookhtml]

Groslashnnum Thorsen N 1987 Suprasegmental transcription ARIPUC - Annual Report ofthe Institute of Phonetics University of Copenhagen 21 1-27

Gumperz JJ y J Berenz 1993 Transcribing Conversational Exchangesrdquo Talking DataTranscription and Coding in Discourse Research Eds JA Ewards y M D Lampert HillsdaleNJ Lawrence Erlbaum Associates 91-122

Hart J lsquoT R Collier y A Cohen 1990 A Perceptual Study of Intonation An Experimental- Phonetic Approach to Intonation Cambridge Cambridge University Press (Cambridge Studiesin Speech Science and Communication)

Hess W K Kohler y HG Tillmann 1995 The PhonDat-Verbmobil Speech CorpusEurospeech95 Proceedings of the 4th European Conference on Speech Communication andSpeech Technology Madrid Spain 18-21 September 1995 Vol 1 863-866

Hieronymus JL 1994 ASCII phonetic symbols for the worlds languages WorldbetATampT Bell Laboratories Technical Memo [Documento de Internet disponible enhttpwwwcseogieduCSLUcorporapapershtml]

Hirst D A Di Cristo y R Espesser en prensaLevels of representation and levels ofanalysis for intonation Prosody Theory and Experiments Ed M Horne Dordrecht Kluwer

Hirst DJ y A Di Cristo en prensa A survey of intonation systemsrdquo IntonationSystems A Survey of 20 Languages Eds D Hirst y A Di Cristo Cambridge CambridgeUniversity Press

Hirst DJ 1991 Intonation models towards a third generation Actes du XIIegraveme CongregravesInternational des Sciences Phoneacutetiques 19-24 aoucirct 1991 Aix-en-Provence France Aix-en-Provence Universiteacute de Provence Service des Publications Vol 1 305-310

Hirst DJ A Di Cristo M Le Besnerais Z Najim P Nicolas y P Romeacuteas 1993Multilingual modelling of intonation patternsrdquo Proceedings of an ESCA Workshop on ProsodySeptember 27-29 1993 Lund Sweden Eds D House y P Touati Lund University Departmentof Linguistics and Phonetics Working Papers 41 204-207

Hirst DJ N Ide y J Veacuteronis 1994 Coding fundamental frequency patterns for multi-lingual synthesis with INTSINT in the MULTEXT project Conference Proceedings of theSecond ESCAIEEE Workshop on Speech Synthesis September 12-15 1994 Mohonk MountainHouse New Paltz New York USA 77-80

Ide N y J Veacuteronis eds 1995 The Text Encoding Initiative Background and ContextsComputers and the Humanities 29 1-3 Publicado en forma de libro en Dordrecht KluwerAcademic Publishers

IPA 1989 The IPA 1989 Kiel Convention Workgroup 9 report Computer Coding of IPAsymbols and Computer Representation of Individual Languages Journal of the InternationalPhonetic Association 192 81-92

IPA 1993 IPA Chart revised to 1993 Journal of the International Phonetic Association231 [Documento de Internet disponible en httpwwwartsglaacukIPAipacharthtml]

IPA 1995 Preview of the IPA Handbook Journal of the International Phonetic Association251

ISO 8879 1986 Information Processing Text and Office Systems Standard GeneralizedMarkup Language (SGML) Geneva International Organization for Standardization

Johansson S 1995a The approach of the Text Encoding Initiative to the encoding ofspoken discourse Spoken English on Computer Transcription Markup and Applications EdsG Leech G Myers y J Thomas Harlow Longman 82-98

Johansson S 1995b The Encoding of Spoken Texts Computers and the Humanities291 149-158 The Text Encoding Initiative Background and Context Eds N Ide y J VeacuteronisDordrecht Kluwer Academic Publishers 149-158

Keating P P MacEachern A Shryock y S Domiacutenguez 1994 A manual for phonetictranscription Segmentation and labelling of words in spontaneous speech UCLA WorkingPapers in Phonetics 88 91-120

Kluger-Kruse M 1987 Computer Phonetic Alphabet ESPRIT Linguistic Analysis of theEuropean Languages Report BU-CPA0267 July 1987

Krot C y B Taylor 1995 Criteria for Acoustic-Phonetic Segmentation and WordLabelling in the Australian National Database of Spoken Language[Documento de Internet disponible en httpwwwshlrcmqeduaucriteriahtml]

Lander T 1997 The CSLU Labeling Guide Center for Spoken Language UnderstandingOregon Graduate Institute[Documento de Internet disponible en httpwwwcseogieduCSLUcorporapapershtml]

Llisterri J 1994 Prosody Encoding Survey WP 1 Specifications and Standards T15Markup Specifications Deliverable 153 Final version 15 September 1994 LRE Project 62-050MULTEXT

Llisterri J ed 1996 Prosody Tools Efficiency and Failures WP 4 Corpus T46 SpeechMarkup and Validation Deliverable 452 Final version 15 October 1996 LRE Project 62-050MULTEXT

MacWhinney B 1991The CHILDES Project Tools for Analyzing Talk Hillsdale NJLawrence Erlbaum

Marchal A N Nguyen y W Hardcastle 1995 Multitiered phonetic approach to speechlabelling Levels in Speech Communication Relations and Interactions A Tribute to MaxWajskop Hommage agrave Max Wajskop Eds C Sorin J Mariani H Meloni y J SchoengenAmsterdam Elsevier Science BV 149-158

NERC 1994 NERC-1 Network of European Reference Corpora Final Report PisaInstituto di Linguistica Computazionale - CNR January 1994 versioacuten en curso de publicacioacutenTowards a Network of European Reference Corpora Eds N Calzolari M Baker y PG KruytPisa Giardini

Nicolas P y D Hirst 1995 Symbolic coding of Higher-Level Characteristics ofFundamental Frequency Curvesrdquo Eurospeech95 Proceedings of the 4th European Conferenceon Speech Communication and Technology Madrid Spain 18-21 September 1995 Vol 2 989-992

OConnell DC y S Kowal 1994 Some Current Transcription Systems for SpokenDiscourse A critical Analysis Pragmatics 4 81-107

Ochs E 1979 Transcription as Theory Developmental Pragmatics Eds E Ochs E yBB Schieffelin New York Academic Press 43-72

Payne J 1992 Report on the compatibility of JP Frenchs spoken corpus transcriptionconventions with the TEI guidelines for transcription of spoken texts Working paper COBUILDBirmingham and IDS Mannheim December 1992 NERC-WP8WP4-122

Payne J 1995 The COBUILD spoken corpus transcription conventions SpokenEnglish on Computer Transcription Markup and Applications Eds G Leech G Myers y JThomas Harlow Longman 203-207

Payratoacute Ll 1995 Transcripcioacuten del discurso coloquialrdquo El espantildeol coloquial Actas del ISimposio sobre Anaacutelisis del Discurso Oral Almeriacutea 23-25 de noviembre de 1994 Ed L CorteacutesRodriacuteguez Almeriacutea Universidad de Almeriacutea Servicio de Publicaciones 43-70

Pierrehumbert J B 1897 (1980) The Phonology and Phonetics of English IntonationPhD Thesis Department of Linguistics MIT Bloomington Indiana University Linguistics Club

Pitrelli J M Beckman y J Hirschberg 1994 Evaluation of prosodic transcriptionlabelling reliability in the ToBI frameworkrdquo Proceedings of the Third International Conference onSpoken Language Processing Yokohama ICSLP Vol 2 123-126

Pullum GK y WA Ladusaw 1996 (1986) Phonetic Symbol Guide Chicago TheUniversity of Chicago Press 2nd edition

Roach P H Roach A Dew y P Rowlands 1990 Phonetic analysis and the automaticsegmentation and labeling of speech sounds Journal of the International Phonetic Association201 15-21

Schmidt MS C Scott y MA Jack 1993 Phonetic transcription standards for Europeannames (ONOMASTICA) Eurospeech93 3rd European Conference on Speech Communicationand Technology Berlin Germany 21-23 September 1993 Vol 1 279-282

Schuetze-Coburn S 1991Units of intonation in discourse a comparison of acoustic andauditory analysis Language and Speech 343 207-234

Selting M 1987 Descriptive categories for the auditive analysis of intonation inconversation Journal of Pragmatics 11 777-791

Selting M 1988 The role of intonation in the organisation of repair and problem handlingsequences in conversation Journal of Pragmatics 12 293-322

Senia F y JG Van Velden 1997 Specifications of orthographic transcription and lexiconconventions LRE-4001 SpeechDat Technical Report SD132 Final version 10 January 1997[Documento de Internet disponible en httpwwwphonetikuni-muenchendeSpeechDathtml]

Silverman K M Beckman J Pitrelli M Ostendorf C Wightman P Price JPierrehumbert y J Hirschberg 1992 TOBI A standard for labelling English prosodyProceedings of the Second International Conference on Spoken Language Processing ICSLP-92Banff October 1992 867-870

Sinclair J 1994 Spoken Language [3B] PhoneticPhonemic and Prosodic Annotation[52] NERC 1994 NERC-1 Network of European Reference Corpora Final Report PisaVersioacuten en curso de publicacioacuten Towards a Network of European Reference Corpora Eds NCalzolari M Baker y PG Kruyt Pisa Giardini

Sinclair J 1995 From theory to practicerdquo Spoken English on Computer TranscriptionMarkup and Applications Eds G Leech G Myers Y J Thomas Harlow Longman 99- 112

Sperberg-McQueen CM y L Burnard eds 1994 Guidelines for Electronic Text Encodingand Interchange TEI P3 Chicago and Oxford Association for Computational Linguistics Association for Computers and the Humanities Association for Literary and LinguisticComputing [Cap 11 Transcriptions of Speech] [Documento de Internet disponible enhttpetextvirginiaeduTEIhtml]

Strangert E y M Heldner 1995 Labelling of boundaries and prominences byphonetically experienced and non-experienced transcribers Phonum 3 Reports from theDepartment of Phonetics Umearing University 85-109 [Documento de Internet disponible enhttpwwwlingumusefonphonum3html]

Teubert W 1993 Phonetic Phonemic and Prosodic Annotation Final Report IDSMannheim February 1993 NERC-WP8-171

Tillmann HG y B Pompino-Marschall 1993 Theoretical Principles ConcerningSegmentation Labelling Strategies and Levels of Categorical Annotation for Spoken LanguageDatabase Systems Eurospeech93 3rd European Conference on Speech Communication andTechnology Berlin Germany 21-23 September 1993 Vol 3 1691-1694

Trancoso I 1995 The ONOMASTICA Interlanguage Pronunciation LexiconrdquoEurospeech95 Proceedings of the 4th European Conference on Speech Communication andTechnology Madrid Spain 18-21 September 1995 Vol 1 829-832

Wells JC 1987 Computer Coded Phonetic Transcription Journal of the InternationalPhonetic Association 172 94-114

Wells JC 1989 Computer-coded phonemic notation of individual languages of theEuropean Community Journal of the International Phonetic Association 191 31-54

Wells JC 1994 Computer-coding the IPA a proposed extension of SAMPA SpeechHearing and Language Work in Progress 1994 (University College London Department ofPhonetics and Linguistics) 8 271-289

Wells JC 1995 SAMPROSA (SAM Prosodic Transcription [Documento de Internetdisponible en httpwwwphonuclacukhomesampasamprosahtm]

Wells JC W Barry M Grice A Fourcin y D Gibbon 1992 Standard Computer-Compatible Transcription SAM Stage Report Sen3 SAM UCL-037 28 February 1992 SAM(1992) Esprit Project 2589 (SAM) Multilingual Speech InputOutput AssessmentMethodologyand Standardisation Final Report Year Three 1III91-28II1992 London University CollegeLondon

Wesenick M-B y F Schiel 1995 Feasibility of Automatic Annotation and BuildingPronunciation Lexica from Corpus Material LRE-63314 SpeechDat Report D3123 Finalversion 10 October 1995[Documento de Internet disponible en httpwwwicpgrenetfrSpeechDathomehtml]

Winski R R Moore y D Gibbon 1995 EAGLES Spoken Language Working GroupOverview and Resultsrdquo Eurospeech95 Proceedings of the 4th European Conference on SpeechCommunication and Speech Technology Madrid Spain 18-21 September 1995 Vol 1 841-844[Documento de Internet disponible en httpcoralliliuni-bielefeldde~gibbonEAGLESrwpaperrwpaperhtml]

  • 1- INTRODUCCIOacuteN
  • 2- NIVELES DE REPRESENTACIOacuteN ETIQUETADO Y CODIFICACIOacuteN
  • 3- REPRESENTACIOacuteN ORTOGRAacuteFICA DE CORPUS ORALES
  • 31- Propuestas para la representacioacuten ortograacutefica de corpus orales en el aacutembito de la linguumliacutestica de corpus
  • 32- Propuestas para la representacioacuten ortograacutefica de corpus orales en el aacutembito de las tecnologiacuteas del habla
  • 4- REPRESENTACIOacuteN FONEacuteTICA DE CORPUS ORALES
  • 41- La representacioacuten foneacutetica de los elementos segmentales
  • 42- La representacioacuten foneacutetica de los elementos suprasegmentales
  • 5- ETIQUETADO FONEacuteTICO DE CORPUS ORALES
  • 51- Niveles de etiquetado foneacutetico de corpus orales
  • 52- La transcripcioacuten y el etiquetado automaacutetico de corpus orales
  • 6- TRANSCRIPCIOacuteN Y CODIFICACIOacuteN DE CORPUS PARA EL ANAacuteLISIS DE LA LENGUA ORAL
  • 61- Los requisitos de una transcripcioacuten
  • 62- Propuestas de estandarizacioacuten para la transcripcioacuten y codificacioacuten de corpus orales
  • 7- CONCLUSIONES
  • BIBLIOGRAFIacuteA
Page 20: Transcripción, etiquetado y codificación de corpus orales

Beckman ME y GM Ayers GM 1994 Guidelines for ToBI Labelling Version 20February 1994[Documento de Internet disponible en httplingohio-stateeduPhoneticsToBIToBI0html]

Beckman ME y J Hirschberg J 1994 The ToBI Annotation Conventions Apeacutendice A deME Beckman y GM Ayers 1994 Guidelines for ToBI Labelling Version 20 February 1994[Documento de Internet disponible en httplingohio-stateeduPhoneticsToBIToBI0html]

Bruce G 1988 23 Supasegmental categories and 24 The symbolization of temporalevents Journal of the International Phonetic Association 182 75-76

Bruce G 1989 Report from the IPA working group on suprasegmental categories LundUniversity Department of Linguistics General Linguistics Phonetics Working Papers 35 25-40

Burnard L 1995 What is SGML and how does it help Computers and the Humanities291 41-50 The Text Encoding Initiative Background and Context Eds N Ide y J VeacuteronisDordrecht Kluwer Academic Publishers

Burnard L 1995a Text Encoding for Information Exchange An Introduction to the TextEncoding Initiaive TEI Document TEI J31 [Documento de Internet disponible enhttpwwwuiceduorgsteiinfoteij31]

Burnard L 1995b The Text Encoding Initiative an overviewrdquo Spoken English onComputer Transcription Markup and Applications Eds G LEECH G MYERS y JTHOMAS Harlow Longman 69-81

Chafe W 1995 Adequacy user-friendliness and practicality in transcribingrdquo English onComputer Transcription Markup and Applications Eds G Leech G Myers y J ThomasHarlow Longman 54-61

Chan D A Fourcin D Gibbon B Granstroumlm M Huckvale G Kokkinakis K KvaleL Lamel B Lindberg A Moreno J Mouropoulos F Senia I Trancoso C Veld y J Zeiliger1995 EUROM - A Spoken Language Resource for the EU Eurospeech95 Proceedings of the4th European Conference on Speech Communication and Speech Technology Madrid Spain 18-21 September 1995 Vol 1 867-870

Cole RA BT Oshika M Noel T Lander y M Fanty 1994 Labeler Agreement inPhonetic Labeling of Continuous Speech Proceedings of the 1994 International Conference onSpoken Language Processing Yokohama Japan 18-22 September 1994[Documento de Internet disponible en httpwwwcseogieduCSLUcorporapapershtml]

Cook G 1995 Theoretical issues transcribing the untranscribablerdquo Spoken English onComputer Transcription Markup and Applications Eds G Leech G Myers y J ThomasHarlow Longman 35-53

Du Bois JW 1991 Transcription design principles for spoken discourse researchPragmatics 1 71-106

Du Bois JW S Schuetze-Coburn S Cumming y D Paolino 1993 Outline of discoursetranscriptionrdquo Talking Data Transcription and Coding in Discourse Research Eds JAEdwards y MD Lampert Hillsdale NJ Lawrence Erlbaum Associates 45-90

EAGLES 1996 Preliminary Recommendations on Spoken Texts EAGLES DocumentEAG-TCWG-STPP May 1996[Documento de Internet disponible enhttpwwwilcpicnritEAGLES96spokentxspokentxhtml]

Edwards JA 1992 Design principles in the transcription of spoken discourserdquoDirections in Corpus Linguistics Proceedings of Nobel Symposium 82 Stockholm 4-8 August1991 Ed J Svartvik Berlin Mouton de Gruyter 129-147

Edwards JA 1993 Principles and Contrasting Systems of Discourse TranscriptionrdquoTalking Data Transcription and Coding in Discourse Research Eds JA Edwards y MDLampert Hillsdale Hillsdale NJ Lawrence Erlbaum Associates 3-32

Edwards JA 1995 Principles and alternative systems in the transcription coding andmark-up of spoken discourserdquo Spoken English on Computer Transcription Markup andApplications Eds G Leech G Myers y J Thomas Harlow Longman 19-34

Ehlich K 1993 HIAT A Transcription System for Discourse Datardquo Talking DataTranscription and Coding in Discourse Research Eds JA Edwards y MD Lampert HillsdaleNJ Lawrence Erlbaum Associates 123-148

Eisen B 1993 Reliability of speech segmentation and labelling at different levels oftranscription Eurospeech93 3rd European Conference on Speech Communication andTechnology Berlin Germany 21-23 September 1993 Vol 1 673-676

Esling JH y H Gaylord 1993 Computer Codes for Phonetic Symbols Journal of theInternational Phonetic Association 232 77-82

Esling JH 1988 Computer coding of IPA symbols and detailed phonetic representationsof computer databases Journal of the International Phonetic Association 182 99-106

Esling JH 1990 Computer Coding of the IPA Supplementary Report Journal of theInternational Phonetic Association 201 22-26

Fourcin A y JM Dolmazon (on behalf of the SAM Project) 1991 Speech knowledgestandards and assessment Actes du XIIegraveme Congregraves International des Sciences Phoneacutetiques 19-24 aoucirct 1991 Aix-en-Provence France Aix-en-Provence Universiteacute de Provence Service desPublications Vol 5 430-433

Fourcin A G Harland W Barry y V Hazan eds 1989 Speech Input and OutputAssessment Multilingual Methods and Standards Chichester Ellis Horwood Ltd

French JP 1991 Updated notes for soundprint transcribers Working paper Universityof Birmingham October 1991 NERC-WP4-47

French JP 1992 Transcription proposals multilevel system Working paper Universityof Birmingham October 1992 NERC-WP4-50

Gibbon D 1989 Survey of Prosodic Labelling for EC Languages SAM-UBI-190 12February 1989 Report e6 in ESPRIT 2589 (SAM) Interim Report Year 1 Ref SAM-UCLG002 University College London February 1990

Gibbon D R Moore y R Winski eds 1997 Handbook on Standards and Resources forSpoken Language Systems Berlin Mouton De Gruyter [Documento de Internet disponible en httpcoralliliuni-bielefelddeEAGLESeagbookeagbookhtml]

Groslashnnum Thorsen N 1987 Suprasegmental transcription ARIPUC - Annual Report ofthe Institute of Phonetics University of Copenhagen 21 1-27

Gumperz JJ y J Berenz 1993 Transcribing Conversational Exchangesrdquo Talking DataTranscription and Coding in Discourse Research Eds JA Ewards y M D Lampert HillsdaleNJ Lawrence Erlbaum Associates 91-122

Hart J lsquoT R Collier y A Cohen 1990 A Perceptual Study of Intonation An Experimental- Phonetic Approach to Intonation Cambridge Cambridge University Press (Cambridge Studiesin Speech Science and Communication)

Hess W K Kohler y HG Tillmann 1995 The PhonDat-Verbmobil Speech CorpusEurospeech95 Proceedings of the 4th European Conference on Speech Communication andSpeech Technology Madrid Spain 18-21 September 1995 Vol 1 863-866

Hieronymus JL 1994 ASCII phonetic symbols for the worlds languages WorldbetATampT Bell Laboratories Technical Memo [Documento de Internet disponible enhttpwwwcseogieduCSLUcorporapapershtml]

Hirst D A Di Cristo y R Espesser en prensaLevels of representation and levels ofanalysis for intonation Prosody Theory and Experiments Ed M Horne Dordrecht Kluwer

Hirst DJ y A Di Cristo en prensa A survey of intonation systemsrdquo IntonationSystems A Survey of 20 Languages Eds D Hirst y A Di Cristo Cambridge CambridgeUniversity Press

Hirst DJ 1991 Intonation models towards a third generation Actes du XIIegraveme CongregravesInternational des Sciences Phoneacutetiques 19-24 aoucirct 1991 Aix-en-Provence France Aix-en-Provence Universiteacute de Provence Service des Publications Vol 1 305-310

Hirst DJ A Di Cristo M Le Besnerais Z Najim P Nicolas y P Romeacuteas 1993Multilingual modelling of intonation patternsrdquo Proceedings of an ESCA Workshop on ProsodySeptember 27-29 1993 Lund Sweden Eds D House y P Touati Lund University Departmentof Linguistics and Phonetics Working Papers 41 204-207

Hirst DJ N Ide y J Veacuteronis 1994 Coding fundamental frequency patterns for multi-lingual synthesis with INTSINT in the MULTEXT project Conference Proceedings of theSecond ESCAIEEE Workshop on Speech Synthesis September 12-15 1994 Mohonk MountainHouse New Paltz New York USA 77-80

Ide N y J Veacuteronis eds 1995 The Text Encoding Initiative Background and ContextsComputers and the Humanities 29 1-3 Publicado en forma de libro en Dordrecht KluwerAcademic Publishers

IPA 1989 The IPA 1989 Kiel Convention Workgroup 9 report Computer Coding of IPAsymbols and Computer Representation of Individual Languages Journal of the InternationalPhonetic Association 192 81-92

IPA 1993 IPA Chart revised to 1993 Journal of the International Phonetic Association231 [Documento de Internet disponible en httpwwwartsglaacukIPAipacharthtml]

IPA 1995 Preview of the IPA Handbook Journal of the International Phonetic Association251

ISO 8879 1986 Information Processing Text and Office Systems Standard GeneralizedMarkup Language (SGML) Geneva International Organization for Standardization

Johansson S 1995a The approach of the Text Encoding Initiative to the encoding ofspoken discourse Spoken English on Computer Transcription Markup and Applications EdsG Leech G Myers y J Thomas Harlow Longman 82-98

Johansson S 1995b The Encoding of Spoken Texts Computers and the Humanities291 149-158 The Text Encoding Initiative Background and Context Eds N Ide y J VeacuteronisDordrecht Kluwer Academic Publishers 149-158

Keating P P MacEachern A Shryock y S Domiacutenguez 1994 A manual for phonetictranscription Segmentation and labelling of words in spontaneous speech UCLA WorkingPapers in Phonetics 88 91-120

Kluger-Kruse M 1987 Computer Phonetic Alphabet ESPRIT Linguistic Analysis of theEuropean Languages Report BU-CPA0267 July 1987

Krot C y B Taylor 1995 Criteria for Acoustic-Phonetic Segmentation and WordLabelling in the Australian National Database of Spoken Language[Documento de Internet disponible en httpwwwshlrcmqeduaucriteriahtml]

Lander T 1997 The CSLU Labeling Guide Center for Spoken Language UnderstandingOregon Graduate Institute[Documento de Internet disponible en httpwwwcseogieduCSLUcorporapapershtml]

Llisterri J 1994 Prosody Encoding Survey WP 1 Specifications and Standards T15Markup Specifications Deliverable 153 Final version 15 September 1994 LRE Project 62-050MULTEXT

Llisterri J ed 1996 Prosody Tools Efficiency and Failures WP 4 Corpus T46 SpeechMarkup and Validation Deliverable 452 Final version 15 October 1996 LRE Project 62-050MULTEXT

MacWhinney B 1991The CHILDES Project Tools for Analyzing Talk Hillsdale NJLawrence Erlbaum

Marchal A N Nguyen y W Hardcastle 1995 Multitiered phonetic approach to speechlabelling Levels in Speech Communication Relations and Interactions A Tribute to MaxWajskop Hommage agrave Max Wajskop Eds C Sorin J Mariani H Meloni y J SchoengenAmsterdam Elsevier Science BV 149-158

NERC 1994 NERC-1 Network of European Reference Corpora Final Report PisaInstituto di Linguistica Computazionale - CNR January 1994 versioacuten en curso de publicacioacutenTowards a Network of European Reference Corpora Eds N Calzolari M Baker y PG KruytPisa Giardini

Nicolas P y D Hirst 1995 Symbolic coding of Higher-Level Characteristics ofFundamental Frequency Curvesrdquo Eurospeech95 Proceedings of the 4th European Conferenceon Speech Communication and Technology Madrid Spain 18-21 September 1995 Vol 2 989-992

OConnell DC y S Kowal 1994 Some Current Transcription Systems for SpokenDiscourse A critical Analysis Pragmatics 4 81-107

Ochs E 1979 Transcription as Theory Developmental Pragmatics Eds E Ochs E yBB Schieffelin New York Academic Press 43-72

Payne J 1992 Report on the compatibility of JP Frenchs spoken corpus transcriptionconventions with the TEI guidelines for transcription of spoken texts Working paper COBUILDBirmingham and IDS Mannheim December 1992 NERC-WP8WP4-122

Payne J 1995 The COBUILD spoken corpus transcription conventions SpokenEnglish on Computer Transcription Markup and Applications Eds G Leech G Myers y JThomas Harlow Longman 203-207

Payratoacute Ll 1995 Transcripcioacuten del discurso coloquialrdquo El espantildeol coloquial Actas del ISimposio sobre Anaacutelisis del Discurso Oral Almeriacutea 23-25 de noviembre de 1994 Ed L CorteacutesRodriacuteguez Almeriacutea Universidad de Almeriacutea Servicio de Publicaciones 43-70

Pierrehumbert J B 1897 (1980) The Phonology and Phonetics of English IntonationPhD Thesis Department of Linguistics MIT Bloomington Indiana University Linguistics Club

Pitrelli J M Beckman y J Hirschberg 1994 Evaluation of prosodic transcriptionlabelling reliability in the ToBI frameworkrdquo Proceedings of the Third International Conference onSpoken Language Processing Yokohama ICSLP Vol 2 123-126

Pullum GK y WA Ladusaw 1996 (1986) Phonetic Symbol Guide Chicago TheUniversity of Chicago Press 2nd edition

Roach P H Roach A Dew y P Rowlands 1990 Phonetic analysis and the automaticsegmentation and labeling of speech sounds Journal of the International Phonetic Association201 15-21

Schmidt MS C Scott y MA Jack 1993 Phonetic transcription standards for Europeannames (ONOMASTICA) Eurospeech93 3rd European Conference on Speech Communicationand Technology Berlin Germany 21-23 September 1993 Vol 1 279-282

Schuetze-Coburn S 1991Units of intonation in discourse a comparison of acoustic andauditory analysis Language and Speech 343 207-234

Selting M 1987 Descriptive categories for the auditive analysis of intonation inconversation Journal of Pragmatics 11 777-791

Selting M 1988 The role of intonation in the organisation of repair and problem handlingsequences in conversation Journal of Pragmatics 12 293-322

Senia F y JG Van Velden 1997 Specifications of orthographic transcription and lexiconconventions LRE-4001 SpeechDat Technical Report SD132 Final version 10 January 1997[Documento de Internet disponible en httpwwwphonetikuni-muenchendeSpeechDathtml]

Silverman K M Beckman J Pitrelli M Ostendorf C Wightman P Price JPierrehumbert y J Hirschberg 1992 TOBI A standard for labelling English prosodyProceedings of the Second International Conference on Spoken Language Processing ICSLP-92Banff October 1992 867-870

Sinclair J 1994 Spoken Language [3B] PhoneticPhonemic and Prosodic Annotation[52] NERC 1994 NERC-1 Network of European Reference Corpora Final Report PisaVersioacuten en curso de publicacioacuten Towards a Network of European Reference Corpora Eds NCalzolari M Baker y PG Kruyt Pisa Giardini

Sinclair J 1995 From theory to practicerdquo Spoken English on Computer TranscriptionMarkup and Applications Eds G Leech G Myers Y J Thomas Harlow Longman 99- 112

Sperberg-McQueen CM y L Burnard eds 1994 Guidelines for Electronic Text Encodingand Interchange TEI P3 Chicago and Oxford Association for Computational Linguistics Association for Computers and the Humanities Association for Literary and LinguisticComputing [Cap 11 Transcriptions of Speech] [Documento de Internet disponible enhttpetextvirginiaeduTEIhtml]

Strangert E y M Heldner 1995 Labelling of boundaries and prominences byphonetically experienced and non-experienced transcribers Phonum 3 Reports from theDepartment of Phonetics Umearing University 85-109 [Documento de Internet disponible enhttpwwwlingumusefonphonum3html]

Teubert W 1993 Phonetic Phonemic and Prosodic Annotation Final Report IDSMannheim February 1993 NERC-WP8-171

Tillmann HG y B Pompino-Marschall 1993 Theoretical Principles ConcerningSegmentation Labelling Strategies and Levels of Categorical Annotation for Spoken LanguageDatabase Systems Eurospeech93 3rd European Conference on Speech Communication andTechnology Berlin Germany 21-23 September 1993 Vol 3 1691-1694

Trancoso I 1995 The ONOMASTICA Interlanguage Pronunciation LexiconrdquoEurospeech95 Proceedings of the 4th European Conference on Speech Communication andTechnology Madrid Spain 18-21 September 1995 Vol 1 829-832

Wells JC 1987 Computer Coded Phonetic Transcription Journal of the InternationalPhonetic Association 172 94-114

Wells JC 1989 Computer-coded phonemic notation of individual languages of theEuropean Community Journal of the International Phonetic Association 191 31-54

Wells JC 1994 Computer-coding the IPA a proposed extension of SAMPA SpeechHearing and Language Work in Progress 1994 (University College London Department ofPhonetics and Linguistics) 8 271-289

Wells JC 1995 SAMPROSA (SAM Prosodic Transcription [Documento de Internetdisponible en httpwwwphonuclacukhomesampasamprosahtm]

Wells JC W Barry M Grice A Fourcin y D Gibbon 1992 Standard Computer-Compatible Transcription SAM Stage Report Sen3 SAM UCL-037 28 February 1992 SAM(1992) Esprit Project 2589 (SAM) Multilingual Speech InputOutput AssessmentMethodologyand Standardisation Final Report Year Three 1III91-28II1992 London University CollegeLondon

Wesenick M-B y F Schiel 1995 Feasibility of Automatic Annotation and BuildingPronunciation Lexica from Corpus Material LRE-63314 SpeechDat Report D3123 Finalversion 10 October 1995[Documento de Internet disponible en httpwwwicpgrenetfrSpeechDathomehtml]

Winski R R Moore y D Gibbon 1995 EAGLES Spoken Language Working GroupOverview and Resultsrdquo Eurospeech95 Proceedings of the 4th European Conference on SpeechCommunication and Speech Technology Madrid Spain 18-21 September 1995 Vol 1 841-844[Documento de Internet disponible en httpcoralliliuni-bielefeldde~gibbonEAGLESrwpaperrwpaperhtml]

  • 1- INTRODUCCIOacuteN
  • 2- NIVELES DE REPRESENTACIOacuteN ETIQUETADO Y CODIFICACIOacuteN
  • 3- REPRESENTACIOacuteN ORTOGRAacuteFICA DE CORPUS ORALES
  • 31- Propuestas para la representacioacuten ortograacutefica de corpus orales en el aacutembito de la linguumliacutestica de corpus
  • 32- Propuestas para la representacioacuten ortograacutefica de corpus orales en el aacutembito de las tecnologiacuteas del habla
  • 4- REPRESENTACIOacuteN FONEacuteTICA DE CORPUS ORALES
  • 41- La representacioacuten foneacutetica de los elementos segmentales
  • 42- La representacioacuten foneacutetica de los elementos suprasegmentales
  • 5- ETIQUETADO FONEacuteTICO DE CORPUS ORALES
  • 51- Niveles de etiquetado foneacutetico de corpus orales
  • 52- La transcripcioacuten y el etiquetado automaacutetico de corpus orales
  • 6- TRANSCRIPCIOacuteN Y CODIFICACIOacuteN DE CORPUS PARA EL ANAacuteLISIS DE LA LENGUA ORAL
  • 61- Los requisitos de una transcripcioacuten
  • 62- Propuestas de estandarizacioacuten para la transcripcioacuten y codificacioacuten de corpus orales
  • 7- CONCLUSIONES
  • BIBLIOGRAFIacuteA
Page 21: Transcripción, etiquetado y codificación de corpus orales

Du Bois JW S Schuetze-Coburn S Cumming y D Paolino 1993 Outline of discoursetranscriptionrdquo Talking Data Transcription and Coding in Discourse Research Eds JAEdwards y MD Lampert Hillsdale NJ Lawrence Erlbaum Associates 45-90

EAGLES 1996 Preliminary Recommendations on Spoken Texts EAGLES DocumentEAG-TCWG-STPP May 1996[Documento de Internet disponible enhttpwwwilcpicnritEAGLES96spokentxspokentxhtml]

Edwards JA 1992 Design principles in the transcription of spoken discourserdquoDirections in Corpus Linguistics Proceedings of Nobel Symposium 82 Stockholm 4-8 August1991 Ed J Svartvik Berlin Mouton de Gruyter 129-147

Edwards JA 1993 Principles and Contrasting Systems of Discourse TranscriptionrdquoTalking Data Transcription and Coding in Discourse Research Eds JA Edwards y MDLampert Hillsdale Hillsdale NJ Lawrence Erlbaum Associates 3-32

Edwards JA 1995 Principles and alternative systems in the transcription coding andmark-up of spoken discourserdquo Spoken English on Computer Transcription Markup andApplications Eds G Leech G Myers y J Thomas Harlow Longman 19-34

Ehlich K 1993 HIAT A Transcription System for Discourse Datardquo Talking DataTranscription and Coding in Discourse Research Eds JA Edwards y MD Lampert HillsdaleNJ Lawrence Erlbaum Associates 123-148

Eisen B 1993 Reliability of speech segmentation and labelling at different levels oftranscription Eurospeech93 3rd European Conference on Speech Communication andTechnology Berlin Germany 21-23 September 1993 Vol 1 673-676

Esling JH y H Gaylord 1993 Computer Codes for Phonetic Symbols Journal of theInternational Phonetic Association 232 77-82

Esling JH 1988 Computer coding of IPA symbols and detailed phonetic representationsof computer databases Journal of the International Phonetic Association 182 99-106

Esling JH 1990 Computer Coding of the IPA Supplementary Report Journal of theInternational Phonetic Association 201 22-26

Fourcin A y JM Dolmazon (on behalf of the SAM Project) 1991 Speech knowledgestandards and assessment Actes du XIIegraveme Congregraves International des Sciences Phoneacutetiques 19-24 aoucirct 1991 Aix-en-Provence France Aix-en-Provence Universiteacute de Provence Service desPublications Vol 5 430-433

Fourcin A G Harland W Barry y V Hazan eds 1989 Speech Input and OutputAssessment Multilingual Methods and Standards Chichester Ellis Horwood Ltd

French JP 1991 Updated notes for soundprint transcribers Working paper Universityof Birmingham October 1991 NERC-WP4-47

French JP 1992 Transcription proposals multilevel system Working paper Universityof Birmingham October 1992 NERC-WP4-50

Gibbon D 1989 Survey of Prosodic Labelling for EC Languages SAM-UBI-190 12February 1989 Report e6 in ESPRIT 2589 (SAM) Interim Report Year 1 Ref SAM-UCLG002 University College London February 1990

Gibbon D R Moore y R Winski eds 1997 Handbook on Standards and Resources forSpoken Language Systems Berlin Mouton De Gruyter [Documento de Internet disponible en httpcoralliliuni-bielefelddeEAGLESeagbookeagbookhtml]

Groslashnnum Thorsen N 1987 Suprasegmental transcription ARIPUC - Annual Report ofthe Institute of Phonetics University of Copenhagen 21 1-27

Gumperz JJ y J Berenz 1993 Transcribing Conversational Exchangesrdquo Talking DataTranscription and Coding in Discourse Research Eds JA Ewards y M D Lampert HillsdaleNJ Lawrence Erlbaum Associates 91-122

Hart J lsquoT R Collier y A Cohen 1990 A Perceptual Study of Intonation An Experimental- Phonetic Approach to Intonation Cambridge Cambridge University Press (Cambridge Studiesin Speech Science and Communication)

Hess W K Kohler y HG Tillmann 1995 The PhonDat-Verbmobil Speech CorpusEurospeech95 Proceedings of the 4th European Conference on Speech Communication andSpeech Technology Madrid Spain 18-21 September 1995 Vol 1 863-866

Hieronymus JL 1994 ASCII phonetic symbols for the worlds languages WorldbetATampT Bell Laboratories Technical Memo [Documento de Internet disponible enhttpwwwcseogieduCSLUcorporapapershtml]

Hirst D A Di Cristo y R Espesser en prensaLevels of representation and levels ofanalysis for intonation Prosody Theory and Experiments Ed M Horne Dordrecht Kluwer

Hirst DJ y A Di Cristo en prensa A survey of intonation systemsrdquo IntonationSystems A Survey of 20 Languages Eds D Hirst y A Di Cristo Cambridge CambridgeUniversity Press

Hirst DJ 1991 Intonation models towards a third generation Actes du XIIegraveme CongregravesInternational des Sciences Phoneacutetiques 19-24 aoucirct 1991 Aix-en-Provence France Aix-en-Provence Universiteacute de Provence Service des Publications Vol 1 305-310

Hirst DJ A Di Cristo M Le Besnerais Z Najim P Nicolas y P Romeacuteas 1993Multilingual modelling of intonation patternsrdquo Proceedings of an ESCA Workshop on ProsodySeptember 27-29 1993 Lund Sweden Eds D House y P Touati Lund University Departmentof Linguistics and Phonetics Working Papers 41 204-207

Hirst DJ N Ide y J Veacuteronis 1994 Coding fundamental frequency patterns for multi-lingual synthesis with INTSINT in the MULTEXT project Conference Proceedings of theSecond ESCAIEEE Workshop on Speech Synthesis September 12-15 1994 Mohonk MountainHouse New Paltz New York USA 77-80

Ide N y J Veacuteronis eds 1995 The Text Encoding Initiative Background and ContextsComputers and the Humanities 29 1-3 Publicado en forma de libro en Dordrecht KluwerAcademic Publishers

IPA 1989 The IPA 1989 Kiel Convention Workgroup 9 report Computer Coding of IPAsymbols and Computer Representation of Individual Languages Journal of the InternationalPhonetic Association 192 81-92

IPA 1993 IPA Chart revised to 1993 Journal of the International Phonetic Association231 [Documento de Internet disponible en httpwwwartsglaacukIPAipacharthtml]

IPA 1995 Preview of the IPA Handbook Journal of the International Phonetic Association251

ISO 8879 1986 Information Processing Text and Office Systems Standard GeneralizedMarkup Language (SGML) Geneva International Organization for Standardization

Johansson S 1995a The approach of the Text Encoding Initiative to the encoding ofspoken discourse Spoken English on Computer Transcription Markup and Applications EdsG Leech G Myers y J Thomas Harlow Longman 82-98

Johansson S 1995b The Encoding of Spoken Texts Computers and the Humanities291 149-158 The Text Encoding Initiative Background and Context Eds N Ide y J VeacuteronisDordrecht Kluwer Academic Publishers 149-158

Keating P P MacEachern A Shryock y S Domiacutenguez 1994 A manual for phonetictranscription Segmentation and labelling of words in spontaneous speech UCLA WorkingPapers in Phonetics 88 91-120

Kluger-Kruse M 1987 Computer Phonetic Alphabet ESPRIT Linguistic Analysis of theEuropean Languages Report BU-CPA0267 July 1987

Krot C y B Taylor 1995 Criteria for Acoustic-Phonetic Segmentation and WordLabelling in the Australian National Database of Spoken Language[Documento de Internet disponible en httpwwwshlrcmqeduaucriteriahtml]

Lander T 1997 The CSLU Labeling Guide Center for Spoken Language UnderstandingOregon Graduate Institute[Documento de Internet disponible en httpwwwcseogieduCSLUcorporapapershtml]

Llisterri J 1994 Prosody Encoding Survey WP 1 Specifications and Standards T15Markup Specifications Deliverable 153 Final version 15 September 1994 LRE Project 62-050MULTEXT

Llisterri J ed 1996 Prosody Tools Efficiency and Failures WP 4 Corpus T46 SpeechMarkup and Validation Deliverable 452 Final version 15 October 1996 LRE Project 62-050MULTEXT

MacWhinney B 1991The CHILDES Project Tools for Analyzing Talk Hillsdale NJLawrence Erlbaum

Marchal A N Nguyen y W Hardcastle 1995 Multitiered phonetic approach to speechlabelling Levels in Speech Communication Relations and Interactions A Tribute to MaxWajskop Hommage agrave Max Wajskop Eds C Sorin J Mariani H Meloni y J SchoengenAmsterdam Elsevier Science BV 149-158

NERC 1994 NERC-1 Network of European Reference Corpora Final Report PisaInstituto di Linguistica Computazionale - CNR January 1994 versioacuten en curso de publicacioacutenTowards a Network of European Reference Corpora Eds N Calzolari M Baker y PG KruytPisa Giardini

Nicolas P y D Hirst 1995 Symbolic coding of Higher-Level Characteristics ofFundamental Frequency Curvesrdquo Eurospeech95 Proceedings of the 4th European Conferenceon Speech Communication and Technology Madrid Spain 18-21 September 1995 Vol 2 989-992

OConnell DC y S Kowal 1994 Some Current Transcription Systems for SpokenDiscourse A critical Analysis Pragmatics 4 81-107

Ochs E 1979 Transcription as Theory Developmental Pragmatics Eds E Ochs E yBB Schieffelin New York Academic Press 43-72

Payne J 1992 Report on the compatibility of JP Frenchs spoken corpus transcriptionconventions with the TEI guidelines for transcription of spoken texts Working paper COBUILDBirmingham and IDS Mannheim December 1992 NERC-WP8WP4-122

Payne J 1995 The COBUILD spoken corpus transcription conventions SpokenEnglish on Computer Transcription Markup and Applications Eds G Leech G Myers y JThomas Harlow Longman 203-207

Payratoacute Ll 1995 Transcripcioacuten del discurso coloquialrdquo El espantildeol coloquial Actas del ISimposio sobre Anaacutelisis del Discurso Oral Almeriacutea 23-25 de noviembre de 1994 Ed L CorteacutesRodriacuteguez Almeriacutea Universidad de Almeriacutea Servicio de Publicaciones 43-70

Pierrehumbert J B 1897 (1980) The Phonology and Phonetics of English IntonationPhD Thesis Department of Linguistics MIT Bloomington Indiana University Linguistics Club

Pitrelli J M Beckman y J Hirschberg 1994 Evaluation of prosodic transcriptionlabelling reliability in the ToBI frameworkrdquo Proceedings of the Third International Conference onSpoken Language Processing Yokohama ICSLP Vol 2 123-126

Pullum GK y WA Ladusaw 1996 (1986) Phonetic Symbol Guide Chicago TheUniversity of Chicago Press 2nd edition

Roach P H Roach A Dew y P Rowlands 1990 Phonetic analysis and the automaticsegmentation and labeling of speech sounds Journal of the International Phonetic Association201 15-21

Schmidt MS C Scott y MA Jack 1993 Phonetic transcription standards for Europeannames (ONOMASTICA) Eurospeech93 3rd European Conference on Speech Communicationand Technology Berlin Germany 21-23 September 1993 Vol 1 279-282

Schuetze-Coburn S 1991Units of intonation in discourse a comparison of acoustic andauditory analysis Language and Speech 343 207-234

Selting M 1987 Descriptive categories for the auditive analysis of intonation inconversation Journal of Pragmatics 11 777-791

Selting M 1988 The role of intonation in the organisation of repair and problem handlingsequences in conversation Journal of Pragmatics 12 293-322

Senia F y JG Van Velden 1997 Specifications of orthographic transcription and lexiconconventions LRE-4001 SpeechDat Technical Report SD132 Final version 10 January 1997[Documento de Internet disponible en httpwwwphonetikuni-muenchendeSpeechDathtml]

Silverman K M Beckman J Pitrelli M Ostendorf C Wightman P Price JPierrehumbert y J Hirschberg 1992 TOBI A standard for labelling English prosodyProceedings of the Second International Conference on Spoken Language Processing ICSLP-92Banff October 1992 867-870

Sinclair J 1994 Spoken Language [3B] PhoneticPhonemic and Prosodic Annotation[52] NERC 1994 NERC-1 Network of European Reference Corpora Final Report PisaVersioacuten en curso de publicacioacuten Towards a Network of European Reference Corpora Eds NCalzolari M Baker y PG Kruyt Pisa Giardini

Sinclair J 1995 From theory to practicerdquo Spoken English on Computer TranscriptionMarkup and Applications Eds G Leech G Myers Y J Thomas Harlow Longman 99- 112

Sperberg-McQueen CM y L Burnard eds 1994 Guidelines for Electronic Text Encodingand Interchange TEI P3 Chicago and Oxford Association for Computational Linguistics Association for Computers and the Humanities Association for Literary and LinguisticComputing [Cap 11 Transcriptions of Speech] [Documento de Internet disponible enhttpetextvirginiaeduTEIhtml]

Strangert E y M Heldner 1995 Labelling of boundaries and prominences byphonetically experienced and non-experienced transcribers Phonum 3 Reports from theDepartment of Phonetics Umearing University 85-109 [Documento de Internet disponible enhttpwwwlingumusefonphonum3html]

Teubert W 1993 Phonetic Phonemic and Prosodic Annotation Final Report IDSMannheim February 1993 NERC-WP8-171

Tillmann HG y B Pompino-Marschall 1993 Theoretical Principles ConcerningSegmentation Labelling Strategies and Levels of Categorical Annotation for Spoken LanguageDatabase Systems Eurospeech93 3rd European Conference on Speech Communication andTechnology Berlin Germany 21-23 September 1993 Vol 3 1691-1694

Trancoso I 1995 The ONOMASTICA Interlanguage Pronunciation LexiconrdquoEurospeech95 Proceedings of the 4th European Conference on Speech Communication andTechnology Madrid Spain 18-21 September 1995 Vol 1 829-832

Wells JC 1987 Computer Coded Phonetic Transcription Journal of the InternationalPhonetic Association 172 94-114

Wells JC 1989 Computer-coded phonemic notation of individual languages of theEuropean Community Journal of the International Phonetic Association 191 31-54

Wells JC 1994 Computer-coding the IPA a proposed extension of SAMPA SpeechHearing and Language Work in Progress 1994 (University College London Department ofPhonetics and Linguistics) 8 271-289

Wells JC 1995 SAMPROSA (SAM Prosodic Transcription [Documento de Internetdisponible en httpwwwphonuclacukhomesampasamprosahtm]

Wells JC W Barry M Grice A Fourcin y D Gibbon 1992 Standard Computer-Compatible Transcription SAM Stage Report Sen3 SAM UCL-037 28 February 1992 SAM(1992) Esprit Project 2589 (SAM) Multilingual Speech InputOutput AssessmentMethodologyand Standardisation Final Report Year Three 1III91-28II1992 London University CollegeLondon

Wesenick M-B y F Schiel 1995 Feasibility of Automatic Annotation and BuildingPronunciation Lexica from Corpus Material LRE-63314 SpeechDat Report D3123 Finalversion 10 October 1995[Documento de Internet disponible en httpwwwicpgrenetfrSpeechDathomehtml]

Winski R R Moore y D Gibbon 1995 EAGLES Spoken Language Working GroupOverview and Resultsrdquo Eurospeech95 Proceedings of the 4th European Conference on SpeechCommunication and Speech Technology Madrid Spain 18-21 September 1995 Vol 1 841-844[Documento de Internet disponible en httpcoralliliuni-bielefeldde~gibbonEAGLESrwpaperrwpaperhtml]

  • 1- INTRODUCCIOacuteN
  • 2- NIVELES DE REPRESENTACIOacuteN ETIQUETADO Y CODIFICACIOacuteN
  • 3- REPRESENTACIOacuteN ORTOGRAacuteFICA DE CORPUS ORALES
  • 31- Propuestas para la representacioacuten ortograacutefica de corpus orales en el aacutembito de la linguumliacutestica de corpus
  • 32- Propuestas para la representacioacuten ortograacutefica de corpus orales en el aacutembito de las tecnologiacuteas del habla
  • 4- REPRESENTACIOacuteN FONEacuteTICA DE CORPUS ORALES
  • 41- La representacioacuten foneacutetica de los elementos segmentales
  • 42- La representacioacuten foneacutetica de los elementos suprasegmentales
  • 5- ETIQUETADO FONEacuteTICO DE CORPUS ORALES
  • 51- Niveles de etiquetado foneacutetico de corpus orales
  • 52- La transcripcioacuten y el etiquetado automaacutetico de corpus orales
  • 6- TRANSCRIPCIOacuteN Y CODIFICACIOacuteN DE CORPUS PARA EL ANAacuteLISIS DE LA LENGUA ORAL
  • 61- Los requisitos de una transcripcioacuten
  • 62- Propuestas de estandarizacioacuten para la transcripcioacuten y codificacioacuten de corpus orales
  • 7- CONCLUSIONES
  • BIBLIOGRAFIacuteA
Page 22: Transcripción, etiquetado y codificación de corpus orales

Gibbon D 1989 Survey of Prosodic Labelling for EC Languages SAM-UBI-190 12February 1989 Report e6 in ESPRIT 2589 (SAM) Interim Report Year 1 Ref SAM-UCLG002 University College London February 1990

Gibbon D R Moore y R Winski eds 1997 Handbook on Standards and Resources forSpoken Language Systems Berlin Mouton De Gruyter [Documento de Internet disponible en httpcoralliliuni-bielefelddeEAGLESeagbookeagbookhtml]

Groslashnnum Thorsen N 1987 Suprasegmental transcription ARIPUC - Annual Report ofthe Institute of Phonetics University of Copenhagen 21 1-27

Gumperz JJ y J Berenz 1993 Transcribing Conversational Exchangesrdquo Talking DataTranscription and Coding in Discourse Research Eds JA Ewards y M D Lampert HillsdaleNJ Lawrence Erlbaum Associates 91-122

Hart J lsquoT R Collier y A Cohen 1990 A Perceptual Study of Intonation An Experimental- Phonetic Approach to Intonation Cambridge Cambridge University Press (Cambridge Studiesin Speech Science and Communication)

Hess W K Kohler y HG Tillmann 1995 The PhonDat-Verbmobil Speech CorpusEurospeech95 Proceedings of the 4th European Conference on Speech Communication andSpeech Technology Madrid Spain 18-21 September 1995 Vol 1 863-866

Hieronymus JL 1994 ASCII phonetic symbols for the worlds languages WorldbetATampT Bell Laboratories Technical Memo [Documento de Internet disponible enhttpwwwcseogieduCSLUcorporapapershtml]

Hirst D A Di Cristo y R Espesser en prensaLevels of representation and levels ofanalysis for intonation Prosody Theory and Experiments Ed M Horne Dordrecht Kluwer

Hirst DJ y A Di Cristo en prensa A survey of intonation systemsrdquo IntonationSystems A Survey of 20 Languages Eds D Hirst y A Di Cristo Cambridge CambridgeUniversity Press

Hirst DJ 1991 Intonation models towards a third generation Actes du XIIegraveme CongregravesInternational des Sciences Phoneacutetiques 19-24 aoucirct 1991 Aix-en-Provence France Aix-en-Provence Universiteacute de Provence Service des Publications Vol 1 305-310

Hirst DJ A Di Cristo M Le Besnerais Z Najim P Nicolas y P Romeacuteas 1993Multilingual modelling of intonation patternsrdquo Proceedings of an ESCA Workshop on ProsodySeptember 27-29 1993 Lund Sweden Eds D House y P Touati Lund University Departmentof Linguistics and Phonetics Working Papers 41 204-207

Hirst DJ N Ide y J Veacuteronis 1994 Coding fundamental frequency patterns for multi-lingual synthesis with INTSINT in the MULTEXT project Conference Proceedings of theSecond ESCAIEEE Workshop on Speech Synthesis September 12-15 1994 Mohonk MountainHouse New Paltz New York USA 77-80

Ide N y J Veacuteronis eds 1995 The Text Encoding Initiative Background and ContextsComputers and the Humanities 29 1-3 Publicado en forma de libro en Dordrecht KluwerAcademic Publishers

IPA 1989 The IPA 1989 Kiel Convention Workgroup 9 report Computer Coding of IPAsymbols and Computer Representation of Individual Languages Journal of the InternationalPhonetic Association 192 81-92

IPA 1993 IPA Chart revised to 1993 Journal of the International Phonetic Association231 [Documento de Internet disponible en httpwwwartsglaacukIPAipacharthtml]

IPA 1995 Preview of the IPA Handbook Journal of the International Phonetic Association251

ISO 8879 1986 Information Processing Text and Office Systems Standard GeneralizedMarkup Language (SGML) Geneva International Organization for Standardization

Johansson S 1995a The approach of the Text Encoding Initiative to the encoding ofspoken discourse Spoken English on Computer Transcription Markup and Applications EdsG Leech G Myers y J Thomas Harlow Longman 82-98

Johansson S 1995b The Encoding of Spoken Texts Computers and the Humanities291 149-158 The Text Encoding Initiative Background and Context Eds N Ide y J VeacuteronisDordrecht Kluwer Academic Publishers 149-158

Keating P P MacEachern A Shryock y S Domiacutenguez 1994 A manual for phonetictranscription Segmentation and labelling of words in spontaneous speech UCLA WorkingPapers in Phonetics 88 91-120

Kluger-Kruse M 1987 Computer Phonetic Alphabet ESPRIT Linguistic Analysis of theEuropean Languages Report BU-CPA0267 July 1987

Krot C y B Taylor 1995 Criteria for Acoustic-Phonetic Segmentation and WordLabelling in the Australian National Database of Spoken Language[Documento de Internet disponible en httpwwwshlrcmqeduaucriteriahtml]

Lander T 1997 The CSLU Labeling Guide Center for Spoken Language UnderstandingOregon Graduate Institute[Documento de Internet disponible en httpwwwcseogieduCSLUcorporapapershtml]

Llisterri J 1994 Prosody Encoding Survey WP 1 Specifications and Standards T15Markup Specifications Deliverable 153 Final version 15 September 1994 LRE Project 62-050MULTEXT

Llisterri J ed 1996 Prosody Tools Efficiency and Failures WP 4 Corpus T46 SpeechMarkup and Validation Deliverable 452 Final version 15 October 1996 LRE Project 62-050MULTEXT

MacWhinney B 1991The CHILDES Project Tools for Analyzing Talk Hillsdale NJLawrence Erlbaum

Marchal A N Nguyen y W Hardcastle 1995 Multitiered phonetic approach to speechlabelling Levels in Speech Communication Relations and Interactions A Tribute to MaxWajskop Hommage agrave Max Wajskop Eds C Sorin J Mariani H Meloni y J SchoengenAmsterdam Elsevier Science BV 149-158

NERC 1994 NERC-1 Network of European Reference Corpora Final Report PisaInstituto di Linguistica Computazionale - CNR January 1994 versioacuten en curso de publicacioacutenTowards a Network of European Reference Corpora Eds N Calzolari M Baker y PG KruytPisa Giardini

Nicolas P y D Hirst 1995 Symbolic coding of Higher-Level Characteristics ofFundamental Frequency Curvesrdquo Eurospeech95 Proceedings of the 4th European Conferenceon Speech Communication and Technology Madrid Spain 18-21 September 1995 Vol 2 989-992

OConnell DC y S Kowal 1994 Some Current Transcription Systems for SpokenDiscourse A critical Analysis Pragmatics 4 81-107

Ochs E 1979 Transcription as Theory Developmental Pragmatics Eds E Ochs E yBB Schieffelin New York Academic Press 43-72

Payne J 1992 Report on the compatibility of JP Frenchs spoken corpus transcriptionconventions with the TEI guidelines for transcription of spoken texts Working paper COBUILDBirmingham and IDS Mannheim December 1992 NERC-WP8WP4-122

Payne J 1995 The COBUILD spoken corpus transcription conventions SpokenEnglish on Computer Transcription Markup and Applications Eds G Leech G Myers y JThomas Harlow Longman 203-207

Payratoacute Ll 1995 Transcripcioacuten del discurso coloquialrdquo El espantildeol coloquial Actas del ISimposio sobre Anaacutelisis del Discurso Oral Almeriacutea 23-25 de noviembre de 1994 Ed L CorteacutesRodriacuteguez Almeriacutea Universidad de Almeriacutea Servicio de Publicaciones 43-70

Pierrehumbert J B 1897 (1980) The Phonology and Phonetics of English IntonationPhD Thesis Department of Linguistics MIT Bloomington Indiana University Linguistics Club

Pitrelli J M Beckman y J Hirschberg 1994 Evaluation of prosodic transcriptionlabelling reliability in the ToBI frameworkrdquo Proceedings of the Third International Conference onSpoken Language Processing Yokohama ICSLP Vol 2 123-126

Pullum GK y WA Ladusaw 1996 (1986) Phonetic Symbol Guide Chicago TheUniversity of Chicago Press 2nd edition

Roach P H Roach A Dew y P Rowlands 1990 Phonetic analysis and the automaticsegmentation and labeling of speech sounds Journal of the International Phonetic Association201 15-21

Schmidt MS C Scott y MA Jack 1993 Phonetic transcription standards for Europeannames (ONOMASTICA) Eurospeech93 3rd European Conference on Speech Communicationand Technology Berlin Germany 21-23 September 1993 Vol 1 279-282

Schuetze-Coburn S 1991Units of intonation in discourse a comparison of acoustic andauditory analysis Language and Speech 343 207-234

Selting M 1987 Descriptive categories for the auditive analysis of intonation inconversation Journal of Pragmatics 11 777-791

Selting M 1988 The role of intonation in the organisation of repair and problem handlingsequences in conversation Journal of Pragmatics 12 293-322

Senia F y JG Van Velden 1997 Specifications of orthographic transcription and lexiconconventions LRE-4001 SpeechDat Technical Report SD132 Final version 10 January 1997[Documento de Internet disponible en httpwwwphonetikuni-muenchendeSpeechDathtml]

Silverman K M Beckman J Pitrelli M Ostendorf C Wightman P Price JPierrehumbert y J Hirschberg 1992 TOBI A standard for labelling English prosodyProceedings of the Second International Conference on Spoken Language Processing ICSLP-92Banff October 1992 867-870

Sinclair J 1994 Spoken Language [3B] PhoneticPhonemic and Prosodic Annotation[52] NERC 1994 NERC-1 Network of European Reference Corpora Final Report PisaVersioacuten en curso de publicacioacuten Towards a Network of European Reference Corpora Eds NCalzolari M Baker y PG Kruyt Pisa Giardini

Sinclair J 1995 From theory to practicerdquo Spoken English on Computer TranscriptionMarkup and Applications Eds G Leech G Myers Y J Thomas Harlow Longman 99- 112

Sperberg-McQueen CM y L Burnard eds 1994 Guidelines for Electronic Text Encodingand Interchange TEI P3 Chicago and Oxford Association for Computational Linguistics Association for Computers and the Humanities Association for Literary and LinguisticComputing [Cap 11 Transcriptions of Speech] [Documento de Internet disponible enhttpetextvirginiaeduTEIhtml]

Strangert E y M Heldner 1995 Labelling of boundaries and prominences byphonetically experienced and non-experienced transcribers Phonum 3 Reports from theDepartment of Phonetics Umearing University 85-109 [Documento de Internet disponible enhttpwwwlingumusefonphonum3html]

Teubert W 1993 Phonetic Phonemic and Prosodic Annotation Final Report IDSMannheim February 1993 NERC-WP8-171

Tillmann HG y B Pompino-Marschall 1993 Theoretical Principles ConcerningSegmentation Labelling Strategies and Levels of Categorical Annotation for Spoken LanguageDatabase Systems Eurospeech93 3rd European Conference on Speech Communication andTechnology Berlin Germany 21-23 September 1993 Vol 3 1691-1694

Trancoso I 1995 The ONOMASTICA Interlanguage Pronunciation LexiconrdquoEurospeech95 Proceedings of the 4th European Conference on Speech Communication andTechnology Madrid Spain 18-21 September 1995 Vol 1 829-832

Wells JC 1987 Computer Coded Phonetic Transcription Journal of the InternationalPhonetic Association 172 94-114

Wells JC 1989 Computer-coded phonemic notation of individual languages of theEuropean Community Journal of the International Phonetic Association 191 31-54

Wells JC 1994 Computer-coding the IPA a proposed extension of SAMPA SpeechHearing and Language Work in Progress 1994 (University College London Department ofPhonetics and Linguistics) 8 271-289

Wells JC 1995 SAMPROSA (SAM Prosodic Transcription [Documento de Internetdisponible en httpwwwphonuclacukhomesampasamprosahtm]

Wells JC W Barry M Grice A Fourcin y D Gibbon 1992 Standard Computer-Compatible Transcription SAM Stage Report Sen3 SAM UCL-037 28 February 1992 SAM(1992) Esprit Project 2589 (SAM) Multilingual Speech InputOutput AssessmentMethodologyand Standardisation Final Report Year Three 1III91-28II1992 London University CollegeLondon

Wesenick M-B y F Schiel 1995 Feasibility of Automatic Annotation and BuildingPronunciation Lexica from Corpus Material LRE-63314 SpeechDat Report D3123 Finalversion 10 October 1995[Documento de Internet disponible en httpwwwicpgrenetfrSpeechDathomehtml]

Winski R R Moore y D Gibbon 1995 EAGLES Spoken Language Working GroupOverview and Resultsrdquo Eurospeech95 Proceedings of the 4th European Conference on SpeechCommunication and Speech Technology Madrid Spain 18-21 September 1995 Vol 1 841-844[Documento de Internet disponible en httpcoralliliuni-bielefeldde~gibbonEAGLESrwpaperrwpaperhtml]

  • 1- INTRODUCCIOacuteN
  • 2- NIVELES DE REPRESENTACIOacuteN ETIQUETADO Y CODIFICACIOacuteN
  • 3- REPRESENTACIOacuteN ORTOGRAacuteFICA DE CORPUS ORALES
  • 31- Propuestas para la representacioacuten ortograacutefica de corpus orales en el aacutembito de la linguumliacutestica de corpus
  • 32- Propuestas para la representacioacuten ortograacutefica de corpus orales en el aacutembito de las tecnologiacuteas del habla
  • 4- REPRESENTACIOacuteN FONEacuteTICA DE CORPUS ORALES
  • 41- La representacioacuten foneacutetica de los elementos segmentales
  • 42- La representacioacuten foneacutetica de los elementos suprasegmentales
  • 5- ETIQUETADO FONEacuteTICO DE CORPUS ORALES
  • 51- Niveles de etiquetado foneacutetico de corpus orales
  • 52- La transcripcioacuten y el etiquetado automaacutetico de corpus orales
  • 6- TRANSCRIPCIOacuteN Y CODIFICACIOacuteN DE CORPUS PARA EL ANAacuteLISIS DE LA LENGUA ORAL
  • 61- Los requisitos de una transcripcioacuten
  • 62- Propuestas de estandarizacioacuten para la transcripcioacuten y codificacioacuten de corpus orales
  • 7- CONCLUSIONES
  • BIBLIOGRAFIacuteA
Page 23: Transcripción, etiquetado y codificación de corpus orales

Ide N y J Veacuteronis eds 1995 The Text Encoding Initiative Background and ContextsComputers and the Humanities 29 1-3 Publicado en forma de libro en Dordrecht KluwerAcademic Publishers

IPA 1989 The IPA 1989 Kiel Convention Workgroup 9 report Computer Coding of IPAsymbols and Computer Representation of Individual Languages Journal of the InternationalPhonetic Association 192 81-92

IPA 1993 IPA Chart revised to 1993 Journal of the International Phonetic Association231 [Documento de Internet disponible en httpwwwartsglaacukIPAipacharthtml]

IPA 1995 Preview of the IPA Handbook Journal of the International Phonetic Association251

ISO 8879 1986 Information Processing Text and Office Systems Standard GeneralizedMarkup Language (SGML) Geneva International Organization for Standardization

Johansson S 1995a The approach of the Text Encoding Initiative to the encoding ofspoken discourse Spoken English on Computer Transcription Markup and Applications EdsG Leech G Myers y J Thomas Harlow Longman 82-98

Johansson S 1995b The Encoding of Spoken Texts Computers and the Humanities291 149-158 The Text Encoding Initiative Background and Context Eds N Ide y J VeacuteronisDordrecht Kluwer Academic Publishers 149-158

Keating P P MacEachern A Shryock y S Domiacutenguez 1994 A manual for phonetictranscription Segmentation and labelling of words in spontaneous speech UCLA WorkingPapers in Phonetics 88 91-120

Kluger-Kruse M 1987 Computer Phonetic Alphabet ESPRIT Linguistic Analysis of theEuropean Languages Report BU-CPA0267 July 1987

Krot C y B Taylor 1995 Criteria for Acoustic-Phonetic Segmentation and WordLabelling in the Australian National Database of Spoken Language[Documento de Internet disponible en httpwwwshlrcmqeduaucriteriahtml]

Lander T 1997 The CSLU Labeling Guide Center for Spoken Language UnderstandingOregon Graduate Institute[Documento de Internet disponible en httpwwwcseogieduCSLUcorporapapershtml]

Llisterri J 1994 Prosody Encoding Survey WP 1 Specifications and Standards T15Markup Specifications Deliverable 153 Final version 15 September 1994 LRE Project 62-050MULTEXT

Llisterri J ed 1996 Prosody Tools Efficiency and Failures WP 4 Corpus T46 SpeechMarkup and Validation Deliverable 452 Final version 15 October 1996 LRE Project 62-050MULTEXT

MacWhinney B 1991The CHILDES Project Tools for Analyzing Talk Hillsdale NJLawrence Erlbaum

Marchal A N Nguyen y W Hardcastle 1995 Multitiered phonetic approach to speechlabelling Levels in Speech Communication Relations and Interactions A Tribute to MaxWajskop Hommage agrave Max Wajskop Eds C Sorin J Mariani H Meloni y J SchoengenAmsterdam Elsevier Science BV 149-158

NERC 1994 NERC-1 Network of European Reference Corpora Final Report PisaInstituto di Linguistica Computazionale - CNR January 1994 versioacuten en curso de publicacioacutenTowards a Network of European Reference Corpora Eds N Calzolari M Baker y PG KruytPisa Giardini

Nicolas P y D Hirst 1995 Symbolic coding of Higher-Level Characteristics ofFundamental Frequency Curvesrdquo Eurospeech95 Proceedings of the 4th European Conferenceon Speech Communication and Technology Madrid Spain 18-21 September 1995 Vol 2 989-992

OConnell DC y S Kowal 1994 Some Current Transcription Systems for SpokenDiscourse A critical Analysis Pragmatics 4 81-107

Ochs E 1979 Transcription as Theory Developmental Pragmatics Eds E Ochs E yBB Schieffelin New York Academic Press 43-72

Payne J 1992 Report on the compatibility of JP Frenchs spoken corpus transcriptionconventions with the TEI guidelines for transcription of spoken texts Working paper COBUILDBirmingham and IDS Mannheim December 1992 NERC-WP8WP4-122

Payne J 1995 The COBUILD spoken corpus transcription conventions SpokenEnglish on Computer Transcription Markup and Applications Eds G Leech G Myers y JThomas Harlow Longman 203-207

Payratoacute Ll 1995 Transcripcioacuten del discurso coloquialrdquo El espantildeol coloquial Actas del ISimposio sobre Anaacutelisis del Discurso Oral Almeriacutea 23-25 de noviembre de 1994 Ed L CorteacutesRodriacuteguez Almeriacutea Universidad de Almeriacutea Servicio de Publicaciones 43-70

Pierrehumbert J B 1897 (1980) The Phonology and Phonetics of English IntonationPhD Thesis Department of Linguistics MIT Bloomington Indiana University Linguistics Club

Pitrelli J M Beckman y J Hirschberg 1994 Evaluation of prosodic transcriptionlabelling reliability in the ToBI frameworkrdquo Proceedings of the Third International Conference onSpoken Language Processing Yokohama ICSLP Vol 2 123-126

Pullum GK y WA Ladusaw 1996 (1986) Phonetic Symbol Guide Chicago TheUniversity of Chicago Press 2nd edition

Roach P H Roach A Dew y P Rowlands 1990 Phonetic analysis and the automaticsegmentation and labeling of speech sounds Journal of the International Phonetic Association201 15-21

Schmidt MS C Scott y MA Jack 1993 Phonetic transcription standards for Europeannames (ONOMASTICA) Eurospeech93 3rd European Conference on Speech Communicationand Technology Berlin Germany 21-23 September 1993 Vol 1 279-282

Schuetze-Coburn S 1991Units of intonation in discourse a comparison of acoustic andauditory analysis Language and Speech 343 207-234

Selting M 1987 Descriptive categories for the auditive analysis of intonation inconversation Journal of Pragmatics 11 777-791

Selting M 1988 The role of intonation in the organisation of repair and problem handlingsequences in conversation Journal of Pragmatics 12 293-322

Senia F y JG Van Velden 1997 Specifications of orthographic transcription and lexiconconventions LRE-4001 SpeechDat Technical Report SD132 Final version 10 January 1997[Documento de Internet disponible en httpwwwphonetikuni-muenchendeSpeechDathtml]

Silverman K M Beckman J Pitrelli M Ostendorf C Wightman P Price JPierrehumbert y J Hirschberg 1992 TOBI A standard for labelling English prosodyProceedings of the Second International Conference on Spoken Language Processing ICSLP-92Banff October 1992 867-870

Sinclair J 1994 Spoken Language [3B] PhoneticPhonemic and Prosodic Annotation[52] NERC 1994 NERC-1 Network of European Reference Corpora Final Report PisaVersioacuten en curso de publicacioacuten Towards a Network of European Reference Corpora Eds NCalzolari M Baker y PG Kruyt Pisa Giardini

Sinclair J 1995 From theory to practicerdquo Spoken English on Computer TranscriptionMarkup and Applications Eds G Leech G Myers Y J Thomas Harlow Longman 99- 112

Sperberg-McQueen CM y L Burnard eds 1994 Guidelines for Electronic Text Encodingand Interchange TEI P3 Chicago and Oxford Association for Computational Linguistics Association for Computers and the Humanities Association for Literary and LinguisticComputing [Cap 11 Transcriptions of Speech] [Documento de Internet disponible enhttpetextvirginiaeduTEIhtml]

Strangert E y M Heldner 1995 Labelling of boundaries and prominences byphonetically experienced and non-experienced transcribers Phonum 3 Reports from theDepartment of Phonetics Umearing University 85-109 [Documento de Internet disponible enhttpwwwlingumusefonphonum3html]

Teubert W 1993 Phonetic Phonemic and Prosodic Annotation Final Report IDSMannheim February 1993 NERC-WP8-171

Tillmann HG y B Pompino-Marschall 1993 Theoretical Principles ConcerningSegmentation Labelling Strategies and Levels of Categorical Annotation for Spoken LanguageDatabase Systems Eurospeech93 3rd European Conference on Speech Communication andTechnology Berlin Germany 21-23 September 1993 Vol 3 1691-1694

Trancoso I 1995 The ONOMASTICA Interlanguage Pronunciation LexiconrdquoEurospeech95 Proceedings of the 4th European Conference on Speech Communication andTechnology Madrid Spain 18-21 September 1995 Vol 1 829-832

Wells JC 1987 Computer Coded Phonetic Transcription Journal of the InternationalPhonetic Association 172 94-114

Wells JC 1989 Computer-coded phonemic notation of individual languages of theEuropean Community Journal of the International Phonetic Association 191 31-54

Wells JC 1994 Computer-coding the IPA a proposed extension of SAMPA SpeechHearing and Language Work in Progress 1994 (University College London Department ofPhonetics and Linguistics) 8 271-289

Wells JC 1995 SAMPROSA (SAM Prosodic Transcription [Documento de Internetdisponible en httpwwwphonuclacukhomesampasamprosahtm]

Wells JC W Barry M Grice A Fourcin y D Gibbon 1992 Standard Computer-Compatible Transcription SAM Stage Report Sen3 SAM UCL-037 28 February 1992 SAM(1992) Esprit Project 2589 (SAM) Multilingual Speech InputOutput AssessmentMethodologyand Standardisation Final Report Year Three 1III91-28II1992 London University CollegeLondon

Wesenick M-B y F Schiel 1995 Feasibility of Automatic Annotation and BuildingPronunciation Lexica from Corpus Material LRE-63314 SpeechDat Report D3123 Finalversion 10 October 1995[Documento de Internet disponible en httpwwwicpgrenetfrSpeechDathomehtml]

Winski R R Moore y D Gibbon 1995 EAGLES Spoken Language Working GroupOverview and Resultsrdquo Eurospeech95 Proceedings of the 4th European Conference on SpeechCommunication and Speech Technology Madrid Spain 18-21 September 1995 Vol 1 841-844[Documento de Internet disponible en httpcoralliliuni-bielefeldde~gibbonEAGLESrwpaperrwpaperhtml]

  • 1- INTRODUCCIOacuteN
  • 2- NIVELES DE REPRESENTACIOacuteN ETIQUETADO Y CODIFICACIOacuteN
  • 3- REPRESENTACIOacuteN ORTOGRAacuteFICA DE CORPUS ORALES
  • 31- Propuestas para la representacioacuten ortograacutefica de corpus orales en el aacutembito de la linguumliacutestica de corpus
  • 32- Propuestas para la representacioacuten ortograacutefica de corpus orales en el aacutembito de las tecnologiacuteas del habla
  • 4- REPRESENTACIOacuteN FONEacuteTICA DE CORPUS ORALES
  • 41- La representacioacuten foneacutetica de los elementos segmentales
  • 42- La representacioacuten foneacutetica de los elementos suprasegmentales
  • 5- ETIQUETADO FONEacuteTICO DE CORPUS ORALES
  • 51- Niveles de etiquetado foneacutetico de corpus orales
  • 52- La transcripcioacuten y el etiquetado automaacutetico de corpus orales
  • 6- TRANSCRIPCIOacuteN Y CODIFICACIOacuteN DE CORPUS PARA EL ANAacuteLISIS DE LA LENGUA ORAL
  • 61- Los requisitos de una transcripcioacuten
  • 62- Propuestas de estandarizacioacuten para la transcripcioacuten y codificacioacuten de corpus orales
  • 7- CONCLUSIONES
  • BIBLIOGRAFIacuteA
Page 24: Transcripción, etiquetado y codificación de corpus orales

Marchal A N Nguyen y W Hardcastle 1995 Multitiered phonetic approach to speechlabelling Levels in Speech Communication Relations and Interactions A Tribute to MaxWajskop Hommage agrave Max Wajskop Eds C Sorin J Mariani H Meloni y J SchoengenAmsterdam Elsevier Science BV 149-158

NERC 1994 NERC-1 Network of European Reference Corpora Final Report PisaInstituto di Linguistica Computazionale - CNR January 1994 versioacuten en curso de publicacioacutenTowards a Network of European Reference Corpora Eds N Calzolari M Baker y PG KruytPisa Giardini

Nicolas P y D Hirst 1995 Symbolic coding of Higher-Level Characteristics ofFundamental Frequency Curvesrdquo Eurospeech95 Proceedings of the 4th European Conferenceon Speech Communication and Technology Madrid Spain 18-21 September 1995 Vol 2 989-992

OConnell DC y S Kowal 1994 Some Current Transcription Systems for SpokenDiscourse A critical Analysis Pragmatics 4 81-107

Ochs E 1979 Transcription as Theory Developmental Pragmatics Eds E Ochs E yBB Schieffelin New York Academic Press 43-72

Payne J 1992 Report on the compatibility of JP Frenchs spoken corpus transcriptionconventions with the TEI guidelines for transcription of spoken texts Working paper COBUILDBirmingham and IDS Mannheim December 1992 NERC-WP8WP4-122

Payne J 1995 The COBUILD spoken corpus transcription conventions SpokenEnglish on Computer Transcription Markup and Applications Eds G Leech G Myers y JThomas Harlow Longman 203-207

Payratoacute Ll 1995 Transcripcioacuten del discurso coloquialrdquo El espantildeol coloquial Actas del ISimposio sobre Anaacutelisis del Discurso Oral Almeriacutea 23-25 de noviembre de 1994 Ed L CorteacutesRodriacuteguez Almeriacutea Universidad de Almeriacutea Servicio de Publicaciones 43-70

Pierrehumbert J B 1897 (1980) The Phonology and Phonetics of English IntonationPhD Thesis Department of Linguistics MIT Bloomington Indiana University Linguistics Club

Pitrelli J M Beckman y J Hirschberg 1994 Evaluation of prosodic transcriptionlabelling reliability in the ToBI frameworkrdquo Proceedings of the Third International Conference onSpoken Language Processing Yokohama ICSLP Vol 2 123-126

Pullum GK y WA Ladusaw 1996 (1986) Phonetic Symbol Guide Chicago TheUniversity of Chicago Press 2nd edition

Roach P H Roach A Dew y P Rowlands 1990 Phonetic analysis and the automaticsegmentation and labeling of speech sounds Journal of the International Phonetic Association201 15-21

Schmidt MS C Scott y MA Jack 1993 Phonetic transcription standards for Europeannames (ONOMASTICA) Eurospeech93 3rd European Conference on Speech Communicationand Technology Berlin Germany 21-23 September 1993 Vol 1 279-282

Schuetze-Coburn S 1991Units of intonation in discourse a comparison of acoustic andauditory analysis Language and Speech 343 207-234

Selting M 1987 Descriptive categories for the auditive analysis of intonation inconversation Journal of Pragmatics 11 777-791

Selting M 1988 The role of intonation in the organisation of repair and problem handlingsequences in conversation Journal of Pragmatics 12 293-322

Senia F y JG Van Velden 1997 Specifications of orthographic transcription and lexiconconventions LRE-4001 SpeechDat Technical Report SD132 Final version 10 January 1997[Documento de Internet disponible en httpwwwphonetikuni-muenchendeSpeechDathtml]

Silverman K M Beckman J Pitrelli M Ostendorf C Wightman P Price JPierrehumbert y J Hirschberg 1992 TOBI A standard for labelling English prosodyProceedings of the Second International Conference on Spoken Language Processing ICSLP-92Banff October 1992 867-870

Sinclair J 1994 Spoken Language [3B] PhoneticPhonemic and Prosodic Annotation[52] NERC 1994 NERC-1 Network of European Reference Corpora Final Report PisaVersioacuten en curso de publicacioacuten Towards a Network of European Reference Corpora Eds NCalzolari M Baker y PG Kruyt Pisa Giardini

Sinclair J 1995 From theory to practicerdquo Spoken English on Computer TranscriptionMarkup and Applications Eds G Leech G Myers Y J Thomas Harlow Longman 99- 112

Sperberg-McQueen CM y L Burnard eds 1994 Guidelines for Electronic Text Encodingand Interchange TEI P3 Chicago and Oxford Association for Computational Linguistics Association for Computers and the Humanities Association for Literary and LinguisticComputing [Cap 11 Transcriptions of Speech] [Documento de Internet disponible enhttpetextvirginiaeduTEIhtml]

Strangert E y M Heldner 1995 Labelling of boundaries and prominences byphonetically experienced and non-experienced transcribers Phonum 3 Reports from theDepartment of Phonetics Umearing University 85-109 [Documento de Internet disponible enhttpwwwlingumusefonphonum3html]

Teubert W 1993 Phonetic Phonemic and Prosodic Annotation Final Report IDSMannheim February 1993 NERC-WP8-171

Tillmann HG y B Pompino-Marschall 1993 Theoretical Principles ConcerningSegmentation Labelling Strategies and Levels of Categorical Annotation for Spoken LanguageDatabase Systems Eurospeech93 3rd European Conference on Speech Communication andTechnology Berlin Germany 21-23 September 1993 Vol 3 1691-1694

Trancoso I 1995 The ONOMASTICA Interlanguage Pronunciation LexiconrdquoEurospeech95 Proceedings of the 4th European Conference on Speech Communication andTechnology Madrid Spain 18-21 September 1995 Vol 1 829-832

Wells JC 1987 Computer Coded Phonetic Transcription Journal of the InternationalPhonetic Association 172 94-114

Wells JC 1989 Computer-coded phonemic notation of individual languages of theEuropean Community Journal of the International Phonetic Association 191 31-54

Wells JC 1994 Computer-coding the IPA a proposed extension of SAMPA SpeechHearing and Language Work in Progress 1994 (University College London Department ofPhonetics and Linguistics) 8 271-289

Wells JC 1995 SAMPROSA (SAM Prosodic Transcription [Documento de Internetdisponible en httpwwwphonuclacukhomesampasamprosahtm]

Wells JC W Barry M Grice A Fourcin y D Gibbon 1992 Standard Computer-Compatible Transcription SAM Stage Report Sen3 SAM UCL-037 28 February 1992 SAM(1992) Esprit Project 2589 (SAM) Multilingual Speech InputOutput AssessmentMethodologyand Standardisation Final Report Year Three 1III91-28II1992 London University CollegeLondon

Wesenick M-B y F Schiel 1995 Feasibility of Automatic Annotation and BuildingPronunciation Lexica from Corpus Material LRE-63314 SpeechDat Report D3123 Finalversion 10 October 1995[Documento de Internet disponible en httpwwwicpgrenetfrSpeechDathomehtml]

Winski R R Moore y D Gibbon 1995 EAGLES Spoken Language Working GroupOverview and Resultsrdquo Eurospeech95 Proceedings of the 4th European Conference on SpeechCommunication and Speech Technology Madrid Spain 18-21 September 1995 Vol 1 841-844[Documento de Internet disponible en httpcoralliliuni-bielefeldde~gibbonEAGLESrwpaperrwpaperhtml]

  • 1- INTRODUCCIOacuteN
  • 2- NIVELES DE REPRESENTACIOacuteN ETIQUETADO Y CODIFICACIOacuteN
  • 3- REPRESENTACIOacuteN ORTOGRAacuteFICA DE CORPUS ORALES
  • 31- Propuestas para la representacioacuten ortograacutefica de corpus orales en el aacutembito de la linguumliacutestica de corpus
  • 32- Propuestas para la representacioacuten ortograacutefica de corpus orales en el aacutembito de las tecnologiacuteas del habla
  • 4- REPRESENTACIOacuteN FONEacuteTICA DE CORPUS ORALES
  • 41- La representacioacuten foneacutetica de los elementos segmentales
  • 42- La representacioacuten foneacutetica de los elementos suprasegmentales
  • 5- ETIQUETADO FONEacuteTICO DE CORPUS ORALES
  • 51- Niveles de etiquetado foneacutetico de corpus orales
  • 52- La transcripcioacuten y el etiquetado automaacutetico de corpus orales
  • 6- TRANSCRIPCIOacuteN Y CODIFICACIOacuteN DE CORPUS PARA EL ANAacuteLISIS DE LA LENGUA ORAL
  • 61- Los requisitos de una transcripcioacuten
  • 62- Propuestas de estandarizacioacuten para la transcripcioacuten y codificacioacuten de corpus orales
  • 7- CONCLUSIONES
  • BIBLIOGRAFIacuteA
Page 25: Transcripción, etiquetado y codificación de corpus orales

Schuetze-Coburn S 1991Units of intonation in discourse a comparison of acoustic andauditory analysis Language and Speech 343 207-234

Selting M 1987 Descriptive categories for the auditive analysis of intonation inconversation Journal of Pragmatics 11 777-791

Selting M 1988 The role of intonation in the organisation of repair and problem handlingsequences in conversation Journal of Pragmatics 12 293-322

Senia F y JG Van Velden 1997 Specifications of orthographic transcription and lexiconconventions LRE-4001 SpeechDat Technical Report SD132 Final version 10 January 1997[Documento de Internet disponible en httpwwwphonetikuni-muenchendeSpeechDathtml]

Silverman K M Beckman J Pitrelli M Ostendorf C Wightman P Price JPierrehumbert y J Hirschberg 1992 TOBI A standard for labelling English prosodyProceedings of the Second International Conference on Spoken Language Processing ICSLP-92Banff October 1992 867-870

Sinclair J 1994 Spoken Language [3B] PhoneticPhonemic and Prosodic Annotation[52] NERC 1994 NERC-1 Network of European Reference Corpora Final Report PisaVersioacuten en curso de publicacioacuten Towards a Network of European Reference Corpora Eds NCalzolari M Baker y PG Kruyt Pisa Giardini

Sinclair J 1995 From theory to practicerdquo Spoken English on Computer TranscriptionMarkup and Applications Eds G Leech G Myers Y J Thomas Harlow Longman 99- 112

Sperberg-McQueen CM y L Burnard eds 1994 Guidelines for Electronic Text Encodingand Interchange TEI P3 Chicago and Oxford Association for Computational Linguistics Association for Computers and the Humanities Association for Literary and LinguisticComputing [Cap 11 Transcriptions of Speech] [Documento de Internet disponible enhttpetextvirginiaeduTEIhtml]

Strangert E y M Heldner 1995 Labelling of boundaries and prominences byphonetically experienced and non-experienced transcribers Phonum 3 Reports from theDepartment of Phonetics Umearing University 85-109 [Documento de Internet disponible enhttpwwwlingumusefonphonum3html]

Teubert W 1993 Phonetic Phonemic and Prosodic Annotation Final Report IDSMannheim February 1993 NERC-WP8-171

Tillmann HG y B Pompino-Marschall 1993 Theoretical Principles ConcerningSegmentation Labelling Strategies and Levels of Categorical Annotation for Spoken LanguageDatabase Systems Eurospeech93 3rd European Conference on Speech Communication andTechnology Berlin Germany 21-23 September 1993 Vol 3 1691-1694

Trancoso I 1995 The ONOMASTICA Interlanguage Pronunciation LexiconrdquoEurospeech95 Proceedings of the 4th European Conference on Speech Communication andTechnology Madrid Spain 18-21 September 1995 Vol 1 829-832

Wells JC 1987 Computer Coded Phonetic Transcription Journal of the InternationalPhonetic Association 172 94-114

Wells JC 1989 Computer-coded phonemic notation of individual languages of theEuropean Community Journal of the International Phonetic Association 191 31-54

Wells JC 1994 Computer-coding the IPA a proposed extension of SAMPA SpeechHearing and Language Work in Progress 1994 (University College London Department ofPhonetics and Linguistics) 8 271-289

Wells JC 1995 SAMPROSA (SAM Prosodic Transcription [Documento de Internetdisponible en httpwwwphonuclacukhomesampasamprosahtm]

Wells JC W Barry M Grice A Fourcin y D Gibbon 1992 Standard Computer-Compatible Transcription SAM Stage Report Sen3 SAM UCL-037 28 February 1992 SAM(1992) Esprit Project 2589 (SAM) Multilingual Speech InputOutput AssessmentMethodologyand Standardisation Final Report Year Three 1III91-28II1992 London University CollegeLondon

Wesenick M-B y F Schiel 1995 Feasibility of Automatic Annotation and BuildingPronunciation Lexica from Corpus Material LRE-63314 SpeechDat Report D3123 Finalversion 10 October 1995[Documento de Internet disponible en httpwwwicpgrenetfrSpeechDathomehtml]

Winski R R Moore y D Gibbon 1995 EAGLES Spoken Language Working GroupOverview and Resultsrdquo Eurospeech95 Proceedings of the 4th European Conference on SpeechCommunication and Speech Technology Madrid Spain 18-21 September 1995 Vol 1 841-844[Documento de Internet disponible en httpcoralliliuni-bielefeldde~gibbonEAGLESrwpaperrwpaperhtml]

  • 1- INTRODUCCIOacuteN
  • 2- NIVELES DE REPRESENTACIOacuteN ETIQUETADO Y CODIFICACIOacuteN
  • 3- REPRESENTACIOacuteN ORTOGRAacuteFICA DE CORPUS ORALES
  • 31- Propuestas para la representacioacuten ortograacutefica de corpus orales en el aacutembito de la linguumliacutestica de corpus
  • 32- Propuestas para la representacioacuten ortograacutefica de corpus orales en el aacutembito de las tecnologiacuteas del habla
  • 4- REPRESENTACIOacuteN FONEacuteTICA DE CORPUS ORALES
  • 41- La representacioacuten foneacutetica de los elementos segmentales
  • 42- La representacioacuten foneacutetica de los elementos suprasegmentales
  • 5- ETIQUETADO FONEacuteTICO DE CORPUS ORALES
  • 51- Niveles de etiquetado foneacutetico de corpus orales
  • 52- La transcripcioacuten y el etiquetado automaacutetico de corpus orales
  • 6- TRANSCRIPCIOacuteN Y CODIFICACIOacuteN DE CORPUS PARA EL ANAacuteLISIS DE LA LENGUA ORAL
  • 61- Los requisitos de una transcripcioacuten
  • 62- Propuestas de estandarizacioacuten para la transcripcioacuten y codificacioacuten de corpus orales
  • 7- CONCLUSIONES
  • BIBLIOGRAFIacuteA
Page 26: Transcripción, etiquetado y codificación de corpus orales

Wells JC 1987 Computer Coded Phonetic Transcription Journal of the InternationalPhonetic Association 172 94-114

Wells JC 1989 Computer-coded phonemic notation of individual languages of theEuropean Community Journal of the International Phonetic Association 191 31-54

Wells JC 1994 Computer-coding the IPA a proposed extension of SAMPA SpeechHearing and Language Work in Progress 1994 (University College London Department ofPhonetics and Linguistics) 8 271-289

Wells JC 1995 SAMPROSA (SAM Prosodic Transcription [Documento de Internetdisponible en httpwwwphonuclacukhomesampasamprosahtm]

Wells JC W Barry M Grice A Fourcin y D Gibbon 1992 Standard Computer-Compatible Transcription SAM Stage Report Sen3 SAM UCL-037 28 February 1992 SAM(1992) Esprit Project 2589 (SAM) Multilingual Speech InputOutput AssessmentMethodologyand Standardisation Final Report Year Three 1III91-28II1992 London University CollegeLondon

Wesenick M-B y F Schiel 1995 Feasibility of Automatic Annotation and BuildingPronunciation Lexica from Corpus Material LRE-63314 SpeechDat Report D3123 Finalversion 10 October 1995[Documento de Internet disponible en httpwwwicpgrenetfrSpeechDathomehtml]

Winski R R Moore y D Gibbon 1995 EAGLES Spoken Language Working GroupOverview and Resultsrdquo Eurospeech95 Proceedings of the 4th European Conference on SpeechCommunication and Speech Technology Madrid Spain 18-21 September 1995 Vol 1 841-844[Documento de Internet disponible en httpcoralliliuni-bielefeldde~gibbonEAGLESrwpaperrwpaperhtml]

  • 1- INTRODUCCIOacuteN
  • 2- NIVELES DE REPRESENTACIOacuteN ETIQUETADO Y CODIFICACIOacuteN
  • 3- REPRESENTACIOacuteN ORTOGRAacuteFICA DE CORPUS ORALES
  • 31- Propuestas para la representacioacuten ortograacutefica de corpus orales en el aacutembito de la linguumliacutestica de corpus
  • 32- Propuestas para la representacioacuten ortograacutefica de corpus orales en el aacutembito de las tecnologiacuteas del habla
  • 4- REPRESENTACIOacuteN FONEacuteTICA DE CORPUS ORALES
  • 41- La representacioacuten foneacutetica de los elementos segmentales
  • 42- La representacioacuten foneacutetica de los elementos suprasegmentales
  • 5- ETIQUETADO FONEacuteTICO DE CORPUS ORALES
  • 51- Niveles de etiquetado foneacutetico de corpus orales
  • 52- La transcripcioacuten y el etiquetado automaacutetico de corpus orales
  • 6- TRANSCRIPCIOacuteN Y CODIFICACIOacuteN DE CORPUS PARA EL ANAacuteLISIS DE LA LENGUA ORAL
  • 61- Los requisitos de una transcripcioacuten
  • 62- Propuestas de estandarizacioacuten para la transcripcioacuten y codificacioacuten de corpus orales
  • 7- CONCLUSIONES
  • BIBLIOGRAFIacuteA