anÁlisis de la modulaciÓn de voz ocasionada por el...

61
ESCUELA TÉCNICA SUPERIOR DE INGENIERIA Y SISTEMAS DE TELECOMUNICACION DEPARTAMENTO DE TEORIA DE LA SEÑAL Y COMUNICACIONES PROYECTO FIN DE CARRERA ANÁLISIS DE LA MODULACIÓN DE VOZ OCASIONADA POR EL TEMBLOR VOCAL _________________________________ AUTOR Laura Nathalia Argüello García ________________________________ TUTOR Rubén Fraile Muñoz Abril 2016

Upload: others

Post on 08-May-2020

2 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: ANÁLISIS DE LA MODULACIÓN DE VOZ OCASIONADA POR EL …oa.upm.es/40772/1/PFC_LAURA_NATHALIA_ARGUELLO_GARCIA.pdf · reproducción normal de la voz, aunque no se han identificado con

ESCUELA TÉCNICA SUPERIOR DE INGENIERIA Y SISTEMAS DE TELECOMUNICACION

DEPARTAMENTO DE TEORIA DE LA SEÑAL Y COMUNICACIONES

PROYECTO FIN DE CARRERA

ANÁLISIS DE LA MODULACIÓN DE VOZ OCASIONADA POR EL TEMBLOR VOCAL

_________________________________

AUTOR

Laura Nathalia Argüello García

________________________________

TUTOR

Rubén Fraile Muñoz

Abril 2016

Page 2: ANÁLISIS DE LA MODULACIÓN DE VOZ OCASIONADA POR EL …oa.upm.es/40772/1/PFC_LAURA_NATHALIA_ARGUELLO_GARCIA.pdf · reproducción normal de la voz, aunque no se han identificado con
Page 3: ANÁLISIS DE LA MODULACIÓN DE VOZ OCASIONADA POR EL …oa.upm.es/40772/1/PFC_LAURA_NATHALIA_ARGUELLO_GARCIA.pdf · reproducción normal de la voz, aunque no se han identificado con

AGRADECIMIENTOS

En primer lugar quisiera agradecer a Dios ya que sin el nada de esto sería posible.

Gracias a mi familia que confiaron en mí y me apoyaron desde la distancia en este reto. Todo lo que soy y lo que seré es gracias a ustedes.

A mi novio y mejor amigo, gracias por no dejarme vencer, por animarme en las derrotas y por creer en mi incluso más de lo que yo creo.

A mis amigos, ha sido increíble haberlos conocido, gracias por estar en las buenas y en las malas y por adaptarse a mis difíciles horarios.

A Rubén mi tutor que me dio la oportunidad de participar en este proyecto, por siempre estar disponible para resolver mis dudas y por su gran paciencia. Muchas gracias.

En definitiva a todas las personas que han pasado por mi vida y que me ayudaron a ser una mejor persona, porque nada sucede al azar.

“caminante no hay camino, se hace camino al andar”

Page 4: ANÁLISIS DE LA MODULACIÓN DE VOZ OCASIONADA POR EL …oa.upm.es/40772/1/PFC_LAURA_NATHALIA_ARGUELLO_GARCIA.pdf · reproducción normal de la voz, aunque no se han identificado con
Page 5: ANÁLISIS DE LA MODULACIÓN DE VOZ OCASIONADA POR EL …oa.upm.es/40772/1/PFC_LAURA_NATHALIA_ARGUELLO_GARCIA.pdf · reproducción normal de la voz, aunque no se han identificado con

5

Resumen

La realización de este proyecto está basado en el estudio realizado por Jean Schoentgen en el cual el autor caracterizó el micro temblor vocal por medio del índice y la frecuencia de modulación. En este proyecto se utilizará la herramienta Matlab para el cálculo de estos parámetros y al finalizar se analizarán los datos obtenidos.

El proyecto se ha dividido en tres grandes partes. En la primera de ellas se ha explicado brevemente los conceptos básicos de la voz y conceptos importantes tales como el temblor fisiológico, el patológico y el Jitter vocal entre otros, también se han detallado conceptos matemáticos utilizados en el desarrollo del código. Esto se realizó con el fin que el lector tenga claros algunos conceptos importantes antes del desarrollo del código y así pueda entender con más facilidad el estudio realizado en este proyecto, en esta parte no se ha realizado una explicación muy extensa de cada concepto, entendiendo que el lector posee unos conocimientos básicos de ingeniería, por otra parte existen innumerables libros que explican de una manera más precisa cada uno de estos conceptos.

En la segunda parte se llevó a cabo el desarrollo del código. Como se mencionó anteriormente se ha utilizado la herramienta Matlab que es muy utilizada en la mayoría de las asignaturas de la carrera obteniendo así un buen dominio de esta, además posee unos toolbox muy útiles que facilitan los cálculos matemáticos. En esta parte se ilustra paso a paso cada etapa de elaboración del código y algunas graficas de la señal de voz a medida que pasa por cada etapa del código.

En la última parte se obtienen los datos de todos los cálculos de los registros de voz y se analiza cada uno de ellos a la vez que se comparan con los del estudio de Jean Schoentgen y se analizan las posibles diferencias.

Page 6: ANÁLISIS DE LA MODULACIÓN DE VOZ OCASIONADA POR EL …oa.upm.es/40772/1/PFC_LAURA_NATHALIA_ARGUELLO_GARCIA.pdf · reproducción normal de la voz, aunque no se han identificado con

6

Abstract

The Project is based on the search made by Jean Schoentgen, whose research the micro

tremor vocal can be established by frequency modulation and modulation index.

This project has been carried out in Matlab to calculate the aforementioned parameters and finally, the results were contrasted with the results from Jean Shoetngen’s research.

This project consists of three parts:

The first of all, to be able to understand this project to future readers .It was explained different basic concepts about the voice such as physiologic tremor, pathological tremor and Jitter. Furthermore, mathematical concepts were explained in detail, due to these were used in the software development.

Then, it was focused on software development such as the elaboration of code and different voice signals that were processed. This part was made with Matlab, which is mathematical software with high-level language for numerical computation, visualization, collaborate across disciplines including signal and image processing and application development.

At finally, the acquired calculations were contrasted with the results from Jean Schoentgen’s research.

Page 7: ANÁLISIS DE LA MODULACIÓN DE VOZ OCASIONADA POR EL …oa.upm.es/40772/1/PFC_LAURA_NATHALIA_ARGUELLO_GARCIA.pdf · reproducción normal de la voz, aunque no se han identificado con

7

Índice general

RESUMEN .............................................................................................................................................. 5

ABSTRACT .............................................................................................................................................. 6

ÍNDICE DE FIGURAS ................................................................................................................................ 8

ÍNDICE DE TABLAS .................................................................................................................................. 9

1. INTRODUCCIÓN ........................................................................................................................... 11

1.1. OBJETIVOS DEL PROYECTO ............................................................................................................... 12

1.2. PLAN DE TRABAJO .......................................................................................................................... 12

1.3. ORGANIZACIÓN DEL PROYECTO ......................................................................................................... 14

2. CONCEPTOS PRELIMINARES ........................................................................................................ 15

2.1. CONCEPTOS BÁSICOS DE LA VOZ ........................................................................................................ 15

2.1.1. La voz ................................................................................................................................ 15

2.1.2. Disfonía ............................................................................................................................ 17

2.1.3. Temblor fisiológico y patológico ....................................................................................... 17

2.1.4. Jitter vocal ........................................................................................................................ 18

2.1.5. La voz como señal............................................................................................................. 18

2.2. CONCEPTOS MATEMÁTICOS.............................................................................................................. 20

2.2.1. Variables aleatorias .......................................................................................................... 20 2.2.1.1. Variable aleatoria discreta ......................................................................................................... 20 2.2.1.2. Variable aleatoria continúa ........................................................................................................ 22

2.2.2. Señales aleatorias en tiempo discreto .............................................................................. 23 2.2.2.1. Correlación de señales discretas en el tiempo ........................................................................... 23 2.2.2.2. Correlación cruzada y autocorrelación ....................................................................................... 24 2.2.2.3. Covarianza .................................................................................................................................. 25 2.2.2.4. Covarianza cruzada .................................................................................................................... 25

2.3. TRANSFORMADA DISCRETA DE FOURIER .............................................................................................. 26

2.4. DISEÑO DE FILTROS DIGITALES........................................................................................................... 27

2.4.1. Filtros FIR .......................................................................................................................... 27

2.5. INTERPOLACIÓN Y DIEZMADO ........................................................................................................... 30

2.5.1. Interpolación .................................................................................................................... 30

2.5.2. Diezmado ......................................................................................................................... 32

3. DESARROLLO DEL CÓDIGO ........................................................................................................... 34

3.1. GRUPO DE DATOS DE PRUEBA ........................................................................................................... 35

3.2. ELABORACIÓN DEL CÓDIGO .............................................................................................................. 36

5. CONCLUSIONES Y TRABAJOS FUTUROS ....................................................................................... 53

6. PRESUPUESTO ............................................................................................................................. 55

7. BIBLIOGRAFÍA .............................................................................................................................. 59

Page 8: ANÁLISIS DE LA MODULACIÓN DE VOZ OCASIONADA POR EL …oa.upm.es/40772/1/PFC_LAURA_NATHALIA_ARGUELLO_GARCIA.pdf · reproducción normal de la voz, aunque no se han identificado con

8

Índice de Figuras

Figura 1 Diagrama P.E.R.T del proyecto ...................................................................... 13

Figura 2 Mecanismo fonador y mecanismo respiratorio ............................................... 16

Figura 3 Cuerda vocal normal ....................................................................................... 16

Figura 4 Partes de la laringe .......................................................................................... 16

Figura 5 a) Representación de una señal sinusoidal básica b) Representación de una voz de mujer ................................................................................................................... 19

Figura 6 Espectrograma de la voz de una mujer ........................................................... 19

Figura 7 Representación de diferentes ventanas para el diseño de filtros FIR .............. 29

Figura 8 Representación de diferentes ventanas en el dominio de la frecuencia .......... 30

Figura 9 Representación de la señal antes de la Interpolacion ...................................... 31

Figura 10 Representación de la señal Interpolada con factor L=7 ................................ 31

Figura 11 Representación de la señal antes del diezmado ............................................ 32

Figura 12 Representación de la señal Diezmada con factor M=7 ................................. 33

Figura 13 Registro antes de convertirla en señal cuadrada ........................................... 37

Figura 14 Señal cuadrada .............................................................................................. 38

Figura 15 Señal de covarianza (verde) y sus picos (rojos) ............................................ 39

Figura 16 Espectrograma del registro KXH30AN voz patológica de mujer................. 40

Figura 17 Espectrograma del registro JAN1NAL voz de mujer. .................................. 42

Figura 18 Espectrograma del registro MJU1NAL voz de hombre................................ 42

Figura 19 Espectrograma del registro GPC1NAL voz de hombre. ............................... 43

Figura 20 Espectro de las DFT. En rojo la DFT “principal” en azul las DFT del vector revuelto 100 veces aleatoriamente. ................................................................................. 44

Figura 21 Índice de modulación m1 mujeres vs resultados de Jean Schoentgen .......... 49

Figura 22 Índice de modulación m2 mujeres vs resultados de Jean Schoentgen .......... 49

Figura 23 Índice de modulación m1 hombres vs resultados de Jean Schoentgen ......... 49

Figura 24 Índice de modulación m2 hombres vs resultados de Jean Schoentgen ......... 49

Figura 25 Frecuencia de modulacionfm2 mujeres vs resultados de Jean Schoentgen .. 50

Figura 26 Frecuencia de modulacionfm2 hombres vs resultados de Jean Schoentgen . 50

Figura 27 Frecuencia fundamental mujeres vs resultados de Jean Schoentgen ............ 50

Figura 28 Frecuencia fundamental hombres vs resultados de Jean Schoentgen ........... 50

Figura 29 Histograma de los índices de modulación m1 de las mujeres....................... 51

Figura 30 Histograma de los índices de modulación m2 de las mujeres....................... 51

Figura 31 Histograma de los índices de modulación m1 de los hombres ..................... 51

Figura 32 Histograma de los índices de modulación m2 de los hombres ..................... 51

Figura 33 Distribución de la frecuencia de modulación. ............................................... 52

Figura 34 Productividad mensual de programación y depuración del código .............. 57

Page 9: ANÁLISIS DE LA MODULACIÓN DE VOZ OCASIONADA POR EL …oa.upm.es/40772/1/PFC_LAURA_NATHALIA_ARGUELLO_GARCIA.pdf · reproducción normal de la voz, aunque no se han identificado con

9

Índice de Tablas

Tabla 1. Lista de Actividades y duración de cada una en la realización del proyecto. . 13

Tabla 2. Características de algunas ventanas para el diseño de filtros FIR. Fuente: [21] [25]. ................................................................................................................................ 29

Tabla 3. Grupo de voces normales utilizadas para el estudio. Fuente: [29]. ................. 35

Tabla 4. Grupo de voces con patologías utilizadas para el estudio ............................... 36

Tabla 5. Frecuencia fundamental de todos los registros de voz. ................................... 46

Tabla 6. Índice de modulación m1 en porcentajes. ....................................................... 46

Tabla 7. Índice de modulación m2 en porcentajes. ....................................................... 46

Tabla 8. Frecuencia de modulación fm2 en Hz. Obtenida en el punto donde la magnitud de la DFT presenta su amplitud máxima. ....................................................................... 47

Tabla 9. Frecuencia fundamental, frecuencia de modulación (fm2) e índices de modulación (m1,m2) de los registros de voz con disfonia pronosticada........................ 47

Tabla 10. Calendario de horas empleadas por meses en la realización del código. ...... 56

Tabla 11. Coste total de las horas de programación y depuración. ............................... 57

Tabla 12. Coste de otros gastos. .................................................................................... 58

Tabla 13. Coste total del proyecto. ................................................................................ 58

Page 10: ANÁLISIS DE LA MODULACIÓN DE VOZ OCASIONADA POR EL …oa.upm.es/40772/1/PFC_LAURA_NATHALIA_ARGUELLO_GARCIA.pdf · reproducción normal de la voz, aunque no se han identificado con

10

Page 11: ANÁLISIS DE LA MODULACIÓN DE VOZ OCASIONADA POR EL …oa.upm.es/40772/1/PFC_LAURA_NATHALIA_ARGUELLO_GARCIA.pdf · reproducción normal de la voz, aunque no se han identificado con

11

1. Introducción

La voz es una forma de comunicación única utilizada por los seres humanos, es la manera en la cual podemos interactuar con las personas a nuestro alrededor y hacernos entender.

La reproducción de voz empieza con un flujo de aire proveniente de los pulmones, que sube hasta la laringe ocasionando la vibración de las cuerdas vocales, y terminando en la cavidad bucal que hace la función de mecanismo resonador dándole al sonido las características necesarias para poder ser comprensible para las demás personas.

En la creación de la voz pueden aparecer diferentes problemas que afecten la reproducción normal de la voz, aunque no se han identificado con exactitud los parámetros de una “voz normal” el medico Ignacio Cobeta en su libro “Patología de la voz” ha establecido cuatro criterios fundamentales para caracterizar una voz normal y son: un timbre agradable, un tono de voz adecuado, volumen apropiado y una flexibilidad adecuada [1]. Partiendo de estos criterios, podemos decir, que si alguno de estos no se cumplen ocasiona que se dificulte un entendimiento normal con las demás personas.

Existen múltiples estudios que analizan las características de la voz, enfocándose en diferentes aspectos como la identificación de parámetros espectrales de la calidad de la voz [2] o la caracterización de voces patológicas por medio de un análisis espectral [3] entre otros. El estudio realizado en este proyecto se enfocara en la caracterización del micro temblor vocal; se considera importante este aspecto debido a que no existe en la actualidad muchos datos acerca de este.

Es importante poder caracterizar de manera matemática todos los aspectos posibles de la voz y así hacer que su estudio sea lo más fácil y mejor posible, para lograr esto se ha utilizado la herramienta Matlab, que facilita los cálculos matemáticos y la visualización de los resultados.

En el desarrollo del estudio de este proyecto se explicará los cálculos utilizados y el desarrollo del código que ayudó a lograr los resultados obtenidos.

Page 12: ANÁLISIS DE LA MODULACIÓN DE VOZ OCASIONADA POR EL …oa.upm.es/40772/1/PFC_LAURA_NATHALIA_ARGUELLO_GARCIA.pdf · reproducción normal de la voz, aunque no se han identificado con

12

1.1. Objetivos del Proyecto

El objetivo principal de este proyecto es la detección y análisis de la frecuencia y el nivel de modulación ocasionada por el temblor vocal. El temblor vocal está definido como una modulación de la frecuencia de fonación o la amplitud del ciclo de la voz, este temblor cabe suponer que es causado por el temblor fisiológico de la laringe, las cuerdas vocales y los músculos respiratorios [4].

El segundo objetivo del proyecto es automatizar los cálculos de todos los parámetros de las voces, este procedimiento se realizará a través de la herramienta Matlab. Los datos obtenidos se mostrarán paso a paso a través de gráficas y tablas para una mejor apreciación de los mismos.

1.2. Plan de Trabajo

En la elaboración del plan de trabajo se realizó un diagrama P.E.R.T que es un acrónimo de Program Evaluation and Review Technique (Técnicas de Evaluación y Revisión de Programas). Este diagrama se representa mediante una red de nodos y flechas que permite evaluar actividades críticas, estimar fechas para cada actividad y revisar el progreso del proyecto.

Los círculos del diagrama P.E.R.T son denominados eventos, estos eventos son enumerados con letras, números o cualquier otra forma de enumeración que se desee. El propósito de estos nodos es tener presente cuando se ha finalizado una actividad y así poder pasar a la siguiente actividad.

Page 13: ANÁLISIS DE LA MODULACIÓN DE VOZ OCASIONADA POR EL …oa.upm.es/40772/1/PFC_LAURA_NATHALIA_ARGUELLO_GARCIA.pdf · reproducción normal de la voz, aunque no se han identificado con

13

Tabla 1. Lista de Actividades y duración de cada una en la realización del proyecto.

Código Descripción de la Tarea Duración en

semanas

Actividades precedentes

A Búsqueda de información y estudios anteriores acerca de tema

2 -

B Organización de las partes del proyecto 1 A

C Desarrollo de los algoritmos y depuración del código 10 B,D

D Redacción del anteproyecto 1 B

E Análisis de los datos obtenidos 4 C

F Redacción y presentación del proyecto 3 E

G Fin del proyecto 0 F

Figura 1 Diagrama P.E.R.T del proyecto

Analizando el diagrama P.E.R.T (Figura 1) se obtiene un tiempo de finalización del proyecto de 21 semanas, se estima una dedicación de 6 horas diarias de lunes a viernes.

Al final del proyecto se analizara nuevamente este diagrama y se verificará si se cumplió con el tiempo estimado.

Page 14: ANÁLISIS DE LA MODULACIÓN DE VOZ OCASIONADA POR EL …oa.upm.es/40772/1/PFC_LAURA_NATHALIA_ARGUELLO_GARCIA.pdf · reproducción normal de la voz, aunque no se han identificado con

14

1.3. Organización del proyecto

El segundo capítulo abarca los conceptos preliminares donde se han incluido aspectos generales relacionados con la voz, también se describen conceptos matemáticos que son utilizados en el desarrollo del proyecto. El objetivo de este capítulo es poder ubicar al lector en el entorno de este proyecto, aunque de manera general, no se pretende profundizar en cada aspecto de los conceptos.

En el tercer capítulo se describe el desarrollo del código, en esta parte se aplican los conceptos matemáticos explicados en el apartado anterior, como se ha dicho anteriormente, este código es realizado en Matlab. Este apartado es desarrollado en varias fases para una mejor organización y entendimiento.

En el cuarto capítulo, se mostrarán los resultados obtenidos en tablas y gráficas. En este capítulo se analizarán los mismos.

El quinto capítulo abarca las conclusiones y trabajos futuros aquí se detallarán las conclusiones obtenidas, los objetivos alcanzados y se proponen los posibles trabajos futuros.

En el último capítulo se dará el presupuesto aproximado de este proyecto.

Page 15: ANÁLISIS DE LA MODULACIÓN DE VOZ OCASIONADA POR EL …oa.upm.es/40772/1/PFC_LAURA_NATHALIA_ARGUELLO_GARCIA.pdf · reproducción normal de la voz, aunque no se han identificado con

15

2. Conceptos preliminares

En este capítulo se realizará una breve introducción de los conceptos básicos con el fin de que la persona que lea este proyecto tenga una idea general de los términos claves que se utilizarán.

Este capítulo se divide en dos partes: conceptos básicos de la voz y conceptos matemáticos.

2.1. Conceptos básicos de la voz

2.1.1. La voz

Antes de estudiar la voz y sus características de modulación es prioritario entender cómo se genera y los órganos que intervienen. [5] [6] [7].

En la reproducción de la voz intervienen tres mecanismos, el mecanismo respiratorio, mecanismo fonador y el mecanismo resonador.

- Mecanismo respiratorio: En donde se encuentran las fosas nasales, la tráquea, los pulmones y el diafragma. En la Figura 2 se puede observar el mecanismo fonador y el respiratorio juntos.

- Mecanismo fonador: Aquí se encuentran las cuerdas vocales y la laringe. La laringe está formada por cuatro cartílagos (Figura 4): 1) Tiroides más conocido como la nuez de Adam. 2) Cricoides que se encuentra sobre la tráquea. 3) Aritenoides que son dos cartílagos simétricos donde se insertan las cuerdas vocales inferiores (verdaderas). 4) Epiglotis que es una lengüeta que regula la respiración y el paso de los alimentos, cuando comemos se cierra y al respirar se abre. Las cuerdas vocales (Figura 3) son dos membranas formadas por ligamentos y músculos: dos inferiores o verdaderas y dos superiores o falsas, por delante están unidas a la nuez de Adam y por detrás están unidas a los aritenoides. El espacio entre las cuerdas vocales se denomina glotis, cuando respiramos la glotis está ampliamente abierta haciendo que el aire pase libremente y no se produzca casi ningún sonido, para producir sonido la glotis se cierra y los pulmones empiezan a proporcionar presión de aire que hace vibrar las cuerdas vocales haciendo que se produzca unas ondas sonoras. Cuando crece la velocidad del flujo del aire se aumenta la frecuencia y el tono es más agudo y cuando la frecuencia baja el tono es más grave.

Page 16: ANÁLISIS DE LA MODULACIÓN DE VOZ OCASIONADA POR EL …oa.upm.es/40772/1/PFC_LAURA_NATHALIA_ARGUELLO_GARCIA.pdf · reproducción normal de la voz, aunque no se han identificado con

16

- Mecanismo Resonador: Este mecanismo actúa como una cámara de resonancia que transforman a las ondas sonoras provenientes del mecanismo fonador en un sonido comprensible para los demás. En este mecanismo se encuentra la faringe, la boca, las fosas nasales y los senos cráneo-faciales.

Figura 2 1 Figura 2 2

Figura 2 3

Figura 2 Mecanismo fonador y mecanismo respiratorioFuente: [7]

Figura 3 Cuerda vocal normal Fuente: [8]

Figura 4 Partes de la laringe Fuente: [7]

Page 17: ANÁLISIS DE LA MODULACIÓN DE VOZ OCASIONADA POR EL …oa.upm.es/40772/1/PFC_LAURA_NATHALIA_ARGUELLO_GARCIA.pdf · reproducción normal de la voz, aunque no se han identificado con

17

2.1.2. Disfonía

La disfonia son todas aquellas alteraciones que afectan a la reproducción normal de la voz, debido a problema en el tono, el timbre, intensidad, frecuencia o melodía de esta, la voz se escucha ronca, apagada o entrecortada. La Afonía es la falta total de la voz [9].

La clasificación más general de la disfonia es Funcional y Orgánica, aunque algunos autores como Jackson Menaldi (2002) tienen una clasificación más amplia como funcional, orgánica, lesiones asociadas y psiquiátricas [8].

a) Orgánicas

Estas se producen por una alteración en la voz como consecuencia de una lesión anatómica en los órganos de fonación, independientemente del uso de la voz, produciendo alteraciones anatómicas en las cuerdas vocales (nódulos, pólipos, quistes, ulceras, sulcus, entre otros).

b) Funcionales

Son aquellas producidas por un mal uso o abuso de la musculatura de la laringe, esta disfonia puede provocar con el tiempo, la aparición de lesiones orgánicas benignas en la mucosa de las cuerdas vocales, por ejemplo nódulos y pólipos, laringitis crónica, quistes epidérmicos y las cicatrices en las cuerdas vocales entre otras [10]. Este tipo de disfonia no presenta alteraciones en los órganos fonatorios.

2.1.3. Temblor fisiológico y patológico

El temblor es una oscilación rítmica e involuntaria que puede afectar uno o varios segmentos del cuerpo, se pueden clasificar en base de la situación en la que se presenta el temblor, ya sea en alguna postura, en reposo o en actividad.

En personas normales existe un temblor fisiológico de escasa amplitud que por lo general no se percibe a simple vista, este temblor está asociado a las pulsaciones del corazón, al respirar, o a las oscilaciones neuronales y se exacerba durante periodos de fatiga muscular, ansiedad, estrés emocional, miedo o excitación [11].

El temblor patológico ocasiona movimientos involuntarios de las extremidades del cuerpo las cuales no siempre son perceptibles [12], este temblor puede aparecer cuando la persona está en reposo o en movimiento. El temblor en reposo aparece en una parte del cuerpo que se encuentra relajada y apoyada para evitar la gravedad, este temblor es característico de la enfermedad de Parkinson, este temblor no ocasiona ninguna limitación funcional para la persona.

Page 18: ANÁLISIS DE LA MODULACIÓN DE VOZ OCASIONADA POR EL …oa.upm.es/40772/1/PFC_LAURA_NATHALIA_ARGUELLO_GARCIA.pdf · reproducción normal de la voz, aunque no se han identificado con

18

El temblor en movimiento o Acción aparece durante cualquier contracción muscular voluntaria y se divide en

- Temblor postural: Se presenta cuando mantenemos una postura contra gravedad voluntariamente

- Temblor cinético: se presenta durante el movimiento voluntario de una parte del cuerpo

Este estudio solo se centrara en las perturbaciones ocasionadas por los temblores fisiológicos.

2.1.4. Jitter vocal

El jitter o perturbación de la frecuencia se corresponde a las variaciones rápidas de la frecuencia fundamental que existe entre cada ciclo vocal y el siguiente, representadas como un ruido por modulación en frecuencia, esta perturbación es ocasionada por variaciones irregulares de las cuerdas vocales [13] [14].

El jitter es menor a frecuencias altas, los valores del jitter aumentan a medida que aumenta la edad [15]. Las lesiones de la masa de las cuerdas vocales incrementan mucho el Jitter, hay que resaltar que el Jitter no es una medida para determinar la causa de una disfonia.

2.1.5. La voz como señal

Para la realización de un estudio, es importante disponer de una representación gráfica de la señal de voz y así poder realizar los análisis pertinentes.

La representación más básica de un sonido es una señal sinusoidal, aunque es muy raro encontrar un sonido que se pueda representar de esta manera, debido a que los sonidos son una suma de varios sonidos distintos como lo es en este caso, la voz. En la figura 5 podemos observar una señal sinusoidal y una señal de voz.

Page 19: ANÁLISIS DE LA MODULACIÓN DE VOZ OCASIONADA POR EL …oa.upm.es/40772/1/PFC_LAURA_NATHALIA_ARGUELLO_GARCIA.pdf · reproducción normal de la voz, aunque no se han identificado con

19

0 0.005 0.01 0.015 0.02 0.025-1

-0.8

-0.6

-0.4

-0.2

0

0.2

0.4

0.6

0.8

1

Tiempo(s)

Am

plit

ud

a) Señal sinusoidal

b) Señal de voz

Figura 5 a) Representación de una señal sinusoidal básica b) Representación de una voz de mujer

La señal de la voz se puede representar tanto en el dominio del tiempo como en el dominio de la frecuencia, para realizar esta última representación es necesario utilizar la transformada de Fourier. La representación en el dominio de la frecuencia es muy importante ya que permite obtener información en el dominio de la frecuencia, que en el domino del tiempo no sería posible.

El espectro representa la frecuencia vs la intensidad de un sonido, si observamos un segmento de un sonido vocal podemos ver una estructura de armónicos cuasi periódicos que pueden ser atribuidos a la vibración de las cuerda vocales y una envolvente espectral debida al tracto vocal. Esta envolvente presenta unos picos, denominados formantes. Cada vocal se caracteriza por sus formantes, cuya posición en el espectro es distinta para cada una.

Las estrías que se observan en el espectrograma de la Figura 6 se atribuyen a la regularidad con la que se abren y se cierran las cuerdas vocales [16] [17].

Figura 6 Espectrograma de la voz de una mujer

0 0.005 0.01 0.015 0.02 0.025-1

-0.8

-0.6

-0.4

-0.2

0

0.2

0.4

0.6

0.8

1

Tiempo(s)

Am

plit

ud

0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.90

1000

2000

3000

4000

5000

6000

7000

8000

Time

Fre

quency (

Hz)

Page 20: ANÁLISIS DE LA MODULACIÓN DE VOZ OCASIONADA POR EL …oa.upm.es/40772/1/PFC_LAURA_NATHALIA_ARGUELLO_GARCIA.pdf · reproducción normal de la voz, aunque no se han identificado con

20

2.2. Conceptos matemáticos

Murray R. Spiegel (1991) definió la estadística como “El estudio de los métodos científicos para recoger, organizar, resumir y analizar datos, así como para sacar conclusiones válidas y tomar decisiones razonables basadas en tal análisis” [18].

El objetivo fundamental de la estadística es analizar datos y transformarlos en información útil.

2.2.1. Variables aleatorias

El concepto de variable aleatoria permite pasar de los resultados experimentales a la función numérica de los resultados. La variable aleatoria es una función que asigna a cada suceso un número.

Existen dos tipos diferentes de variables aleatorias: las variables aleatorias discretas y las variables aleatorias continuas, para el cálculo de las variables aleatorias es necesario utilizar operaciones como la suma y la resta; para las variables continuas es necesario operaciones un poco más complejas como las integrales y derivadas.

2.2.1.1. Variable aleatoria discreta

En un experimento existen numerosa variables que pueden ser observadas, pero el experimentador solo se enfoca en ciertas variables que sean de su interés, por ejemplo en el número de coches que pasan por una determinada autopista, el experimentador elije un intervalo de tiempo, y el color de coche, excluyendo de esta manera muchas otras variables como sexo del conductor, edad, nacionalidad, etc… el experimentador le puede asignar un valor a cada muestra que tiene, esta asociación se le conoce como variable aleatoria, es una variable porque son posibles diferentes valores numéricos y aleatoria porque el valor observado depende de los posibles resultados experimentales que resulte [19].

• Distribución de probabilidad

La distribución de probabilidad nos indica cómo está distribuida la probabilidad total de uno de los varios valores posibles de X, se define para cada valor de x como:

���� = ��� = �� (2.1)

Page 21: ANÁLISIS DE LA MODULACIÓN DE VOZ OCASIONADA POR EL …oa.upm.es/40772/1/PFC_LAURA_NATHALIA_ARGUELLO_GARCIA.pdf · reproducción normal de la voz, aunque no se han identificado con

21

• Esperanza o valor medio

Dada una variable aleatoria X, con un conjunto de valores posibles D y una distribución de probabilidad ���� se define su media o esperanza matemática como:

���� = = �� ∗ ���� � (2.2)

La media se puede interpretar como el centro de gravedad de los valores que puede tomar la variable

• Varianza

La varianza nos indica la cantidad de variabilidad que hay en la función.

Dada una variable aleatoria discreta X, con distribución de probabilidad ����, se define su varianza como:

������ = �� = ��� − �� ∗ ����� = �[�� − ��] (2.3)

De forma más abreviada se puede calcular la varianza con la siguiente formula

�� = ����� − [����]� (2.4)

Y su desviación estándar es simplemente la raíz cuadrada de la varianza

� = ��� (2.5)

Page 22: ANÁLISIS DE LA MODULACIÓN DE VOZ OCASIONADA POR EL …oa.upm.es/40772/1/PFC_LAURA_NATHALIA_ARGUELLO_GARCIA.pdf · reproducción normal de la voz, aunque no se han identificado con

22

2.2.1.2. Variable aleatoria continúa

Una variable aleatoria es continua si el conjunto de valores que pueda tomar solo puede encerrarse en intervalos, formando por lo tanto un conjunto con un número infinito no numerable de elementos.

Sea X una variable aleatoria continua, su función de densidad de probabilidad estará definida por la siguiente ecuación

��� ≤ � ≤ �� = � �������� (2.6)

Para que ���� sea una función de probabilidad, se debe cumplir que

a. ���� ≥ 0

b. ! ������ = 1#$#

• Esperanza o valor medio

Sea X una variable aleatoria continua con función de densidad ����. Se define su media o esperanza matemática como:

���� = = � � ∗ ������&$& (2.7)

El concepto teórico de media no varía si es discreto o continúo “es un valor central alrededor del que se dan el conjunto de realizaciones de la variable aleatoria”

• Varianza

La varianza se interpreta como una medida de la concentración de los valores de la variable aleatoria en torno a su media.

'��[�] = �� = � �� − �� ∗ ������#$# = �[�� − ��] (2.8)

De manera abreviada podemos calcularla con la siguiente ecuación:

�� = ����� − [����]� (2.9)

Page 23: ANÁLISIS DE LA MODULACIÓN DE VOZ OCASIONADA POR EL …oa.upm.es/40772/1/PFC_LAURA_NATHALIA_ARGUELLO_GARCIA.pdf · reproducción normal de la voz, aunque no se han identificado con

23

Y la desviación típica:

� = ��� (2.10)

Si la varianza es pequeña, indica una alta concentración de los valores de la variable en torno a la media y viceversa, si la varianza es grande, indica alta dispersión de los valores de la variable respecto de la media.

2.2.2. Señales aleatorias en tiempo discreto

Era importante en primer lugar describir el concepto de variable aleatoria dado que las señales aleatorias se modelan en base a variables aleatorias, el dominio de estas es crucial para abordar satisfactoriamente el estudio de las señales [20].

Para el procesamiento y análisis de señales es fundamental conocer una representación matemática de la propia señal. Cuando una señal se puede representar de manera inequívoca mediante una expresión matemática, una tabla de datos o una regla definida se le conoce como señal determinista, esto quiere decir que de esta señal conocemos todos sus valores, pasados, presentes y futuros.

Sin embargo, en muchas ocasiones existen señales que no se pueden describir con un grado razonable de precisión o que su descripción matemática es demasiado compleja. La falta de una relación matemática que la defina, implica que la señal evolucione en el tiempo de manera no predecible. Estas señales son conocidas como señales aleatorias. Esto es muy habitual en sistemas de comunicaciones, donde tanto los ruidos como el contenido de los mensajes son imprevisibles. Un ejemplo de estas señales es la señal de la voz.

2.2.2.1. Correlación de señales discretas en el tiempo

La correlación es utilizada para comparar dos señales y medir el grado de similitud que hay entre ellas, esta técnica es utilizada en diversas áreas de ingeniería, como por ejemplo en sistemas radar para la localización de blancos y su velocidad, y en comunicaciones digitales para poder extraer información que se ve afectada por el ruido debido a los componentes electrónicos, etc...

Page 24: ANÁLISIS DE LA MODULACIÓN DE VOZ OCASIONADA POR EL …oa.upm.es/40772/1/PFC_LAURA_NATHALIA_ARGUELLO_GARCIA.pdf · reproducción normal de la voz, aunque no se han identificado con

24

2.2.2.2. Correlación cruzada y autocorrelación

Si tenemos dos secuencias de señales reales ��(�)*�(�la correlación cruzada entre estas señales está dada por la siguiente formula:

�+�,� = � ��(�*�( − ,�#-.$# ,, = 0,±1 ± 2,… .. (2.11)

O de manera similar

�+�,� = � ��( + ,�*�(�#-.$# ,, = 0,±1 ± 2,… .. (2.12)

El índice k es el parámetro de desplazamiento (tiempo) (o retardo) y el subíndice xy indica las secuencias con la que se van a correlar.

�+�,� = �+�−,� (2.13)

Lo que se quiere decir en la ecuación (2.13) es que �+�,� es la versión reflejada de �+�,� efectuando la reflexión en k=0 [19] [20] [21].

Cuando se tienen secuencias de duración finita, se acostumbra a expresar la autocorrelación y la correlación cruzada en función de los límites finitos del sumatorio

�+�,� = � ��(�*�( − ,�5$│7│$8-.7 (2.14)

En el caso de que x(n) e y(n) coincidan tenemos la autocorrelación (2.15)

��,� = � ��(���( − ,�5$│7│$8-.9 (2.15)

Page 25: ANÁLISIS DE LA MODULACIÓN DE VOZ OCASIONADA POR EL …oa.upm.es/40772/1/PFC_LAURA_NATHALIA_ARGUELLO_GARCIA.pdf · reproducción normal de la voz, aunque no se han identificado con

25

2.2.2.3. Covarianza

La covarianza de una variable estadística bidimensional, es el parámetro estadístico más representativo de una distribución bidimensional. La covarianza es una medida de la variabilidad conjunta de dos variables. El signo de la covarianza indica el sentido en el que varían conjuntamente las dos variables, si es mayor a cero las dos variables varían en el mismo sentido, si es menor a cero las variables varían en sentido opuesto [22] [23] [24].

El cálculo de la covarianza es realmente la fórmula de la correlación cruzada (2.12) eliminando la media de las secuencias.

���8, *�� = �[��8 − 8��*� − ��] (2.16)

Siendo E la esperanza o media y 9 = ��9

2.2.2.4. Covarianza cruzada

En procesamiento de señales, la covarianza cruzada es una medida de similitud entre dos señales o campos aleatorios, si las dos señales son iguales, los valores correspondientes de las funciones son máximos y van decreciendo en la medida que estos son diferentes. La covarianza es frecuentemente utilizada para encontrar características relevantes en una señal desconocida por medio de la comparación con otra que si se conoce.

Se define según la ecuación:

�+�:� = �[��-;< − �=*- − +> ∗] (2.17)

Page 26: ANÁLISIS DE LA MODULACIÓN DE VOZ OCASIONADA POR EL …oa.upm.es/40772/1/PFC_LAURA_NATHALIA_ARGUELLO_GARCIA.pdf · reproducción normal de la voz, aunque no se han identificado con

26

2.3. Transformada discreta de Fourier

Para analizar en frecuencia una señal discreta en el tiempo ��(� convertimos una secuencia en el dominio del tiempo, en una secuencia en el dominio de la frecuencia. Esto se hace por medio de la transformada de Fourier X (w) el inconveniente que existe es que X (w) es una función continua de la frecuencia y por lo tanto esta señal no representa adecuadamente la secuencia x(n), para solventar esto consideramos la representación de una secuencia x(n) mediante muestras de su espectro X (w), este procedimiento es conocido como transformada discreta de Fourier (DFT) [21].

Dada una secuencia de duración finita ��(� de longitud N, tiene una transformada de Fourier:

��?� = � ��(�)$@A-5$8-.$B (2.18)

Si se muestrea ��?� en frecuencias igualmente espaciadas ?7 = �C75 , , = 0,1, …D − 1

obtenemos la fórmula de la transformada discreta de Fourier DFT

EFG: ��,� = � ��(�)$@�C7-55$8-.B , , = 0,1,2, … .D − 1 (2.19)

Y la transformada inversa de Fourier IDFT

IEFG: ��(� = 1D� ��,�)@�C7-55$87.B , ( = 0,1,2, …D − 1 (2.20)

Page 27: ANÁLISIS DE LA MODULACIÓN DE VOZ OCASIONADA POR EL …oa.upm.es/40772/1/PFC_LAURA_NATHALIA_ARGUELLO_GARCIA.pdf · reproducción normal de la voz, aunque no se han identificado con

27

2.4. Diseño de filtros digitales

De manera general, un filtro es un dispositivo selectivo de frecuencia que se utiliza para limitar en alguna forma el espectro de una señal dentro de un intervalo específico de frecuencias, ciertas componentes son ampliadas y otras atenuadas.

Existen dos tipos de filtros digitales dependiendo de la respuesta al impulso: filtros FIR (respuesta infinita al impulso) y filtros IIR (respuesta infinita al impulso o auto regresivos).

Entre las ventajas de los filtros FIR se destacan las siguientes:

- Presentan un desfase lineal, lo que implica que el filtro no introduce distorsión de fase.

- Son estables

Entre las ventajas de los filtros IIR están:

- Su diseño puede partir de prototipos analógicos. - Requieren menos coeficientes que un filtro FIR, como consecuencia se

requiere menos tiempo de cálculo y de capacidad de memoria.

Debido a que en este proyecto se utilizará un filtro FIR, solamente se explicara de manera breve estos filtros, si el lector desea obtener una información más amplia de todos los filtros y sus características, existen abundantes libros que se dedican a su explicación detallada [25] [26].

2.4.1. Filtros FIR

Como se explicó anteriormente los filtros FIR son los únicos que presentan un comportamiento de fase lineal, esto significa que todos los armónicos de la señal presentan el mismo retraso al atravesar el filtro, por lo que a la salida se sumaran correctamente, es decir no habrá distorsión de fase.

Nos centraremos en el estudio del filtro FIR de fase lineal

• Diseño de filtros FIR de fase lineal utilizando ventanas

Este método se basa en determinar la respuesta al impulso unidad ℎK�(� a partir de las especificaciones de la respuesta en frecuencia deseada LK�?�, donde las dos están relacionadas por la transformada de Fourier de la siguiente manera

LK�?� = �ℎK&-.B

�(�)$@A- (2.21)

Page 28: ANÁLISIS DE LA MODULACIÓN DE VOZ OCASIONADA POR EL …oa.upm.es/40772/1/PFC_LAURA_NATHALIA_ARGUELLO_GARCIA.pdf · reproducción normal de la voz, aunque no se han identificado con

28

ℎK�(� = 12M� LK�?�)@A-�?C$C (2.22)

Teniendo en cuenta que la respuesta al impulso después de realizar la integral (2.22) es de duración infinita, es necesario truncar la señal, esto se hace multiplicando ℎK�(� por una ventana rectangular definida por:

?�(� = N1, ( = 0,1, … . ,O − 10, )(PQ�PR�SP (2.23)

Luego ahora la respuesta al impulso unidad del filtro FIR es

ℎ�(� = ℎK�(�?�(� = TℎK�(�, ( = 0,1, … ,O − 10, )(PQ�PR�SP (2.24)

Si analizamos la respuesta en frecuencia del filtro FIR que es la convolución en frecuencia de LK�?� con W (w)

L�?� = 12M� LK���U�? − ����C$C (2.25)

La transformada de Fourier de la ventana rectangular es

U�?� = � )$@A-V$8-.B = 1 − )$@AV1 − )$@A = )$@A�V$8�� ∗ WS)( X?O2 Y

S)( X?2Y Z (2.26)

│U�?�│ = │S)( X?O2 Y││S)( X?2Y│ ,M ≤ ? ≤ M

(2.27)

Los grandes lóbulos secundarios de W (w) producen una serie de efectos de rizados que no son deseados en la respuesta en frecuencia del filtro L�?�, este efecto se puede eliminar utilizando ventanas que no contengan discontinuidades abruptas en sus características en el dominio de la frecuencia. Las ventanas más comunes son la rectangular, la Hamming, Hanning, Blackman, y káiser entre otras.

Cada ventana tiene sus propias ventajas e inconvenientes, por lo que no se puede decir cual ventana es mejor con respecto a las otras. A continuación se presentan (Tabla 2) los aspectos más importantes de algunas ventanas: su ancho de transición entre las bandas de paso y atenuada, el rizado en la banda de paso y la atenuación del lóbulo secundario con respecto al principal.

Page 29: ANÁLISIS DE LA MODULACIÓN DE VOZ OCASIONADA POR EL …oa.upm.es/40772/1/PFC_LAURA_NATHALIA_ARGUELLO_GARCIA.pdf · reproducción normal de la voz, aunque no se han identificado con

29

En la Tabla 2 se observa que a medida que aumenta la banda de transición disminuye el rizado del filtro, y viceversa.

Tabla 2. Características de algunas ventanas para el diseño de filtros FIR. Fuente: [21] [25].

Nombre de la ventana

Secuencia en el dominio del tiempo

h(n),0 ≤ n ≤ M-1

Anchura aproximada de la región

de transición del lóbulo principal

Rizado en la banda de paso (dB)

Pico del lóbulo secundario (dB)

Rectangular

1

4M/O

0.7416

-13

Hanning

12 ]1 − cos ] 2M(O − 1aa 8M/O

0.0546

-31

Hamming

0,54 − 0,46 cos ] 2M(O − 1a 8M/O

0.0194

-41

Blackman

0.42 − 0.5 cos ] 2M(O − 1a+ 0.008cos� 4M(O − 1�

12M/O

0.0017

-57

Con estas ventanas se obtienen lóbulos secundarios más pequeños comparados con los de la ventana rectangular, aunque si se tiene el mismo valor de M, se obtiene un ancho del lóbulo principal mayor que el de la ventana rectangular, estas ventanas también tienen una región de transición mayor, para contrarrestar esto, es necesario aumentar la longitud de la ventana, aunque esto ocasiona un filtro muy grande. En la Figura 7 se ilustra las ventanas de Hamming, Hanning, Blackman y Bartlett con M=64, en el dominio del tiempo y en la Figura 8 en el dominio de la frecuencia (dB).

Figura 7 Representación de diferentes ventanas para el diseño de filtros FIR Fuente: Propia

10 20 30 40 50 600

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

Samples

Am

plit

ude

Time domain

Hamming

Blackman

Hanning

Bartlett

Page 30: ANÁLISIS DE LA MODULACIÓN DE VOZ OCASIONADA POR EL …oa.upm.es/40772/1/PFC_LAURA_NATHALIA_ARGUELLO_GARCIA.pdf · reproducción normal de la voz, aunque no se han identificado con

30

Figura 8 Representación de diferentes ventanas en el dominio de la frecuencia Fuente: Propia

2.5. Interpolación y Diezmado

En ocasiones en el procesado de señales digitales es necesario aumentar o disminuir la frecuencia de muestreo de una señal, por ejemplo en audio, discos compactos, cintas de audio, televisión, etc...

El incremento en la frecuencia de muestreo se conoce como interpolación y la disminución de la misma como diezmado.

2.5.1. Interpolación

En el caso de un interpolador viene representado por la ecuación

*e[(] = � f(. ghi (2.28)

Siendo T el periodo de muestreo de x[n], se disminuye este un factor L veces, lo que hace que se produzca un aumento de la frecuencia de muestreo.

En las Figuras 9 y 10 se puede observar gráficamente el efecto de la interpolación.

0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9-140

-120

-100

-80

-60

-40

-20

0

20

40

Normalized Frequency (×π rad/sample)

Magnitu

de (

dB

)

Frequency domain

Hamming

Blackman

Hanning

Bartlett

Page 31: ANÁLISIS DE LA MODULACIÓN DE VOZ OCASIONADA POR EL …oa.upm.es/40772/1/PFC_LAURA_NATHALIA_ARGUELLO_GARCIA.pdf · reproducción normal de la voz, aunque no se han identificado con

31

x[n] v[n] yL[n]

fs=1/T f`s=Lfs f`s

Figura 9 Representación de la señal antes de la Interpolacion Fuente: Propia

Figura 10 Representación de la señal Interpolada con factor L=7 Fuente: Propia

1 1.1 1.2 1.3 1.4 1.5 1.6 1.7 1.8 1.9 2

x 10-3

-0.4

-0.3

-0.2

-0.1

0

0.1

0.2

0.3

0.4

1 1.1 1.2 1.3 1.4 1.5 1.6 1.7 1.8 1.9 2

x 10-3

-0.4

-0.3

-0.2

-0.1

0

0.1

0.2

0.3

0.4

h(n) ↑L

Page 32: ANÁLISIS DE LA MODULACIÓN DE VOZ OCASIONADA POR EL …oa.upm.es/40772/1/PFC_LAURA_NATHALIA_ARGUELLO_GARCIA.pdf · reproducción normal de la voz, aunque no se han identificado con

32

2.5.2. Diezmado

La relación entrada-salida de un diezmador viene representada por la expresión (2.29)

*V[(] = �[(.O] (2.29)

Para evitar un solapamiento de muestras, se añade un filtro paso bajo antes de realizar el diezmado, en las Figuras 11 y 12 se puede apreciar el efecto del diezmado con un factor de M=7.

x[n] v[n] yM[n]

fs=1/T f`s=fs/M

Figura 11 Representación de la señal antes del diezmado Fuente: Propia

1 1.1 1.2 1.3 1.4 1.5 1.6 1.7 1.8 1.9 2

x 10-3

-0.4

-0.3

-0.2

-0.1

0

0.1

0.2

0.3

0.4

M h[n]

Page 33: ANÁLISIS DE LA MODULACIÓN DE VOZ OCASIONADA POR EL …oa.upm.es/40772/1/PFC_LAURA_NATHALIA_ARGUELLO_GARCIA.pdf · reproducción normal de la voz, aunque no se han identificado con

33

Figura 12 Representación de la señal Diezmada con factor M=7 Fuente: Propia

1 1.1 1.2 1.3 1.4 1.5 1.6 1.7 1.8 1.9 2

x 10-3

-0.4

-0.3

-0.2

-0.1

0

0.1

0.2

0.3

0.4

Page 34: ANÁLISIS DE LA MODULACIÓN DE VOZ OCASIONADA POR EL …oa.upm.es/40772/1/PFC_LAURA_NATHALIA_ARGUELLO_GARCIA.pdf · reproducción normal de la voz, aunque no se han identificado con

34

3. Desarrollo del código

El objetivo principal del proyecto es caracterizar la modulación de la voz producida por los micro temblores vocales, para realizar este análisis se ha utilizado el programa MATLAB, se ha elegido este programa porque a lo largo de la carrera se ha utilizado en diferentes asignaturas dando un conocimiento más amplio del mismo.

Matlab es una herramienta que permite desarrollar cálculos matemáticos de manera sencilla. Tiene un amplio abanico de funciones especializadas que ayudan a minimizar líneas de programación llamadas toolboxes, actualmente estos toolboxes cubren prácticamente la totalidad de las principales áreas de la ingeniería. Matlab proporciona un entorno agradable que facilita el desarrollo de códigos de manera más sencilla, adicionalmente permite visualizar diferentes graficas que pueden ser de utilidad para una mejor comprensión de todos los cálculos.

Existen múltiples bibliografías dedicadas a explicar con detalle cada una de las funciones de MATLAB [27] [28] pero en este proyecto no se va profundizar en la herramienta MATLAB, solamente se nombraran las funciones utilizadas para la realización del mismo.

Page 35: ANÁLISIS DE LA MODULACIÓN DE VOZ OCASIONADA POR EL …oa.upm.es/40772/1/PFC_LAURA_NATHALIA_ARGUELLO_GARCIA.pdf · reproducción normal de la voz, aunque no se han identificado con

35

3.1. Grupo de datos de Prueba

Los datos que se utilizan para este estudio provienen de la base de datos Massachusetts Eye and Ear Infirmary (MEEI). Las grabaciones de las voces son un segmento de la vocal /a/ pronunciada por 53 sujetos sin ningún problema en la laringe diagnosticado (32 Mujeres y 21 Hombres) y 3 sujetos con problemas en la voz (Dos Mujeres y un Hombre) [29].

Las grabaciones normales utilizadas en este estudio son:

Tabla 3. Grupo de voces normales utilizadas para el estudio. Fuente: [29].

Nombre del

archivo

Genero Duración (s)

Nombre del archivo

Genero Duración (s)

Nombre del

archivo

Genero Duración (s)

AXH1NAL Mujer 3 LLA1NAL Mujer 3 FMB1NAL Hombre 3

BJV1NAL Mujer 3 LMV1NAL Mujer 3 GPC1NAL Hombre 3

CAD1NAL Mujer 3 LMW1NAL Mujer 3 GZZ1NAL Hombre 3

CEB1NAL Mujer 3 MAM1NAL Mujer 3 JMC1NAL Hombre 3

DAJ1NAL Mujer 3 MAS1NAL Mujer 3 KAN1NAL Hombre 3

DFP1NAL Mujer 3 MCB1NAL Mujer 3 MFM1NAL Hombre 3

DMA1NAL Mujer 3 MXB1NAL Mujer 3 MJU1NAL Hombre 3

EDC1NAL Mujer 3 NJS1NAL Mujer 3 MXZ1NAL Hombre 2

HBL1NAL Mujer 2 SCK1NAL Mujer 3 OVK1NAL Hombre 3

JAF1NAL Mujer 2 SCT1NAL Mujer 3 PCA1NAL Hombre 3

JAN1NAL Mujer 3 SEB1NAL Mujer 3 RHG1NAL Hombre 3

JAP1NAL Mujer 3 SLC1NAL Mujer 3 RHM1NAL Hombre 3

JEG1NAL Mujer 3 VMC1NAL Mujer 3 RJS1NAL Hombre 3

JKR1NAL Mujer 3 PBD1NAL Mujer 3 SIS1NAL Hombre 3

JTH1NAL Mujer 3 BJB1NAL Hombre 3 SXV1NAL Hombre 3

JXC1NAL Mujer 3 DJG1NAL Hombre 3 TXN1NAL Hombre 3

LAD1NAL Mujer 3 DWS1NAL Hombre 3 WDK1NAL Hombre 3

LDP1NAL Mujer 3 EJC1NAL Hombre 3

Las patologías diagnosticadas para las voces con problemas por el MEEI son las siguientes [29]

Page 36: ANÁLISIS DE LA MODULACIÓN DE VOZ OCASIONADA POR EL …oa.upm.es/40772/1/PFC_LAURA_NATHALIA_ARGUELLO_GARCIA.pdf · reproducción normal de la voz, aunque no se han identificado con

36

Tabla 4. Grupo de voces con patologías utilizadas para el estudio

Nombre del Archivo

Genero Diagnostico Duración(s)

KXH30AN Mujer Temblor vocal y disfonia espasmódica

1

RCC11AN Mujer Reflujo gástrico, temblor vocal, edema en las cuerdas vocales y disfonia espasmódica

1

WFCO7AN Hombre Temblor vocal, compresión ventricular y disfonia espasmódica

1

Los registros no tienen la misma duración como se refleja en las Tablas 3 y 4, para el estudio se cortan todos los registros a 1 segundo de duración. La frecuencia de muestreo de todas las grabaciones es de 25 KHz.

3.2. Elaboración del código

Como se ha dicho anteriormente el propósito es caracterizar el micro temblor vocal, por esto no se ha enfocado en la realización de códigos para los cálculos matemáticos, en lugar de esto se utilizaran los toolboxes antes mencionados, los cuales se explicaran de manera abreviada a medida que se utilicen en el desarrollo del código, con esto solo se centrara el estudio en obtener los resultados que nos permitan la caracterización del micro temblor.

Para el desarrollo del código nos basaremos en el estudio realizado por Jean Schoentgen en el artículo “Modulation frequency and modulation level owing to vocal microtremor” [12], el autor propone dividir el estudio en cuatro fases:

Fase 1. Estimación de la frecuencia fundamental de cada registro de voz, mediante la

función de covarianza.

Para este cálculo se realizara las siguientes etapas:

Etapa 1. Conversión de la señal en dos niveles

Etapa 2. Calculo de la autocovarianza de la señal de la Etapa 1.

Etapa 3. Localización de máximos locales.

Para todas las representaciones graficas que se hagan en adelante se utilizará el registro AXH1NAL. Esta voz como se puede observar en la Tabla 3 es una voz de mujer sin ningún problema vocal diagnosticado. Si a lo largo del proyecto se considera

Page 37: ANÁLISIS DE LA MODULACIÓN DE VOZ OCASIONADA POR EL …oa.upm.es/40772/1/PFC_LAURA_NATHALIA_ARGUELLO_GARCIA.pdf · reproducción normal de la voz, aunque no se han identificado con

37

conveniente representar otro registro por alguna característica especial se dirá cual registro es y la razón por la cual se está representando.

Etapa 1. Conversión de la señal en dos niveles

Para la conversión de la señal de voz se asignó +1 para los valores positivos y -1 para los valores negativos.

Se puede observar esta conversión en las dos siguientes figuras, en la Figura 13 se ha visualizado un fragmento de voz, esta ha sido recortada como se había mencionado en el apartado 3.1. En la figura 14 se observa la señal después de convertirla en una señal de dos niveles.

Figura 13 Fragmento de voz de mujer sin Patología. Fuente: Propia

0 0.001 0.002 0.003 0.004 0.005 0.006 0.007 0.008 0.009 0.01-1

-0.8

-0.6

-0.4

-0.2

0

0.2

0.4

0.6

0.8

1RECORTADA

Tiempo(s)

Am

plit

ud

Page 38: ANÁLISIS DE LA MODULACIÓN DE VOZ OCASIONADA POR EL …oa.upm.es/40772/1/PFC_LAURA_NATHALIA_ARGUELLO_GARCIA.pdf · reproducción normal de la voz, aunque no se han identificado con

38

Figura 14 Fragmento de señal cuadrada de mujer sin patología Fuente: Propia

Etapa 2. Calculo de la autocovarianza

Una vez se ha transformado la señal en una de dos niveles (Figura 14) se procede a calcular la covarianza de esta. En el capítulo 2 se ha explicado el significado de la covarianza y lo importante que es para calcular la similitud de dos señales. En esta etapa para el cálculo de la autocovarianza se ha utilizado la función xcov, esta función devuelve la covarianza de dos señales de tiempo discreto.

La covarianza requiere la normalización para estimar la función correctamente.

Etapa 3. Localización de los máximos locales.

Una vez obtenida la covarianza de la señal de voz, se procede a buscar los máximos locales. En la búsqueda de los máximos, se le otorga un valor de uno positivo a los picos encontrados, obteniendo a la salida la señal de la Figura 15.

Debido a que la covarianza es simétrica, solamente se toma la información de la mitad derecha, no afectando esto los resultados obtenidos.

0 0.001 0.002 0.003 0.004 0.005 0.006 0.007 0.008 0.009 0.01-2

-1.5

-1

-0.5

0

0.5

1

1.5

2CUADRADA

Tiempo(s)

Am

plit

ud

Page 39: ANÁLISIS DE LA MODULACIÓN DE VOZ OCASIONADA POR EL …oa.upm.es/40772/1/PFC_LAURA_NATHALIA_ARGUELLO_GARCIA.pdf · reproducción normal de la voz, aunque no se han identificado con

39

Figura 15 Señal de covarianza (verde) y sus picos (rojos) Fuente: propia

Los picos hallados son almacenados en un vector que indica la posición de cada uno de ellos. El fin de hallar los máximos es conseguir calcular a partir de estos la periodicidad de la señal, el programa busca el máximo local y compara con los dos picos siguientes a su posición, si la posición del primer pico está dentro del 5% de la posición de los otros dos picos ,este se da como bueno y se mantiene en el vector, si no encuentra un pico que satisfaga esta condición, el programa se detiene, da salida por el vector todos los máximos que encontró e invita al usuario a elegir un periodo de manera visual y aproximada. Para este cálculo se da un margen de error del 5%(este error es un porcentaje valido para el cálculo, debido a que la señal de voz no es una señal sinusoidal perfecta).

En esta fase se ha tenido que eliminar el registro KXH30AN este registro está en el grupo de las voces con problema patológico diagnosticado (Tabla 4), si analizamos el espectro de la voz, podemos ver que no tiene unas líneas de frecuencia definidas, los picos que puede calcular Matlab son muy pocos he imprecisos, por esta razón el código al final muestra a la salida los picos que pudo encontrar y descarta este registro del estudio.

0 0.05 0.1 0.15 0.2 0.25 0.3 0.35 0.4 0.45-0.8

-0.6

-0.4

-0.2

0

0.2

0.4

0.6

0.8

1

Page 40: ANÁLISIS DE LA MODULACIÓN DE VOZ OCASIONADA POR EL …oa.upm.es/40772/1/PFC_LAURA_NATHALIA_ARGUELLO_GARCIA.pdf · reproducción normal de la voz, aunque no se han identificado con

40

Figura 16 Espectrograma del registro KXH30AN voz patológica de mujer Fuente: Propia

Fase 2. Extracción de series de tiempo del registro de voz

Igual que en la primera fase, se ha dividido el código en dos etapas:

Etapa 1. Interpolación y filtrado

Etapa 2. Longitud de ciclos

Etapa 1. Interpolación y filtrado

Como se explicó en el apartado 2.5.1 la interpolación es el aumento de la tasa de muestreo de la señal, en esta etapa se realizó la interpolación por un factor de 7, obteniendo un aumento en la frecuencia de muestreo de 25kHz a 175KHz, este aumento tan significativo de la frecuencia de muestreo da como resultado una mejor resolución de la señal.

Una vez obtenida la señal interpolada, se le aplica un filtro paso bajo, en el apartado 2.4 se explicó los diferentes filtros y las ventajas que hay entre cada uno de ellos, para este caso, se eligió un filtro FIR utilizando la ventana de Hamming, para esto se utilizó la función ofrecida por Matlab para la ventana “Hamming”. La longitud de la ventana debe ser un numero entero y positivo, en este caso la longitud de la ventana es L=1093, esta longitud de ventana ha sido elegida siguiendo los parámetros del estudio base [12]. La frecuencia de corte del filtro paso bajo es de 800 Hz. Se ha determinado que el

0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.90

1000

2000

3000

4000

5000

6000

7000

8000

Time

Fre

quency (

Hz)

Page 41: ANÁLISIS DE LA MODULACIÓN DE VOZ OCASIONADA POR EL …oa.upm.es/40772/1/PFC_LAURA_NATHALIA_ARGUELLO_GARCIA.pdf · reproducción normal de la voz, aunque no se han identificado con

41

temblor vocal está presente en las frecuencias bajas, dando así un margen amplio para el estudio del temblor vocal.

Etapa 2. Longitud de ciclos

Después de tener la señal filtrada, se procede a buscar la longitud de los ciclos vocales, la longitud es la distancia entre los picos más prominentes de la señal, se realizó de esta manera debido a que en el estudio se enfoca en la caracterización del micro temblor vocal, sin tener en cuenta el jitter.

Se realiza nuevamente una búsqueda de los picos de la señal, teniendo en cuenta que esta nueva señal es la que se ha interpolado y posteriormente se ha filtrado. Una vez hallado el vector de picos se busca el pico más prominente. Este pico se toma como “pico referencia” y se busca que la distancia entre este y el siguiente pico de la izquierda tenga una separación igual a frecuencia fundamental hallada en la fase 1 con un margen de error del 10%, si el “pico referencia” no cumple con este requisito, se anula y se toma el siguiente pico de la izquierda como “pico referencia” hasta que se halle un pico que cumpla con este requisito. Si con el margen de error del 10% el programa no encontrase los picos que cumplan con el requisito mencionado anteriormente se eleva el porcentaje a 15%.

Cuando el programa llegue al final de los picos de la izquierda, se detiene y vuelve hacia el “pico referencia” encontrado al principio y empieza la búsqueda por la derecha de la misma manera que lo hizo con los picos de la izquierda, al final el programa saca un vector con todas posiciones de los picos encontrados.

Si después de ampliar el margen de la búsqueda hasta 15% no encontrase los picos que satisfagan los requisitos de la búsqueda, se eliminará el registro de voz del estudio, esto ha sucedido con tres voces una de mujer y dos de hombres normales, quedando al final un grupo de 31 mujeres y 19 hombres.

Aunque fue posible determinar el periodo fundamental de estas voces en un principio, en esta fase se han tenido que eliminar. A continuación se podrá observar los espectros de las tres voces y los problemas en las líneas de frecuencia que hizo que Matlab no pudiese encontrar los picos.

Page 42: ANÁLISIS DE LA MODULACIÓN DE VOZ OCASIONADA POR EL …oa.upm.es/40772/1/PFC_LAURA_NATHALIA_ARGUELLO_GARCIA.pdf · reproducción normal de la voz, aunque no se han identificado con

42

Figura 17 Espectrograma del registro JAN1NAL voz de mujer. Fuente: Propia

Figura 18 Espectrograma del registro MJU1NAL voz de hombre.

Fuente: Propia

0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.90

1000

2000

3000

4000

5000

6000

7000

8000

Time

Fre

quency (

Hz)

0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.90

1000

2000

3000

4000

5000

6000

7000

8000

Time

Fre

quency (

Hz)

Page 43: ANÁLISIS DE LA MODULACIÓN DE VOZ OCASIONADA POR EL …oa.upm.es/40772/1/PFC_LAURA_NATHALIA_ARGUELLO_GARCIA.pdf · reproducción normal de la voz, aunque no se han identificado con

43

Figura 19 Espectrograma del registro GPC1NAL voz de hombre. Fuente: Propia

Fase 3. Estimación de la frecuencia de modulación utilizando la transformada de

Fourier

El vector de la longitud de tiempos obtenido en la fase anterior es analizado a través de la transformada de Fourier. Para la realización de este cálculo Matlab utiliza el algoritmo rápido de la transformada de Fourier (FFT).

Se obtiene la transformada de Fourier del vector de tiempos, esta se tomara como la DFT “principal” para asegurar que las frecuencias halladas sean realmente significativas, se ha tomado el vector de la longitud de tiempos y se ha desordenado de manera aleatoria y sin repeticiones 100 veces, en cada repetición se ha calculado su DFT. En la Figura 20 se puede observar las DFT, en color rojo esta la DFT “principal” y en color azul las 100 DFT.

Se compara el módulo de la DFT inicial con las 100 transformadas obtenidas de las series aleatorias, eligiendo solamente los picos espectrales cuyo tamaño siempre excedan los picos espectrales de las 100 series aleatorias. Para que se entienda de forma más clara, se compara la señal roja con respecto a las señales azules (Figura 20), si existe algún pico espectral de la señal roja menor que los picos espectrales de alguna señal azul, este pico espectral será eliminado, entendiendo que no es un valor significativo.

0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.90

1000

2000

3000

4000

5000

6000

7000

8000

Time

Fre

quency (

Hz)

Page 44: ANÁLISIS DE LA MODULACIÓN DE VOZ OCASIONADA POR EL …oa.upm.es/40772/1/PFC_LAURA_NATHALIA_ARGUELLO_GARCIA.pdf · reproducción normal de la voz, aunque no se han identificado con

44

Una vez obtenido el vector con los picos espectrales significativos, se eliminan las frecuencias mayores a 15Hz, debido a que el micro temblor vocal está presente en frecuencias menores a 15Hz.

Figura 20 Espectro de las DFT. En rojo la DFT “principal” en azul las DFT del vector revuelto 100 veces aleatoriamente. Fuente: Propia

Fase 4. Estimación del índice de modulación

Por último se ha calculado el índice de modulación de la señal, el índice de modulación es una medida de tamaño con respecto a la duración media de las perturbaciones. Para realizar este caculo es preciso calcular la inversa de la transformada de Fourier, para esto se utilizó la función inversa de la DFT proporcionada por matlab.

Para el cálculo del índice de modulación se utilizó la siguiente ecuación (3.1)

:8 = h<� − hjhj ∗ 100 (3.1)

Donde h<� es el máximo absoluto de la inversa de la DFT y hj la media.

Se ha realizado una segunda medida del índice de modulación (3.2) este cálculo se ha basado en la raíz cuadrada de las perturbaciones de todo el ciclo, realizando la

0 20 40 60 80 100 1200

50

100

150

200

250

300

350

espectro unilateral de distanciasf(t)

Frequency (Hz)

dis

tancia

sf(f

)

Page 45: ANÁLISIS DE LA MODULACIÓN DE VOZ OCASIONADA POR EL …oa.upm.es/40772/1/PFC_LAURA_NATHALIA_ARGUELLO_GARCIA.pdf · reproducción normal de la voz, aunque no se han identificado con

45

sumatoria una a una y eliminando la media. Se puede interpretar como la desviación típica de la señal (ecuación 3.2).

:2 = kX1DY∑ �h9 − hB��59.8hB ∗ 100

(3.2)

Al realizar los cálculos de todos los índices de modulación de los registros, los valores tanto de m1 y m2 varían cada vez que se ejecuta el código, la variación es del 5% de diferencia con respecto a la anterior, esto sucede porque los cálculos se realizan sobre los datos obtenidos después de desordenar la serie de tiempos 100 veces, como este desorden es aleatorio, hace que en la comparación de las frecuencias más significativas existan pequeños picos que varíen, para evitar esto se ha aumentado la variación aleatoria a 200 veces, logrando así que los índices de modulación sean más estables.

Page 46: ANÁLISIS DE LA MODULACIÓN DE VOZ OCASIONADA POR EL …oa.upm.es/40772/1/PFC_LAURA_NATHALIA_ARGUELLO_GARCIA.pdf · reproducción normal de la voz, aunque no se han identificado con

46

4. Resultados

Una vez finalizado el estudio, se analizaran los resultados obtenidos para todas las voces y se compararán con los resultados obtenidos por Jean Schoentgen, en el estudio que ha servido como guía de este estudio [12].

Los resultados se mostrarán por cuartiles para poder facilitar el análisis y también abreviar el número de resultados.

En la Tabla 5 se presentan los datos de la frecuencia fundamental, se puede observar que las mujeres presentan valores superiores a las registradas por los hombres, esta característica se puede explicar por las diferencias anatómicas que existen entre hombres y mujeres, en el caso de los hombres estos tienen un tamaño de laringe superior a la de las mujeres ocasionando una frecuencia fundamental inferior [30].

Tabla 5. Frecuencia fundamental de todos los registros de voz.

Mujeres Hombres

Mínimo 95,24 66,23

Primer cuartil 217,39 121,95

Segundo cuartil 238,1 129,87

Tercer cuartil 243,9 151,52

Máximo 312,5 232,56

En la Tabla 6 y Tabla 7se encuentran los valores de los índices de modulación m1 y m2. En estos no existen diferencias significativas entre hombres y mujeres.

Tabla 6. Índice de modulación m1 en porcentajes.

Mujeres Hombres

Mínimo 0.2874 0.2454

Primer cuartil 0.8383 0.7588

Segundo cuartil 1,7623 1,2168

Tercer cuartil 2,2602 1,5403

Máximo 6,1407 2,7931

Tabla 7. Índice de modulación m2 en porcentajes.

Mujeres Hombres

Mínimo 0.2032 0.1735

Primer cuartil 0.4335 0.4096

Segundo cuartil 0.7242 0.6228

Tercer cuartil 1,0484 0.6948

Máximo 3,4460 1,4066

Page 47: ANÁLISIS DE LA MODULACIÓN DE VOZ OCASIONADA POR EL …oa.upm.es/40772/1/PFC_LAURA_NATHALIA_ARGUELLO_GARCIA.pdf · reproducción normal de la voz, aunque no se han identificado con

47

Para el cálculo de la frecuencia de modulación fm2, se ha hallado el punto donde la magnitud de la DFT presenta su amplitud máxima.

Los valores de la frecuencia de modulación fm2 (Tabla 8) no presentan variaciones significativas entre las mujeres y los hombres.

Tabla 8. Frecuencia de modulación fm2 en Hz. Obtenida en el punto donde la magnitud de la DFT presenta su amplitud máxima.

Mujeres Hombres

Mínimo 0.9927 1,0115

Primer cuartil 1,0083 1,0169

Segundo cuartil 2,0113 2,0325

Tercer cuartil 4,0292 3,0386

Máximo 6,0599 6,0976

Las voces que se tenían con disfonia eran muy pocas para un estudio más detallado, aun así se presentan a continuación los datos obtenidos de estas.

Tabla 9. Frecuencia fundamental, frecuencia de modulación (fm2) e índices de modulación (m1, m2) de los registros de voz con disfonia pronosticada.

RCC11AN WFC07AN

Genero Mujer Hombre

Frecuencia Fundamental (Hz) 113,64 116,28

m1 4,7709 1,1208

m2 2,1667 0,7219

fm2 1,0146 4,04455

En el registro de las voces con disfonia (Tabla 9) se puede concluir:

Con respecto a la frecuencia fundamental:

- La voz de mujer tiene un valor bajo con respecto a la frecuencia de las mujeres sanas. Pero sin llegar a ser menor que el valor mínimo.

- La voz de hombre tiene un valor bajo con respecto a la frecuencia de los hombres sanos. Pero sin llegar a ser menor que el valor mínimo.

Con respecto a m1:

- La voz de mujer, presenta un valor alto con respecto a los índices de las mujeres sanas, no llegando a superar el valor máximo de estas.

- La voz de hombre, tiene un valor bajo con respecto a los hombres sanos, ubicado en el segundo cuartil.

Page 48: ANÁLISIS DE LA MODULACIÓN DE VOZ OCASIONADA POR EL …oa.upm.es/40772/1/PFC_LAURA_NATHALIA_ARGUELLO_GARCIA.pdf · reproducción normal de la voz, aunque no se han identificado con

48

Con respecto a m2:

- La voz de mujer, presenta un valor alto con respecto a los índices de las mujeres sanas, no llegando a superar el valor máximo de estas.

- La voz de hombre también presenta un valor alto con respecto a los índices de los hombres sanos, no llegando a superar el valor máximo de estos.

Con respecto a fm2:

- La voz de mujer, presenta un valor bajo con respecto a la frecuencia de modulación de las mujeres sanas, ubicado en el primer cuartil.

- La voz de hombre, presenta un valor alto por encima del tercer cuartil con respecto a la frecuencia de modulación de los hombres sanos.

- El valor de la frecuencia del registro de hombre es un poco mayor que el de la mujer, esto es poco normal, porque como se ha dicho anteriormente la frecuencia fundamental de la mujer debe ser mayor que la de hombre.

Con los datos obtenidos de las voces con disfonia, no se podría realizar un estudio preciso ni un análisis detallado de estos debido a que solo se tienen dos registros, por lo cual se precisan más registros para poder llegar a una conclusión más concreta.

Para poder realizar un análisis de la similitud de los resultados obtenidos y los del estudio de Jean Schoentgen [12] se ha optado por realizar un diagrama cuantil-cuantil o más conocido como QQplot. Este diagrama permite comprobar si las series de datos obtenidas corresponden a una distribución normal, si los valores se asemejan a la distribución normal los puntos aparecen agrupados en torno a la línea recta, este diagrama también se puede utilizar para la comparación de una muestra con otra muestra de referencia. Como lo que se desea analizar son los resultados obtenidos con los datos del estudio de Jean Schoentgen [12] se tomará como referencia los resultados de este.

En las gráficas obtenidas se puede observar que las dos distribuciones son semejantes, aunque difieren algunas en los valores de los cuartiles, se analizarán a continuación las posibles razones de estas diferencias.

En las Figuras 21 y 22 se puede observar que los datos obtenidos difieren un poco de los resultados de referencia, esto puede deberse a dos cosas:

La primera es que en el estudio de referencia, el autor contaba con 16 registros de mujeres con voces normales y en este estudio los registros eran de 31 mujeres, este dato

Page 49: ANÁLISIS DE LA MODULACIÓN DE VOZ OCASIONADA POR EL …oa.upm.es/40772/1/PFC_LAURA_NATHALIA_ARGUELLO_GARCIA.pdf · reproducción normal de la voz, aunque no se han identificado con

49

hace que al calcular los cuartiles, el valor cambie, debido a que en la fórmula del cálculo de los cuartiles interviene la cantidad de datos que existen en el vector.

La segunda razón es que cuando se ha desordenado de manera aleatoria el vector de longitudes, Jean Schoentgen lo ha realizado 100 veces y en este estudio se ha aumentado a 200 veces debido a la inestabilidad observada en los datos obtenidos de los índices de modulación.

Figura 21 Índice de modulación m1 mujeres vs resultados de Jean Schoentgen

Fuente: Propia

Figura 22 Índice de modulación m2 mujeres vs resultados de Jean Schoentgen

Fuente: Propia

Con los índices de modulación de los hombres (Figura 23 y Figura 24) sucede lo mismo, aunque la diferencia del número de registros no es tan grande como con los de las mujeres, (Jean Schoentgen contaba con 22 registros de hombres normales y en este estudio los registros eran 19 hombres) el resultado es afectado aparentemente por esta diferencia.

Figura 23 Índice de modulación m1 hombres vs resultados de Jean Schoentgen

Fuente: Propia

Figura 24 Índice de modulación m2 hombres vs resultados de Jean Schoentgen

Fuente: Propia

0 1 2 3 4 5 6 70

1

2

3

4

5

6

7

X Quantiles

Y Q

uantile

s

Mujeres(m1)vs Jean Mujeres(m1)

0 0.5 1 1.5 2 2.5 3 3.50

0.5

1

1.5

2

2.5

3

X Quantiles

Y Q

uantile

s

Mujeres(m2)vs Jean Mujeres(m2)

0 0.5 1 1.5 2 2.5 30

0.5

1

1.5

2

2.5

3

3.5

4

4.5

X Quantiles

Y Q

uantile

s

Hombres(m1)vs Jean Hombres(m1)

0 0.5 1 1.50

0.5

1

1.5

2

2.5

X Quantiles

Y Q

uantile

s

Hombres(m2)vs Jean Hombres(m2)

Page 50: ANÁLISIS DE LA MODULACIÓN DE VOZ OCASIONADA POR EL …oa.upm.es/40772/1/PFC_LAURA_NATHALIA_ARGUELLO_GARCIA.pdf · reproducción normal de la voz, aunque no se han identificado con

50

En las figuras de la frecuencia de modulación fm2 (Figura 25 y Figura 26) se puede observar que existe una gran similitud entre los resultados, debido a que la frecuencia de modulación es el punto máximo de la DFT, este cálculo no se ve afectado por el aumento del número de veces que se desordeno el vector de longitudes (200 veces). La pequeña diferencia que existe puede ser ocasionada por la diferencia del número de registros entre los estudios.

Figura 25 Frecuencia de modulacionfm2 mujeres vs resultados de Jean Schoentgen

Fuente: Propia

Figura 26 Frecuencia de modulacionfm2 hombres vs resultados de Jean Schoentgen

Fuente: Propia

Con respecto a la frecuencia fundamental de las mujeres (Figura 27) la disparidad es ocasionada por la diferencia en el número de registros entre los estudios. Por el contrario en la frecuencia fundamental de los hombres (Figura 28) existe más similitud entre ambos estudios. Aunque los resultados de jean schoentgen son un poco mayores a los de este estudio.

Figura 27 Frecuencia fundamental mujeres vs resultados de Jean Schoentgen

Fuente: Propia

Figura 28 Frecuencia fundamental hombres vs resultados de Jean Schoentgen

Fuente: Propia

0 1 2 3 4 5 6 72

2.5

3

3.5

4

4.5

5

5.5

6

X Quantiles

Y Q

uantile

s

Fm2M

ujeres(fm2)vs Jean Mujeres(fm2)

1 2 3 4 5 6 72

2.5

3

3.5

4

4.5

5

5.5

6

X Quantiles

Y Q

uantile

s

Fm2Hombres(fm2)vs Jean Hombres(fm2)

50 100 150 200 250 300 35050

100

150

200

250

300

350

X Quantiles

Y Q

uantile

s

Mujeres(fo)vs Jean Mujeres(fo)

60 80 100 120 140 160 180 200 220 24060

80

100

120

140

160

180

X Quantiles

Y Q

uantile

s

Hombres(fo)vs Jean Hombres(fo)

Page 51: ANÁLISIS DE LA MODULACIÓN DE VOZ OCASIONADA POR EL …oa.upm.es/40772/1/PFC_LAURA_NATHALIA_ARGUELLO_GARCIA.pdf · reproducción normal de la voz, aunque no se han identificado con

51

No se ha realizado graficas con las voces patológicas, debido a que son pocas las que se tienen en este estudio (2 voces y en el estudio de Jean Schoentgen 51 voces) y no mostrarían datos relevantes para una conclusión.

A parte de los diagramas cuantil-cuantil se ha realizado los histogramas de los índices de modulación. El histograma permite visualizar la distribución de los datos, se considera que un grupo de datos presenta una distribución normal si su altura máxima se encuentra en el centro de la gráfica disminuyendo hacia ambos lados en forma acampanada y además si la gráfica es simétrica respecto al intervalo central. Cualquier grupo de datos que no sean normales, se consideran asimétricos. En las Figuras 29, 30, 31, 32 se puede apreciar que las gráficas no cumplen los requisitos para una distribución normal, por lo que son asimétricas por la derecha.

Figura 29 Histograma de los índices de modulación m1 de las mujeres Fuente: Propia

Figura 30 Histograma de los índices de modulación m2 de las mujeres Fuente: Propia

Figura 31 Histograma de los índices de modulación m1 de los hombres Fuente: Propia

Figura 32 Histograma de los índices de modulación m2 de los hombres Fuente: Propia

0 1 2 3 4 5 6 7 80

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1Mujeres m1

Indice de modulacion (m1)

Fre

cuencia

rela

tiva

0 1 2 3 4 5 6 7 80

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1Mujeres m2

Indice de modulacion (m2)

Fre

cuencia

rela

tiva

0 1 2 3 4 5 6 7 80

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1Hombres m1

Indice de modulacion (m1)

Fre

cuencia

rela

tiva

0 1 2 3 4 5 6 7 80

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1Hombres m2

Indice de modulacion (m2)

Fre

cuencia

rela

tiva

Page 52: ANÁLISIS DE LA MODULACIÓN DE VOZ OCASIONADA POR EL …oa.upm.es/40772/1/PFC_LAURA_NATHALIA_ARGUELLO_GARCIA.pdf · reproducción normal de la voz, aunque no se han identificado con

52

Se analizó también si el micro temblor se podía catalogar como paso bajo, paso alto o paso bajo, para esto se estudiaron todas las frecuencias de modulación de los registros. En la figura 33 se puede observar que existe un grupo de voces que presentan un comportamiento paso bajo y otros paso banda.

Figura 33 Distribución de la frecuencia de modulación. Fuente: Propia

Por último y de manera general, cabe mencionar que los registros de las voces son diferentes, aunque las condiciones en las que se tomaron son similares a las de las de los registros de las voces utilizadas en este estudio (en una cabina insonorizada, y pidiendo a los sujetos que produjeran una fonación mantenida de la vocal /a/ de manera natural y sin forzarla). Existen factores que pueden afectar la calidad del registro, como es la distancia a la que se mantuvo el micrófono de los sujetos y la calidad del mismo.

0 1 2 3 4 5 6 71

2

3

4

5

6

7

Frecuncia de Modulacion fm2

Media

Pondera

da

Mujeres

Hombres

Mujer P

Hombre P

Page 53: ANÁLISIS DE LA MODULACIÓN DE VOZ OCASIONADA POR EL …oa.upm.es/40772/1/PFC_LAURA_NATHALIA_ARGUELLO_GARCIA.pdf · reproducción normal de la voz, aunque no se han identificado con

53

5. Conclusiones y trabajos futuros

En este proyecto se ha realizado un estudio acerca del temblor vocal y se han calculado los datos más relevantes como es su índice y frecuencia de modulación.

Con respecto a los datos que se obtuvieron se puede concluir:

• Como era de esperarse, la frecuencia fundamental de las mujeres es mayor que la de los hombres. Como se explicó anteriormente esto es ocasionado por la diferencia anatómica que existe entre los hombres y las mujeres con respecto al tamaño de la laringe, la laringe de los hombres es más ancha que la de las mujeres, ocasionando que tengan una frecuencia menor que las mujeres. Con las voces patológicas se obtuvo resultados desconcertantes, debido a que la frecuencia fundamental de la voz del hombre era superior a la de la voz de mujer, este fenómeno es interesante de analizar, se podría pensar que la frecuencia de modulación es afectada por los problemas existentes en las cuerdas vocales, pero para poder realizar un análisis más acertado, es preciso contar con un número mayor de registros de voces patológicas.

• El temblor vocal no puede ser catalogado como un filtro paso bajo, paso banda o paso alto, debido a que en este estudio se ha podido observar (Figura 33) que un grupo es paso bajo y otro paso banda. En estos grupos están tanto hombres como mujeres, por lo que se da a entender que en un mismo género existen frecuencias tanto paso bajo como paso banda.

• En los resultados obtenidos de los índices de modulación m1 y m2 no existen diferencias significativas entre los hombres y las mujeres. En las figuras de los histogramas (Figura 29-32) se puede observar que la mayoría de los valores obtenidos están distribuidos en torno a los primeros cuartiles.

• En la frecuencia de modulación, no se aprecian diferencias significativas entre los hombres y las mujeres, por lo que se pude concluir que la frecuencia de modulación es independiente de las diferencias anatómicas que existen entre los hombres y las mujeres, al contrario que con la frecuencia fundamental.

• Con los datos obtenidos se pude decir que el micro-temblor vocal está presente en una frecuencia inferior a 6.1 Hz (Figura 33).

Como trabajos futuros sería importante el análisis de las voces patológicas. Los resultados que se obtuvieron en el marco de este estudio no han sido precisos en la caracterización de estas. Con los resultados obtenidos se podría pensar, que alguna patología en la voz perjudica la frecuencia fundamental y a la frecuencia de modulación. Los índices de modulación en estas voces también son afectados, existiendo una gran diferencia entre los índices de modulación entre hombres y mujeres.

Page 54: ANÁLISIS DE LA MODULACIÓN DE VOZ OCASIONADA POR EL …oa.upm.es/40772/1/PFC_LAURA_NATHALIA_ARGUELLO_GARCIA.pdf · reproducción normal de la voz, aunque no se han identificado con

54

Aunque en el código realizado se ha automatizado el proceso de los cálculos de todos los registros, no se pensó en la automatización de los resultados, por este motivo el programa analiza los registros uno a uno a medida que el usuario los va introduciendo, y al final se debe tomar nota de cada resultado obtenido. Por este motivo se propone que se adicione un código que tenga la capacidad de guardar cada dato y después los enseñe en vectores.

Page 55: ANÁLISIS DE LA MODULACIÓN DE VOZ OCASIONADA POR EL …oa.upm.es/40772/1/PFC_LAURA_NATHALIA_ARGUELLO_GARCIA.pdf · reproducción normal de la voz, aunque no se han identificado con

55

6. Presupuesto

El presente presupuesto hace referencia a un proyecto de diseño de un código para el estudio de unos registros de voz, por este motivo no es necesaria la utilización de ninguna clase de material, únicamente el tiempo y destreza de un ingeniero de Telecomunicaciones, es por ello que el presupuesto hace referencia al coste de las horas empleadas para la realización de este y algunos costes adicionales como coste de vida del ordenador utilizado y la compra de la licencia de Matlab.

En principio se elevara el coste del presupuesto por las horas empleadas, teniendo en cuenta que la persona que realiza el programa no es un experto en la materia y no estará dedicado exclusivamente al proyecto, solo le dedicara un par de horas diarias, por otra parte este proyecto no se realizó con la idea de comercializar el programa para poder amortizar los costes, se hace únicamente para el estudio de este proyecto en particular quedando a disposición de la universidad para ser utilizado libremente en cualquier proyecto futuro.

Coste hora del trabajo

Para la determinación del coste de la hora solo se tiene en cuenta las horas del ingeniero que realizo el código sin incluir los costes de las horas del Tutor.

Tomando como referencia la nómina actual del ingeniero se ha determinado que el precio que paga la empresa por un ingeniero junior a la hora es:

Ingeniero = 12.42 € / Hora

Este sería el valor como se ha dicho anteriormente que le supone a la empresa.

Tiempo de programación

Para la estimación del tiempo se ha llevado un control de horas desde el principio del proyecto, para así poder tener el control del tiempo empleado y la dedicación. Esto se pensó para poder realizar al final del proyecto un presupuesto con la mayor exactitud posible.

Page 56: ANÁLISIS DE LA MODULACIÓN DE VOZ OCASIONADA POR EL …oa.upm.es/40772/1/PFC_LAURA_NATHALIA_ARGUELLO_GARCIA.pdf · reproducción normal de la voz, aunque no se han identificado con

56

Tabla 10. Calendario de horas empleadas por meses en la realización del código.

SEPTIEMBRE ENERO JUNIO

Semana Horas diarias

Horas semanales

Semana Horas diarias Horas

semanales

Semana Horas diarias

Horas semanales

15/09/2014 19/09/2014 4 20 09/01/2015 10/01/2015 4 8 06/06/2015 07/06/2015 4 8

22/09/2014 26/09/2014 4 20 16/01/2015 17/01/2015 4 8 20/06/2015 21/06/2015 4 8

29/09/2014 03/10/2014 4 20 23/01/2015 25/01/2015 4 12 27/06/2015 28/06/2015 4 8

31/01/2015 01/02/2015 4 8

Total horas mes 60 Total horas mes 36 Total horas mes 24

OCTUBRE FEBRERO JULIO

Semana Horas diarias

Horas semanales

Semana Horas diarias

Horas semanales

Semana

Horas diarias

Horas semanales

06/10/2014 10/10/2014 4 20 06/02/2015 07/02/2015 4 8 01/07/2015 05/07/2015 2 10

13/10/2014 17/10/2014 4 20 09/02/2015 15/02/2015 4 28 06/07/2015 12/07/2015 2 14

20/10/2014 24/10/2014 4 20 16/02/2015 22/02/2015 4 28 13/07/2015 19/07/2015 2 14

27/10/2014 31/10/2014 4 20 23/02/2015 01/03/2015 4 28 20/07/2015 24/07/2015 2 10

27/07/2015 31/07/2015 2 10

Total horas mes 80 Total horas mes 92 Total horas mes 58

NOVIEMBRE ABRIL AGOSTO

Semana Horas diarias

Horas semanales

Semana Horas diarias

Horas semanales

Semana Horas diarias

Horas semanales

03/11/2014 07/11/2014 4 20 03/04/2015 05/04/2015 4 12 03/08/2015 07/08/2015 2 10

15/11/2014 16/11/2014 4 8 11/04/2015 12/04/2015 4 8 10/08/2015 14/08/2015 2 10

22/11/2014 23/11/2014 4 8 18/04/2015 19/04/2015 4 8

29/11/2014 30/11/2014 4 8 25/04/2015 26/04/2015 4 8

Total horas mes 44 Total horas mes 36 Total horas mes 20

DICIEMBRE MAYO OCTUBRE

Semana Horas diarias

Horas semanales

Semana Horas diarias

Horas semanales

Semana Horas diarias

Horas semanales

06/12/2014 07/12/2014 4 8 01/05/2015 03/05/2015 4 12 02/10/2015 04/10/2015 4 12

13/12/2014 14/12/2014 4 8 09/05/2015 10/05/2015 4 8

20/12/2014 21/12/2014 4 8 16/05/2015 17/05/2015 4 8

23/05/2015 24/05/2015 4 8

30/05/2015 31/05/2015 4 8

Total horas mes 24 Total horas mes 44 Total horas mes 12

Se han invertido en total 530 horas de programación y depuración del código, en apariencia puede resultar excesivo y es posible que un Programador experto lo pueda realizar en menos de la mitad de horas, dándole una dedicación exclusiva a tiempo completo en la realización del código.

A continuación se realiza el coste de las horas invertidas (Tabla 11):

Page 57: ANÁLISIS DE LA MODULACIÓN DE VOZ OCASIONADA POR EL …oa.upm.es/40772/1/PFC_LAURA_NATHALIA_ARGUELLO_GARCIA.pdf · reproducción normal de la voz, aunque no se han identificado con

57

Tabla 11. Coste total de las horas de programación y depuración.

DESCRIPCION TIEMPOS/HORAS COSTES €

Programación y depuración del código

530 6582,6

En la Figura 34 se ha querido plasmar por medio de un histograma, la productividad mensual del código.

Figura 34 Productividad mensual de programación y depuración del código Fuente: Propia

En este histograma se puede observar que hubo meses de poca productividad que ocasionaron que no se pudieran cumplir los objetivos fijados en el plan de trabajo (1.2) también se contempló al principio del proyecto una dedicación de 6 horas diarias de lunes a viernes, como se puede observar en la Tabla 10 este tiempo no se cumplió, en la figura (1.1) no se tuvo en cuenta otros factores externos que retrasaran las fechas de entrega.

0102030405060708090

100

SEP

TIEM

BR

E

OC

TUB

RE

NO

VIE

MB

RE

DIC

IEM

BR

E

ENER

O

FEB

RER

O

MA

RZO

AB

RIL

MA

YO

JUN

IO

JULI

O

AG

OST

O

SEP

TIEM

BR

E

OC

TUB

RE

PRODUCTIVIDAD MENSUAL

HORAS MENSUALES

Page 58: ANÁLISIS DE LA MODULACIÓN DE VOZ OCASIONADA POR EL …oa.upm.es/40772/1/PFC_LAURA_NATHALIA_ARGUELLO_GARCIA.pdf · reproducción normal de la voz, aunque no se han identificado con

58

Otros gastos

Como otros gastos se ha contemplado un ordenador portátil y la licencia de Matlab siendo estos dos vitales para la realización del proyecto

• Licencia de matlab =99 $ que son aproximadamente 92 € [31]

• Ordenador portátil con las siguientes características: Modelo Asus de 15,6"; Procesador Intel® Core™ i3-4005U; RAM 4GB; disco Duro 500GB Coste = 404,10€ [32]

En el presupuesto no se estimará el valor total del ordenador, entendiendo que el ingeniero que realiza la programación cuenta con uno, solo se estimara el 30 por ciento del coste de este, este porcentaje se basa en el hecho que un ordenador se amortiza aproximadamente en 4 años después de su compra y teniendo en cuenta que se ha trabajado con él un tiempo de 1 año, se estima que se deberá cobrar en el proyecto ese 30 por ciento.

Tabla 12. Coste de otros gastos.

DESCRIPCION COSTES €

Licencia de Matlab

92

Ordenador 122

Total 214

Total de los costes del proyecto

En la Tabla 13 se han agrupado todos los costes del proyecto y su valor final.

Tabla 13. Coste total del proyecto.

DESCRIPCION COSTES €

Tiempo de programación 6582,60

Otros gastos 214,00

Total del proyecto 6796,60

Page 59: ANÁLISIS DE LA MODULACIÓN DE VOZ OCASIONADA POR EL …oa.upm.es/40772/1/PFC_LAURA_NATHALIA_ARGUELLO_GARCIA.pdf · reproducción normal de la voz, aunque no se han identificado con

59

7. Bibliografía

[1] COBETA, Ignacio… [et al.]. Patología de la Voz .1ª ed. España: Marge Medica Books, 2013.ISBN 978-84-15340-86-7

[2] DEL PINO, Paulino… [et al.]. “Identificación de algunos parámetros espectrales que determinan la calidad de la voz” Revista Ingeniería UC. 2004, vol11, n.3, p. 7-16.

[3] FRAILE, Ruben… [et al.]. “Characterization of dysphonic voices by means of a filterbank-based spectral analysis: sustained vowels and running speech “Journal of Voice.2013, vol. 27, n. 1, p. 11-23.

[4] TITZE, Ingo. Motor and sensory components of a feedback-control model of fundamental frequency. New York: American Institute of Physics, 1995. ISBN: 1-56396-286-1.

[5] FAÚNDEZ ZANUY, Marcos. Tratamiento digital de voz e imagen y aplicación a la multimedia. México: Alfaomega, 2000.

[6] BERNAL BERMUDEZ, Jesús… [et al]. Reconocimiento de voz y fonética acústica España: RA-MA, 2000. ISBN: 84-7897-398-2.

[7] RUIZ ALONSO, Amelia. La voz humana. España: Visión libros, 2011. ISBN: 978-84-9008-137-2.

[8] JACKSON-MENALDI, María Cristina A. La voz patológica. Argentina: Ed. Médica Panamericana, 2002. ISBN: 950-06-1111-2

[9] ESCALANTE, Isabel… [et al.]. “Causa de disfonía en la consulta de Otorrinolaringología de Hospital Salvador B. Gautier” Rev. Med Dom. 2002, vol. 63, n 1, p. 55-58.

[10] ELHENDI, Sofia… [et al.]. “Puesta al día en las disfonías funcionales”. ORL-DIPS, 2005, vol. 32, no 1, p. 6-13.

[11] LÓPEZ OJEDA, María del Carmen; WEBER RODRIGUEZ, Federico; SÁNCHEZ AMAYA, Luis Enrique. “Diagnóstico diferencial del temblor”. ACTA MÉDICA GRUPO ÁNGELES, 2009, vol. 7, n. 3, p. 143-149.

[12] SCHOENTGEN, Jean. “Modulation frequency and modulation level owing to vocal micro tremor”. The journal of the Acoustical Society of America.2002, vol. 112, n. 2, p. 690-700.

[13] MONZO, Carlos; IRIONDO, Ignasi; MARTÍNEZ, Elisa. “Procedimiento para la medida y la modificación del Jitter y del shimmer aplicado a la síntesis del habla expresiva”. V Jornadas en Tecnología del Habla, 2008, p. 58-61.

Page 60: ANÁLISIS DE LA MODULACIÓN DE VOZ OCASIONADA POR EL …oa.upm.es/40772/1/PFC_LAURA_NATHALIA_ARGUELLO_GARCIA.pdf · reproducción normal de la voz, aunque no se han identificado con

60

[14] FERRER, C.; HERNÁNDEZ-DIAZ, M. E. “La medición de perturbaciones de frecuencia como indicador de la aspereza de la voz”. Congreso latinoamericano de ingeniería biomédica, 2001.

[15] SUÁREZ, Carlos… [et al]. Tratado de otorrinolaringología y cirugía de cabeza y cuello. Argentina: Ed. Médica Panamericana, 2007.ISBN: 978-84-9835-076-0

[16] NUÑEZ BATALLA, Faustino; SUAREZ NIETO, Carlos. Espectrografía clínica de la voz. España: Universidad de Oviedo, servicio de publicaciones, 1999.ISBN: 84-8317-177-5.

[17] BOQUERA ESPAÑA, María Carmen. Servicios avanzados de telecomunicación. España: Ed Díaz de santos, S.A, 2003. ISBN: 84-7978-607-8.

[18] SPIEGEL R, Murray. Estadística. España: McGraw-Hill, 1991.ISBN:0-07-060234-4.

[19] WALPOLE, Ronald E.; MYERS, Raymond H.; MYERS, Sharon L. Probabilidad y estadística para ingenieros. México: Pearson Educación, 1999.ISBN: 970-17-02645-6

[20] LÓPEZ, Jesús; MARTOS, Eduardo. Señales aleatorias: teoría y ejercicios resueltos. Marcombo, 2010.

[21] PROAKIS, Jhon G; MANOLAKIS, Dimitris G Tratamiento digital de señales. España: Pearson Prentice Hall, 2007. ISBN: 978-84-8322-347-5

[22] OLIVAS, Emilio Soria... [et al] Tratamiento digital de señales: problemas y ejercicios resueltos. España: Pearson Educación, 2003. ISBN: 84-205-3559-1

[23] MOORE, David S. Estadística aplicada básica. España: Antoni Bosch editor, 2005: ISBN: 84-95348-04-07

[24] ACEVEDO, Juan C… [et al] Matemáticas avanzadas y estadística para ciencias e ingenierías. España: Universidad de Sevilla, 2006.ISBN: 84-472-1095-2

[25] QUEVEDO IBARRA Raúl; LOPEZ SERRANO Miguel principios de teoría de las comunicaciones, México: Limusa. S.A, 1999. ISBN: 968-18-5752-6

[26] BELTRAN ALBERTI, Eduard Procesado digital de señales fundamentos para comunicaciones y control-II. España: Edicions UPC, 2006. ISBN: 84-83101-851-9

[27] PEREZ LOPEZ, Cesar. Matlab y sus aplicaciones en las ciencias y la ingeniería. España: Pearson Educación, 2002. ISBN: 84-205-3537-0.

[28] DORMIDO, Sebastián… [et al.]. Matlab, edición de estudiante. Guía de usuario. Versión 4. España, 1995. ISBN: 0-13-459793-1

Page 61: ANÁLISIS DE LA MODULACIÓN DE VOZ OCASIONADA POR EL …oa.upm.es/40772/1/PFC_LAURA_NATHALIA_ARGUELLO_GARCIA.pdf · reproducción normal de la voz, aunque no se han identificado con

61

[29] PARSA V, Jamieson DG. “Identification of pathological voices using glottal noise measures.” Journal of Speech, Language, and Hearing Research.2000, vol. 43, n.2, p.469-485

[30] JACKSON-MENALDI, María Cristina A... [et al] La voz normal Argentina: Ed. Médica Panamericana 1992. ISBN: 950-06-1108-2

[31] AMAZON.COM. Matlab [en línea]. < http://www.amazon.com/MATLAB-Simulink-Student-Suite-R2015b/dp/0989614026 [consulta: 14-11-2015]

[32] FNAC.S.A. PC portátiles [en línea]. http://www.fnac.es/Asus-F554LA-XX1690T-15-6-Ordenador-portatil-PC-Portatil/a1175984 [consulta: 15-11-2014]

[33] MATLAB. El lenguaje de cálculo técnico Math Works España [en línea], [consulta 5-12-2015]. Disponible en web: <http://es.mathworks.com/products/matlab/>

[34] LIRA CHÁVEZ, Jorge. Tratamiento digital de imágenes multiespectrales. México: Instituto de Geofísica, UNAM, 2010.ISBN: 978-1-105-04502-8.

[35] FREUND, John E.; SIMON, Gary A. Estadística elemental. México: Pearson Educación, 1994. ISBN: 968-880-433-9

[36] DEVORE, Jay L. Probabilidad Y Estadística Para Ingeniería Y Ciencias/Probability And Statistics For Engineering And Sciences. México: Cengage Learning Editores, 2008. ISBN: 13-978-970-686-831-2.

[37] EVANS, Michael J.; ROSENTHAL, Jeffrey S. Probabilidad y estadística. España: Reverté, S.A 2005. ISBN: 84-291-5034-X [38] MORENO, Jesús… [et al.]. Métodos matemáticos: aplicación de matemáticas para ciencias e ingenierías.1ª Ed. España. Paraninfo, 2006. ISBN: 84-9732-288-6 [39] OPPENHEIM, Alan V.; WILLSKY, Alan S.; NAWAB, S. Hamid. Señales y sistemas. México: Pearson Educación, 1998. ISBN: 970-17-0116-X