introducción a la voz humanamzanartu/elo313/docs/... · elo-313: procesamiento digital de señales...

40
ELO-313: Procesamiento Digital de Señales con Aplicaciones. Primer Semestre 2013 - UTFSM Profesor: Dr. Matías Zañartu. Introducción a la Voz Humana Presentado por: Víctor Espinoza.

Upload: others

Post on 11-Jun-2020

9 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Introducción a la Voz Humanamzanartu/ELO313/Docs/... · ELO-313: Procesamiento Digital de Señales con Aplicaciones. Primer Semestre 2013 - UTFSM Profesor: Dr. Matías Zañartu

ELO-313: Procesamiento Digital de Señales con Aplicaciones. Primer Semestre 2013 - UTFSM

Profesor: Dr. Matías Zañartu.

Introducción a la Voz Humana

Presentado por: Víctor Espinoza.

Page 2: Introducción a la Voz Humanamzanartu/ELO313/Docs/... · ELO-313: Procesamiento Digital de Señales con Aplicaciones. Primer Semestre 2013 - UTFSM Profesor: Dr. Matías Zañartu

Generación Voz

Page 3: Introducción a la Voz Humanamzanartu/ELO313/Docs/... · ELO-313: Procesamiento Digital de Señales con Aplicaciones. Primer Semestre 2013 - UTFSM Profesor: Dr. Matías Zañartu

Anatomía

Page 4: Introducción a la Voz Humanamzanartu/ELO313/Docs/... · ELO-313: Procesamiento Digital de Señales con Aplicaciones. Primer Semestre 2013 - UTFSM Profesor: Dr. Matías Zañartu

Fuente – Cuerdas Vocales

Modelo Mecánico

Ciclo Cuerdas Vocales

Page 5: Introducción a la Voz Humanamzanartu/ELO313/Docs/... · ELO-313: Procesamiento Digital de Señales con Aplicaciones. Primer Semestre 2013 - UTFSM Profesor: Dr. Matías Zañartu

Fuente – Cuerdas Vocales

Page 6: Introducción a la Voz Humanamzanartu/ELO313/Docs/... · ELO-313: Procesamiento Digital de Señales con Aplicaciones. Primer Semestre 2013 - UTFSM Profesor: Dr. Matías Zañartu

Fuente – Cuerdas Vocales

Impulso Glotal (tiempo)

Impulso Glotal (frecuencia)

Page 7: Introducción a la Voz Humanamzanartu/ELO313/Docs/... · ELO-313: Procesamiento Digital de Señales con Aplicaciones. Primer Semestre 2013 - UTFSM Profesor: Dr. Matías Zañartu

Sistema – Tracto Vocal

● Modelo en base a tubos.

● Articulación determina diámetro sección en modelo. Ej: /a/ <> /e/.

● Articulación depende apertura bucal y posición lengua.

● No considera cavidad nasal.

Page 8: Introducción a la Voz Humanamzanartu/ELO313/Docs/... · ELO-313: Procesamiento Digital de Señales con Aplicaciones. Primer Semestre 2013 - UTFSM Profesor: Dr. Matías Zañartu

Sistema – Tracto Vocal

● Tubos → Infinitas resonancias.

● Resonancias → Polos

● “Polos” en Voz → Formantes.

● Formantes → Muy importante para la codificación del lenguaje!!!

● Frecuencias de resonancia dependen de la articulación.

Page 9: Introducción a la Voz Humanamzanartu/ELO313/Docs/... · ELO-313: Procesamiento Digital de Señales con Aplicaciones. Primer Semestre 2013 - UTFSM Profesor: Dr. Matías Zañartu

Sistema – Tracto Vocal

Carta de Formantes Vocales

Page 10: Introducción a la Voz Humanamzanartu/ELO313/Docs/... · ELO-313: Procesamiento Digital de Señales con Aplicaciones. Primer Semestre 2013 - UTFSM Profesor: Dr. Matías Zañartu

Sistema Completo Fonación

Page 11: Introducción a la Voz Humanamzanartu/ELO313/Docs/... · ELO-313: Procesamiento Digital de Señales con Aplicaciones. Primer Semestre 2013 - UTFSM Profesor: Dr. Matías Zañartu

Sonidos Fuente

Page 12: Introducción a la Voz Humanamzanartu/ELO313/Docs/... · ELO-313: Procesamiento Digital de Señales con Aplicaciones. Primer Semestre 2013 - UTFSM Profesor: Dr. Matías Zañartu

Fonética

Page 13: Introducción a la Voz Humanamzanartu/ELO313/Docs/... · ELO-313: Procesamiento Digital de Señales con Aplicaciones. Primer Semestre 2013 - UTFSM Profesor: Dr. Matías Zañartu

DSP en Voz

l Herramientas de Análisis:

● Time Signal – Waveform● FFT – Fast Fourier Transform● Spectrogram – Short Time Fourier Transform● LPC – Linear Predictive Code● Cepstrum – Homomorphic Signal Processing

Page 14: Introducción a la Voz Humanamzanartu/ELO313/Docs/... · ELO-313: Procesamiento Digital de Señales con Aplicaciones. Primer Semestre 2013 - UTFSM Profesor: Dr. Matías Zañartu

DSP en Voz

Page 15: Introducción a la Voz Humanamzanartu/ELO313/Docs/... · ELO-313: Procesamiento Digital de Señales con Aplicaciones. Primer Semestre 2013 - UTFSM Profesor: Dr. Matías Zañartu

DSP en Voz

l FFT● Parameters:

● Smoothing Window (Hann, Hamming, etc)● Buffer size (128, 256, etc)● Decimate(*)● Overlap(*)● Padding(*)

Page 16: Introducción a la Voz Humanamzanartu/ELO313/Docs/... · ELO-313: Procesamiento Digital de Señales con Aplicaciones. Primer Semestre 2013 - UTFSM Profesor: Dr. Matías Zañartu

DSP en Voz

l Spectrogram:● Parameters:

● Same as FFT

Page 17: Introducción a la Voz Humanamzanartu/ELO313/Docs/... · ELO-313: Procesamiento Digital de Señales con Aplicaciones. Primer Semestre 2013 - UTFSM Profesor: Dr. Matías Zañartu

DSP en Voz

Page 18: Introducción a la Voz Humanamzanartu/ELO313/Docs/... · ELO-313: Procesamiento Digital de Señales con Aplicaciones. Primer Semestre 2013 - UTFSM Profesor: Dr. Matías Zañartu

DSP en Voz

Page 19: Introducción a la Voz Humanamzanartu/ELO313/Docs/... · ELO-313: Procesamiento Digital de Señales con Aplicaciones. Primer Semestre 2013 - UTFSM Profesor: Dr. Matías Zañartu

DSP en Voz

Page 20: Introducción a la Voz Humanamzanartu/ELO313/Docs/... · ELO-313: Procesamiento Digital de Señales con Aplicaciones. Primer Semestre 2013 - UTFSM Profesor: Dr. Matías Zañartu

DSP en Voz

Page 21: Introducción a la Voz Humanamzanartu/ELO313/Docs/... · ELO-313: Procesamiento Digital de Señales con Aplicaciones. Primer Semestre 2013 - UTFSM Profesor: Dr. Matías Zañartu

DSP en Voz

Page 22: Introducción a la Voz Humanamzanartu/ELO313/Docs/... · ELO-313: Procesamiento Digital de Señales con Aplicaciones. Primer Semestre 2013 - UTFSM Profesor: Dr. Matías Zañartu

DSP en Voz

Page 23: Introducción a la Voz Humanamzanartu/ELO313/Docs/... · ELO-313: Procesamiento Digital de Señales con Aplicaciones. Primer Semestre 2013 - UTFSM Profesor: Dr. Matías Zañartu

Aplicaciones STFT

● Audio Digital– MPEG 2 – layer III (MP3)

– AAC – Advanced Audio Coding (iTunes)

– Dolby Digital AC-3● Audio 5.1 (Audio Cinema, DVD, Bluray, Netflix)

– DTS (Digital Theater Sound)● Audio 5.1 (Audio Cinema, DVD, Bluray).

Page 24: Introducción a la Voz Humanamzanartu/ELO313/Docs/... · ELO-313: Procesamiento Digital de Señales con Aplicaciones. Primer Semestre 2013 - UTFSM Profesor: Dr. Matías Zañartu

Cepstrum

● Superposición● Sistema Homomórfico por Convolución● Cepstrum (Definición basada en DTFT)● Separación fuente-sistema – Ejemplo 1● Remoción de “Eco” - Ejemplo 02● Codificación – Ejemplo 03

Page 25: Introducción a la Voz Humanamzanartu/ELO313/Docs/... · ELO-313: Procesamiento Digital de Señales con Aplicaciones. Primer Semestre 2013 - UTFSM Profesor: Dr. Matías Zañartu

Cepstrum

● Superposición

Page 26: Introducción a la Voz Humanamzanartu/ELO313/Docs/... · ELO-313: Procesamiento Digital de Señales con Aplicaciones. Primer Semestre 2013 - UTFSM Profesor: Dr. Matías Zañartu

Cepstrum

● Separación

Page 27: Introducción a la Voz Humanamzanartu/ELO313/Docs/... · ELO-313: Procesamiento Digital de Señales con Aplicaciones. Primer Semestre 2013 - UTFSM Profesor: Dr. Matías Zañartu

Cepstrum

● Sistema Homomórfico

: Characteristic system for convolution

Page 28: Introducción a la Voz Humanamzanartu/ELO313/Docs/... · ELO-313: Procesamiento Digital de Señales con Aplicaciones. Primer Semestre 2013 - UTFSM Profesor: Dr. Matías Zañartu

Cepstrum

Page 29: Introducción a la Voz Humanamzanartu/ELO313/Docs/... · ELO-313: Procesamiento Digital de Señales con Aplicaciones. Primer Semestre 2013 - UTFSM Profesor: Dr. Matías Zañartu

Cepstrum (DTFT)

Page 30: Introducción a la Voz Humanamzanartu/ELO313/Docs/... · ELO-313: Procesamiento Digital de Señales con Aplicaciones. Primer Semestre 2013 - UTFSM Profesor: Dr. Matías Zañartu

Cepstrum (DTFT)

Page 31: Introducción a la Voz Humanamzanartu/ELO313/Docs/... · ELO-313: Procesamiento Digital de Señales con Aplicaciones. Primer Semestre 2013 - UTFSM Profesor: Dr. Matías Zañartu

Cepstrum

Page 32: Introducción a la Voz Humanamzanartu/ELO313/Docs/... · ELO-313: Procesamiento Digital de Señales con Aplicaciones. Primer Semestre 2013 - UTFSM Profesor: Dr. Matías Zañartu

Cepstrum

Page 33: Introducción a la Voz Humanamzanartu/ELO313/Docs/... · ELO-313: Procesamiento Digital de Señales con Aplicaciones. Primer Semestre 2013 - UTFSM Profesor: Dr. Matías Zañartu

Cepstrum

● Liftering (Cepstrum real)

Page 34: Introducción a la Voz Humanamzanartu/ELO313/Docs/... · ELO-313: Procesamiento Digital de Señales con Aplicaciones. Primer Semestre 2013 - UTFSM Profesor: Dr. Matías Zañartu

Cepstrum

Terminología

Spectrum → Cepstrum

Analysis → Alanysis

Filtering → Liftering

Frequency → Quefrency

Harmonic → Rahmonic

Page 35: Introducción a la Voz Humanamzanartu/ELO313/Docs/... · ELO-313: Procesamiento Digital de Señales con Aplicaciones. Primer Semestre 2013 - UTFSM Profesor: Dr. Matías Zañartu

Cepstrum: Ejemplos

● Pitch● System

Page 36: Introducción a la Voz Humanamzanartu/ELO313/Docs/... · ELO-313: Procesamiento Digital de Señales con Aplicaciones. Primer Semestre 2013 - UTFSM Profesor: Dr. Matías Zañartu

Cepstrum: Ejemplos

● Remoción de Eco: Ver Matlab...

Page 37: Introducción a la Voz Humanamzanartu/ELO313/Docs/... · ELO-313: Procesamiento Digital de Señales con Aplicaciones. Primer Semestre 2013 - UTFSM Profesor: Dr. Matías Zañartu

Cepstrum: Ejemplos

● Perceptual Coding

Frecuencia v/s Variación BW Frecuencia v/s Escala Mel

Page 38: Introducción a la Voz Humanamzanartu/ELO313/Docs/... · ELO-313: Procesamiento Digital de Señales con Aplicaciones. Primer Semestre 2013 - UTFSM Profesor: Dr. Matías Zañartu

Cepstrum: Ejemplos

● MFCC: Mel Frequency Cepstral Coefficients

Típicamente, mfcc con DCT, Nmfcc=13 y R= 24 bandas para fs=8000 Hz.Gran reducción (compresión) de datos!!!

Page 39: Introducción a la Voz Humanamzanartu/ELO313/Docs/... · ELO-313: Procesamiento Digital de Señales con Aplicaciones. Primer Semestre 2013 - UTFSM Profesor: Dr. Matías Zañartu

Cepstrum: Ejemplos

Page 40: Introducción a la Voz Humanamzanartu/ELO313/Docs/... · ELO-313: Procesamiento Digital de Señales con Aplicaciones. Primer Semestre 2013 - UTFSM Profesor: Dr. Matías Zañartu

ELO-313: Procesamiento Digital de Señales con Aplicaciones. Primer Semestre 2013 - UTFSM

Profesor: Dr. Matías Zañartu.

Introducción a la Voz Humana

Presentado por: Víctor Espinoza.