![Page 1: 1 Compresión de Audio. 2 Existen básicamente dos tipos de compresión. Lossless Lossy](https://reader033.vdocuments.pub/reader033/viewer/2022051019/5665b4671a28abb57c913d07/html5/thumbnails/1.jpg)
1
Compresión de Audio
![Page 2: 1 Compresión de Audio. 2 Existen básicamente dos tipos de compresión. Lossless Lossy](https://reader033.vdocuments.pub/reader033/viewer/2022051019/5665b4671a28abb57c913d07/html5/thumbnails/2.jpg)
2
Existen básicamente dos tipos de compresión.
LosslessLossy
![Page 3: 1 Compresión de Audio. 2 Existen básicamente dos tipos de compresión. Lossless Lossy](https://reader033.vdocuments.pub/reader033/viewer/2022051019/5665b4671a28abb57c913d07/html5/thumbnails/3.jpg)
3
La compresión lossless produce una representación digital del audio que luego puede ser expandida a una réplica exacta.
Para los esquemas lossy, los cambios sobre el original son irreversibles.
![Page 4: 1 Compresión de Audio. 2 Existen básicamente dos tipos de compresión. Lossless Lossy](https://reader033.vdocuments.pub/reader033/viewer/2022051019/5665b4671a28abb57c913d07/html5/thumbnails/4.jpg)
4
En ambos casos se busca eliminar la redundancia, sin embargo los codec con pérdidas buscan reducir también la información irrelevante.
![Page 5: 1 Compresión de Audio. 2 Existen básicamente dos tipos de compresión. Lossless Lossy](https://reader033.vdocuments.pub/reader033/viewer/2022051019/5665b4671a28abb57c913d07/html5/thumbnails/5.jpg)
5
Irrelevante llamaremos a aquella información que sea perceptualmente inaudible.
Los criterios para evaluar la percepción se basarán en la psicoacústica.
![Page 6: 1 Compresión de Audio. 2 Existen básicamente dos tipos de compresión. Lossless Lossy](https://reader033.vdocuments.pub/reader033/viewer/2022051019/5665b4671a28abb57c913d07/html5/thumbnails/6.jpg)
6
Escala Bark
Eberhard Zwicker en 1961 propuso una escala de frecuencias con bandas críticas (Barks).
Esta escala se originó a partir de la escala Mel.
![Page 7: 1 Compresión de Audio. 2 Existen básicamente dos tipos de compresión. Lossless Lossy](https://reader033.vdocuments.pub/reader033/viewer/2022051019/5665b4671a28abb57c913d07/html5/thumbnails/7.jpg)
7
Bandas Críticas
![Page 8: 1 Compresión de Audio. 2 Existen básicamente dos tipos de compresión. Lossless Lossy](https://reader033.vdocuments.pub/reader033/viewer/2022051019/5665b4671a28abb57c913d07/html5/thumbnails/8.jpg)
8
Bandas Críticas
Como se ha visto, esta modelización tiene una fuerte correlación con el comportamiento de la cóclea.
Desde el punto de vista de la percepción, las bandas críticas pueden ser analizadas individualmente.
![Page 9: 1 Compresión de Audio. 2 Existen básicamente dos tipos de compresión. Lossless Lossy](https://reader033.vdocuments.pub/reader033/viewer/2022051019/5665b4671a28abb57c913d07/html5/thumbnails/9.jpg)
9
Volumen
La noción de volumen fue estudiada en primer lugar por Fletcher y Munson en 1933.
Hicieron mediciones trazando curvas para igual volumen percibido a distintas frecuencias.
![Page 10: 1 Compresión de Audio. 2 Existen básicamente dos tipos de compresión. Lossless Lossy](https://reader033.vdocuments.pub/reader033/viewer/2022051019/5665b4671a28abb57c913d07/html5/thumbnails/10.jpg)
10
Curvas Equal-Loudness
![Page 11: 1 Compresión de Audio. 2 Existen básicamente dos tipos de compresión. Lossless Lossy](https://reader033.vdocuments.pub/reader033/viewer/2022051019/5665b4671a28abb57c913d07/html5/thumbnails/11.jpg)
11
El oído es mas sensible en el rango 1-5kHz. Esto se explica en gran medida por la resonancia del canal auditivo y la función transferencia de los huesos del oído medio.
Obsérvese que el umbral de audición varía desde 0 hasta 80dB SPL (!)
Ver http://www.phys.unsw.edu.au/jw/hearing.html
![Page 12: 1 Compresión de Audio. 2 Existen básicamente dos tipos de compresión. Lossless Lossy](https://reader033.vdocuments.pub/reader033/viewer/2022051019/5665b4671a28abb57c913d07/html5/thumbnails/12.jpg)
12
Enmascaramiento
Enmascaramiento Simultaneo En presencia de un tono, el umbral de audición
a su alrededor varía. De esta manera, se “tapan” frecuencias que de
lo contrario serían audibles.Enmascaramiento Temporal Si dos tonos cercanos son presentados
secuencialmente. El primero es capaz de volver inaudible al segundo .
![Page 13: 1 Compresión de Audio. 2 Existen básicamente dos tipos de compresión. Lossless Lossy](https://reader033.vdocuments.pub/reader033/viewer/2022051019/5665b4671a28abb57c913d07/html5/thumbnails/13.jpg)
13
Enmascaramiento simultaneo Como ya vimos…
![Page 14: 1 Compresión de Audio. 2 Existen básicamente dos tipos de compresión. Lossless Lossy](https://reader033.vdocuments.pub/reader033/viewer/2022051019/5665b4671a28abb57c913d07/html5/thumbnails/14.jpg)
14
Enmascaramiento simultaneo
![Page 15: 1 Compresión de Audio. 2 Existen básicamente dos tipos de compresión. Lossless Lossy](https://reader033.vdocuments.pub/reader033/viewer/2022051019/5665b4671a28abb57c913d07/html5/thumbnails/15.jpg)
15
Enmascaramiento temporal
Cualquier sonido dentro del área sombreada será enmascarado.
Las colas exponenciales variarán su largo (no linealmente) en función de la duración del tono.
![Page 16: 1 Compresión de Audio. 2 Existen básicamente dos tipos de compresión. Lossless Lossy](https://reader033.vdocuments.pub/reader033/viewer/2022051019/5665b4671a28abb57c913d07/html5/thumbnails/16.jpg)
16
¿Como podemos aprovechar esto?
![Page 17: 1 Compresión de Audio. 2 Existen básicamente dos tipos de compresión. Lossless Lossy](https://reader033.vdocuments.pub/reader033/viewer/2022051019/5665b4671a28abb57c913d07/html5/thumbnails/17.jpg)
17
Lo que hace es adaptar la cantidad de bits, para que el ruido de cuantización quede justo por debajo del enmascaramiento.
Para esto, es conveniente el análisis del audio en bandas de frecuencia.
![Page 18: 1 Compresión de Audio. 2 Existen básicamente dos tipos de compresión. Lossless Lossy](https://reader033.vdocuments.pub/reader033/viewer/2022051019/5665b4671a28abb57c913d07/html5/thumbnails/18.jpg)
18
Compresor Lossy
![Page 19: 1 Compresión de Audio. 2 Existen básicamente dos tipos de compresión. Lossless Lossy](https://reader033.vdocuments.pub/reader033/viewer/2022051019/5665b4671a28abb57c913d07/html5/thumbnails/19.jpg)
19
MPEG - 1
![Page 20: 1 Compresión de Audio. 2 Existen básicamente dos tipos de compresión. Lossless Lossy](https://reader033.vdocuments.pub/reader033/viewer/2022051019/5665b4671a28abb57c913d07/html5/thumbnails/20.jpg)
20
MPEG - 1
MPEG-1 es un standard de compresión lossy para video y audio.
Fue publicado en 1993 por el grupo “Moving Picture Expert Group“.
Trabaja con frecuencias de sampleo de 32, 44.1 , y 48 kHz.
Bitrates desde 32 hasta 448kbit/s (Layer 1 Stereo).
![Page 21: 1 Compresión de Audio. 2 Existen básicamente dos tipos de compresión. Lossless Lossy](https://reader033.vdocuments.pub/reader033/viewer/2022051019/5665b4671a28abb57c913d07/html5/thumbnails/21.jpg)
21
MPEG - 1
Tiene 4 modos posibles: mono, stereo, dual (ideal para SAP) y joint stereo.
Tiene definidas 3 capas. Cada una con algoritmos de complejidad progresiva.
Las capas son inclusivas. Con el codec para Layer III es posible decodificar también Layer I y II.
![Page 22: 1 Compresión de Audio. 2 Existen básicamente dos tipos de compresión. Lossless Lossy](https://reader033.vdocuments.pub/reader033/viewer/2022051019/5665b4671a28abb57c913d07/html5/thumbnails/22.jpg)
22
Estructura de Codificador/Decodificador MPEG - 1 Layer I y II
![Page 23: 1 Compresión de Audio. 2 Existen básicamente dos tipos de compresión. Lossless Lossy](https://reader033.vdocuments.pub/reader033/viewer/2022051019/5665b4671a28abb57c913d07/html5/thumbnails/23.jpg)
23
Análisis multibanda
El codec subdivide el espectro en 32 bandas de filtros equiespaciados.
La implementación de los pasabandas se hace por filtros polifásicos.
![Page 24: 1 Compresión de Audio. 2 Existen básicamente dos tipos de compresión. Lossless Lossy](https://reader033.vdocuments.pub/reader033/viewer/2022051019/5665b4671a28abb57c913d07/html5/thumbnails/24.jpg)
24
Filtros polifásicos
Consisten en una serie N (2k) de filtros equiespaciados.
Se construyen con un filtro pasabajos base con fc=fs/4N, modulado por N senoidales.
Se los usa porque requieren baja complejidad computacional.
![Page 25: 1 Compresión de Audio. 2 Existen básicamente dos tipos de compresión. Lossless Lossy](https://reader033.vdocuments.pub/reader033/viewer/2022051019/5665b4671a28abb57c913d07/html5/thumbnails/25.jpg)
25
Masking Thresholds
Para fijar los umbrales, el codec MPEG-1 utilizaThreshold in quiet (Equal Loudness)Intra-band masking
• Simultaneous masking• Non-simultaneous masking
![Page 26: 1 Compresión de Audio. 2 Existen básicamente dos tipos de compresión. Lossless Lossy](https://reader033.vdocuments.pub/reader033/viewer/2022051019/5665b4671a28abb57c913d07/html5/thumbnails/26.jpg)
26
Modelos Matemáticos
Tanto para el enmascaramiento simultáneo como para el temporal. Se utilizan modelos matemáticos. Ambos propuestos por Ernst Terhardt.
Con estos, se traza un umbral a partir del mínimo valor de la “máscara inaudible”. Uno por cada banda (JND).
![Page 27: 1 Compresión de Audio. 2 Existen básicamente dos tipos de compresión. Lossless Lossy](https://reader033.vdocuments.pub/reader033/viewer/2022051019/5665b4671a28abb57c913d07/html5/thumbnails/27.jpg)
27
Just Noticeable Distortion (JND)
![Page 28: 1 Compresión de Audio. 2 Existen básicamente dos tipos de compresión. Lossless Lossy](https://reader033.vdocuments.pub/reader033/viewer/2022051019/5665b4671a28abb57c913d07/html5/thumbnails/28.jpg)
28
Compresión Lossless
Para la compresión lossless, el enfoque es totalmente distinto.
Se busca codificar la redundancia como lo haría un zip, pero con algoritmos específicos para audio.
![Page 29: 1 Compresión de Audio. 2 Existen básicamente dos tipos de compresión. Lossless Lossy](https://reader033.vdocuments.pub/reader033/viewer/2022051019/5665b4671a28abb57c913d07/html5/thumbnails/29.jpg)
29
Esquema básico
![Page 30: 1 Compresión de Audio. 2 Existen básicamente dos tipos de compresión. Lossless Lossy](https://reader033.vdocuments.pub/reader033/viewer/2022051019/5665b4671a28abb57c913d07/html5/thumbnails/30.jpg)
30
Framing
Para la división en frames, se evalúaQue el frame no sea excesivamente corto.
Overhead en decodificación.Tampoco que sea demasiado largo. Baja
adaptabilidad. En los algoritmos mas populares, el largo
del frame va desde 13 a 26ms.
![Page 31: 1 Compresión de Audio. 2 Existen básicamente dos tipos de compresión. Lossless Lossy](https://reader033.vdocuments.pub/reader033/viewer/2022051019/5665b4671a28abb57c913d07/html5/thumbnails/31.jpg)
31
Intrachannel decorrelation
La mayoría de los algoritmos remueven redundancia de los samples utilizando predictores lineales.
De esta manera, la señal que se envía son los parámetros del predictor y la señal de error.
![Page 32: 1 Compresión de Audio. 2 Existen básicamente dos tipos de compresión. Lossless Lossy](https://reader033.vdocuments.pub/reader033/viewer/2022051019/5665b4671a28abb57c913d07/html5/thumbnails/32.jpg)
32
Intrachannel decorrelation
Existen otros métodos (menos comunes), donde se calculan versiones de bajo bit-rate de la señal.
Luego se envía sin pérdidas la diferencia entre esta y la señal original.
![Page 33: 1 Compresión de Audio. 2 Existen básicamente dos tipos de compresión. Lossless Lossy](https://reader033.vdocuments.pub/reader033/viewer/2022051019/5665b4671a28abb57c913d07/html5/thumbnails/33.jpg)
33
Modelo Predictor (Predicción)
Feedforward Feedback
![Page 34: 1 Compresión de Audio. 2 Existen básicamente dos tipos de compresión. Lossless Lossy](https://reader033.vdocuments.pub/reader033/viewer/2022051019/5665b4671a28abb57c913d07/html5/thumbnails/34.jpg)
34
Modelo Predictor (Reconstrucción)
![Page 35: 1 Compresión de Audio. 2 Existen básicamente dos tipos de compresión. Lossless Lossy](https://reader033.vdocuments.pub/reader033/viewer/2022051019/5665b4671a28abb57c913d07/html5/thumbnails/35.jpg)
35
Filtros adaptativos
Para reducir los tiempos de cálculo, en general, los compresores trabajan con listas de set de coeficientes.
Se trabaja con punto fijoFacilita aritméticaEs standard
![Page 36: 1 Compresión de Audio. 2 Existen básicamente dos tipos de compresión. Lossless Lossy](https://reader033.vdocuments.pub/reader033/viewer/2022051019/5665b4671a28abb57c913d07/html5/thumbnails/36.jpg)
36
Entropy coding
Se usan fundamentalmente 3 métodosRun Length CodingHuffmanRice Coding
![Page 37: 1 Compresión de Audio. 2 Existen básicamente dos tipos de compresión. Lossless Lossy](https://reader033.vdocuments.pub/reader033/viewer/2022051019/5665b4671a28abb57c913d07/html5/thumbnails/37.jpg)
37
Rice Coding
Los números a codificar se dividen en 3 partes.Bit de signom números de la parte menos significativa.N ceros. Con N igual al número binario que
quedó en la parte mas significativa.Un ‘1’ al final.
![Page 38: 1 Compresión de Audio. 2 Existen básicamente dos tipos de compresión. Lossless Lossy](https://reader033.vdocuments.pub/reader033/viewer/2022051019/5665b4671a28abb57c913d07/html5/thumbnails/38.jpg)
38
Rice Coding
![Page 39: 1 Compresión de Audio. 2 Existen básicamente dos tipos de compresión. Lossless Lossy](https://reader033.vdocuments.pub/reader033/viewer/2022051019/5665b4671a28abb57c913d07/html5/thumbnails/39.jpg)
39
Rice Coding
La codificación Rice es un subset de la codificación Golomb.
Es utilizado en esquemas adaptativos, porque sus parámetros se pueden ajustar.
Se utiliza tanto en audio como en imagen.
![Page 40: 1 Compresión de Audio. 2 Existen básicamente dos tipos de compresión. Lossless Lossy](https://reader033.vdocuments.pub/reader033/viewer/2022051019/5665b4671a28abb57c913d07/html5/thumbnails/40.jpg)
40
Rice Coding
El parámetro m es la clave para la compresión. Frame a frame, se lo recalcula
Tiene la propiedad de adaptarse según la magnitud del error, siendo óptimo para señales que estadísticamente se mueven dentro de un rango.