13 встреча — Сжатие данных (Р. Одинцов)
Post on 26-May-2015
208 Views
Preview:
DESCRIPTION
TRANSCRIPT
СЖАТИЕ ДАННЫХ
Руслан ОдинцовСмоленск, 201 3
Вместо введения
25 fps303 x 225 pxRGB
Исходное видео: 58. 3 mb, 4975 kbsСжатое видео: 0. 324 mb, 27 kbsСтепеь сжатия R = 0. 00000545 (1 84x)
Часть IЭнтропия
Неэнтропийные методы:Run-Length Encoding (RLE)
Исходная строка:
WWWWWWWWWWWWBWWWWWWWWWWWWBBBWWWWWWWWWWWWWWWWWWWWWWWWBWWWWWWWWWWWWWW
Сжатая строка:
1 2W1 B1 2W3B24W1 B1 4W
[применяется в JPEG, PCX и др. ]
Неэнтропийные методы:Distance Coding (DC)
aaabccca --> 1 1 301 1 00
если алфавит A = "abc"
[применяется в BWT]
Неэнтропийные методы:Словарные методы Lempel-Ziv (LZ)
Информационная энтропия
Information is theresolution ofuncertainty.
– Claude Shannon
Информационная энтропия:Минимальная единица информации
1 бит
2 бита
3 бита
Информационная энтропия
Информационная энтропия
Метод Хаффмана
Символ Код Вероятность Код Хаффманаa 00 0. 5 0b 01 0. 25 1 0c 1 0 0. 1 25 1 1 0d 1 1 0. 1 25 1 1 1
aaaabbсd --> 0 0 0 0 1 0 1 0 1 1 0 1 1 1R = 0. 875
Арифметическоеэнтропийное кодирование
Контекстное моделирование
THE ROOM WAS NOT VERY LARGE___ ROO_ ___ NOT V___ L____
Filter Predictor Entropyencoder
Структура компрессора
Model(s)
Prediction by partial match(PPM)
abbbabbb
Модель 1 -ого порядка:Контекст Символ Частотаa a 0a b 2b a 1b b 4
Prediction by partial match (PPM)
1 . readSymbol()2. shorten context3. while (context not found)4. output(escape sequence)5. shorten context6. output(character)7. while (context length not -1 ) do8. inc freq9. shorten context
Dynamic Markov Compression (DMC)
Часть IIПотери
Сжатие с потерями(Lossy compression)
Transform Entropyencoder
Потери
Filter
Сжатие с потерями:сжатие аудио
- Delta-coding (ADPCM)- Дискретное косинусное преобразование (DCT)- Психоакустическое моделирование- Аналитикосинтетическое сжатие речи
Преобразование Фурье
DCT
DFT
Сжатие с потерями:сжатие изображений
- Квантирование, YCbCr- Дискретное косинусное преобразование (DCT)- Wavelet
Двумерное дискретное косинусноепреобразование (DCT)
Двумерное дискретное косинусноепреобразование (DCT)
Часть IIIДругое
Колмогоровская сложность
Колмогоровская сложность K(x) - меравычислительных ресурсов, необходимых дляточного определения объекта x.
- Зависимость колмогоровской сложности отязыка описания ограничена- Колмогоровская сложность невычислима- На практике значение колмогоровскойсложности может быть аппроксимизированоразличными алгоритмами сжатия
Perpetuum mobile в сжатии данных
R = compressed_size / uncompressed_size
typ R < 1
avg R > 1
avg R <= 1 - perpetuum mobile в сжатии данных
R_copy = 1 = const
Премия Хаттера
Спасибо за внимание
top related