13 встреча — Сжатие данных (Р. Одинцов)

Post on 26-May-2015

208 Views

Category:

Education

5 Downloads

Preview:

Click to see full reader

DESCRIPTION

13 встреча Smolensk Computer Science Club Презентация Руслана Одинцова про сжатие данных ВКонтакте: http://vk.com/scsc_13

TRANSCRIPT

СЖАТИЕ ДАННЫХ

Руслан ОдинцовСмоленск, 201 3

Вместо введения

25 fps303 x 225 pxRGB

Исходное видео: 58. 3 mb, 4975 kbsСжатое видео: 0. 324 mb, 27 kbsСтепеь сжатия R = 0. 00000545 (1 84x)

Часть IЭнтропия

Неэнтропийные методы:Run-Length Encoding (RLE)

Исходная строка:

WWWWWWWWWWWWBWWWWWWWWWWWWBBBWWWWWWWWWWWWWWWWWWWWWWWWBWWWWWWWWWWWWWW

Сжатая строка:

1 2W1 B1 2W3B24W1 B1 4W

[применяется в JPEG, PCX и др. ]

Неэнтропийные методы:Distance Coding (DC)

aaabccca --> 1 1 301 1 00

если алфавит A = "abc"

[применяется в BWT]

Неэнтропийные методы:Словарные методы Lempel-Ziv (LZ)

Информационная энтропия

Information is theresolution ofuncertainty.

– Claude Shannon

Информационная энтропия:Минимальная единица информации

1 бит

2 бита

3 бита

Информационная энтропия

Информационная энтропия

Метод Хаффмана

Символ Код Вероятность Код Хаффманаa 00 0. 5 0b 01 0. 25 1 0c 1 0 0. 1 25 1 1 0d 1 1 0. 1 25 1 1 1

aaaabbсd --> 0 0 0 0 1 0 1 0 1 1 0 1 1 1R = 0. 875

Арифметическоеэнтропийное кодирование

Контекстное моделирование

THE ROOM WAS NOT VERY LARGE___ ROO_ ___ NOT V___ L____

Filter Predictor Entropyencoder

Структура компрессора

Model(s)

Prediction by partial match(PPM)

abbbabbb

Модель 1 -ого порядка:Контекст Символ Частотаa a 0a b 2b a 1b b 4

Prediction by partial match (PPM)

1 . readSymbol()2. shorten context3. while (context not found)4. output(escape sequence)5. shorten context6. output(character)7. while (context length not -1 ) do8. inc freq9. shorten context

Dynamic Markov Compression (DMC)

Часть IIПотери

Сжатие с потерями(Lossy compression)

Transform Entropyencoder

Потери

Filter

Сжатие с потерями:сжатие аудио

- Delta-coding (ADPCM)- Дискретное косинусное преобразование (DCT)- Психоакустическое моделирование- Аналитикосинтетическое сжатие речи

Преобразование Фурье

DCT

DFT

Сжатие с потерями:сжатие изображений

- Квантирование, YCbCr- Дискретное косинусное преобразование (DCT)- Wavelet

Двумерное дискретное косинусноепреобразование (DCT)

Двумерное дискретное косинусноепреобразование (DCT)

Часть IIIДругое

Колмогоровская сложность

Колмогоровская сложность K(x) - меравычислительных ресурсов, необходимых дляточного определения объекта x.

- Зависимость колмогоровской сложности отязыка описания ограничена- Колмогоровская сложность невычислима- На практике значение колмогоровскойсложности может быть аппроксимизированоразличными алгоритмами сжатия

Perpetuum mobile в сжатии данных

R = compressed_size / uncompressed_size

typ R < 1

avg R > 1

avg R <= 1 - perpetuum mobile в сжатии данных

R_copy = 1 = const

Премия Хаттера

Спасибо за внимание

top related