k f p reprezentacja widmowa - pforczmanski.zut.edu.pl
Post on 23-Nov-2021
3 Views
Preview:
TRANSCRIPT
.::
PRZE
TWAR
ZAN
IE O
BRAZ
ÓW
::.
Paw
eł F
orcz
mań
ski
1 / 61
Reprezentacja widmowa
dr inż. Paweł ForczmańskiKatedra Systemów Multimedialnych, Wydział Informatyki ZUT
Informatyka, S1 sem. letni, 2014/2015, wykład#5
.::
PRZE
TWAR
ZAN
IE O
BRAZ
ÓW
::.
Paw
eł F
orcz
mań
ski
2 / 61
Jean Baptiste Joseph FourierJean Baptiste Joseph Fourier
.::
PRZE
TWAR
ZAN
IE O
BRAZ
ÓW
::.
Paw
eł F
orcz
mań
ski
3 / 61
Transformacje obrazu:
→punktowe
→lokalne
→globalne
.::
PRZE
TWAR
ZAN
IE O
BRAZ
ÓW
::.
Paw
eł F
orcz
mań
ski
4 / 61
Liniowe transformacje globalne Liniowe transformacje globalne obrazuobrazu
.::
PRZE
TWAR
ZAN
IE O
BRAZ
ÓW
::.
Paw
eł F
orcz
mań
ski
6 / 61
dla funkcji ciągłych:
Transformata Fouriera Transformata Fouriera (jednowymiarowa)(jednowymiarowa)
.::
PRZE
TWAR
ZAN
IE O
BRAZ
ÓW
::.
Paw
eł F
orcz
mań
ski
7 / 61
dla funkcji ciągłych:
Transformata Fouriera Transformata Fouriera (dwuwymiarowa)(dwuwymiarowa)
.::
PRZE
TWAR
ZAN
IE O
BRAZ
ÓW
::.
Paw
eł F
orcz
mań
ski
10 / 61
W cyfrowej obróbce obrazu zakłada się, że obraz jest dyskretną funk-cją okresową o okresie (N,N)
Obraz cyfrowy jako dyskretna Obraz cyfrowy jako dyskretna funkcja okresowafunkcja okresowa
.::
PRZE
TWAR
ZAN
IE O
BRAZ
ÓW
::.
Paw
eł F
orcz
mań
ski
11 / 61
Dla sygnałów dyskretnychDla sygnałów dyskretnych
.::
PRZE
TWAR
ZAN
IE O
BRAZ
ÓW
::.
Paw
eł F
orcz
mań
ski
12 / 61
Separowalność transformaty Fouriera:
FT wg wierszy → FT wg kolumn
Ogólne własnościOgólne własności
.::
PRZE
TWAR
ZAN
IE O
BRAZ
ÓW
::.
Paw
eł F
orcz
mań
ski
14 / 61
Widmo obrazu dane jest w postaci zespolonej. Można je rozłożyć na dwie części: moduł i fazę:
Reprezentacja geometryczna liczb zespolonych →
Faza i moduł widmaFaza i moduł widma
.::
PRZE
TWAR
ZAN
IE O
BRAZ
ÓW
::.
Paw
eł F
orcz
mań
ski
15 / 61
W praktyce moduł widma zwany jest czasem widmem amplitudowym, a faza widma – widmem fazowym.
Przykładowy obraz Moduł Faza
Faza i moduł widmaFaza i moduł widma
.::
PRZE
TWAR
ZAN
IE O
BRAZ
ÓW
::.
Paw
eł F
orcz
mań
ski
16 / 61
Aby wykonać klasyczną transformatę Fouriera na sygnale dyskretnymnależy posłużyć się wzorem:
1
0
2 1,0),exp()()(N
n
NNkkn jnxkC
Obliczanie TF według powyższego wzoru wymaga N*N obliczeńz liczbami zespolonymi. W celu zmniejszenia złożoności obliczeniowejmożna dokonać następującego przekształcenia:
Budowa algorytmu FFTBudowa algorytmu FFT
.::
PRZE
TWAR
ZAN
IE O
BRAZ
ÓW
::.
Paw
eł F
orcz
mań
ski
17 / 61
Wektor przedstawiamy w postaci dwóch nowych wektorów:
X (p) i X (np) w następujący sposób:
gdzie “p” oznacza elementy parzyste, a “np” - elementy nieparzyste.Przekształcając wzór na transformatę Fouriera pod względemrozłożonego wektora na dwie składowe, otrzymujemy:
12
,0,)12()(
)2()((n p)
Nn
nxnXnxnX (p)
Budowa algorytmu FFT (2)Budowa algorytmu FFT (2)
.::
PRZE
TWAR
ZAN
IE O
BRAZ
ÓW
::.
Paw
eł F
orcz
mań
ski
18 / 61
Przekształcając wzór na transformatę Fouriera pod względemrozłożonego na dwie składowe wektora, otrzymujemy:
Budowa algorytmu FFT (3)Budowa algorytmu FFT (3)
.::
PRZE
TWAR
ZAN
IE O
BRAZ
ÓW
::.
Paw
eł F
orcz
mań
ski
19 / 61
Jest to zwykłe dyskretne przekształcenie Fouriera (DFT), gdy okreswynosi N/2 próbek, i jest współczynnikiem, który zależy tylko od k.Z tego wynika że składową C(k) można obliczyć w nast. sposób:
Budowa algorytmu FFT (4)Budowa algorytmu FFT (4)
.::
PRZE
TWAR
ZAN
IE O
BRAZ
ÓW
::.
Paw
eł F
orcz
mań
ski
20 / 61
22 2
24 2
2 22
N N N NN
Był to graf FFT dla N = 8
Ponieważ dla
w dolnej części grafu na wcześniejszym rys. mamy odejmowanie.
W j k N k NNk exp / , ,2 0 1
k N W WNk N
Nk ( / ), /2 2
Liczba operacji w przedstawionym algorytmie jest równa:
Budowa algorytmu FFT (4)Budowa algorytmu FFT (4)
.::
PRZE
TWAR
ZAN
IE O
BRAZ
ÓW
::.
Paw
eł F
orcz
mań
ski
21 / 61
Operacja DFT dla N = 4 wygląda następująco:
Budowa algorytmu FFT (5)Budowa algorytmu FFT (5)
.::
PRZE
TWAR
ZAN
IE O
BRAZ
ÓW
::.
Paw
eł F
orcz
mań
ski
22 / 61
Dodając poszczególne części grafów otrzymujemy:
Graf FFT dla N = 8 , W j k N k NNk exp / , ,2 0 1
Budowa algorytmu FFT (6)Budowa algorytmu FFT (6)
.::
PRZE
TWAR
ZAN
IE O
BRAZ
ÓW
::.
Paw
eł F
orcz
mań
ski
23 / 61
Zastosowania reprezentacji widmowej obrazu:
FiltracjaAnaliza (rozpoznawanie)KodowanieKompresjaCyfrowe znaki wodne (digital watermarking)
.::
PRZE
TWAR
ZAN
IE O
BRAZ
ÓW
::.
Paw
eł F
orcz
mań
ski
25 / 61
Transformaty umożliwiają rozłożenie funkcji jasności,będącej dyskretną funkcją dwóch zmiennych, nasuperpozycję funkcji bazowych transformaty.• DCT (ang. discrete cosine transform, czyli dyskretnatransformacja cosinusowa) - jedna z najpopularniejszych blo-kowych transformacji danych.
Jest szczególnie popularna w stratnej kompresji danych.• DCT przekształca skończony ciąg N liczb rzeczywistychg(0), … , g(N-1) w ciąg liczb rzeczywistychG(0), ..., G(N-1) zgodnie z zależnościami:
Transformata w kompresjiTransformata w kompresji
.::
PRZE
TWAR
ZAN
IE O
BRAZ
ÓW
::.
Paw
eł F
orcz
mań
ski
26 / 61
Transformata w kompresjiTransformata w kompresji
.::
PRZE
TWAR
ZAN
IE O
BRAZ
ÓW
::.
Paw
eł F
orcz
mań
ski
27 / 61
Transformata DCT 1DTransformata DCT 1D
Jeśli f(i, j) oznacza wartość piksla leżącego w punkcie o współrzędnych (i, j), a F(u, v) reprezentuje dwuwymiarowy współczynnik transformaty ze składową harmoniczną rzędu u wzdłuż osi U i składową harmoniczną rzędu v wzdłuż osi V (gdzie U i V odpowiadają osiom I i J), wówczas F(u, v) definiowane są jako:
.::
PRZE
TWAR
ZAN
IE O
BRAZ
ÓW
::.
Paw
eł F
orcz
mań
ski
29 / 61
Obliczanie DCT2D na podstawie DCT Obliczanie DCT2D na podstawie DCT 1D1D
.::
PRZE
TWAR
ZAN
IE O
BRAZ
ÓW
::.
Paw
eł F
orcz
mań
ski
30 / 61
Czym jest JPEG ?
"Joint Photographic Expert Group". Międzynarodowy
standard od roku 1992. Grupa JPEG - 1986.
Operuje na rzeczywistych obrazach kolorowych i w
odcieniach szarości – szerokie spektrum zastosowań.
Ukończone prace nad standardem JPEG2000, który
wykorzystuje kompresję falkową (wavelet compression)
Ciągle rozszerzany – wprowadzenie formatu JPEG-LS
(bezstratnego o wysokim współczynniku kompresji)
.::
PRZE
TWAR
ZAN
IE O
BRAZ
ÓW
::.
Paw
eł F
orcz
mań
ski
31 / 61
założenia formatu JPEG:
Obraz monochromatyczny (w odcieniach szarości) – tablica
punktów opisujących jasność punktów obrazu
Obraz barwny (wielokolorowy) – tablica liczb całkowitych
(zwykle 3 tablice) opisujące obraz w ustalonym modelu
barwnym (np. RGB)
.::
PRZE
TWAR
ZAN
IE O
BRAZ
ÓW
::.
Paw
eł F
orcz
mań
ski
33 / 61
Konwersja RGB → YIQ (YCbC
r)
DCT (Discrete Cosine Transformation)
Kwantyzacja (Quantization )
Skanowanie alg. Zigzag
Kodowanie składowych częstotliwościowych
(DPCM, RLE, Entropia)
Podstawowe etapy algorytmu JPEGPodstawowe etapy algorytmu JPEG
.::
PRZE
TWAR
ZAN
IE O
BRAZ
ÓW
::.
Paw
eł F
orcz
mań
ski
34 / 61
Obraz wejściowy RGB dany jest za pomocą 3 tablic:
R=[ rij ], G=[ g
ij ], B=[ b
ij ];
konwersja polega na opisaniu obrazu za pomocą 3 nowych
tablic Y,I,Q:
[yij
iij
q ij]=[ 0.229 0.587 0.114
−0.168 −0.257 −0.3210.212 −0.528 0.311 ][
rij
g ij
b ij]
Konwersja do YIQKonwersja do YIQ
.::
PRZE
TWAR
ZAN
IE O
BRAZ
ÓW
::.
Paw
eł F
orcz
mań
ski
35 / 61
Obraz wyjściowy YIQ opisany jest za pomocą 3 tablic: Y=[ y
ij ], I=[ i
ij ], Q=[ q
ij ];
tablica Y odpowiada za luminancję (jasność), natomiast
tablice I i Q – za chrominancję (kolor)
Konwersja do YIQ (2)Konwersja do YIQ (2)
.::
PRZE
TWAR
ZAN
IE O
BRAZ
ÓW
::.
Paw
eł F
orcz
mań
ski
36 / 61
Subsampling koloruSubsampling koloru
Schemat subsamplingu jest często opisywany jako stosunek trzech ele-mentów (np. 4:2:2), części te to (w kolejności):●Luminancja (Luma, Y) pozioma wartość próbkowania (początkowo, jako wielokrotność 3.579 MHz w systemie NTSC) ●Chrominancja R (Cr) – współczynnik poziomego próbkowania (w sto-sunku do pierwszej wartości)●Chrominancja B (Cb) – współczynnik poziomego próbkowania (w sto-sunku do pierwszej wartości). Wyjątkiem jest zero, co oznacza że war-tość Cb jest równa Cr i jednocześnie Cb i Cr są próbkowane w stosunku 2:1 w kierunku pionowym.
.::
PRZE
TWAR
ZAN
IE O
BRAZ
ÓW
::.
Paw
eł F
orcz
mań
ski
37 / 61
Subsampling koloruSubsampling koloru
Schemat 4:2:0 jest stosowany w:●wszystkie wersje MPEG video (MPEG-1, MPEG-2/DVD). Niektóre wyższe profile MPEG-4 stosują 4:4:4●PAL, DV, DVCAM●większość implementacji JPEG/JFIF, H.261 i MJPEG
.::
PRZE
TWAR
ZAN
IE O
BRAZ
ÓW
::.
Paw
eł F
orcz
mań
ski
38 / 61
=
+ W1*
+ W2*
+ W3*
+ . . .
Zestaw funkcji bazowychZestaw funkcji bazowych
.::
PRZE
TWAR
ZAN
IE O
BRAZ
ÓW
::.
Paw
eł F
orcz
mań
ski
40 / 61
Blokpo DCT2 / Tablica
kwantyzacji =Blokdo
kodowania(skanowania ZIGZAG)
Kwantyzacja współczynników DCT2 Kwantyzacja współczynników DCT2 w blokuw bloku
Kwantyzacja współczynnikówtransformaty F(u, v)otrzymanych z kodowaniaDCT przy pomocy macierzyKwantyzacji.
Polega na dzieleniu każdego ze współczynników F(u, v) przezodpowiadający mu elementtablicy dwuwymiarowejQ(u, v)
.::
PRZE
TWAR
ZAN
IE O
BRAZ
ÓW
::.
Paw
eł F
orcz
mań
ski
41 / 61
W jakim celu? -- aby zgrupować współczynniki niskoczęstotliwościowe na początku wektora
Przejście z macierzy 8 x 8 na wektor 1 x 64
Skanowanie Zig-zagSkanowanie Zig-zag
.::
PRZE
TWAR
ZAN
IE O
BRAZ
ÓW
::.
Paw
eł F
orcz
mań
ski
42 / 61
Usuwanie wspólczynników DCTUsuwanie wspólczynników DCT
W jakim celu? -współczynniki o niewielkim znaczeniu są usuwane (zerowane)
Współczynniki DCT (reprezentacja 1D)
.::
PRZE
TWAR
ZAN
IE O
BRAZ
ÓW
::.
Paw
eł F
orcz
mań
ski
43 / 61
Dlaczego DCT a nie FFT?Dlaczego DCT a nie FFT?
FFT zakłada, że sygnał jest okresowy,co powoduje, że po odrzuceniu wybranych współczynników, po dekompresji powstają silne zniekształcenia brzegowe...
top related