architektura kodera hevc-3d kodowanie wielowidokowych sekwencji wizyjnych z wykorzystaniem...
TRANSCRIPT
-
*Architektura kodera HEVC-3D Kodowanie wielowidokowych sekwencji wizyjnych z wykorzystaniem informacji o przesanianiuSeminarium Katedralne, stycze 2012Krzysztof Wegner
Katedra Telekomunikacji Multimedialnej i MikroelektronikiPolitechnika Poznaska
*
-
CelPrzesanie do odbiornika wielowidokowej sekwencji wizyjnej w sposb umoliwiajcy syntez wielu widokwNa wejciu kodera 3 widoki tekstury3 mapy gbiParametry systemu kamerowegoNa wyjciu dekoderawiele widokw wirtualnych
*
-
Wybrane warunki konkursuIlo danychIlo nieskompresowane danych nie powinna przekracza 4x wielko pojedynczego nieskompresowanego widokuWielko strumienia danych (Widoki + informacje dodatkowe)Nie wicej jak 2x wielko strumienia pojedynczego widoku najlepsz dostpn technik odniesieniaJakoGwnym celem standardu bdzie rekonstrukcja widoku widzianego z arbitralnego miejsca w przestrzeni. ZoonoWymagania na nisk zoono na syntez widoku
*
-
Analiza procesu syntezy*
-
Analiza procesu syntezy*
-
Analiza procesu syntezy*
-
Analiza procesu syntezy*
-
Analiza procesu syntezy*
-
Analiza procesu syntezy*
-
Analiza procesu syntezy*
-
Analiza procesu syntezy*
-
Analiza procesu syntezy*Nie wszystkie prbki w lewym i prawym obrazie s wykorzystywane do syntezy obrazu wirtualnego
Nie trzeba ich przesya
-
MVCMPEG 4 cz 10 aneks H MVCRozszerzenie standardu AVC na przypadek wielowidokowyDodanie predykcji midzy widokowejNa listach obrazw odniesienia dodano obrazy z ssiednich (ju zakodowanych) widokwOkoo 25% redukcji strumienia wzgldem AVC kodujcego widoki niezalenie.
*
-
HEVCNowy standard kodowania obrazu ruchomegoPrace standaryzacyjne w tokuIdea kodowania bez zmianWiele nowych narzdzi kodowaniaOkoo 50% redukcji strumienia wzgldem AVC
*
-
HEVC-3D MVCJako koder bazowy wybrano HEVC 3.0Ktry zmodyfikowano na wzr kodera MVC
*
-
Implementacja wielowidokowoci*MVC na podstawie kodera AVCKodowanie kolejnych widokwZaletyNiewielki wzrost zuycia pamici wzgldem kodera bazowegoWadyDostp tylko do rekonstrukcji innych widokw
-
Implementacja wielowidokowoci*HEVC-3D na podstawie kodera HEVCKodowanie kolejnych ramek wszystkich widokw narazZaletyDostp do wszystkich pl wszystkich kodowanych widokw moliwe zrnicowane predykcjePojedynczy odczyt danych z dyskuWadyZnaczny wzrost zuycia pamici wzgldem kodera bazowego
-
HEVC-3D MVCWyniki porwnywalne z zyskiem osignitym przy rozszerzeniu MVC (wzgldem AVC)
Sony prezentowao podobne wyniki ju przed konkursem
*
Redukcja strumienia przy kodowaniu HEVC-3D (MVC) w porwnaniu do HEVC kodujcego widoki niezalenie
RA-HEPrzypadek 2 widokowyRA-HEPrzypadek 3 widokowyY BD-rateU BD-rateV BD-rateY BD-rateU BD-rateV BD-ratePoznan_Hall2-19.0%-16.7%-16.8%-23.4%-19.1%-21.0%Poznan_Street-24.2%-23.7%-23.5%-33.2%-33.6%-31.3%Undo_Dancer-30.5%-33.3%-32.8%-41.3%-44.0%-43.0%GT_Fly-33.5%-34.5%-34.5%-44.0%-44.9%-45.0%Kendo-15.9%-9.1%-12.0%-24.4%-19.4%-21.9%Balloons-19.2%-15.3%-17.7%-27.1%-24.0%-25.9%Lovebird1-18.6%-17.6%-17.7%-28.2%-25.6%-26.1%Newspaper-20.4%-18.5%-18.3%-22.1%-19.4%-20.3%Overall-22.7%-21.1%-21.7%-30.5%-28.8%-29.3%
-
Architektura kodera HEVC 3D
*
-
Koder HEVC-3DNarzdziaJednorodna reprezentacja gbiKodowanie warstwy szumowejPredykcja z kompensacj rozbienociDziedziczenie wektorw ruchuPrzesyanie tylko obszarw odsonitychKwantowanie zalene od gbiNieliniowa reprezentacja gbiKodowanie parametrw kamer
*
-
Kodowanie przesoni
*Obraz do zakodowaniaMapa odsoni (przesoni)Odsonite fragmenty obrazuPrzesyane fragmenty obrazu
-
Kodowanie przesoniKodowanie tylko odsonite fragmentyNie kodowane jednoci CU nie s w ogle wygnalizowaneDekoder wie ktre fragmenty obrazu przesanoPodzia jednostki CU nie sygnalizowany jeli mona przewidzie go w dekoderze
*
-
Wygadzanie krawdziRnice w owietleniu sceny w rnych widokachGadkie przejcie pomidzy czci kodowan a syntezowan
*
-
WynikiWyniki obiektywnePsnr widoku bazowegoredni PSNR kodowanych widokwWyniki subiektywneObecna subiektywna jakoci widokw porednich
*
-
Wyniki obiektywneSekwencja Poznan_Street
*
-
Wyniki obiektywneSekwencja GT_Fly
*
-
Wyniki obiektywneSekwencja Poznan_Street
*
-
Wyniki obiektywneSekwencja GT_Fly
*
-
Wyniki obiektywneWyniki kodowania koderem HEVC-3D
*
Sequence2-view case3-view casePSNR [dB]Bitrate [%]PSNR [dB]Bitrate [%]Poznan_Hall21,8-45,32,5-59,3Poznan_Street2,7-54,63,9-69,6Undo_Dancer1,9-51,02,7-62,6GT_Fly2,2-55,53,1-67,0Kendo4,2-58,86,2-73,3Balloons5,2-64,66,7-74,3Lovebird14,2-66,75,8-76,4Newspaper5,1-66,56,3-76,1Average3,4-57,94,7-69,8
-
Wyniki subiektywneSekwencja GT_FLY
*
-
Struktura strumieniaPodzia strumienia pomidzy dane widoku bazwego i pobocznych
*
-
Struktura strumieniaPodzia strumienia pomidzy dane obrazu i map gbi
*
-
Podzia strumienia pomidzy dane obrazu i map gbi (Udzia w strumieniu widoku bazowego i bocznych)
*
-
Czas kodowania
*
-
PodsumowanieWiele narzdzi zostao wczonych do powstajcego oprogramowania odniesienia
*
-
Filtr wygadzajcy krawdzie
*
-
Mapy gbiInformacja o strukturze przestrzennej scenyIm janiejszy kolor tym bliszy obiekt
*
-
*Wyznaczenie mapy gbiDo wyznaczenie mapy gbi wykorzystuje si rozbieno stereoskopow
-
*Wyznaczenie mapy gbiRozbieno wyszukuje si za pomoc pasowania blokw (lub innej bardziej zaawansowanej techniki)
d
-
*Wyznaczenie mapy gbiRozbieno wyszukuje si za pomoc pasowania blokw (lub innej bardziej zaawansowanej techniki)
ddd
-
*Problem zasanianiaNie wszystkie punkty s widoczne w ssiednim obrazie
d????
-
*RozwizanieDo wyznaczenie mapy gbi wykorzystuje si nie dwa a trzy obrazy
d????
d
-
*Problem wyboru kierunkuJak wyznaczy ktr rozbieno wybra??Standardowo wybiera si t warto ktra lepiej pasuje (min sel) np. DERS
d????
d
-
*Problem wyboru kierunkuJednak w niektrych przypadkach niewaciwa rozbieno jest wybierana
d2
d1
-
Problem wyboru kierunkuRozmywanie krawdzi w macie gbi
*
-
PomysWybr kierunku na podstawie przewidywanej widocznoci punktu w ssiednich widokach
*
-
Wybr kierunkuZ aktualnie wyliczonej mapy gbi (moe niedoskonaej) zsyntezuj mapy gbi widokw ssiednich.
*
-
Wybr kierunkuSprawd czy punkt jest widoczny w ssiednim widoku (Z-Test)Jeli jest widoczna tylko w jednym widoku wybierz ten widokJeli w obu urednij koszty pasowania.
*
-
Wyniki*
DERSDERS - OCC
-
Wyniki*
-
Wyniki*
-
PodsumowanieZaproponowano now metod wyboru obrazu odniesienia bazujc na wykrywaniu widocznoci punktuZaproponowana metoda poprawia otrzymywanie mapy gbi rednio o 2dbZaproponowana metoda nie ingeruje w sposb wyznaczania map gbi a jedynie w sposb wyboru obrazu odniesienia
*
-
Dzikuje za uwagPytania?
*
-
Telewizja swobodnego punktu widzeniaWidz moe wybra z ktrego miejsca chce oglda scen.Nie tylko z miejsca z ktrego fizycznie rejestrowalimy scen
*
-
Synteza widoku wirtualnegoMa na celu stworzenie obrazu z wirtualnej kameryNa podstawie obrazw referencyjnych Renderowanie
*
-
Synteza widoku wirtualnego1. Rekonstrukcja modelu w przestrzeni 3Dobrazy referencyjnemapy gebi
*
-
Synteza widoku wirtualnego2. Model w przestrzeni 3Dpoprawki modelu
*
-
Synteza widoku wirtualnego3. Renderowanie nowego widokurzutowanie modelu do nowego widoku
*
-
Synteza widoku wirtualnegoProblemyNie dokadnoci w mapie gbiRnice w owietleniuPprzeroczystociNawigowanieCzas syntezy
*
-
CzasRenderowanie zoone obliczeniowoObliczenie pozycji w przestrzeniKady punkt opisany 7 liczbami3 wsprzdne4 skadowe koloruObliczenie pooenia wymaga rozwizania rwnania z macierzami 4x4
*
-
Czas - rozwizanieRenderowanie
*Renderowanie Homografia
-
Czas - rozwizanieRenderowanie HomografiaPrzesuwanie punktwObliczenie pooenia wymaga rozwizania rwnania z macierzami 3x3 (256 szczeglnych przypadkw)
*
-
Czas - rozwizanieRenderowanie HomografiaImplementacja na karcie graficznej GPGPUOgromne zrwnoleglenie specjalny algorytm
*
-
Schemat zaproponowanego rozwizania
*
-
Pozna Street - Rotacja*
-
Pozna Street - Zoom*
-
Wyniki*Wyniki jakoci subiektywnej praca w toku
GPU ATI RadeonProcek - Core i7VSRS - RefCzas przetwarzania25 fps 40 ms0.5 fps 2s0.25 fps 4 s
*