module image montpellier 2015 - lirmm.fr · visualisation 3d de vidéos capturées ... compositing...

57

05/05/2015 1 crestic.univ‐reims.fr ©2012 CReSTIC. Tous droits réservés De l’acquisition à la diffusion L. Lucas Vidéo Relief 3D 05/05/2015 2 Module Image – ED I2S – Université de Montpellier Merci à mes collègues Y. Remion, C. Loscos, S. Prévost, G. Valette, P. Vautrot, J.M. Nourrit, A. Benassarou, R. Guillemot, H. Deleau J. Bonnard, L. Blache, I. Muhannad nos partenaires OPEXMedia (B. Battin, J. Lehuraux, D. Debons) XD Productions (C. Niquin, P. Souchet, J. Peyrache) nos financeurs Contact : laurent.lucas@univ‐reims.fr

Upload: dinhkhanh

Post on 13-Sep-2018

214 views

Category:

Documents

0 download

Report

Download

Embed Size (px):

TRANSCRIPT

Page 1: Module Image Montpellier 2015 - lirmm.fr · Visualisation 3D de vidéos capturées ... Compositing XXX Mosaicking X Frozen time XX Bullet time X Réalité Augmentée XXX Free Viewpoint

05/05/2015

1

crestic.univ‐reims.fr

©2012 CReSTIC. Tous droits réservés

De l’acquisition à la diffusion

L. Lucas

Vidéo Relief 3D

05/05/2015 2Module Image – ED I2S – Université de Montpellier

Merci à

mes collègues

Y. Remion, C. Loscos, S. Prévost, G. Valette, P. Vautrot, J.M. Nourrit, A. Benassarou, R. Guillemot, H. DeleauJ. Bonnard, L. Blache, I. Muhannad

nos partenaires

OPEXMedia (B. Battin, J. Lehuraux, D. Debons)XD Productions (C. Niquin, P. Souchet, J. Peyrache)

nos financeurs

Contact : laurent.lucas@univ‐reims.fr

Page 2: Module Image Montpellier 2015 - lirmm.fr · Visualisation 3D de vidéos capturées ... Compositing XXX Mosaicking X Frozen time XX Bullet time X Réalité Augmentée XXX Free Viewpoint

05/05/2015

2

Module Image – ED I2S – Université de Montpellier05/05/2015 3

Vidéo 3D oui mais … quelle vidéo 3D ?

Capture multivuesReprésentation &Reconstruction 3D

Codage &Transmission

Rendu &Affichage 3D

Module Image – ED I2S – Université de Montpellier05/05/2015 4

Vidéo 3D oui mais … quelle vidéo 3D ?

Systèmes binoculaires

RIG stéréoscopique

Systèmes multi‐vues

Latéraux ou directionnels (rectiligne, grille)

Linéiques ou grille (Camera Array)

Plénoptique

Englobants ou omni‐directionnels

Page 3: Module Image Montpellier 2015 - lirmm.fr · Visualisation 3D de vidéos capturées ... Compositing XXX Mosaicking X Frozen time XX Bullet time X Réalité Augmentée XXX Free Viewpoint

05/05/2015

3

Module Image – ED I2S – Université de Montpellier05/05/2015 5

Vision ou vidéo 3D, quel paradigme ?

Représentation algorithmique de la vision humaine

Paradigme de traitement de l’information visuelle opère généralement selon deux voies

Ascendante (passage de l’information sensorielle à la représentation abstraite)

Descendante (passage des primitives de l’image à l’ensemble des objets connus)

Primal sketch [Marr 82]

Représentation fonctionnelle dite plénoptique [Adelson 91]

Vision Field Computing [Dai 10]

Module Image – ED I2S – Université de Montpellier05/05/2015 6

Sommaire

Quelques rappels

Un peu d’histoire, stéréopsie et physiologie de la 3D

Pipeline de production de contenus et modèle de caméra

Caractérisation des géométries de capture et de restitution d'images reliefs

Caractérisation du relief et évaluation des cartes de disparités

Mise en correspondance multi‐vues

Reconstruction de surfaces

Compression de flux vidéo multi‐vues : approches LDV

Génération et compression des LDI

Reconstruction des vues

Affichage autostéréoscopique

Applications, conclusion, perspectives et démos

Page 4: Module Image Montpellier 2015 - lirmm.fr · Visualisation 3D de vidéos capturées ... Compositing XXX Mosaicking X Frozen time XX Bullet time X Réalité Augmentée XXX Free Viewpoint

05/05/2015

4

05/05/2015 7Module Image – ED I2S – Université de Montpellier

Partie 1

Fondements

Module Image – ED I2S – Université de Montpellier05/05/2015 8

Un peu d’histoire … la conquête de la réalité

Le terme « 3D » repose sur un ensemble de techniques issues de conception assistée par ordinateur qui

permet de représenter des objets en perspective sur un écran ordinateur. La « 3D » est encore affichées à

plat aujourd’hui.

Ce principe de représentation commence à être « théoriser » à la Renaissance. La Cité idéale (1475) de

Piero della Francesca et le perspectographe de Dürer illustrent ce principe.

La Cité idéale,1475, Piero della Francesca

L'expérience de BrunelleschiPerspectographe de Dürer

Page 5: Module Image Montpellier 2015 - lirmm.fr · Visualisation 3D de vidéos capturées ... Compositing XXX Mosaicking X Frozen time XX Bullet time X Réalité Augmentée XXX Free Viewpoint

05/05/2015

5

Module Image – ED I2S – Université de Montpellier05/05/2015 9

Un peu d’histoire … de la 3D … relief

1877

Télétroscope Noir&BlancTV

CouleurTV

HDTV

1908 1948 1981

TV NumériqueTV par satellite

1993

3DTV

1838

Stéréoscope PhotographieIntégrale

Holographie Cinema 3D

1908 1948 1952

IMAX3D DVD

1986

Wheatstone, 1838

Holmes, 1860

Brewster & Duboscq , 1838

Gaumont,1910

… 1ère Vague ][ 2nd vague ][ 3ème vague ][ 4ème vague …

L’ère du to

ut n

umériq

ue

…

Module Image – ED I2S – Université de Montpellier05/05/2015 10

Pourquoi un tel renouveau ?

Un domaine qui n’est pas nouveau, mais un développement ralenti par :

Qualité médiocre

Démocratisation de la TV couleur / déploiement …

Récent renouvellement de l'intérêt et l'activité en raison de :

Amélioration qualitative technologies et des réseaux

Évolution logique de la TV

Productions de l’industrie cinématographique (blockbuster 3D)

Meilleur réalisme : une meilleure perception de profondeur et de distance

Meilleure immersion dans les images : de nouvelles sensations et émotions

Nouveau paradigme de représentation et d'interaction avec les images

Page 6: Module Image Montpellier 2015 - lirmm.fr · Visualisation 3D de vidéos capturées ... Compositing XXX Mosaicking X Frozen time XX Bullet time X Réalité Augmentée XXX Free Viewpoint

05/05/2015

6

Module Image – ED I2S – Université de Montpellier05/05/2015 11

Stéréopsie et physiologie de la 3D

Le système visuel humain (HVS) est un système complexe. La perception du relief mobilise :

Sources subjectives

Indices psychophysiques (théorie de Gestalt)

Indices graphiques

Indices dynamiques

Sources objectives

Informations oculaires

Informations stéréoscopiques

Limites physiologiques

Module Image – ED I2S – Université de Montpellier05/05/2015 12

Stéréopsie et physiologie de la 3D

Le système visuel humain (HVS) est un système complexe. La perception du relief mobilise :

Sources subjectives

Indices psychophysiques (théorie de Gestalt)

Indices graphiques

Indices dynamiques

Sources objectives

Informations oculaires

Informations stéréoscopiques

Limites physiologiques

Page 7: Module Image Montpellier 2015 - lirmm.fr · Visualisation 3D de vidéos capturées ... Compositing XXX Mosaicking X Frozen time XX Bullet time X Réalité Augmentée XXX Free Viewpoint

05/05/2015

7

Module Image – ED I2S – Université de Montpellier05/05/2015 13

Stéréopsie et physiologie de la 3D

Le système visuel humain (HVS) est un système complexe. La perception du relief mobilise :

Sources subjectives

Indices psychophysiques (théorie de Gestalt)

Indices graphiques

Indices dynamiques

Sources objectives

Informations oculaires

Convergence

Accommodation

Informations stéréoscopiques

Limites physiologiques

convergen

ce

convergen

ce

accommodation

accommodation

Module Image – ED I2S – Université de Montpellier05/05/2015 14

Stéréopsie et physiologie de la 3D

Le système visuel humain (HVS) est un système complexe. La perception du relief mobilise :

Sources subjectives

Indices psychophysiques (théorie de Gestalt)

Indices graphiques

Indices dynamiques

Sources objectives

Informations oculaires

Informations stéréoscopiques

Vision binoculaire

Disparité rétinienne

Limites physiologiques a’ b

Œil gauche Œil droit

A

B

b’ a

Page 8: Module Image Montpellier 2015 - lirmm.fr · Visualisation 3D de vidéos capturées ... Compositing XXX Mosaicking X Frozen time XX Bullet time X Réalité Augmentée XXX Free Viewpoint

05/05/2015

8

Module Image – ED I2S – Université de Montpellier05/05/2015 15

Stéréopsie et physiologie de la 3D

Le système visuel humain (HVS) est un système complexe. La perception du relief mobilise :

Sources subjectives

Indices psychophysiques (théorie de Gestalt)

Indices graphiques

Indices dynamiques

Sources objectives

Informations oculaires

Informations stéréoscopiques

Limites physiologiques

Acuité maximale 3°

Module Image – ED I2S – Université de Montpellier05/05/2015 16

Stéréopsie et physiologie de la 3D

Le système visuel humain (HVS) est un système complexe. La perception du relief mobilise :

Sources subjectives

Indices psychophysiques (théorie de Gestalt)

Indices graphiques

Indices dynamiques

Sources objectives

Informations oculaires

Informations stéréoscopiques

Limites physiologiques

Acuité maximale 3°

Aire de panum

Horoptère

Nerf optique

Information champ visuel gauche

Champ visuel binoculaire

Cortex visu

el prim

aire

Information champ visuel droit

Page 9: Module Image Montpellier 2015 - lirmm.fr · Visualisation 3D de vidéos capturées ... Compositing XXX Mosaicking X Frozen time XX Bullet time X Réalité Augmentée XXX Free Viewpoint

05/05/2015

9

Module Image – ED I2S – Université de Montpellier05/05/2015 17

Stéréopsie et physiologie de la 3D

L’inconfort visuel du spectateur devant des contenus présentés en 3D relief est lié au conflit de

synergie accommodation/convergence, c’est‐à‐dire à la difficulté qu’a le spectateur à focaliser ses yeux sur

l’écran de projection tout en fusionnant les points homologues aux images gauche‐droite en fonction de la

distance virtuelle de l’objet 3D en mouvement.

Plan d’accomodation Plan de convergence

Écran ÉcranRéel

Module Image – ED I2S – Université de Montpellier05/05/2015 18

Stéréopsie et physiologie de la 3D

Rendu monoscopique standard (modèle sténopé) : la scène est vue d’un œil et est projectée sur un plan

de découpe (Near clipping plane) correspondant à la fenêtre (viewport) associée à l’écran.

Eye space

X

YZ

Viewport

Near clipping plane

Page 10: Module Image Montpellier 2015 - lirmm.fr · Visualisation 3D de vidéos capturées ... Compositing XXX Mosaicking X Frozen time XX Bullet time X Réalité Augmentée XXX Free Viewpoint

05/05/2015

10

Module Image – ED I2S – Université de Montpellier05/05/2015 19

Stéréopsie et physiologie de la 3D

Décalage des yeux gauche et droit autour

de la vision centrale

Eye space

X

YZ

Near clipping plane

Left Frustum

Écran Right FrustumUn écran « virtuel » où les pyramides de vision gauche et droite converge

Deux images sont générées indépendamment l’une de l’autre sur le plan de découpe…et présentées indépendamment également à chaque de l’utilisateur sur un dispositif physique (écran réel)

Module Image – ED I2S – Université de Montpellier05/05/2015 20

Stéréopsie et physiologie de la 3D

Quantité de profondeur : parallaxe crée la perception de la profondeur relativement à l’écran (1/3 – 2/3).

Lorsque la parallaxe est négative, les objets apparaissent devant l’écran.

Modèle de caméra à axes parallèles : pas d’effets de déformations, bonne restitution de la profondeur,

nécessite un décalage d’images.

Œil gauche

Vision monoculaire

Œil droit

ÉcranEn jaillissement En creux

Plan de collimation

……

Parallaxe négative Parallaxe positive

Quantité de profondeur (depth budget)

Page 11: Module Image Montpellier 2015 - lirmm.fr · Visualisation 3D de vidéos capturées ... Compositing XXX Mosaicking X Frozen time XX Bullet time X Réalité Augmentée XXX Free Viewpoint

05/05/2015

11

05/05/2015 21Module Image – ED I2S – Université de Montpellier

Partie 2

Caractérisation des géométries de capture et de diffusion

Module Image – ED I2S – Université de Montpellier05/05/2015 22

Différents systèmes d’acquisition multi‐vues

Pourquoi prendre plusieurs clichés d'une même scène ?

Visualisation 3D de vidéos capturées

Reconstruction de scène réelles

Reconstruction 2.5D (profondeur)

Reconstruction 3D texturés ou non (digital models)

Capture de mouvements (MoCap – utilisée pour l’animation)

Image compositing (ajustements/rééclairage)

Mosaicking (panorama ou images THD)

Effet de type Frozen time ou Bullet time

Réalité virtuelle ou réalité mixte

Recalcul de point de vue intermédiaires (Free Viewpoint Vidéo ou TV)

Réajustement du focus (refocusing)

Page 12: Module Image Montpellier 2015 - lirmm.fr · Visualisation 3D de vidéos capturées ... Compositing XXX Mosaicking X Frozen time XX Bullet time X Réalité Augmentée XXX Free Viewpoint

05/05/2015

12

Module Image – ED I2S – Université de Montpellier05/05/2015 23

Différents systèmes d’acquisition multi‐vues

Systèmes Binoculaire Multi‐vues Latéral/directionnel

GlobalOmnidirectionnel

Visualisation vidéo 3D X X

2.5D/profondeur X X

Modélisation 3D X X

MoCap X

Compositing X X X

Mosaicking X

Frozen time X X

Bullet time X

Réalité Augmentée X X X

Free Viewpoint Video X X

Refocusing X

Module Image – ED I2S – Université de Montpellier05/05/2015 24

Systèmes binoculaires

Rig stéréoscopiques : deux caméras connectées (synchronisées) par un cadre articulé rigide

Vidéo binoculaire se réfère à la stéréoscopie

La mise en correspondance des couples stéréo permet d’extraire les informations de profondeur

La géométrie de capture est liée à la géométrie épipolaire

Rigs from Binocle (http://www.binocle.com/)

Page 13: Module Image Montpellier 2015 - lirmm.fr · Visualisation 3D de vidéos capturées ... Compositing XXX Mosaicking X Frozen time XX Bullet time X Réalité Augmentée XXX Free Viewpoint

05/05/2015

13

Module Image – ED I2S – Université de Montpellier05/05/2015 25

Systèmes multi‐vues latéraux ou directionnels

Trois cameras ou plus (multi‐stéréoscopie)

Uniformément réparties le long d'une courbe ou d'une grille

Assemblage mécanique (linéaire ou matricielle)

Synchronisation assurée à l'aide d’une électronique spécifique

Contenu ciblé (FVV, reconstruction 3D, visualisation 3D, refocusing, …) impacte

Le nombre de caméras nécessaires

Leur organisation spatiales

Standford Camera Array (128 caméras)

CReSTIC Octocam (8 points de vue)

Module Image – ED I2S – Université de Montpellier05/05/2015 26

Systèmes multi‐vues latéraux ou directionnels

Trois types de géométries de captures

Géométrie convergente (Toe‐in) Géométrie parallèle Géométrie parallèle (Off‐axis)

Centre optique

Zone de capture des images (en sténopé inverse)

Lignes des centres optiques

Axe optique

Point focalPoint focal

Page 14: Module Image Montpellier 2015 - lirmm.fr · Visualisation 3D de vidéos capturées ... Compositing XXX Mosaicking X Frozen time XX Bullet time X Réalité Augmentée XXX Free Viewpoint

05/05/2015

14

Module Image – ED I2S – Université de Montpellier05/05/2015 27

Caméras grille vs. caméras plénoptiques

Caméras grille

Capturer plusieurs images avec une grande résolution pour de la reconstruction 3D ou de la visualisation interactive

Caméras plénoptiques

Capturer l’environnement lumineux pour du FVV (interpolation de vues), du refocusing ou de calcul de profondeur

Module Image – ED I2S – Université de Montpellier05/05/2015 28

Systèmes globaux ou omnidirectionnels

Objectif : modéliser des contenus 3D animés (objets et/ou acteurs)

Un volume de scène suffisamment grand

Reconstruction basée sur la redondance des vues

Nombre et position des caméras dépendent des objectifs

Latéral/haut/bas pour la reconstruction 3D

Trajectoire pour l’effet « Frozen time »

Dispositions : en cercle, sur des coins, en extérieur, …

Nombre variant de quelques à plusieurs centaines de caméras !

Système multi‐vues utilisé dans Matrix (effet de ralenti)

120 caméras fixes

2 caméras vidéo pour le

découpage temporel

« Bullet time » ou « Frozen

time »

Page 15: Module Image Montpellier 2015 - lirmm.fr · Visualisation 3D de vidéos capturées ... Compositing XXX Mosaicking X Frozen time XX Bullet time X Réalité Augmentée XXX Free Viewpoint

05/05/2015

15

Module Image – ED I2S – Université de Montpellier05/05/2015 29

Quelles considérations matérielles ?

Systèmes multi‐vues différent par

Leur nombre de caméras

La disposition des caméras

Ils sont utilisés à des fins diverses mais … partagent les mêmes problèmes

Synchronisation

Calibration (besoin de beaucoup de précision)

Flux vidéo (besoin de capacité réseau, de stockage et de calcul)

Module Image – ED I2S – Université de Montpellier05/05/2015 30

Pipeline de production de contenus

Capture :• Multi vs. mono Caméra• Holographique vs. Holoscopique• Lumière structurée • Caméra Time‐Of‐Flight (TOF)

ReprésentationReprésentation :• Pseudo 3D• Dense Depth• Surface‐based vs. Point‐based vs. Object‐based• Light field vs. Texture mapping• Volumetric

Compression :• Stereoscopic video coding• Multiview video coding (MVC)• Layer depth video coding (LDV)

Codage:• DVB‐S, DVB‐…• IP/IPTV

Transmission :• Satellite• IP streaming/Internet• 3G/4G• Media (Blu‐ray disc)

AffichageAffichage:• Stereoscopic based on eye‐wear• Autostereoscopic (lenticular vs. barrier)• Integral imaging• Holographic• Volumetric

Création

Codage/Transm

ission

Diffusion

Page 16: Module Image Montpellier 2015 - lirmm.fr · Visualisation 3D de vidéos capturées ... Compositing XXX Mosaicking X Frozen time XX Bullet time X Réalité Augmentée XXX Free Viewpoint

05/05/2015

16

05/05/2015 31Module Image – ED I2S – Université de Montpellier

Partie 3

Reconstruction du relief

Module Image – ED I2S – Université de Montpellier05/05/2015 32

Rappel sur la géométrie épipolaire simplifiée

Axes optiques

Parallèles entre eux

Perpendiculaire à la ligne des centres optiques

Focales identiques

Lignes des images parallèles à la ligne des centre optiques

Image gauche Image droite

P

Bi

IG ID

PG

PD

Epipolaire de PG

CG CD

Page 17: Module Image Montpellier 2015 - lirmm.fr · Visualisation 3D de vidéos capturées ... Compositing XXX Mosaicking X Frozen time XX Bullet time X Réalité Augmentée XXX Free Viewpoint

05/05/2015

17

Module Image – ED I2S – Université de Montpellier05/05/2015 33

Géométrie de prise de vue

Les relations entre la disparité stéréoscopique d, exprimée en fraction de la largeur W de l’image, et la

distance Z sont définies par :

La relation entre profondeur réelle Z et perçue Z’ qualifie les distorsions géométriques perçues suivant :

Module Image – ED I2S – Université de Montpellier05/05/2015 34

Instanciation du modèle

FPGA supporte de 2 à 9 vues à 25 images/s

Protocole de communication basé sur du CameraLink

Capteur HD CMOS

Gestion dynamique des ROI

Colorisation (bayerisation) sur la volée sur les données brutes

Support HDRi (10bits/p) avec un temps d'exposition adapté par vue

Requiert une phase d’étalonnage (colorimétrique & géométrique)

Caméra répondant à un géométrie à axes parallèles rectifiés :pas de déformations trapézoïdales, bonne restitution desprofondeurs, nécessite d’adapter les ROI sur les capteurs,gestion explicite des paramètres de déformations

Page 18: Module Image Montpellier 2015 - lirmm.fr · Visualisation 3D de vidéos capturées ... Compositing XXX Mosaicking X Frozen time XX Bullet time X Réalité Augmentée XXX Free Viewpoint

05/05/2015

18

Module Image – ED I2S – Université de Montpellier05/05/2015 35

Disparité vs. profondeur

Exploitation des disparités

Approches multi‐vues dans le cadre de la géométrie épipolaire simplifiée

Plus forte redondance donc a priori plus robustes

Parfaitement adapté aux dispositifs de restitution en relief

illusoire par un mixage planaire multi‐vues co‐localisées

disparité =K

profondeur

Module Image – ED I2S – Université de Montpellier05/05/2015 36

Disparités, oui mais …

Incohérences des cartes de disparités

Les pixels , et sont‐ils des redondances ou des occultations ?

Résultats différents pour les deux yeux

Page 19: Module Image Montpellier 2015 - lirmm.fr · Visualisation 3D de vidéos capturées ... Compositing XXX Mosaicking X Frozen time XX Bullet time X Réalité Augmentée XXX Free Viewpoint

05/05/2015

19

Module Image – ED I2S – Université de Montpellier05/05/2015 37

Taxonomie des approches

Approches par régions

Réputées pour obtenir les meilleurs résultats sur les séquences de référence (http://vision.middlebury.edu/stereo)

Contraintes

Suppose une scène contrastée

Asymétrique d’une image à l’autre

Module Image – ED I2S – Université de Montpellier05/05/2015 38

Taxonomie des approches

Approches par corrélation

Compatibles avec le temps réel

Contraintes

Gestion précise des occultations est impossible

Cohérence d’une carte de disparité à l’autre est impossible à assurer

Page 20: Module Image Montpellier 2015 - lirmm.fr · Visualisation 3D de vidéos capturées ... Compositing XXX Mosaicking X Frozen time XX Bullet time X Réalité Augmentée XXX Free Viewpoint

05/05/2015

20

Module Image – ED I2S – Université de Montpellier05/05/2015 39

Taxonomie des approches

Approches par méthodes symétriques

Gèrent les images multi‐vues

Permettent des interdépendances entre cartes de disparité

Contraintes

N’assure pas la suppression de toutes les incohérences

Ne définit pas exactement les redondances et occultations de la scène

P : ensemble des pixels des N images

f : fonction de disparité

E( f ) : fonction d’énergie

But : trouver la fonction de disparité f qui minimise E( f ).

E( f ) = S( f ) + L( f ) + O( f )

Similarité Lissage Occultation

Module Image – ED I2S – Université de Montpellier05/05/2015 40

Évaluation des disparités

Méthodes usuelles

Utilisation de disparités réelles

Ambiguïtés dues aux valeurs réelles

Produit des artefacts de craquelures lors de la reconstruction

Notre approche

Utilisation de disparités entières

Mise en correspondance exacte des pixels appartenant à chaque vue

Disparités réelles

0 1 2

Page 21: Module Image Montpellier 2015 - lirmm.fr · Visualisation 3D de vidéos capturées ... Compositing XXX Mosaicking X Frozen time XX Bullet time X Réalité Augmentée XXX Free Viewpoint

05/05/2015

21

Module Image – ED I2S – Université de Montpellier05/05/2015 41

Évaluation des disparités

Méthodes usuelles

Utilisation de disparités réelles

Ambiguïtés dues aux valeurs réelles

Produit des artefacts de craquelures lors de la reconstruction

Notre approche

Utilisation de disparités entières

Mise en correspondance exacte des pixels appartenant à chaque vue

Disparités entières

0 1 2

Module Image – ED I2S – Université de Montpellier05/05/2015 42

Génération de LDI

Match ensemble de pixels qui sont la projection d’un même point P

Le match m = { P0 , P1 , P2 } est défini par : mx = x0my = y0md ϵ∞

Définition exacte des redondances et des occultations

Géométrie épipolaire simplifiée :xi = mx – md iyi = my

P

0 1 2

P0 = (x0, y0) P1 P2

Page 22: Module Image Montpellier 2015 - lirmm.fr · Visualisation 3D de vidéos capturées ... Compositing XXX Mosaicking X Frozen time XX Bullet time X Réalité Augmentée XXX Free Viewpoint

05/05/2015

22

Module Image – ED I2S – Université de Montpellier05/05/2015 43

Génération de LDI

Les matchs forment une partition de l’ensemble des pixels

Trouver une partition qui décrit au mieux la scène (contrainte d’homogénéité)

Graphe de correspondances

0 1 2

2

1

0

Module Image – ED I2S – Université de Montpellier05/05/2015 44

Méthode Far‐Near

0 1 2

Page 23: Module Image Montpellier 2015 - lirmm.fr · Visualisation 3D de vidéos capturées ... Compositing XXX Mosaicking X Frozen time XX Bullet time X Réalité Augmentée XXX Free Viewpoint

05/05/2015

23

Module Image – ED I2S – Université de Montpellier05/05/2015 45

Méthode Far‐Near

0 1 2

Module Image – ED I2S – Université de Montpellier05/05/2015 46

Méthode Far‐Near

0 1 2

Page 24: Module Image Montpellier 2015 - lirmm.fr · Visualisation 3D de vidéos capturées ... Compositing XXX Mosaicking X Frozen time XX Bullet time X Réalité Augmentée XXX Free Viewpoint

05/05/2015

24

Module Image – ED I2S – Université de Montpellier05/05/2015 47

Méthode Near‐Far

0 1 2

Module Image – ED I2S – Université de Montpellier05/05/2015 48

Méthode Near‐Far

0 1 2

Page 25: Module Image Montpellier 2015 - lirmm.fr · Visualisation 3D de vidéos capturées ... Compositing XXX Mosaicking X Frozen time XX Bullet time X Réalité Augmentée XXX Free Viewpoint

05/05/2015

25

Module Image – ED I2S – Université de Montpellier05/05/2015 49

Méthode Near‐Far

0 1 2

Module Image – ED I2S – Université de Montpellier05/05/2015 50

Génération des LDI

Estimation des disparités

Méthode d’estimation des disparités

Far/Near Near/Far

Type de méthode Locale (par pixel) Globale

Initialisation de la partition Disparités les plus faibles Disparités les plus fortes

Ordre de parcours des disparités

Ordre croissant Ordre décroissant

Sélection de la valeur de disparité

Minimisation de la SSADMinimisation de la SAD +

occlusions + lissage

Contrainte d’homogénéite Naturellement satisfaite Coupure de graphe

Avantages Faible coût algorithmiqueGénère des cartes de disparités plus précises

Page 26: Module Image Montpellier 2015 - lirmm.fr · Visualisation 3D de vidéos capturées ... Compositing XXX Mosaicking X Frozen time XX Bullet time X Réalité Augmentée XXX Free Viewpoint

05/05/2015

26

Module Image – ED I2S – Université de Montpellier05/05/2015 51

Génération des LDI

Estimation des disparités

Algorithme Far/Near

Algorithme Near/Far

Initialisation Step = 3 Step = 6 Step = 9

Initialisation Step = 6 Step = 3 Step = 0

Module Image – ED I2S – Université de Montpellier05/05/2015 52

Reconstruction des vues et applications

Génération de points de vue intermédiaires (DIBR)

Génération de maillagesConstruction du nuage de points

Construction de la surface

Page 27: Module Image Montpellier 2015 - lirmm.fr · Visualisation 3D de vidéos capturées ... Compositing XXX Mosaicking X Frozen time XX Bullet time X Réalité Augmentée XXX Free Viewpoint

05/05/2015

27

Module Image – ED I2S – Université de Montpellier05/05/2015 53

Reconstruction des vues et applications

Algorithme de reconstruction

Trier les points de chaque plan épipolaire

Créer une bande de triangles entre chaque paire de plans épipolaires

0 1 2

05/05/2015 54Module Image – ED I2S – Université de Montpellier

Partie 4

Compression des flux multi‐vues

Page 28: Module Image Montpellier 2015 - lirmm.fr · Visualisation 3D de vidéos capturées ... Compositing XXX Mosaicking X Frozen time XX Bullet time X Réalité Augmentée XXX Free Viewpoint

05/05/2015

28

Module Image – ED I2S – Université de Montpellier05/05/2015 55

Pourquoi compresser ?

Capture multi‐vues de scènes 3D génère une grande quantité d’information fortement redondante

Dispositifs de restitution en constante évolution

Résolution :

Full HD : 1920 x 1080 (2006)

UHDTV (4K) : 3840 x 2160 (2009)

UHDTV2 (8K) : 7680 x 4320 (2009)

Fréquence d’affichage

Fonction 3D (stéréoscopique, auto‐stéréoscopique, …)

Full HD UHDTV (4k) UHDTV2 (8k)

Module Image – ED I2S – Université de Montpellier05/05/2015 56

État de l’art

Méthodes MVD (Multiview Video plus Depth) : conserve uniquement un jeu restreint de vues ainsi que les cartes de

profondeur associées+ Permet la synthèse de points de vue intermédiaires‐ Redondance significative au sein des vues gardées‐ Les zones occultées dans les vues gardées ne peuvent pas être précisément reconstruites

Méthodes basées sur la re‐projection des vues : compresse l’ensemble des vues re‐projetées selon une vue de référence à

l’aide d’un schéma basé DCT‐3D+ Exploite la corrélation entre les vues‐ Synthèse de points de vues intermédiaires impossible

H264 / MultiView Coding (Vidéo) : standard proposé par le groupe MPEG, extension 2D du schéma de prédiction inter/intra

frame+ Exploite la corrélation inter‐vues et grande flexibilité d’encodage‐ Gain par rapport à H264/AVC relativement faible (20%)‐ Encodage/Décodage couteux en temps de calcul

Méthodes basées LDV (Layered Depth Video) : élimine l’information redondante entre chaque vues+ Exploite la corrélation inter‐vues et permet la synthèse de points de vues intermédiaires‐ Nécessite des cartes de profondeur précises pour éviter toutes ambigüités ‐ Pas de standard

3DVC (3D Video Coding) futur standard en cours de normalisation

Page 29: Module Image Montpellier 2015 - lirmm.fr · Visualisation 3D de vidéos capturées ... Compositing XXX Mosaicking X Frozen time XX Bullet time X Réalité Augmentée XXX Free Viewpoint

05/05/2015

29

Module Image – ED I2S – Université de Montpellier05/05/2015 57

Schéma de compression LDV

Génération des LDI

Compression de la texture de disparité

Base de notre processus de reconstruction du à l’agrégation des pixels dans la texture chromatique

Doit être compressée sans pertes

Plusieurs solutions (approche basée contextes (JPEG‐LS), basée DWT (JPEG2000 lossless mode ou basée LZW (PNG))

Compression de la texture chromatique

L0

L1,R

Ln‐1,R

YUV 4:4:4

YUV 4:4:4

2D DCT

3D DCT

2D Quant.

3D Quant.

2D Scan

3D Scan

Train de bits

compressé

Codeur entropique

Module Image – ED I2S – Université de Montpellier05/05/2015 58

Schéma de compression LDV

Génération des LDI

Compression de la texture de disparité

Base de notre processus de reconstruction du à l’agrégation des pixels dans la texture chromatique

Doit être compressée sans pertes

Plusieurs solutions (approche basée contextes (JPEG‐LS), basée DWT (JPEG2000 lossless mode ou basée LZW (PNG))

Compression de la texture chromatique (SA‐DWT Ondelette Daubechies 9/7 + SPIHT)

DWT

YUV 4:4:4

YUV 4:4:4

SA‐DWT

SPIHTCodeur

arithmétique

L0

L1,R

Ln‐1,R Masque binaire

Page 30: Module Image Montpellier 2015 - lirmm.fr · Visualisation 3D de vidéos capturées ... Compositing XXX Mosaicking X Frozen time XX Bullet time X Réalité Augmentée XXX Free Viewpoint

05/05/2015

30

Module Image – ED I2S – Université de Montpellier05/05/2015 59

Génération des LDI

Extraction des layers

Occupation ≈ 4%

0

1

2

Module Image – ED I2S – Université de Montpellier05/05/2015 60

Compression des LDI

Compression de la texture chromatique

1 ‐ Prétraitements

Agrégation horizontale des pixels provenant des layers résiduels Li,R (i>0)

Maximise le nombre de blocs 3D vides

2 ‐ Conversion RGB vers YUV

Par défaut, les composantes U et V ne sont pas sous‐échantillonnées (4:4:4)

BGRV

BGRU

BGRY

*100001.0*51498.0*615.0

*436.0*28886.0*14713.0

*114.0*587.0*299.0

Page 31: Module Image Montpellier 2015 - lirmm.fr · Visualisation 3D de vidéos capturées ... Compositing XXX Mosaicking X Frozen time XX Bullet time X Réalité Augmentée XXX Free Viewpoint

05/05/2015

31

Module Image – ED I2S – Université de Montpellier05/05/2015 61

Compression des LDI

Compression de la texture chromatique

3 ‐ Transformée DCT

Utilisation de la deuxième forme de la DCT 1D séparable (permet un calcul rapide)

Layer de référence : DCT 2D séparable sur des blocks 8*8

Layers résiduels : placés dans un cube 3D (de 8 tranches), DCT 3D séparable sur des blocks 8*8*8

1,0,2

1cos)(

2 1

0

NkknN

xkCN

XN

nnk

else ,1

0 if ,2

1

)(k

kC

Li,R (i>0)

Module Image – ED I2S – Université de Montpellier05/05/2015 62

Compression des LDI

Compression de la texture chromatique

4 ‐ Quantification

Basée sur H.264/AVC (facteur de qualité [0 , 51])

5 ‐ Processus de parcours

Cas 2D : Parcours zig‐zag standard

Cas 3D : Plusieurs approches possibles

• Méthode de l’ isoplan (Yeo et al. 1995)

• Méthode du tri multi‐critère (Chan et al. 1997)

• Trier les valeurs de quantification et les localisations associées par ordre croissant. En cas de valeurs égales, privilégier d’abord les localisations proches des axes du cube 3D

6 ‐ Codage entropique

Codeur entropique de type Huffman (JPEG)

4 tables de Huffman (DC luminance & chrominance, AC luminance & chrominance)

Problème du cas 3D

• Dans un bloc 3D 8*8*8, DC [0 , 5770]

• De tels coefficients non pris en charge par des tables standards ([0 , 2047])

• Extension des tables de Huffman

Page 32: Module Image Montpellier 2015 - lirmm.fr · Visualisation 3D de vidéos capturées ... Compositing XXX Mosaicking X Frozen time XX Bullet time X Réalité Augmentée XXX Free Viewpoint

05/05/2015

32

Module Image – ED I2S – Université de Montpellier05/05/2015 63

Reconstruction des vues à la décompression

0

1

2

Module Image – ED I2S – Université de Montpellier05/05/2015 64

Reconstruction des vues à la décompression

0

1

2

Page 33: Module Image Montpellier 2015 - lirmm.fr · Visualisation 3D de vidéos capturées ... Compositing XXX Mosaicking X Frozen time XX Bullet time X Réalité Augmentée XXX Free Viewpoint

05/05/2015

33

Module Image – ED I2S – Université de Montpellier05/05/2015 65

Reconstruction des vues à la décompression

0

1

2

Module Image – ED I2S – Université de Montpellier05/05/2015 66

Quelques résultats

Protocole :

Encodage H264 (JM 17.2, YUV 4:4:4, 2 profils (CABAC / CAVLC))

Mode d’encodage Intra (Fournit une bonne cohérence entre les vues)

2 profils (CABAC / CAVLC)

Notre approche (Locale : Far/Near et Globale : Near/Far)

Deux séquences de test (cards et dolls)

Machine de test : processeur i7 920, nVidia GTX 480

Géométrie parallèle décentréeDistance inter‐optique (Bi) de 59mm

Géométrie parallèleDistance inter‐optique (Bi) de 160mm

Page 34: Module Image Montpellier 2015 - lirmm.fr · Visualisation 3D de vidéos capturées ... Compositing XXX Mosaicking X Frozen time XX Bullet time X Réalité Augmentée XXX Free Viewpoint

05/05/2015

34

Module Image – ED I2S – Université de Montpellier05/05/2015 67

Quelques résultats

Protocole :

Encodage H264 (JM 17.2, YUV 4:4:4, 2 profils (CABAC / CAVLC))

Mode d’encodage Intra (Fournit une bonne cohérence entre les vues)

2 profils (CABAC / CAVLC)

Notre approche (Locale : Far/Near et Globale : Near/Far)

Deux séquences de test (cards et dolls)

Machine de test : processeur i7 920, nVidia GTX 480

Géométrie parallèle décentréeDistance inter‐optique (Bi) de 59mm

Géométrie parallèleDistance inter‐optique (Bi) de 160mm

05/05/2015 68Module Image – ED I2S – Université de Montpellier

Partie 5

Affichage relief autostéréoscopique

Page 35: Module Image Montpellier 2015 - lirmm.fr · Visualisation 3D de vidéos capturées ... Compositing XXX Mosaicking X Frozen time XX Bullet time X Réalité Augmentée XXX Free Viewpoint

05/05/2015

35

Module Image – ED I2S – Université de Montpellier05/05/2015 69

Taxonomie des systèmes

Classification des différentes techniques d’affichage 3D

Stéréoscopique vs. auto‐stéréoscopique

Profondeur réelle vs. illusoire (ensemble d’mages planaires 3D co‐localisées)

Multiplexage temporel vs. spatial

…

2‐vues

n‐vues

Intégrale

Volumétrique

HMD StéréoscopiqueAuto

stéréoscopiqueHolographique

3D Display [Hol11]

Temporelle

Polarisation

Anaglyphe

Spatialle

Module Image – ED I2S – Université de Montpellier05/05/2015 70

L’affichage 3D en un coup d’oeil

Systèmes stéréoscopiques

Basés sur la perception binoculaire de la profondeur (simples qui peuvent néanmoins provoquer un inconfort visuel)

Requiert le port de lunettes

Systèmes auto‐stéréoscopiques

Sans lunette, 2‐vues (avec ou sans suivi du regard) ou n‐vues essentiellement avec de la parallaxe horizontale

Systèmes Holographiques

Basés sur le principe physique de la duplication de la lumière – 1948, premiers hologrammes in 1960

Approches numériques sont encore à un stade de recherche

Systèmes à Imagerie Intégrale (plénoptiques)

Principe établi par G. Lippmann en 1908

Basés sur une capture multi‐vues via des réseaux de microlentilles (variantes des approches holographiques)

Offrent une expérience visuelle « full‐parallax »

Systèmes volumétriques

Perception réelle des profondeurs au moyen de dispositifs non standards

Page 36: Module Image Montpellier 2015 - lirmm.fr · Visualisation 3D de vidéos capturées ... Compositing XXX Mosaicking X Frozen time XX Bullet time X Réalité Augmentée XXX Free Viewpoint

05/05/2015

36

Module Image – ED I2S – Université de Montpellier05/05/2015 71

Stéréoscopie active

Composants

Signal lumineux séquentiel (suite alternée d’images Gauche/Droite)

Lunettes LCD à obturation

Signal de synchronisation (émetteur câblé ou IR)

Avantages

Restitution complète des couleurs

Projecteur ou écran standard (unique)

Inconvénients

Scintillement avec des basses fréquences

Perte de luminosité due aux lunettes

Lunettes plus chères

Émetteur IRSync

Module Image – ED I2S – Université de Montpellier05/05/2015 72

Stéréoscopie passive (polarisation)

Composants

Double projection équipée de filtres de polarisation

Lunettes polarisées (linéaire ou circulaire)

Écrans métallisé (préservent la polarisation)

Avantages

Restitution complète des couleurs

Projecteurs et lunettes bon marché

Scintillement réduit

Inconvénients

Projecteurs synchronisables et alignés

Nécessite l’emploi d’un écran métallisé

Perte de luminosité

Modulateur depolarisation

Page 37: Module Image Montpellier 2015 - lirmm.fr · Visualisation 3D de vidéos capturées ... Compositing XXX Mosaicking X Frozen time XX Bullet time X Réalité Augmentée XXX Free Viewpoint

05/05/2015

37

Module Image – ED I2S – Université de Montpellier05/05/2015 73

Dispositifs volumétriques

Composants

Différentes structures (miroirs en rotation, arrangement de LED, écran en rotation, …)

Perspecta, Plasma flashpoints, DepthCube

Omnidirectionnels ‐ génèrent des vues simultanées pouvant être perçues par plusieurs utilisateurs

Perception réelle des profondeurs

Avantages

3D réelle

Scintillement réduit

Projecteurs et lunettes bon marché

Inconvénients

Basse résolution (spatiale et couleur)

Systèmes plus onéreux

Projecteur DLP

Relais optique

Écran de projection

ConnecteurPC

(Effet Princesse Leia)

Module Image – ED I2S – Université de Montpellier05/05/2015 74

Écrans auto‐stéréoscopiques

Deux technologies pour séparer le point de vue de l’œil gauche du point de vue de l’œil droit

Barrières de parallaxe : de minces fentes permettent aux spectateurs de ne voir que la bonne image

Lenticulaires : des microlentilles sont conçues de telle sorte à ce que les images soient amplifiées selon l’angle de vue

Filtres optiques sont disposés en face de l’image source sur l’écran LCD

Page 38: Module Image Montpellier 2015 - lirmm.fr · Visualisation 3D de vidéos capturées ... Compositing XXX Mosaicking X Frozen time XX Bullet time X Réalité Augmentée XXX Free Viewpoint

05/05/2015

38

Module Image – ED I2S – Université de Montpellier05/05/2015 75

Principe de séparation des vues

Plus la barrière de parallaxe est proche des pixels, plus la séparation angulaire entre les images gauche et

droite est importante. Pour un écran auto‐stéréoscopique 2‐vue, les images gauche et droite doivent

adresser les yeux gauche et droit, ce qui signifie que les vues doivent être séparées par seulement

quelques degrés.

Pour un écran auto‐stéréoscopique avec un pitch de 65 micromètres, une séparation oculaire de 63mm,

une distance de vue de 30 cm et un indice de réfraction de 1.52 (verre de silice), la séparation pixel‐

barrière de parallaxe doit être d'environ 470 micromètres.

Module Image – ED I2S – Université de Montpellier05/05/2015 76

Principe de pixel 3D

Auto‐stéréoscopie repose sur le multiplexage (entrelacement) de n‐vues

Variabilité de l’encodage (matériel dépendant)

Conception arbitraire ou mathématique des motifs de mélange (filtres)

avec qDi le paramètre de modulation et qRi le paramètre de répétition

, ,…, ∑ mod

Pixel logique 3D

Matrice de base répétée tout au long de la surface d’affichage

Page 39: Module Image Montpellier 2015 - lirmm.fr · Visualisation 3D de vidéos capturées ... Compositing XXX Mosaicking X Frozen time XX Bullet time X Réalité Augmentée XXX Free Viewpoint

05/05/2015

39

Module Image – ED I2S – Université de Montpellier05/05/2015 77

Parallaxe vs. lenticulaire – avantages vs. inconvénients

Avantages

Parallaxe : bonne séparation des vues

Lenticulaire : intensité lumineuse

Adaptabilité au nombre de vues (2 28)

Inconvénients

Parallaxe : perte d’intensité lumineuse

Lenticulaire : effet de « ghosting »

Location rigoureuse

1

2

3

4

5

6

12

23

34

45

56

123

234

345

456

21

32

43

54

65

321

432

543

654

Pseudoscopie ou hyperstéréo

Zone de confort optimale

MonoscopieDistance optimale

Module Image – ED I2S – Université de Montpellier05/05/2015 78

Zones optimales de confort

Dépendance des zones d’observations au nombre de vues

Faisceaux optiques définissent plusieurs zones plus ou moins confortables

Distance optimale restitue les bonnes profondeurs, une bonne immersion (stéréopsie)

Effets indésirables

Images inversées (3D cross‐talk)

Mélanges de zones

…

1

2

3

4

5

6

12

23

34

45

56

123

234

345

456

21

32

43

54

65

321

432

543

654

Pseudoscopie ou hyperstéréo

Zone de confort optimale

MonoscopieDistance optimale

InverseImage

BlendedZones

CorrectViewing

Page 40: Module Image Montpellier 2015 - lirmm.fr · Visualisation 3D de vidéos capturées ... Compositing XXX Mosaicking X Frozen time XX Bullet time X Réalité Augmentée XXX Free Viewpoint

05/05/2015

40

Module Image – ED I2S – Université de Montpellier05/05/2015 79

Rendu auto‐stéréoscopique

Génération des vues

Vues virtuelles calculées par un moteur de rendu OpenGL ou autre

Vues réelles capturées à partir de caméras 3D

A partir des paramètres de poses et des projections

(cf. partie 2)

La boucle d’affichage correspond alors à

1. Sélectionner (bind) le Frame Buffer Object (FBO)

2. Pour chaque point de vue désiré

a. Sélectionner l’unité de texture pour dessiner dans le ième FBO

b. Configurer la pose camera et la projection

c. Rendre la scène

3. Entrelacer et afficher toutes les textures attachées au FBO

4. Libérer le FBO

C0C1

C2

C3C4

…

Module Image – ED I2S – Université de Montpellier05/05/2015 80

Entrelacement de vues

Colors textures / Vues Mask textures / Filtres

1

2

n

… …

Détails

Image entrelacée

Fra

gmen

t sh

ader

#version 120 /*@@*/

uniform sampler2D u_view;uniform int u_view_number;

void main(){float filter_position = mod( gl_FragCoord.y ‐ 5.0 *

gl_FragCoord.x + u_view_number, 8.0);

if(filter_position < 1.0) gl_FragColor = vec4(0.0, 0.0, 1.0, 1.0);else if(filter_position < 2.0) gl_FragColor = vec4(0.0, 1.0, 0.0, 1.0);else if(filter_position < 3.0) gl_FragColor = vec4(1.0, 0.0, 0.0, 1.0);else gl_FragColor = vec4(0.0, 0.0, 0.0, 0.0);

gl_FragColor *= texture2D(u_view, gl_TexCoord[0].st);}

Page 41: Module Image Montpellier 2015 - lirmm.fr · Visualisation 3D de vidéos capturées ... Compositing XXX Mosaicking X Frozen time XX Bullet time X Réalité Augmentée XXX Free Viewpoint

05/05/2015

41

05/05/2015 81Module Image – ED I2S – Université de Montpellier

Partie 6

Extension à la vidéo 3D HDR

Module Image – ED I2S – Université de Montpellier05/05/2015 82

Imagerie 3D HDR

Imagerie HDR

Élargissement de la gamme d'intensité de l'image

Se rapprocher le plus possible de la perception de l’œil humain (20 stops)

Vidéo 3D HDR (couplage HDR et profondeur)

Appariement de pixels (propagation de croyances [Lin 09],

estimation 3D [Lu 11], disparité [Bonnard 12])

Reconstruction HDR (moyenne pondérée,

fusion de poses [Mertens 07])

Page 42: Module Image Montpellier 2015 - lirmm.fr · Visualisation 3D de vidéos capturées ... Compositing XXX Mosaicking X Frozen time XX Bullet time X Réalité Augmentée XXX Free Viewpoint

05/05/2015

42

Module Image – ED I2S – Université de Montpellier05/05/2015 83

Pipeline général pour l’imagerie HDR

I0

Ii

In

Ensemble d’images à différentes expositions

I0

Ii

In

P

P

P

(i0,j0)

(ii,ji)

(in,jn)

Appariement/Recalage

E0

Ei

En

Reconstruction HDR

Module Image – ED I2S – Université de Montpellier05/05/2015 84

Pipeline général pour l’imagerie HDR

Camera Calibration

3D Visualization

Multi Acquisition

Pixel Matching

Multi HDR Generation

Multi LDR Generation

LDR Compositing

Page 43: Module Image Montpellier 2015 - lirmm.fr · Visualisation 3D de vidéos capturées ... Compositing XXX Mosaicking X Frozen time XX Bullet time X Réalité Augmentée XXX Free Viewpoint

05/05/2015

43

Module Image – ED I2S – Université de Montpellier05/05/2015 85

Pipeline général pour l’imagerie HDR

d = 0.3 d = 0.6d = 0.9 d =0 d = 0.3 d = 0.9 d = 0.6d =0

Temps d’exposition réel = 40 ms

Acquisitions simultanées avec plusieurs expositions depuis différents points de vue

∆ 40, 20, 10 or 5 ms

Module Image – ED I2S – Université de Montpellier05/05/2015 86

Appariement de pixels basé disparité

MScène Points 3D

Images LDR

Page 44: Module Image Montpellier 2015 - lirmm.fr · Visualisation 3D de vidéos capturées ... Compositing XXX Mosaicking X Frozen time XX Bullet time X Réalité Augmentée XXX Free Viewpoint

05/05/2015

44

Module Image – ED I2S – Université de Montpellier05/05/2015 87

Fusion HDR

MScène Points 3D

Images LDR

Images HDR résultantes

Module Image – ED I2S – Université de Montpellier05/05/2015 88

Fusion HDR ‐ résultats

Imagesoriginales

Cartes dedisparité

Tonemapped

HDR images

Middlebury CG OctoCam

Page 45: Module Image Montpellier 2015 - lirmm.fr · Visualisation 3D de vidéos capturées ... Compositing XXX Mosaicking X Frozen time XX Bullet time X Réalité Augmentée XXX Free Viewpoint

05/05/2015

45

Module Image – ED I2S – Université de Montpellier05/05/2015 89

Fusion HDR ‐ résultats

Images LDR

Image HDR (vue 4)

Module Image – ED I2S – Université de Montpellier05/05/2015 90

Fusion HDR ‐ résultats

Images LDR

Image HDR (vue 4)

Page 46: Module Image Montpellier 2015 - lirmm.fr · Visualisation 3D de vidéos capturées ... Compositing XXX Mosaicking X Frozen time XX Bullet time X Réalité Augmentée XXX Free Viewpoint

05/05/2015

46

05/05/2015 91Module Image – ED I2S – Université de Montpellier

Partie 7

Vidéo 3D omnidirectionnelle

Module Image – ED I2S – Université de Montpellier05/05/2015 92

Capture omnidirectionnelle pour la production audiovisuelle – RECOVER3D

Production companies nowadays do video compositing for most of their movie frames

They acquire content from various sources

Digital modeling

Video shooting

3D reconstruction of real, animated content

Next is an example of an ongoing project to create an animated 3D reconstructed model of actors

Real‐time Environment for COmputational Video Editing and Rendering in 3D

Ongoing French funded project (2012‐2014)

Aims at providing a suitable industrial facility for recording HQ 4D digital models of actor

performance

Enhanced re‐usability in virtual control room: duplication, edition (space, time, viewpoint, texture, lighting, geometry…).

Quicker and cheaper movie production

Optimal economic access for broadcast/TV industry to virtual technologies beforehand too expensive

Page 47: Module Image Montpellier 2015 - lirmm.fr · Visualisation 3D de vidéos capturées ... Compositing XXX Mosaicking X Frozen time XX Bullet time X Réalité Augmentée XXX Free Viewpoint

05/05/2015

47

Module Image – ED I2S – Université de Montpellier05/05/2015 93

Vue d’ensemble des différents processus

Computation

Film set

Shooting

4D model tracking

3D reconstruction

for each frame

n

n+1

Evaluation

DirectivesDirector

design& tuning

Scenic space

HQ 3D model for each time stamp

4D consistentHQ model

Virtual control room

Actual performance

Module Image – ED I2S – Université de Montpellier05/05/2015 94

Configuration matérielle

Salle chromakey ; jusqu’à 40 cameras HD professionnelles

Synchronisées (genlock et timecode)

Disposition multi‐circulaire – unités monoscopiques intercallées avec les unités multiscopiques

Multi‐stéréo (mSM) à partir des unités multiscopiques

enveloppe visuelle (VH) pour toutes les caméras

Ressources HPC

1 PC / 4 caméras

OpenCL & CUDA

Unités multiscopiques

Unités monoscopiques

Page 48: Module Image Montpellier 2015 - lirmm.fr · Visualisation 3D de vidéos capturées ... Compositing XXX Mosaicking X Frozen time XX Bullet time X Réalité Augmentée XXX Free Viewpoint

05/05/2015

48

Module Image – ED I2S – Université de Montpellier05/05/2015 95

Configuration matérielle

3D reconstruction needs precise calibration of each camera

relates cameras’ projective spaces (pixels coordinates) to scene space by evaluating extrinsic and intrinsic matrices

Needed for VH and mSM

Global calibration process based on a spotlight freely

moved in the room for a few minutes

successive simultaneous projections on each camera

equations system solved for unknown positions

and matrice coefficients

Extrinsèques Intrinsèques

Module Image – ED I2S – Université de Montpellier05/05/2015 96

Reconstruction 3D : rectification

Simplified epipolar geometry: easier and cheaper mSM based on horizontal disparity

mSM: precisely defined occlusions

Unfortunately, multiscopic units design implies a rather large baseline and thus convergent optical axes

layout

Rectified images in decentered parallel geometry

Re‐projection on a common image plane parallel to the common baseline

Nearly aligned and evenly distributed optical centers

Rectificationplane

Roughly convergent optical axes

Page 49: Module Image Montpellier 2015 - lirmm.fr · Visualisation 3D de vidéos capturées ... Compositing XXX Mosaicking X Frozen time XX Bullet time X Réalité Augmentée XXX Free Viewpoint

05/05/2015

49

Module Image – ED I2S – Université de Montpellier05/05/2015 97

Reconstruction 3D : enveloppe visuelle

Silhouettes extraction: green chromakey

Volumetric visual hull construction: excludes voxels out of at least one silhouette

Textured mesh model: marching cubes, refinement, texturing from images

Formulation basée scène avec hybridation par enveloppe visuelle (travaux en cours de finalisation)

Module Image – ED I2S – Université de Montpellier05/05/2015 98

Reconstruction 3D

Modélisation 4D à partir de captures vidéos de points de vues différents

Représentation spatiotemporelle d’une scène ou « vidéo 3D »

Studio de capture multi‐caméras Vidéos multi‐points de vues

Page 50: Module Image Montpellier 2015 - lirmm.fr · Visualisation 3D de vidéos capturées ... Compositing XXX Mosaicking X Frozen time XX Bullet time X Réalité Augmentée XXX Free Viewpoint

05/05/2015

50

Module Image – ED I2S – Université de Montpellier05/05/2015 99

Reconstruction 3D

Reconstruction model‐free volumique de type « enveloppe visuelle ». Les données reconstruites sont

des séquences de volumes

L'extraction de la surface de ces volumes génère des séquences de maillages (sans aucune cohérence

temporelle a priori)

t + 1 t + 2t

Module Image – ED I2S – Université de Montpellier05/05/2015 100

État de l’art

Reconstruction basée modèle

Basé squelette [Vlasic et al. 08] [Gall et al. 09]

Basé surface déformable [De Aguiar et al. 08]

[Cagniart et al. 10]

Animation de maillage

Animation basée squelette [Lewis et al. 00] [Wang & Phillips 02]

Animation basée cage [Thiery et al. 12] [Ju et al. 05] [Lipman et al. 08]

As‐Rigid‐As‐Possible (ARAP) [Sorkine & Alexa 07]

Suivi de mouvements

Mise en correspondance de maillages [Starck & Hilton 07]

[Varanasi et al. 08] [Tung & Matsuyama 10]

Calcul de « flot de scène » ou « flot de mouvements »

[Petit et al. 11] [Nobuhara & Matsuyama 04] [Blache et al. 14]

Page 51: Module Image Montpellier 2015 - lirmm.fr · Visualisation 3D de vidéos capturées ... Compositing XXX Mosaicking X Frozen time XX Bullet time X Réalité Augmentée XXX Free Viewpoint

05/05/2015

51

Module Image – ED I2S – Université de Montpellier05/05/2015 101

Animation de maillage pseudo‐rigide

Utiliser directement les séquences de volumes issus de la reconstruction multi‐vues pour estimer un flot

de mouvements.

Initialiser un maillage de référence à partir de la

première pose de la reconstruction puis l'animer

selon le flot de mouvements.

Module Image – ED I2S – Université de Montpellier05/05/2015 102

Animation de maillage pseudo‐rigide

Séquence de maillages reconstruite Séquence de maillages temporellement cohérente

Page 52: Module Image Montpellier 2015 - lirmm.fr · Visualisation 3D de vidéos capturées ... Compositing XXX Mosaicking X Frozen time XX Bullet time X Réalité Augmentée XXX Free Viewpoint

05/05/2015

52

Module Image – ED I2S – Université de Montpellier05/05/2015 103

Animation de maillage pseudo‐rigide

Un maillage texturé par frame Un unique maillage texturé et animé

Module Image – ED I2S – Université de Montpellier05/05/2015 104

Animation de maillage pseudo‐rigide

Animation basée As‐Rigid‐As‐Possible (ARAP) : un ensemble de points d'ancrages définit une

déformation appliquée à l'ensemble du maillage par minimisation d'énergie.

Conservation de la structure du maillage

Transformation localement rigide

Page 53: Module Image Montpellier 2015 - lirmm.fr · Visualisation 3D de vidéos capturées ... Compositing XXX Mosaicking X Frozen time XX Bullet time X Réalité Augmentée XXX Free Viewpoint

05/05/2015

53

Module Image – ED I2S – Université de Montpellier05/05/2015 105

Animation de maillage pseudo‐rigide

Sélection des points d'ancrage ‐ critères

Un sommet est un point d’ancrage satisfaisant s’il correspond à : 1. une zone de forte courbure

de la surface , 2. un vecteur de mouvement significatif

…

·

…

, ∈

,

On échantillonne les points qui correspondent aux

extrémités du maillage, aux arêtes saillantes et/ou

aux articulations

Module Image – ED I2S – Université de Montpellier05/05/2015 106

Animation de maillage pseudo‐rigide

Formulation énergétique

On cherche à minimiser l’énergie suivante :

est l’énergie de la déformation As‐Rigid‐As‐Possible :

∈

avec le voisinage direct du sommet .

est une énergie quadratique appliquée sur les points d’ancrages :

Résolution

A partir des conditions d’optimalité de et , on déduit le système linéaire suivant :

2

∈∈

Page 54: Module Image Montpellier 2015 - lirmm.fr · Visualisation 3D de vidéos capturées ... Compositing XXX Mosaicking X Frozen time XX Bullet time X Réalité Augmentée XXX Free Viewpoint

05/05/2015

54

Module Image – ED I2S – Université de Montpellier05/05/2015 107

Animation de maillage pseudo‐rigide

Résolution

A partir des conditions d’optimalité de et , on déduit le système linéaire suivant :

2

∈∈

·

La partie gauche de cette expression correspond à la matrice Laplacienne du maillage. Le système peut alors être écrit

sous la forme matricielle.

La résolution du système s’effectue itérativement : la rotation optimale , est calculée par SVD à partir de la

matrice de covariance des positions initiales de et ′ fixées :

Σ

La matrice de rotation est ensuite appliquée à pour obtenir la nouvelle valeur de grâce à un solveur linéaire :

min 2

∈

Module Image – ED I2S – Université de Montpellier05/05/2015 108

Animation de maillage pseudo‐rigide

Résultats

Pose initiale

Application du flot de mouvement brut

ARAP classique Notre méthode

Maillage template et enveloppe visuelle de la pose ciblée

Page 55: Module Image Montpellier 2015 - lirmm.fr · Visualisation 3D de vidéos capturées ... Compositing XXX Mosaicking X Frozen time XX Bullet time X Réalité Augmentée XXX Free Viewpoint

05/05/2015

55

Module Image – ED I2S – Université de Montpellier05/05/2015 109

Animation de maillage pseudo‐rigide

Optimisation locale

Chaque sommet est soumis à un ensemble de contraintes

Système masse‐ressort : chaque arête applique un force répulsive ou attractive sur les sommets adjacents

∝ ∑

∈

Silhouette‐matching : On utilise l'EDT pour guider le déplacement de chaque sommet vers la surface de

l'enveloppe visuelle

Le système de l'ensemble des sommets est résolue itérativement en utilisant un intégrateur RK4

Pose initiale Après déplacement

Après optimisation

Maillage template et enveloppe visuelle de la pose ciblée

Module Image – ED I2S – Université de Montpellier05/05/2015 110

Animation de maillage pseudo‐rigide

Page 56: Module Image Montpellier 2015 - lirmm.fr · Visualisation 3D de vidéos capturées ... Compositing XXX Mosaicking X Frozen time XX Bullet time X Réalité Augmentée XXX Free Viewpoint

05/05/2015

56

05/05/2015 111Module Image – ED I2S – Université de Montpellier

Partie 8

Démonstrations

Module Image – ED I2S – Université de Montpellier05/05/2015 112

Conclusion & perspectives

Résultats issus des projets de recherche

ANR CamRelief (2008‐2010) : chaîne de production de média 3D relief

CPER PIA1 RECOVER3D (2012‐2015) : production audiovisuel et clonage numérique

COST HDRi (2012‐2015) : imagerie HDR

FUI ICOS (2014‐2016) : visualisation relief et navigation per‐opératoire sans contact

PIA2 3DNeuroSecure (2015‐2017) : visual big data

Page 57: Module Image Montpellier 2015 - lirmm.fr · Visualisation 3D de vidéos capturées ... Compositing XXX Mosaicking X Frozen time XX Bullet time X Réalité Augmentée XXX Free Viewpoint

05/05/2015

57

Module Image – ED I2S – Université de Montpellier05/05/2015 113

Quelques ouvrages

Vision 3D

Vidéo 3D

Planenbanner - Plantprint · xxx xxx xxx BA-313 Welche Heckenpflanze für meinen Garten xxx xxx xxx xxx xxx BA-080 Immergrüne Bodendecker BA-167 Immergrüne Gehölze BA-200 Immergrüne

Solo Open Male 100 2013 Jacks Ridge XxX Final 10 Laps ... · Solo Open Male 100 2013 Jacks Ridge XxX Final 10 Laps Place O’All Laps Time Benjamin Hughes 6 45:13 13.27 43 Benjamin

X XX X XXX X XXX XXX XXX XXX X XX - Connecticut

Template Edition 021 Change over time. Interesting column charts can be more powerful than standard charts; clipart could replace the shapes 20XX XX,XXX,XXX

R. X MAGGIO O FOLLE E FELICEhotelesencia.com/wp-content/uploads/2014/10/Vanity... · xxx xxxx xxxx xxx xxx xxx xxx xxx xxx xxxx xx xxx xx xxx x xxx xxx xx xxx x xxx xxx xx xx xxxxxx

ES MANUAL DEL OPERADOR PE03X-XXX-XXX-XXXX168.65.229.59/ir_pdfs/Fluid Technologies/ARO Fluid... · 2013-04-16 · manual del operador pe03x-xxx-xxx-xxxx pe05x-xxx-xxx-xxxx pe07x-xxx-xxx-xxxx

Quelle heure est-il...Quelle heure est-il ? 19 Quelle heure est-il ? 18 Quelle heure est-il ? 17 TIME TIME TIME TIME TIME TIME TIME TIME TIME TIME TIME TIME TIME TIME TIME TIME TIME

TODOLOILUMINAN - Universidad de Sonora · 2019. 10. 1. · simbologÍa r cfe registro registro nomenclatura xxx xxx xxx xxx xxx xxx xxx xxx xxx xxx xxx xxx xxx xxx xxx xxx xxx xxx

˘ ˇ ˇ ˆ · Activity 1 Activity 2 CO 2 xxx g CH 4 xxx g N 2O xxx g CO 2 xxx g CH xxx g CO 2 xxx g Activity ….. Activity n 4 N 2O xxx g CO 2 xxx g CH 4 xxx g N 2O xxx g CH 4 xxx

REZIST ANTB Okt 2016 ZLATIBOR - szr.org.rs · XXX XXX XXX XXX XXX XXX XXX XXX XXX XXX XXX XXX XXX XXX XXX XXX F+ Hromozom Hromozom Plazmid PRINCIP TRANSFERA PLAZMIDA Hromozomalna

PROYECTO EDUCATIVO INSTITUCIONAL - · Matemática xxx 263 xxx 239 xxx 220 Lenguaje xxx 254 xxx 237 xxx 246 Ciencias Naturales xxx 276 xxx 254 xxx 254 Historia xxx xxx xxx xxx xxx

COLÉGIO PROVIDÊNCIA – SIMULADO€¦ · 1 xxx xxx xxx xxx 36 xxx xxx xxx xxx 2 37 3 38 4 ... O vento varria os sonhos E varria as amizades... O vento varria as mulheres

P age 1 Долматинцы н абрала РысяЧ (2) · ooo xxx xxt xxt xxt txt xtt xxx xxx xxx zxx xzz üxx üxü xxx xxx xxx xxx xxx ttx xtx zzz txx xxx xtx zxx zz sss sss

XxX - forums.autodesk.com filePLANVERFASSER AUFTRAGGEBER PROJEKT GZ LP_PR_2018_11_27_Visualisierung.dwg XxX XxX XxX XX PLANGRUNDLAGE PLANSTAND xx.xx.xxxx xxx PLANINHALT *(=(,&+1(7

Vzorová účetní závěrka - PwC · F.IV. Jiná aktiva xxx xxx xxx xxx G. Přechodné účty aktiv 10 xxx xxx xxx xxx G.I. Naběhlé úroky a nájemné xxx xxx xxx xxx G.II. Odložené

SH-D02F-PV-KMC554e-20191104111603 SEMI...xxx (xxx=310- xxx (xxx=260- cells: xxx (xxx=33 - xxx (xxx=275- Valid in conj unction with TÜV Rheinland certificate 9 & 13 - PV 50395944 Page

XXX XXX XXX XXX XXX XXX - Selemar Camper

Einteilung von Kosten - db.nibis.dedb.nibis.de/db/semforum5/forum/upload/home/ol-bbs-sem/ol-bbs-sem-ue... · 09.03.2009 · bei xxx, xxx, xxx, xxx , XXX , XXX . und XXX . ist bereits

Personenzahl: Bestuhlung: Maßstab: xxx xxx 1 Rau 7€¦ · Personenzahl: Bestuhlung: Maßstab: xxx xxx 1 Rau 7 Veranstaltung: Datum: Gebäude: Ansprechpartner: xxx xxx Messehalle

STAÐSETNING FRAMLEIÐSLUMIÐA Enr.607 xxx xxx PNC.916 xxx xxx Enr.606 xxx xxx … · 2018-10-16 · STAÐSETNING FRAMLEIÐSLUMIÐA Enr.607 xxx xxx PNC.916 xxx xxx Enr.606 xxx xxx

iptlaspalmas.weebly.com · Web viewReparar cercas xxx xxx xxx xxx xxx xxx xxx Sanidad del ganado xxx xxx xxx xxx Pastos xxx Siembra ñame xxx Ceba de cerdos xx xx xx xx xx xx xx xx

XXX - Atlas Model Railroad · 2006. 5. 22. · xxx xx655004 655xxx 655xxx 655xxx xxx xxx xxx xxx xxx xxx. created date: 5/18/2006 10:03:48 am

4 XXX S 3 0 !! 250 0 G eogr aphic R s nPl M : SFL-52 ! ! ðÇocean.floridamarine.org/acp/MIAACP/Maps/GRP_Maps/SFL-52.pdfXXX XX XXX XXX XXX X X XXX XXX X XXX XXX XXX XXX X X XXX XXX

Xxx Pol Pol Final Xxx

PROVA PROVA PROVA XXX XXX XXX XXX XXX XXXselemarcamper.com/wp-content/uploads/catalogos/ges/08...PROVA PROVA PROVAPROVA PROVA PROVAXXX XXX XXX 155 FANALERIA FANALERIA POSTERIORE Moduli

Les oiseaux d’espèces peu communes capturées sur l’Île de

BÜHNE PODIUM RAUM - Stadt Braunschweig · 2019-11-20 · xxxxxxx. Xxx xxx Xxxxxx xxxxx xx xxxxxx. Xx Xxxx xxxxx xxx xxxx xxxx xxx xxx xxxxx xxxxxxx. Xxx xxx Xxxxxx ... Ohne Wasser

750-352(/xxx-xxx) - Farnell

moemax.a.bigcontent.io · xxx xxx xxx xxx 0—6--3 . o o . aKÆ// 000 000 0.0

Chemosphere xxx (2013) xxx–xxx

ALGEMEEN KLASSEMENT A B F · ALGEMEEN KLASSEMENT A B c D E F RangRangRang RangRangRang Totaal Rang 1 St. Antonius Abt U erop XXX XXX XXX XXX XXX XXX XXX XXX 11 Koninklijke Schuttersgilde

Hip Premium Time For Series 8hip-servicecenter.com/newpro/download/EASYGUIDE... · คลิก น าเข้า จะขึ้น Success…xxx Record Import log Complete จ

Xxx Xxx Xxx On Weitzman Purchase Xxx Xxx Xxx Xxx · PDF filePHOTO BY JOHN AQUINO ... inctur sam re re dolupta tessin con pe corio dolorum ... ing the so-called Three A’s — Abercrombie

Oracle Direct Seminar...Abe XXX Baba XXX ・・・・・・・・・ Endo XXX Fujita XXX Hirota XXX Inoue XXX ・・・・・・ Kubota XXX Morita XXX Nakata XXX ・・・・・・