estado del arte - bibing.us.esbibing.us.es/proyectos/abreproy/12131/fichero/capitulo+2... ·...

7
1 ESTADO DEL ARTE 1.1 introducción El continuo desarrollo de la electrónica y la fotografía ha permitido que la generación de mapas 3D sea una realidad a día de hoy. Al tra- tase de una tecnología reciente, muchas son las empresas que ofrecen este novedoso servicio al usuario final. Por tanto, el objetivo de esta sección es realizar un estudio tanto de dichas empresas como de las alternativas de código abierto que existen actualmente. 1.2 contexto Hasta principios del año 2000, los grupos de investigación de fotogra- metría y visión artificial habían trabajado de manera independiente en la reconstrucción de entornos 3D, coincidiendo sólo en la reso- lución de problemas basados en visión estereoscópica. Por un lado, los fotogrametristas se centraron en el uso de cámaras de alto coste bien calibradas e imágenes de alta resolución analógicas, a las que se les aplicaban algoritmos de optimización, los cuales necesitaban de bastante interacción humana. Sin embargo, la comunidad de visión artificial trabajaba en sistemas de tiempo real, utilizando imágenes de baja resolución y siendo éstos sistemas totalmente autónomos. Es entonces cuando, en torno al año 2010 se produjo un importante descenso en el precio de las cámaras digitales. Era posible por ejem- plo, adquirir cámaras reflex con unas características de resolución y SNR parecidas a las que se utilizaban a principios del año 2000 en fotogrametría. No es de extrañar que este hecho provocará una evo- lución natural en el tratamiento de imágenes aéreas, donde se combi- naron las prestaciones más relevantes de la fotogrametría y la visión artificial. Gracias a ello, se han estado desarrollando herramientas au- tomáticas y bastantes precisas que permiten modelar un entorno 3D utilizando para ello imágenes tomadas desde una cámara comercial de bajo coste. Sin embargo, antes de que estas herramientas se pudieran ofrecer al público convencional como un servicio, fue necesario el desarrollo de una serie de algoritmos que permitieran que la reconstrucción de modelos 3D fuese factible desde el punto de vista computacional. 1

Upload: hadat

Post on 08-Oct-2018

213 views

Category:

Documents


0 download

TRANSCRIPT

1E S TA D O D E L A RT E

1.1 introducción

El continuo desarrollo de la electrónica y la fotografía ha permitidoque la generación de mapas 3D sea una realidad a día de hoy. Al tra-tase de una tecnología reciente, muchas son las empresas que ofreceneste novedoso servicio al usuario final. Por tanto, el objetivo de estasección es realizar un estudio tanto de dichas empresas como de lasalternativas de código abierto que existen actualmente.

1.2 contexto

Hasta principios del año 2000, los grupos de investigación de fotogra-metría y visión artificial habían trabajado de manera independienteen la reconstrucción de entornos 3D, coincidiendo sólo en la reso-lución de problemas basados en visión estereoscópica. Por un lado,los fotogrametristas se centraron en el uso de cámaras de alto costebien calibradas e imágenes de alta resolución analógicas, a las que seles aplicaban algoritmos de optimización, los cuales necesitaban debastante interacción humana. Sin embargo, la comunidad de visiónartificial trabajaba en sistemas de tiempo real, utilizando imágenes debaja resolución y siendo éstos sistemas totalmente autónomos.

Es entonces cuando, en torno al año 2010 se produjo un importantedescenso en el precio de las cámaras digitales. Era posible por ejem-plo, adquirir cámaras reflex con unas características de resolución ySNR parecidas a las que se utilizaban a principios del año 2000 enfotogrametría. No es de extrañar que este hecho provocará una evo-lución natural en el tratamiento de imágenes aéreas, donde se combi-naron las prestaciones más relevantes de la fotogrametría y la visiónartificial. Gracias a ello, se han estado desarrollando herramientas au-tomáticas y bastantes precisas que permiten modelar un entorno 3Dutilizando para ello imágenes tomadas desde una cámara comercialde bajo coste.

Sin embargo, antes de que estas herramientas se pudieran ofreceral público convencional como un servicio, fue necesario el desarrollode una serie de algoritmos que permitieran que la reconstrucción demodelos 3D fuese factible desde el punto de vista computacional.

1

1.3 mapas 3d desde imágenes aéreas

Previamente al desarrollo de las técnicas anteriormente citadas, lageneración de mapas geográficos era una tarea que normalmente sehacia utilizando imágenes procedentes de vuelos a media altura ode satélites que orbitaban sobre la tierra [1]. Las imágenes obtenidasde estos satélites poseían una resolución y calidad muy baja y eranafectadas drásticamente por fenómenos atmosféricos (ver figura 1c)que ocultaban parte de la zona que se pretendía mapear.

(a) Imagen obtenida por un aeroplano (1500

m).(b) Imagen captada por un UAV (300 m).

(c) Fotografía desde satélite. (d) Fenómenos atmosféricos adversos.

Figura 1: Comparativa de diferentes sistemas de captación de imágenes.

Con el desarrollo de sistemas aéreos no tripulados (UAV) (ver figu-ra 1a) surge una alternativa a las técnicas de mapeado que se reali-zaban hasta entonces, pudiendo realizar vuelos a baja altura con unamayor resolución y calidad de imagen. Además, la integración de sen-sores inerciales en los UAV permite la generación no solo de mapasortogonales georeferenciados, sino también de modelos digitales dealtura (DEM).

2

En definitiva, todos los factores mencionados anteriormente hancreado una gran expectación en torno a la generación de mapas 3D,gracias a sus múltiples aplicaciones y al bajo coste que supone. Se tra-ta pues un mercado relativamente joven en el que empresas ofreceneste tipo de servicios de manera trasparente al usuario, aunque existetambién herramientas open-source que permiten la implementaciónde los diferentes algoritmos necesarios. En las siguientes secciones seplantean cada una de estas alternativas.

1.4 servicios de cloud computing

La principal ventaja de este tipo de servicios es la facilidad para elusuario, pues no tiene la necesidad de instalar ningún programa ensu ordenador. Sin embargo, existen una serie de inconvenientes relati-vos sobre todo a la privacidad de los algoritmos utilizados, ya que elcódigo no es accesible por el usuario (se ejecutan en la nube directa-mente), por lo que el control sobre el resultado final es prácticamen-te nulo. Además, es normal por parte de estas empresas el ofreceruna serie de servicios adicionales, como podría ser atención al clien-te, venta de cámaras fotográficas o venta de sistemas completos deadquisición de imágenes formados por quadrotors o drones.

1.4.1 Pix4D

Pix4D fue fundada a finales de 2009 como una spin-off de EPFL, es-cuela de ingeniería suiza con amplia experiencia tanto en robóticacomo en inteligencia artificial [2].

Entre los productos que oferta esta empresa, destaca Pix4UAV (verfigura 2a), una solución software disponible tanto en la nube comoversión de escritorio. Este paquete software permite la reconstrucciónde mapas 3D a partir de imágenes aéreas así como la generación demapas 2D georreferenciados o la posibilidad de integrar el resultadofinal con Google Maps. La principal diferencia entre la versión enla nube y la de escritorio reside en el precio, ya que en la versiónde escritorio se paga una licencia completa, mientras que para unprocesamiento en la nube solo es necesario abonar cada proyecto demanera independiente.

1.4.2 Sensefly

Sensefly Ltd es una compañia suiza basada en Ecublens que surgió deigual manera que Pix4D como una spin-off del EPFL [3]. La principaldiferencia entre ambas reside en que Sensefly centra su actividad enel desarrollo de UAV propios destinados a ofrecer servicios civilescomo por ejemplo mapeado de zonas forestales, minas etc. Ofrece

3

(a) Suite de Software PixUAV. (b) UAV ultraligero desarrollado por Sensefly.

Figura 2: Diferentes servicios de 3D mapping

también la posibilidad de conseguir una suite de software la cual escompatible únicamente con sus gama de UAV. Entre los productosque oferta Sensefly, destacan:

• Post-flight service. Sensefly permite a sus clientes la generacióntanto de mapas de elevación como de ortomosaicos de maneraautomática a través de su web. Existen varias modalidades deacceso dependiendo del servicio que se desee y , por tanto, elprecio del producto también varía.

• Swinglet Cam. Este UAV (ver figura 2b ) permite la toma de fo-tografías aéreas a través de su cámara de 12 megapíxeles. Equi-pado con un sistema de inteligencia artificial basado en sensoresinerciales, permite autopilotaje y aterrizaje de forma autónoma.Junto con el sistema aéreo, se ofrece una suite de software quepermite realizar un plan de vuelo previo, así como generar lainformación necesaria para utilizar sus servicios de generaciónde mapas de altura y ortomosaicos.

1.5 herramientas open source

Junto a la evolución que ha sufrido la visión artificial en los últimosaños, se han creado varios grupos de desarrollo cuyo objetivo es la li-beración de diferentes herramientas de código abierto. La integraciónde estas herramientas permite abordar problemas más complejos co-mo es el caso del mapeado 3D cuya dificultad reside en la implemen-tación de los diferentes algoritmos que necesita.

En contrapartida a los servicios que ofrecen las empresas priva-das, las soluciones Open Source son las más utilizadas tanto por lacomunidad científica, como por grupos de investigación o empresasprivadas. Estas herramientas son gratuitas y ofrecen la posibilidadde tener control pleno de cada uno de los parámetros que componen

4

los algoritmos utilizados, pudiendo así adaptar y cambiar esos pará-metros según la necesidad del usuario. A continuación se exponenlas herramientas Open Source más destacadas, así como proyectos decódigo libre relacionados con la reconstrucción 3D.

1.5.1 OpenCV y PCL

OpenCV es una biblioteca libre de visión artificial originalmente desa-rrollada por Intel. Desde que apareció su primera versión alfa en elmes de enero de 1999, se ha utilizado en multitud de aplicacionescomo por ejemplo sistemas de seguridad con detección de movimien-to o aplicaciones de control de procesos donde se requiere recono-cimiento de objetos. Esto se debe a que su publicación se da bajolicencia BSD, que permite que sea usada libremente para propósitoscomerciales y de investigación con las condiciones en ella expresadas.

OpenCV es multiplataforma [4], existiendo versiones para GNU/-Linux, Mac OS X y Windows. Contiene más de 500 funciones queabarcan una gran gama de áreas en el proceso de visión, como reco-nocimiento de objetos, calibración de cámaras, visión estéreo y reco-nocimiento de caras.

En lo relativo a reconstrucción 3D, OpenCV ofrece implementacio-nes de los algoritmos más utilizados tales como detectores de ca-racterísticas, establecimiento de correspondencias o algoritmos máscomplejos utilizados en visión estéreo como el conocido Semi-GlobalMatching o Graph Cut. Destaca también la re-implementación de loscitados algoritmos para que sean usados en las emergentes memoriasGPU, que permite una aceleración considerable en el tratamiento deimágenes de alta resolución.

Por último, comentar también la aparición de librerias para el tra-tamiento de nubes de puntos en 3D como Point Cloud Library (PCL)[5], cuya publicación también se da bajo licencia BSD.

1.5.2 VisualSFM

VisualSFM es una herramienta para la reconstrucción de entornos 3Dque implementa el conocido pipeline Structure From Motion [6]. Fuecreada en 2006 por Changchang Wu, un estudiante de la universidadde North Carolina que posteriormente trabajaría en el proyecto Photo-Tourism, predecesor del conocido software de Microsoft Photosynch.

Este software está destinado sobre todo a la reconstrucción de en-tornos 3D de paisajes urbanos tales como edificios o monumentossin tener porqué usar imágenes tomadas desde el aire. Sin embargo,implementa varios elementos que se utilizan para la generación de

5

mapas 3D como por ejemplo, Multicore Bundle Adjustment, o SIFTG-PU entre otros.

VisualSFM es por tanto una herramienta de propósito general (verfigura 3a) que permite la reconstrucción de entornos 3D incluso cuan-do las imágenes son tomadas por gente con poco conocimiento sobrefotografía. En consecuencia, el precio a pagar por esta flexibilidad esuna formulación matemática más inexacta, que incurre en pérdidasde precisión para algunas aplicaciones, como es el caso de la genera-ción de mapas 3D.

(a) Ejemplo de uso de VisualSFM. (b) Mapa de profundidad ge-nerado por MICMAC.

Figura 3: Ejemplos de software open-source

1.5.3 MICMAC

El Instituto Geografico Nacional francés (IGN) decidió en 2007 que elsoftware que estaban desarrollando internamente en sus laboratoriospodría ser de interés para la comunidad científica liberando así laprimera versión de MICMAC/APERO [7].

Implementado en el lenguaje de programación C++, estas libreríaseran utilizadas para propósitos cartográficos utilizando para ello imá-genes aéreas. Desde 2007 en adelante, MICMAC ha ido evolucionan-do incorporando a sus librerías diferentes módulos que permiten lageneración de mapas de profundidad (ver figura 3b) así como la ex-tracción de nubes de puntos 3D con gran resolución.

La principal diferencia de MICMAC con respecto a otras solucionesde código abierto como VisualSFM o Bundler ([8]) reside en asimilarmodelos matemáticos más complejos, lo que permite una precisiónfinal mas alta. En contrapartida a esta precisión se encuentra la difi-cultad para interactuar con la librería, para la cual se necesitan cono-cimientos más amplios sobre fotografía y sobre los algoritmos que seejecutan en cada etapa.

6

B I B L I O G R A F Í A

[1] Krzysztof Bosak. Secrets of uav photomapping. Technical report,Pteryx, 2012. No cited.

[2] Pix4D. Pagina web. [Página web]. No cited.

[3] Sensefly. Pagina web. http://www.sensefly.com/home.html. Nocited.

[4] OpenCV. Pagina web oficial. http://opencv.org/. No cited.

[5] Point Cloud Library (PCL). Pagina web oficial. http://

pointclouds.org/. No cited.

[6] Changchang Wu. Visual Structure From Motion software. Paginaweb. http://homes.cs.washington.edu/~ccwu/vsfm/. No cited.

[7] IGN francés. MICMAC. Pagina web. http://www.micmac.ign.

fr/. No cited.

[8] Bundler. Pagina web. [Página web]. No cited.

7