datos abiertos: reutilización de información en el sector público
DESCRIPTION
Presentación realizada por Jose Emilio Labra Gayo para las Jornadas "Empleo y Universidad" organizadas por la Universidad de Oviedo, los días 9 y 10 de Junio de 2010TRANSCRIPT
Datos abiertos: Reutilización de información
en el sector público
Jose Emilio Labra Gayo
Universidad of Oviedo, Spainhttp://www.di.uniovi.es/~labra
Jose Emilio Labra Gayo, http://www.di.uniovi.es/~labra
Esquema
Explosión de datos
Razones para publicar los datos
¿Cómo publicar los datos?Datos abiertos vs datos enlazados
Jose Emilio Labra Gayo, http://www.di.uniovi.es/~labra
Explosión de datosContenido generado por usuarios
Información de los gobiernos
Internet de las cosas
Jose Emilio Labra Gayo, http://www.di.uniovi.es/~labra
Razones para liberar datos
Facilitan la investigación
Tasa de descubrimiento se acelera con mejores accesos a los datos
Por el bien común de la humanidad
Jose Emilio Labra Gayo, http://www.di.uniovi.es/~labra
Razones para liberar datos
Los sistemas abiertos facilitan las contribuciones externas
Jose Emilio Labra Gayo, http://www.di.uniovi.es/~labra
Razones para liberar datos
Datos = base para la cooperación Para realizar tareas
comunitarias se requiere acceso a datos comunes
Jose Emilio Labra Gayo, http://www.di.uniovi.es/~labra
Razones para liberar datos
Eficiencia y calidad de los sistemas
Hay muchos datos comunes que no están publicados
Ej. ¿Lista de municipios?
Jose Emilio Labra Gayo, http://www.di.uniovi.es/~labra
Razones para liberar datos
TrasparenciaFomentar participación
Generar confianza
Evaluar al gobierno
Jose Emilio Labra Gayo, http://www.di.uniovi.es/~labra
Razones para liberar datos
Esta presentación hubiera sido muchísimo más aburrida si no hubiese tenido acceso a los datos parcial o totalmente abiertos de Google, Flickr,
Wikipedia, Slideshare y muchos otros proyectos…
Jose Emilio Labra Gayo, http://www.di.uniovi.es/~labra
Si realmente quieres algo…
…déjalo libre
Jose Emilio Labra Gayo, http://www.di.uniovi.es/~labra
Como ciudadanos…
…también podemos demandar datos abiertos…
Jose Emilio Labra Gayo, http://www.di.uniovi.es/~labra
…demandar datos abiertos
Cuando los datos pertenecen a la humanidad
Jose Emilio Labra Gayo, http://www.di.uniovi.es/~labra
…demandar datos abiertos
Cuando son hechos independientes y verificables ó de conocimiento común
Ejemplo: conocimiento científico
Jose Emilio Labra Gayo, http://www.di.uniovi.es/~labra
…demandar datos abiertos
Cuando los datos han sido creados con dinero públicoSon nuestros datos
Los han pagado nuestros impuestos
OK, ¡vivan los datos abiertos!pero…
¿Cómo publicarlos?
Jose Emilio Labra Gayo, http://www.di.uniovi.es/~labra
El mayor reto = IntegraciónEn general, el problema no es informatizar algo
El problema es integrar los sistemas
Interoperabilidad
No basta con publicar datos…
Jose Emilio Labra Gayo, http://www.di.uniovi.es/~labra
Modelo de Estrellas*
★ Publicar los datos (en cualquier formato)
★★ Utilizar formato estructurado (Excel en lugar de imágenes escaneadas)
★★★ Usar formatos no propietarios (CSV en lugar de Excel)
★★★★ Usar URIs para identificar datos (otros sistemas puedan enlazar nuestros datos)
★★★★★ Enlazar con otros datos externos (proporcionar contexto)
* Enunciado por TimBerners Lee en Gov 2.0 Expo 2010
http://www.youtube.com/watch?v=ga1aSJXCFe0
Jose Emilio Labra Gayo, http://www.di.uniovi.es/~labra
Formatos no estructurados
Formatos “caja negra”: Imágenes, vídeos, música, etc.
Formatos binarios: PDF, PS, etc.
Requieren técnicas de tratamiento de la señal, reconocimiento de patrones, etc.
★
Jose Emilio Labra Gayo, http://www.di.uniovi.es/~labra
Ejemplo: Servicio Público de Empleo
http://www.sepe.es/contenidos/cifras/datos_estadisticos/municipios/
★
Jose Emilio Labra Gayo, http://www.di.uniovi.es/~labra
Formatos estructurados
Los datos tienen una estructura
Ejemplo: Hojas de cálculoProblema con formatos propietarios
Requieren herramientas que no son públicas
★ ★
Jose Emilio Labra Gayo, http://www.di.uniovi.es/~labra
Ejemplo: Servicio Público de empleo
http://www.sepe.es/contenidos/cifras/datos_estadisticos/municipios/9
★ ★
Jose Emilio Labra Gayo, http://www.di.uniovi.es/~labra
Formatos no propietarios
Utilizar formatos abiertos estructurados
Ejemplos: CSV, HTML
Problema: Contenido depende del contexto
★ ★ ★
Jose Emilio Labra Gayo, http://www.di.uniovi.es/~labra
CSV
“Comma separated values” valores delimitados por comas
★ ★ ★
Jose Emilio Labra Gayo, http://www.di.uniovi.es/~labra
HTML
HTML está pensado para representar información que se visualiza en el navegador
El procesamiento puede requerir “screen scrapping”
★ ★ ★
Jose Emilio Labra Gayo, http://www.di.uniovi.es/~labra
URIs para identificar datos
Utilizar una URI para identificar un dato
Diferentes representaciones para cada tipo de dato
Negociación de contenido
★ ★ ★ ★
http://puzzles.org/pieza23471
Jose Emilio Labra Gayo, http://www.di.uniovi.es/~labra
XML
XML permite representar información estructurada
Los documentos pueden validarse (XML Schema)
El significado de las etiquetas depende de la aplicación
★ ★ ★ ★
Jose Emilio Labra Gayo, http://www.di.uniovi.es/~labra
Negociación de contenido
El protocolo de comunicación permite que el navegador informe al servidor del tipo de contenido que prefiere
El servidor devuelve una representación diferente según las preferencias del cliente
★ ★ ★ ★
cliente servidor
Jose Emilio Labra Gayo, http://www.di.uniovi.es/~labra
¿2 representaciones para lo mismo?
Ejemplo: Códigos de barras
★ ★ ★ ★
Jose Emilio Labra Gayo, http://www.di.uniovi.es/~labra
Enlazar con otros datos
Enlazar datos identificados mediante URIs
Objetivo: Facilitar la identificación de nuevos conjuntos de datosNuevo conocimiento
★ ★ ★ ★ ★
Jose Emilio Labra Gayo, http://www.di.uniovi.es/~labra
RDF
RDF es un modelo de representación en forma de grafo
RDF (Resource Description Framework)
Las propiedades tienen valores globales (URIs)
★ ★ ★ ★ ★
dato4530
Oviedo 2009
http://obs.org#totalDesempleados
http://obs.org#añohttp://obs.org#municipio
Jose Emilio Labra Gayo, http://www.di.uniovi.es/~labra
RDF es composicional
2 grafos independientes pueden componerse
★ ★ ★ ★ ★
El lenguaje SPARQL permite realizar consultas a grafos
Jose Emilio Labra Gayo, http://www.di.uniovi.es/~labra
RDF como representación
Negociación de contenidoHTML: información para navegadores
RDF: información para sistemas automáticos
★ ★ ★ ★ ★
http://tiempo.com/prevision/oviedoURI
303 See Other http://tiempo.com/prevision/Oviedo/informe.html
303 See Other http://tiempo.com/prevision/Oviedo/informe.rdf
Jose Emilio Labra Gayo, http://www.di.uniovi.es/~labra
Proyecto Linking Open Data
★ ★ ★ ★ ★
Jose Emilio Labra Gayo, http://www.di.uniovi.es/~labra
De Wikipedia a DBPediaInfoset
★ ★ ★ ★ ★
Jose Emilio Labra Gayo, http://www.di.uniovi.es/~labra
De Wikipedia a DBPedia
★ ★ ★ ★ ★
Jose Emilio Labra Gayo, http://www.di.uniovi.es/~labra
Un pequeño ejercicio
Obtener datos de desempleo en municipios asturianos
Excel RDF
HTML + Google Maps
Jose Emilio Labra Gayo, http://www.di.uniovi.es/~labra
Ejercicio: Ejemplo de Excel
Jose Emilio Labra Gayo, http://www.di.uniovi.es/~labra
Ejercicio: RDF
Jose Emilio Labra Gayo, http://www.di.uniovi.es/~labra
Ejercicio: HTML
Jose Emilio Labra Gayo, http://www.di.uniovi.es/~labra
Iniciativas para datos abiertos
Jose Emilio Labra Gayo, http://www.di.uniovi.es/~labra
Algunas iniciativas en España
Jose Emilio Labra Gayo, http://www.di.uniovi.es/~labra
Conclusiones
Publicación de datos abiertos
De datos abiertos a datos enlazados
Nuevos retos:Legalidad: licencias, copyrights,
patentes…
Privacidad
Temporalidad
Semántica e inferencia
Fin de la presentación
Más información: http://www.di.uniovi.es/~labra
Jose Emilio Labra Gayo, http://www.di.uniovi.es/~labra
Agradecimientos
Algunas ideas o partes de esta presentación han sido tomadas de otras presentaciones similares de:
Ivan Hermann, Jacco van Ossenbruggen, Nova Spivak, Ian Horrocks, Tim Berners-Lee, Jose Manuel Alonso, Svein-Magnus Sørensen, Jose Luis Marín.
También se han utilizado datos accesibles en Google, Flickr, Wikipedia, Slideshare, etc. a cuyos autores originales me hubiera gustado citar.